Skip to main content

वाक् पहचान और AI

40% तेज़ STT इन्फेरेंस

STT पाइपलाइन को अपग्रेड किया गया, सभी भाषाओं में 40% तेज़ इन्फेरेंस प्रदान करता है।

द्विभाषी मोड स्थिरता फिक्स

मार्च भर में कई क्रिटिकल द्विभाषी मोड फिक्स तैनात किए गए:
  • मोबाइल पर पहली पहचान में भाषा डिटेक्शन के स्वैप होने की समस्या फिक्स
  • टेक्स्ट करेक्शन से भाषा डिटेक्शन टूटने की समस्या फिक्स (Japanese भाषण गलती से English में ट्रांसक्राइब होता था)
  • बातचीत के बीच भाषाएं बदलने पर ऑडियो लॉस फिक्स
  • अडैप्टिव ऑडियो लेंथ डिटेक्शन के साथ छोटे वाक्यांश सटीकता बहाल

iOS ऑडियो गुणवत्ता सुधार

iOS टेलीफोनी-ग्रेड ऑडियो मोड का उपयोग कर रहा था जबकि Android मेज़रमेंट मोड उपयोग करता है। उचित STT ऑडियो कैप्चर मोड में बदला गया, जिससे 1-2m दूरी पर iOS ऑडियो गुणवत्ता Android के बराबर हो गई।

Malay भाषा सपोर्ट

Malay STT जोड़ा गया। Malay के लिए द्विभाषी मोड सपोर्ट भी जोड़ा गया, Indonesian/Malay जोड़ी जानबूझकर अक्षम रखी गई (दोनों के बीच भाषा स्विचिंग विश्वसनीय रूप से पहचानी नहीं जा सकती)।

तेज़ ट्रांसलेशन

काफी तेज़ इन्फेरेंस के साथ नया ट्रांसलेशन मॉडल तैनात किया गया, रीयल-टाइम ट्रांसलेशन प्रतिक्रिया में सुधार।

और भाषाएं आ रही हैं

Khmer ASR मॉडल ट्रेनिंग शुरू। तैयारी में अतिरिक्त भाषाएं: Cantonese, Uzbek, Polish, Dutch, Mongolian, और Bengali।

मीटिंग लॉग और ट्रांसक्रिप्ट सुधार

कस्टमाइज़ेबल AI मीटिंग सारांश टेम्प्लेट

उपयोगकर्ता अब मीटिंग समाप्त करने से पहले सारांश प्रकार चुन सकते हैं। AI मीटिंग प्रकार के अनुसार संरचित सारांश तैयार करता है। छह टेम्प्लेट उपलब्ध हैं:
  1. सामान्य (डिफ़ॉल्ट) — अवलोकन, विषय, कार्य आइटम
  2. ग्राहक साक्षात्कार — अवलोकन, ग्राहक जरूरतें और संकेत, अगले चरण और जोखिम
  3. नियमित टीम मीटिंग / Scrum — प्रगति, बाधाएं और जोखिम, कार्य आइटम
  4. HR भर्ती साक्षात्कार — उम्मीदवार प्रोफाइल, साक्ष्य और अवलोकन, मूल्यांकन और अगले चरण
  5. मानव मूल्यांकन मीटिंग — मूल्यांकन संदर्भ, चर्चित साक्ष्य, निर्णय और अनुवर्ती
  6. औपचारिक प्रेज़ेंटेशन — प्रेज़ेंटेशन अवलोकन, मुख्य निष्कर्ष, निर्णय और अनुवर्ती
टेम्प्लेट चयन प्रति उपयोगकर्ता सेव होता है और वेब एवं मोबाइल पर सिंक होता है।

ट्रांसक्रिप्ट फुल-टेक्स्ट सर्च (प्रोडक्शन लॉन्च)

नए सर्च इंजन के साथ फुल-टेक्स्ट कीवर्ड सर्च में महत्वपूर्ण अपग्रेड। प्रमुख सुधार:
  • 1 वर्ष के ट्रांसक्रिप्ट (~11M दस्तावेज़) को कवर करता है
  • टाइटल, मूल STT टेक्स्ट, और अनुवादित टेक्स्ट में खोज
  • सटीक CJK (Japanese, Chinese, Korean) सर्च — पिछले इंजन की तुलना में महत्वपूर्ण सुधार
  • बूस्टेड रिलेवेंस स्कोरिंग के साथ फ्रेज़ सर्च

मीटिंग लॉग शेयरिंग अनुमतियां

Workspace एडमिन अब उन मीटिंग लॉग पर शेयरिंग सेटिंग अपडेट कर सकते हैं जिन पर उनकी रीड एक्सेस है। पुराने शेयर किए गए लॉग सुरक्षित रहते हैं और उन्हें सीमित किया जा सकता है।

प्रति-उपयोगकर्ता सारांश टेम्प्लेट प्राथमिकता

प्रत्येक उपयोगकर्ता का पसंदीदा AI सारांश टेम्प्लेट सेव होता है और सेशन के पार बना रहता है। मोबाइल पर मीटिंग एंड मोडल अब टैग, नोट, और सारांश प्रकार चयन को भी सपोर्ट करता है।

Mobile App अपडेट

v0.5.16 — बड़ा ओवरहाल

  • आरंभिक वाक् लॉस बग फिक्स — पूर्ण ऑडियो पाइपलाइन रीराइट के साथ मोबाइल पर
  • iOS SDK को Tahoe (iOS 26) कम्पेटिबिलिटी के लिए अपग्रेड किया गया
  • Android पर ऑफलाइन ट्रांसलेशन अब उपलब्ध
  • iOS पर सिस्टम ऑडियो ट्रांसलेशन: माइक इनपुट की बजाय सिस्टम ऑडियो प्लेबैक (जैसे YouTube) अनुवाद करें
  • पूर्ण बिलिंग फ़्लो ओवरहाल — बिलिंग लॉग, इनवॉइस और रसीद डाउनलोड के साथ वेब ऐप पैरिटी
  • प्लान रिस्टोर फ़्लो फिक्स — सभी अपग्रेड/डाउनग्रेड परिदृश्यों में पूर्ण रिग्रेशन टेस्टिंग के साथ

अन्य मोबाइल सुधार

  • रिकॉर्डिंग सेशन समाप्त होने के बाद मोबाइल ऑटो-रिफ्रेश
  • छोटी ट्रांसक्रिप्ट पर ऑडियो प्लेबैक के दौरान स्क्रॉल फ्लिकर फिक्स
  • यूनिट टेस्ट के साथ ऑडियो हाइलाइट और टेक्स्ट हाइलाइट रिग्रेशन फिक्स
  • सर्च परिणामों में क्रिएटर जानकारी (अवतार और नाम) जोड़ी गई
  • सभी नई ट्रांसक्रिप्शन भाषाओं के लिए कैप्शन टैब सपोर्ट
  • सारांश ईमेल नोटिफिकेशन टॉगल जोड़ा गया (वेब के साथ पैरिटी)
  • Google साइन-इन समस्या हल

Desktop App अपडेट

सिस्टम ट्रे मेनू रीडिज़ाइन

  • macOS/Windows सिस्टम ट्रे से सीधे रिकॉर्डिंग शुरू/बंद करें
  • पुरानी टाइम-ट्रैकिंग और डेली-रिपोर्ट मेनू आइटम हटाए गए
  • ट्रे मेनू लेबल के लिए पूर्ण 6-locale सपोर्ट

बग फिक्स

  • ड्रॉपडाउन मोडल क्लिक-थ्रू से आकस्मिक मीटिंग स्टार्ट फिक्स
  • सेशन के पार mic/प्रेज़ेंटेशन सेटिंग की असंगत दृढ़ता फिक्स
  • मोड स्विच करते समय स्क्रीन/विंडो स्वैप फ्लैश फिक्स

लिसनर मोड सुधार

  • गेस्ट के लिए द्विभाषी भाषा सेटिंग: शेयर किए गए URL के माध्यम से जुड़ने वाले लिसनर गेस्ट अब workspace उपयोगकर्ताओं की तरह पूर्ण द्विभाषी STT/ट्रांसलेशन भाषा सेटिंग पाते हैं
  • लिसनर के लिए हाई एक्यूरेसी मोड: टेक्स्ट करेक्शन अब लिसनर सेशन के लिए सही तरीके से काम करता है
  • Chinese localization फिक्स: लिसनर मोड में भाषा सिलेक्टर में अब Chinese सही तरीके से शामिल है

सबटाइटल और कैप्शन सुधार

  • कैप्शन टैब प्रोग्रेस बार: फ़ाइल अपलोड के तुरंत बाद ट्रांसक्रिप्शन प्रोग्रेस बार दिखाई देता है और पेज रीलोड के बाद भी बना रहता है
  • वर्ड-लेवल टाइमस्टैम्प बहाली: कैप्शन टैब में गुम वर्ड-लेवल टाइमस्टैम्प फिक्स
  • नॉन-स्पीच ऑडियो हैंडलिंग: कोई भाषण नहीं वाले अपलोड किए गए ऑडियो पर अब टूटी हुई स्टेटस की बजाय स्पष्ट “no speech detected” संदेश दिखता है
  • टेक्स्ट हाइलाइट फिक्स: ऑडियो प्लेबैक के दौरान टूटे हुए वर्ड-लेवल हाइलाइटिंग को फिक्स किया गया

UI/UX सुधार

  • बिलिंग/सब्सक्रिप्शन चेंज स्क्रीन: प्रोरेटेड राशि, प्रभावी तिथि, और नई नवीनीकरण तिथि दिखाने वाली ऑर्डर कन्फर्मेशन और सफलता स्क्रीन बेहतर की गई
  • शेयर QR कोड UI रीडिज़ाइन: नया एकीकृत शेयरिंग डायलॉग प्रोडक्शन में तैनात
  • Vocabulary Builder UI फिक्स: डिलीट कन्फर्मेशन मोडल, दृश्यमान टेक्स्ट इनपुट बॉर्डर, अल्फ़ान्यूमेरिक संयोजनों के लिए फिक्स उच्चारण
  • प्लान चेंज पेज: बिलिंग साइकिल रीसेट व्यवहार स्पष्ट किया गया — अपग्रेड पर उपयोग रीसेट होता है, डाउनग्रेड अगले साइकिल से लागू होता है

बग फिक्स

  • द्विभाषी मोड भ्रष्टाचार फिक्स: Malay भाषा जोड़ने के बाद Japanese भाषण गलती से English में ट्रांसक्राइब होता था
  • गलत भाषा आंकड़े फिक्स: उपयोग डैशबोर्ड में भाषा वेरिएंट अलग गिने जाते थे — अब ठीक से एकत्रित किए जाते हैं
  • मीटिंग लॉग डेटा लॉस फिक्स: एक साथ ट्रांसक्रिप्ट फाइनलाइज़ेशन और क्लीनअप से फाइनलाइज़ेशन पूरा होने से पहले डेटा डिलीट हो सकता था
  • Chinese localization फिक्स: ट्रांसक्रिप्शन और लिसनर मोड में भाषा सिलेक्टर सूचियों में Chinese गुम था