Skip to main content

वाक् पहचान और AI

9 नई ASR भाषाएं

VoicePing अब रीयल-टाइम speech-to-text के लिए 9 अतिरिक्त भाषाओं को सपोर्ट करता है: German, Thai, Portuguese, Spanish, French, Arabic, Hindi, Indonesian, और Malay। Nepali और Myanmar भी जोड़े गए।

कस्टम फ्रेज़ ऑटो-जनरेशन

PDF, टेक्स्ट फ़ाइल अपलोड करें या रॉ टेक्स्ट पेस्ट करें — VoicePing स्वचालित रूप से डोमेन-विशिष्ट शब्दावली निकालता है और पहचान सटीकता बेहतर करने के लिए कस्टम फ्रेज़ सुझाता है। सिस्टम उन शब्दों की पहचान करता है जिन्हें ASR मॉडल गलत पहचान सकता है और उन्हें आपकी कस्टम फ्रेज़ डिक्शनरी में जोड़ता है। सभी भाषाओं को सपोर्ट करता है।

बेहतर हेल्यूसिनेशन सप्रेशन

बेहतर ट्रेनिंग डेटा फ़िल्टरिंग और इन्फेरेंस ट्यूनिंग से सामान्य ट्रांसक्रिप्शन कलाकृतियां (जैसे बार-बार फिलर टेक्स्ट) कम हुईं, जिससे सभी भाषाओं में साफ ट्रांसक्रिप्शन आउटपुट मिलता है।

बेहतर छोटे वाक्यांश डिटेक्शन

द्विभाषी मोड में बहुत छोटे वाक्यांशों के लिए बेहतर स्थिरता — संक्षिप्त प्रतिक्रियाएं अब सही भाषा में अधिक विश्वसनीय रूप से पहचानी जाती हैं।

कस्टम फ्रेज़ क्षमता बढ़ाई गई

प्रति workspace कस्टम फ्रेज़ की अधिकतम संख्या 500 से बढ़ाकर 1,000 की गई, पहचान गति पर न्यूनतम प्रभाव के साथ।

ऑफलाइन ट्रांसक्रिप्शन स्पीड (Mobile)

iOS और Android दोनों पर डिवाइस पर ट्रांसक्रिप्शन प्रदर्शन में महत्वपूर्ण सुधार, पिछले ऑफलाइन इन्फेरेंस इंजन को बदला गया।

मीटिंग लॉग और ट्रांसक्रिप्ट सुधार

एकीकृत ट्रांसक्रिप्ट व्यू

मीटिंग लॉग सूची (जनवरी में शुरू किए गए कीवर्ड सर्च के साथ) को एकल एकीकृत व्यू में पुनः डिज़ाइन किया गया है, जिसमें जोड़ा गया है:
  • डेट रेंज फ़िल्टरिंग, टैग फ़िल्टरिंग, और क्रिएटर फ़िल्टरिंग
  • सॉर्ट करने योग्य परिणाम query parameters के माध्यम से शेयर करने योग्य फ़िल्टर URL के साथ
  • वेब और मोबाइल दोनों पर उपलब्ध

बल्क ट्रांसक्रिप्ट डाउनलोड

सर्च परिणामों से सीधे कई ट्रांसक्रिप्ट फ़ाइलें चुनें और डाउनलोड करें — एंटरप्राइज़ डेटा एक्सपोर्ट वर्कफ़्लो के लिए आदर्श।

स्पीकर रिअसाइनमेंट

जनवरी में शुरू की गई स्पीकर मर्ज सुविधा को पूर्ण रिअसाइनमेंट UI के साथ विस्तारित किया गया:
  • विभिन्न ट्रांसक्रिप्ट समूहों में स्पीकर लेबल रिअसाइन करें
  • एक स्पीकर के सभी सेगमेंट को दूसरे में बल्क रिलेबल करें

क्लिपबोर्ड पर कॉपी

मीटिंग लॉग पेज पर वन-क्लिक कॉपी बटन से सारांश सहित पूरा ट्रांसक्रिप्ट टेक्स्ट कॉपी करें, बाहरी टूल में जल्दी पेस्ट करने के लिए।

SRT डाउनलोड

मीटिंग ट्रांसक्रिप्ट अब वीडियो एडिटिंग और सबटाइटल वर्कफ़्लो में उपयोग के लिए SRT (subtitle) फॉर्मेट में डाउनलोड किए जा सकते हैं।

मीटिंग लॉग भाषा डिफ़ॉल्ट फिक्स

मीटिंग लॉग भाषा सिलेक्टर अब हमेशा English पर डिफ़ॉल्ट करने की बजाय उपयोगकर्ता की डिस्प्ले भाषा पर सही तरीके से डिफ़ॉल्ट होता है।

Mobile App अपडेट

  • द्विभाषी मोड फिक्स: एक्सपेडाइटेड ऐप स्टोर अपडेट (v0.5.11) के माध्यम से मोबाइल द्विभाषी मोड का क्रिटिकल बग हल किया गया
  • द्विभाषी मोड UI: छोटी मोबाइल स्क्रीन के लिए बेहतर बटन लेआउट
  • एकीकृत ट्रांसक्रिप्ट सूची: मोबाइल अब वेब ऐप जैसा ही सर्च और फ़िल्टर इंटरफेस उपयोग करता है
  • नौ नई भाषाएं: सभी नई जोड़ी गई ASR भाषाएं मोबाइल पर उपलब्ध
  • ऑफलाइन ट्रांसक्रिप्शन स्पीड: iOS और Android दोनों पर डिवाइस ट्रांसक्रिप्शन में महत्वपूर्ण प्रदर्शन सुधार

Desktop App अपडेट

  • फुल-स्क्रीन मोड: ऑडियो एक्सट्रैक्शन (ट्रांसक्रिप्शन) मोड अब लाइव इवेंट के दौरान बेहतर प्रेज़ेंटेशन अनुभव के लिए फुल-स्क्रीन सपोर्ट करता है
  • कॉन्फिगरेबल मैसेज अवधि: रीयल-टाइम ट्रांसक्रिप्शन में तेज़ सबटाइटल डिस्प्ले के लिए न्यूनतम मैसेज अवधि 2 सेकंड तक कम की गई
  • सिस्टम ट्रे रिकॉर्डिंग कंट्रोल: macOS/Windows के लिए नया सिस्टम ट्रे मेनू — मुख्य ऐप खोले बिना मेनू बार से सीधे रिकॉर्डिंग शुरू/बंद करें

सबटाइटल और कैप्शन सुधार

  • लाइन-ब्रेक फिक्स: एम्बेडेड वीडियो फ़ाइलों में सबटाइटल टेक्स्ट के अजीब तरीके से लाइन ब्रेक होने की समस्या हल की गई
  • सबटाइटल पोज़िशनिंग: सिस्टम टास्कबार के साथ ओवरलैप से बचने के लिए सबटाइटल टेक्स्ट थोड़ा ऊपर ले जाया गया
  • English फॉन्ट साइज़ फिक्स: सबटाइटल रेंडरिंग में English टेक्स्ट, नंबर, और विशेष वर्णों के लिए फॉन्ट साइज़ ठीक की गई
  • कैप्शन टैब भाषा विस्तार: कैप्शन टैब अब वीडियो ट्रांसक्रिप्शन, सबटाइटल एम्बेडिंग, और डबिंग के लिए सभी नई जोड़ी गई भाषाओं को सपोर्ट करता है

UI/UX सुधार

  • ग्रुप और प्रोजेक्ट CSV एक्सपोर्ट: विभाग लागत आवंटन और बल्क प्रबंधन के लिए ग्रुप और प्रोजेक्ट सदस्य असाइनमेंट को CSV के रूप में एक्सपोर्ट करें
  • यूज़र फीडबैक कलेक्शन: फ्री-फॉर्म कमेंट फील्ड सहित पर्सोना और फीडबैक डेटा एकत्र करने के लिए साइनअप फ़्लो बेहतर किया गया
  • Japanese localization: ट्रांसक्रिप्ट सूची हेडर, फ़िल्टर लेबल, और नेवीगेशन कंपोनेंट के लिए Japanese अनुवाद पूर्ण किए गए
  • ईमेल प्राथमिकता प्रबंधन: ईमेल फुटर से एक्सेस करने योग्य नई ईमेल प्राथमिकता प्रणाली — लॉगिन किए बिना मार्केटिंग और सिस्टम ईमेल सब्सक्रिप्शन प्रबंधित करें
  • QR कोड शेयरिंग: QR कोड, डाउनलोड, और URL शेयरिंग को एकल डायलॉग में एकीकृत किया गया

बग फिक्स

  • Chinese के लिए ट्रांसलेशन डिस्प्ले फिक्स: कुछ भाषाओं से Chinese में ट्रांसलेशन भाषा कोड मेल न खाने के कारण नहीं दिख रहा था — अब हल
  • अनंत सारांश स्टेटस फिक्स: मीटिंग लॉग सारांश “creating” स्टेटस में अटक सकते थे — टाइमआउट हैंडलिंग बेहतर की गई
  • Hindi मोनो-लैंगुएज मोड फिक्स: द्विभाषी मोड बंद होने पर भी Hindi ट्रांसक्रिप्शन कभी-कभी English लौटाता था — अब सही तरीके से Hindi पर मजबूर किया जाता है
  • Chinese डिस्प्ले भाषा फिक्स: Chinese पर सेट ऐप भाषा पेज रीलोड के बाद रिफ्लेक्ट नहीं हो रही थी
  • लिसनर मोड ट्रांसक्रिप्ट हिस्ट्री फिक्स: लिसनर मोड में आंशिक या पुराना ट्रांसक्रिप्ट डेटा अब सही तरीके से दिखाया जाता है

रिसर्च और प्रकाशन

चार रिसर्च ब्लॉग पोस्ट प्रकाशित:
  1. Offline Speech Translation
  2. Speech-to-Speech Translation
  3. Offline Speech Transcription Benchmark
  4. Offline TTS Evaluation