Skip to main content

वाक् पहचान और AI

द्विभाषी मोड (नया)

VoicePing अब रीयल-टाइम द्विभाषी speech-to-text को सपोर्ट करता है — एक ही मीटिंग में दो भाषाओं में बोलें, और दोनों भाषाएं बिना मैन्युअल स्विच किए एक साथ ट्रांसक्राइब और अनुवादित होती हैं। मुख्य विशेषताएं:
  • भाषा पहचान और ट्रांसक्रिप्शन के लिए 200ms से कम लेटेंसी
  • Japanese-English, Chinese (Simplified)-English, और Chinese (Traditional)-English पेयर के साथ काम करता है
  • मैन्युअल भाषा स्विचिंग की जरूरत नहीं — सिस्टम अपने आप पहचानता है कि कौन सी भाषा बोली जा रही है

छोटे वाक्यांशों की सटीकता

छोटे वाक्यांशों (जैसे “yes” या “そうですね” जैसी संक्षिप्त प्रतिक्रियाएं) में हेल्यूसिनेशन की समस्या कम हुई, जो पहले गलत ट्रांसक्रिप्शन उत्पन्न कर सकती थी। अधिक विश्वसनीय छोटे-वाक्यांश पहचान के लिए बेहतर डिटेक्शन थ्रेशोल्ड और फ़िल्टरिंग।

स्पीकर डायराइज़ेशन सुधार

  • गैर-अंग्रेजी भाषाओं के लिए बेहतर सटीकता वाला नया स्पीकर पहचान मॉडल
  • नई स्पीकर मर्ज सुविधा — ट्रांसक्रिप्ट में गलती से विभाजित हुए स्पीकर को मैन्युअली मिलाएं
  • गैर-अंग्रेजी स्पीकर अलगाव के लिए बेहतर सटीकता

नई सुविधाएं

ट्रांसक्रिप्ट कीवर्ड सर्च

कीवर्ड से अपनी सभी मीटिंग ट्रांसक्रिप्ट में खोजें। परिणाम मैचिंग टेक्स्ट हाइलाइट करते हैं और सीधे संबंधित सेक्शन तक स्क्रॉल करते हैं। सुविधाएं:
  • ट्रांसक्रिप्ट टाइटल, सारांश, और बोले गए कंटेंट में फुल-टेक्स्ट सर्च
  • सभी भाषाओं में काम करता है
  • Japanese IME-फ्रेंडली इनपुट हैंडलिंग
  • मैच किए गए टेक्स्ट स्निपेट के साथ पेजिनेटेड परिणाम

कस्टम फ्रेज़ ऑटो-एक्सट्रैक्शन (Preview)

एक स्वचालित पाइपलाइन का अर्ली प्रीव्यू जो उन शब्दों की पहचान करता है जिन्हें आपका ASR मॉडल अक्सर गलत पहचानता है, और जोड़ने के लिए कस्टम फ्रेज़ सुझाता है। PDF/दस्तावेज़ अपलोड के साथ पूर्ण संस्करण फरवरी में लॉन्च होगा।

लिसनर मोड ट्रांसक्रिप्शन हिस्ट्री

लिसनर अब अपने मोबाइल ब्राउज़र में ट्रांसक्रिप्शन और ट्रांसलेशन लॉग लोकली सेव कर सकते हैं। होस्ट सेशन बदलने पर मैसेज रीसेट होते हैं। होस्ट शेयर ऑप्शन से इस सुविधा को चालू या बंद कर सकते हैं।

Simplified और Traditional Chinese सपोर्ट

VoicePing अब Simplified Chinese (zh-CN) और Traditional Chinese (zh-TW) दोनों को पूरी तरह सपोर्ट करता है:
  • Web app और mobile app इंटरफेस
  • नोटिफिकेशन ईमेल
  • मूल्य निर्धारण और प्लान विवरण
  • डॉक्युमेंटेशन लिंक (manual.voiceping.net/zh और manual.voiceping.net/zh-tw)

डेटा इंटेलिजेंस एन्हांसमेंट

  • Sales Analysis: टॉक रेशियो, भाषा-अनुसार फिलर वर्ड डिटेक्शन
  • PM Dashboard: वर्ड क्लाउड, सेंटिमेंट एनालिसिस, असहमति ट्रैकिंग, और स्पीक रेशियो
  • Japanese, English, Simplified Chinese, Traditional Chinese, और Korean को सपोर्ट करता है

सबटाइटल और कैप्शन सुधार

  • न्यूनतम अवधि कम: डब की गई फ़ाइलें अब 30 सेकंड जितनी छोटी हो सकती हैं (पहले 60 सेकंड थी)
  • एकाधिक फ़ाइल अपलोड: एक साथ कई वीडियो फ़ाइलें चुनें और अपलोड करें
  • सीधा टेक्स्ट एडिटिंग: सबटाइटल टेक्स्ट पर सीधे क्लिक करके एडिट करें — अब पेंसिल आइकन की जरूरत नहीं। फोकस हटने पर ऑटो-सेव होता है
  • रीयल-टाइम प्रोग्रेस: अपलोड, ट्रांसक्रिप्शन, ट्रांसलेशन, एम्बेडिंग, और डबिंग के लिए प्रोग्रेस प्रतिशत के साथ लाइव स्टेटस अपडेट
  • प्रोसेसिंग नोटिफिकेशन: सबटाइटल एम्बेडिंग और डबिंग जॉब के लिए “We will email you” संदेश अब दिखाया जाता है
  • थंबनेल फिक्स: ऑडियो-ओनली MP4 फ़ाइलें (कोई वीडियो स्ट्रीम नहीं) अब सही तरीके से ग्रे प्लेसहोल्डर दिखाती हैं

मीटिंग लॉग और डाउनलोड सुधार

  • डाउनलोड की गई मीटिंग लॉग में कुल प्रतिभागी संख्या शामिल
  • PDF डाउनलोड: नया हल्का PDF फॉर्मेट — पूर्ण CJK फॉन्ट सपोर्ट के साथ उसी ट्रांसक्रिप्ट के लिए फ़ाइल साइज़ 446KB से घटकर 82KB
  • बेहतर फ़ाइल नामकरण: आसान सॉर्टिंग के लिए मीटिंग स्टार्ट टाइम उपसर्ग के रूप में जोड़ा गया
  • ट्रांसलेशन डिक्शनरी फ़ाइलें: अब जेनेरिक नाम की बजाय भाषा-विशिष्ट फ़ाइलनाम उपयोग करती हैं

Mobile App अपडेट

  • iOS और Android दोनों के लिए v0.5.10 रिलीज़
  • द्विभाषी मोड मोबाइल पर उपलब्ध
  • मोबाइल ट्रांसक्रिप्शन के दौरान मैसेज डुप्लिकेशन फिक्स
  • AI सारांश सक्षम होने पर द्विभाषी मोड में ट्रांसक्रिप्ट भाषा भ्रष्टाचार फिक्स
  • समान भाषा जोड़ी बग फिक्स: समान जोड़ी चुनने पर अब सही भाषाएं दिखाई जाती हैं

बग फिक्स

  • सेशन समाप्त होने के बाद इनफिनिट लूप में चलने वाले CSS एनीमेशन के कारण डेस्कटॉप ऐप में CPU लीक फिक्स
  • Italian भाषा डिफ़ॉल्ट फिक्स: नए उपयोगकर्ताओं को गलती से Italian डिफ़ॉल्ट भाषा असाइन हो रही थी
  • वेब ऐप में भाषा बदलते समय लेआउट भ्रष्टाचार फिक्स
  • कुछ ब्राउज़रों (Brave, Sidekick) में अवतार/इमेज लोडिंग फिक्स

UI/UX सुधार

  • बॉटम बार रेस्पॉन्सिव लेआउट: छोटी लैपटॉप स्क्रीन पर एक्शन बटन अब छुपते नहीं
  • सबटाइटल डाउनलोड रीडिज़ाइन: रंग-कोडेड स्टेटस के साथ Video, Subtitle, और Dubbing डाउनलोड के लिए सीधे बटन
  • बाईं ओर स्क्रॉलिंग फिक्स: डेटा इंटेलिजेंस मेनू को ड्रॉपडाउन में समेकित किया गया
  • अपलोड UI में फ़ाइल अपलोड साइज़ सीमा (25MB) अब स्पष्ट रूप से दिखाई जाती है
  • मीटिंग लॉग चयन: मीटिंग टाइटल रो पर कहीं भी क्लिक करने योग्य
  • ट्रांसक्रिप्शन मोड में वर्चुअल ऑफिस सेटिंग उचित रूप से छिपाई गई