Skip to main content

वाक् पहिचान र AI

Bilingual Mode (नयाँ)

VoicePing ले अब real-time bilingual speech-to-text सुविधा दिन्छ — एउटै बैठकमा दुई भाषामा बोल्नुहोस्, र दुवैलाई एकैसाथ transcribe र translate गरिनेछ, हाते भाषा परिवर्तन आवश्यक पर्दैन। मुख्य विशेषताहरू:
  • भाषा पहिचान र transcription को लागि 200ms भन्दा कम latency
  • जापानी-अंग्रेजी, चिनियाँ (Simplified)-अंग्रेजी, र चिनियाँ (Traditional)-अंग्रेजी जोडीहरूसँग काम गर्छ
  • हाते भाषा परिवर्तन आवश्यक छैन — कुन भाषा बोलिँदैछ भनी प्रणालीले स्वतः पहिचान गर्छ

छोटो उच्चारणमा सुधिएको सटीकता

छोटो उच्चारणहरू (जस्तै “yes” वा “そうですね” जस्ता संक्षिप्त प्रतिक्रियाहरू) मा हुने गलत transcription को hallucination समस्या घटाइयो। छोटो वाक्यांश पहिचानमा बढी विश्वसनीयताका लागि detection threshold र filtering सुधार गरियो।

Speaker Diarization सुधारहरू

  • गैर-अंग्रेजी भाषाहरूका लागि राम्रो सटीकताको speaker पहिचान मोडेल
  • नयाँ speaker merge सुविधा — transcript मा गलत रूपमा विभाजित speaker हरूलाई हातैले मिलाउन सक्नुहुन्छ
  • गैर-अंग्रेजी speaker छुट्याउने सटीकता सुधार

नयाँ सुविधाहरू

Transcript Keyword खोज

Keyword बाट आफ्ना सबै meeting transcript हरूमा खोज्नुहोस्। परिणामहरूले मिल्ने पाठ हाइलाइट गरेर सम्बन्धित खण्डमा सोझै scroll गर्छन्। सुविधाहरू:
  • Transcript title, summary र spoken content मा full-text खोज
  • सबै भाषाहरूमा काम गर्छ
  • Japanese IME-friendly input ह्यान्डलिङ
  • मिल्ने text snippet सहितको pagination परिणामहरू

Custom Phrase Auto-Extraction (Preview)

ASR मोडेलले बारम्बार गलत पहिचान गर्ने शब्दहरू पहिचान गरेर custom phrase थप्न सुझाव दिने automated pipeline को early preview। PDF/document upload सहितको पूर्ण संस्करण फेब्रुअरीमा लञ्च हुनेछ।

Listener Mode Transcription History

Listener हरूले अब आफ्नो mobile browser मा transcription र translation log हरू स्थानीय रूपमा सुरक्षित गर्न सक्छन्। Host session परिवर्तन हुँदा message हरू reset हुन्छन्। Host ले share options बाट यो सुविधा सक्षम वा अक्षम गर्न सक्छन्।

Simplified र Traditional Chinese समर्थन

VoicePing ले अब Simplified Chinese (zh-CN) र Traditional Chinese (zh-TW) दुवैलाई पूर्ण रूपमा समर्थन गर्छ:
  • Web app र mobile app interface
  • Notification email हरू
  • Pricing र plan विवरणहरू
  • Documentation links (manual.voiceping.net/zhmanual.voiceping.net/zh-tw)

Data Intelligence सुधारहरू

  • Sales Analysis: भाषाअनुसार Talk ratio, filler word पहिचान
  • PM Dashboard: Word cloud, sentiment analysis, disagreement tracking र speak ratio
  • जापानी, अंग्रेजी, Simplified Chinese, Traditional Chinese र कोरियाली भाषा समर्थन

Subtitle र Caption सुधारहरू

  • न्यूनतम अवधि घटाइयो: Dubbed file हरू अब ३० सेकेन्डसम्म छोटो हुन सक्छन् (पहिले ६० सेकेन्ड)
  • Multiple file upload: एकैपटक धेरै video file हरू रोजेर upload गर्नुहोस्
  • सोझो पाठ सम्पादन: Subtitle पाठमा सोझै क्लिक गरेर सम्पादन गर्नुहोस् — pencil icon आवश्यक छैन। Focus हट्दा स्वतः सुरक्षित हुन्छ
  • Real-time progress: Upload, transcription, translation, embedding र dubbing को लागि progress percentage सहितको live status update
  • Processing notification: Subtitle embedding र dubbing job का लागि “हामी तपाईंलाई email गर्नेछौं” सन्देश देखाइन्छ
  • Thumbnail सुधार: Video stream नभएका audio-only MP4 file हरूले अब त्रुटि हुनुको सट्टा सही रूपमा grey placeholder देखाउँछन्

Meeting Log र Download सुधारहरू

  • कुल सहभागी संख्या download गरिएको meeting log मा समावेश
  • PDF download: पूर्ण CJK font समर्थनसहित file size ४४६KB बाट ८२KB मा घटेको नयाँ हल्का PDF format
  • फाइल नामकरण सुधार: सजिलो sorting का लागि meeting सुरु समय prefix को रूपमा थपियो
  • Translation dictionary file: अब generic नाम सट्टा भाषा-विशिष्ट filename प्रयोग गर्छ

Mobile App अपडेटहरू

  • iOS र Android दुवैका लागि v0.5.10 जारी
  • Mobile मा Bilingual mode उपलब्ध
  • Mobile transcription मा message दोहोरिने समस्या समाधान
  • AI summary सक्षम हुँदा bilingual mode मा transcript भाषा बिग्रने समस्या समाधान
  • Same language pair bug समाधान: एकै जोडी रोज्दा अब सही भाषाहरू देखाइन्छन्

Bug समाधानहरू

  • Session समाप्त भएपछि CSS animation infinite loop का कारण desktop app मा CPU leak समाधान
  • नयाँ users लाई Italian लाई गलत रूपमा default भाषाको रूपमा तोकिने Italian language default समाधान
  • Web app मा भाषा परिवर्तन गर्दा layout बिग्रने समाधान
  • केही browser (Brave, Sidekick) मा avatar/image loading समस्या समाधान

UI/UX सुधारहरू

  • Bottom bar responsive layout: साना laptop screen मा action button हरू अब लुक्दैनन्
  • Subtitle download पुनःडिजाइन: color-coded status सहित Video, Subtitle र Dubbing download का लागि सोझा button हरू
  • Left-side scrolling समाधान: Data intelligence menu एउटै dropdown मा एकीकृत गरियो
  • File upload size limit (25MB) अब upload UI मा स्पष्ट रूपमा देखाइन्छ
  • Meeting log छनोट: Meeting title row को जहाँ पनि क्लिक गर्न सकिन्छ
  • Transcription mode मा Virtual office setting उचित रूपमा लुकाइएको छ