Skip to main content

वाक् पहिचान र AI

९ नयाँ ASR भाषाहरू

VoicePing ले अब real-time speech-to-text का लागि ९ थप भाषाहरू समर्थन गर्छ: German, Thai, Portuguese, Spanish, French, Arabic, Hindi, Indonesian र Malay। नेपाली र मर्मार (Myanmar) पनि थपिएका छन्।

Custom Phrase Auto-Generation

PDF, text file upload गर्नुहोस् वा raw text paste गर्नुहोस् — VoicePing ले स्वतः domain-specific vocabulary निकालेर पहिचान सटीकता सुधार गर्न custom phrase हरू सुझाउँछ। ASR मोडेलले गलत पहिचान गर्ने सम्भावना भएका शब्दहरू पहिचान गरेर custom phrase dictionary मा थप्छ। सबै भाषाहरू समर्थित छन्।

Hallucination दमन सुधार

सुधिएको training data filtering र inference tuning मार्फत सबै भाषाहरूमा स्वच्छ transcription output को लागि सामान्य transcription artifact (जस्तै filler text दोहोरिनु) घटाइयो।

छोटो उच्चारण पहिचान सुधार

Bilingual mode को धेरै छोटो उच्चारण stability सुधार — संक्षिप्त प्रतिक्रियाहरू अब सही भाषामा बढी विश्वसनीय रूपमा पहिचान गरिन्छन्।

Custom Phrase क्षमता बढाइयो

Workspace प्रति maximum custom phrase संख्या ५०० बाट १,००० मा बढाइयो, पहिचान गतिमा न्यूनतम प्रभावसहित।

Offline Transcription गति (Mobile)

iOS र Android दुवैमा पुरानो offline inference engine प्रतिस्थापन गरेर device-level transcription performance मा उल्लेखनीय सुधार।

Meeting Log र Transcript सुधारहरू

Unified Transcript View

(जनवरीमा keyword search सहित प्रस्तुत) meeting log list लाई एकल unified view मा पुनःडिजाइन गरियो, थपिएका:
  • Date range filtering, tag filtering र creator filtering
  • Query parameter मार्फत shareable filter URL सहितको sortable results
  • Web र mobile दुवैमा उपलब्ध

Bulk Transcript Download

खोज परिणामहरूबाट सोझै धेरै transcript file हरू छनोट गरेर download गर्नुहोस् — enterprise data export workflow का लागि उपयुक्त।

Speaker Reassignment

(जनवरीमा प्रस्तुत) speaker merge सुविधालाई full reassignment UI सहित विस्तार गरियो:
  • विभिन्न transcript group हरूमा speaker label हरू Reassign गर्नुहोस्
  • एउटा speaker का सबै segment अर्कोमा Bulk relabel गर्नुहोस्

Copy-to-Clipboard

Meeting log page मा summary सहित पूर्ण transcript text बाह्य उपकरणहरूमा छिटो paste गर्न one-click copy button।

SRT Download

Meeting transcript हरू अब video editing र subtitle workflow मा प्रयोगका लागि SRT (subtitle) format मा download गर्न सकिन्छ।

Meeting Log Language Default समाधान

Meeting log language selector ले अब सधैं English default गर्नुको सट्टा user को display language सही रूपमा default गर्छ।

Mobile App अपडेटहरू

  • Bilingual mode समाधान: Expedited app store update (v0.5.11) मार्फत critical mobile bilingual mode bug समाधान
  • Bilingual mode UI: साना mobile screen का लागि button layout सुधार
  • Unified transcript list: Mobile ले अब web app जस्तै search र filter interface प्रयोग गर्छ
  • ९ नयाँ भाषाहरू: नयाँ थपिएका सबै ASR भाषाहरू mobile मा उपलब्ध
  • Offline transcription गति: iOS र Android दुवैमा device-level transcription को उल्लेखनीय performance सुधार

Desktop App अपडेटहरू

  • Full-screen mode: Audio extraction (transcription) mode ले अब live event मा राम्रो presentation experience का लागि full-screen समर्थन गर्छ
  • Configurable message duration: Real-time transcription मा छिटो subtitle देखाउन minimum message duration २ सेकेन्डमा घटाइयो
  • System tray recording control: Main app window नखोलिकन menu bar बाट सोझै recording सुरु/रोक्न macOS/Windows system tray menu नयाँ

Subtitle र Caption सुधारहरू

  • Line-break समाधान: Embedded video file मा subtitle पाठ अप्ठ्यारो ठाउँमा हुने line break समस्या समाधान
  • Subtitle positioning: System taskbar सँग overlap नहोस् भनेर subtitle पाठ अलिकति माथि सारियो
  • English font size समाधान: Subtitle rendering मा अंग्रेजी पाठ, अंक र special character को font sizing सुधार
  • Caption tab भाषा विस्तार: Caption tab ले अब video transcription, subtitle embedding र dubbing का लागि नयाँ थपिएका सबै भाषाहरू समर्थन गर्छ

UI/UX सुधारहरू

  • Group र project CSV export: विभाग लागत विभाजन र bulk व्यवस्थापनका लागि group र project सदस्य तोकाइ CSV मा export गर्नुहोस्
  • User feedback collection: Free-form comment field सहित persona र feedback data सङ्कलन गर्न signup flow सुधार
  • Japanese localization: Transcript list header, filter label र navigation component को जापानी अनुवाद पूर्ण
  • Email preference management: Login नगरिकन marketing र system email subscription व्यवस्थापन गर्न email footer बाट पहुँचयोग्य नयाँ email preference system
  • QR code sharing: QR code, download र URL sharing एउटै dialog मा एकीकृत

Bug समाधानहरू

  • Chinese translation display समाधान: भाषा code बेमेलका कारण केही भाषाबाट Chinese मा अनुवाद नदेखिने समस्या समाधान
  • Summary status अन्तहीन हुने समाधान: Meeting log summary “creating” अवस्थामा अड्किने समस्या — timeout handling सुधार
  • Hindi mono-language mode समाधान: Bilingual mode बन्द भए पनि Hindi transcription मा English फर्किने समस्या — अब सही रूपमा Hindi मा बाध्य
  • Chinese display language समाधान: App भाषा Chinese मा सेट गरेपछि page reload मा नदेखिने समस्या समाधान
  • Listener mode transcript history समाधान: Listener mode मा partial वा stale transcript data अब सही रूपमा देखाइन्छ

अनुसन्धान र प्रकाशनहरू

चारवटा अनुसन्धान blog post प्रकाशित:
  1. Offline Speech Translation
  2. Speech-to-Speech Translation
  3. Offline Speech Transcription Benchmark
  4. Offline TTS Evaluation