Skip to main content

語音辨識·AI

9種新ASR語言

VoicePing現在新增支援9種即時語音轉文字語言:德語、泰語、葡萄牙語、西班牙語、法語、阿拉伯語、印地語、印尼語和馬來語。同時新增尼泊爾語和緬甸語。

自訂短語自動產生

上傳PDF、文字檔案或貼上文字,自動擷取領域特定詞彙,並建議自訂短語以提高辨識準確度。系統辨識ASR模型容易誤辨識的詞語,並將其新增到自訂短語詞典中。支援所有語言。

幻覺抑制改善

透過改進訓練資料過濾和推理調優,減少了常見的轉錄偽影(如重複填充文字),在所有語言中實現更乾淨的轉錄輸出。

短語音偵測改善

雙語模式下短語音的穩定性提高。短回答現在能更準確地以正確的語言被偵測到。

自訂短語容量增加

每個工作區的最大自訂短語數從500增加到1,000。對辨識速度的影響極小。

離線轉錄速度(行動端)

在iOS和Android上大幅提升裝置端轉錄效能,取代了先前的離線推理引擎。

會議記錄·轉錄改進

統一轉錄視圖

會議記錄列表(1月引入的關鍵字搜尋功能)已重新設計為統一視圖:
  • 日期範圍篩選、標籤篩選和建立者篩選
  • 可排序結果和透過查詢參數的可分享篩選URL
  • 網頁和行動端均可使用

批次轉錄下載

從搜尋結果中選擇並下載多個轉錄檔案。非常適合企業資料匯出。

講者重新分配

擴展了1月引入的講者合併功能,新增了完整的重新分配UI:
  • 在不同轉錄組之間重新分配講者標籤
  • 將一個講者的所有片段批次重新標註給另一個講者

複製到剪貼簿

會議記錄頁面的一鍵複製按鈕,可複製包含摘要在內的完整轉錄文字。

SRT下載

會議轉錄現在可以SRT(字幕)格式下載,用於影片編輯和字幕工作流程。

會議記錄語言預設值修復

會議記錄的語言選擇器現在預設使用使用者的顯示語言,而不是始終預設英語。

行動應用程式更新

  • 雙語模式修復:透過緊急應用商店更新解決了關鍵錯誤
  • 雙語模式UI:為較小的行動螢幕改進了按鈕佈局
  • 統一轉錄列表:行動端現在使用與網頁應用相同的搜尋和篩選介面
  • 9種新語言:所有新增的ASR語言在行動端可用
  • 離線轉錄速度:iOS · Android上的裝置端效能大幅提升

桌面應用程式更新

  • 全螢幕模式:音訊擷取(轉錄)模式現在支援全螢幕,為直播活動提供更好的簡報體驗
  • 訊息顯示時間設定:最小訊息顯示時間縮短至2秒,用於更快的即時字幕顯示
  • 系統匣錄音控制:macOS/Windows新增系統匣選單,可直接從選單列開始/停止錄音,無需開啟主應用程式視窗

字幕·標題改進

  • 換行修復:解決了嵌入式影片檔案中字幕文字不自然換行的問題
  • 字幕位置調整:將字幕文字稍微上移,避免與系統工作列重疊
  • 英語字體大小修復:修正了字幕渲染中英語文字、數字和特殊字元的字體大小
  • 字幕分頁語言擴充:字幕分頁現在支援所有新增語言,用於影片轉錄、字幕嵌入和配音

UI/UX改進

  • 群組和專案CSV匯出:將群組和專案成員分配匯出為CSV,用於部門成本分攤和批次管理
  • 使用者回饋收集:增強註冊流程以收集角色和回饋資料,包括自由格式評論欄位
  • 日語本地化:完成了轉錄列表標題、篩選標籤和導覽組件的日語翻譯
  • 郵件偏好管理:可從郵件頁尾無需登入即可管理行銷和系統郵件的訂閱偏好
  • QR碼分享:將QR碼、下載和URL分享統一至單一對話框

錯誤修復

  • 修復中文翻譯顯示:由於語言代碼不匹配,某些語言到中文的翻譯無法顯示的問題已解決
  • 修復摘要無限建立狀態:會議記錄摘要可能卡在「建立中」狀態 — 改進了逾時處理
  • 修復分詞器載入:新語言的擴展詞彙標記未能正確載入,導致空的轉錄結果
  • 修復印地語單語模式:停用雙語模式時印地語轉錄有時傳回英語 — 現在正確強制為印地語
  • 修復中文顯示語言:設定為中文的應用程式語言在頁面重新載入後未能反映 — 現已修復
  • 修復訪客模式轉錄歷史:訪客模式中的部分或過期轉錄資料現在可正確顯示

研究·出版

發布了四篇研究部落格文章:
  1. 離線語音翻譯
  2. 語音到語音翻譯
  3. 離線語音轉錄基準測試
  4. 離線TTS評估