语音识别·AI
多语言ASR模型升级
我们训练了一个新的统一多语言语音识别模型,涵盖日语、英语、中文、韩语和越南语,替代了各语言的单独模型。主要改进:- 短语音准确率从92%提升至96%,超越OpenAI Whisper large v3(95%)
- 语言检测准确率从71%提升至96%,大幅减少错误的语言识别
- 噪声鲁棒性改善 — 已在背景噪声、音乐和环境声中测试
翻译质量提升
自托管翻译引擎进行了重大升级:- 所有支持的语言对翻译准确度提高
- 尤其是中文语言对的翻译速度提升
- 统一的多语言架构带来更一致的质量
STT修正改善
实时语音修正变得更加温和 — 系统现在保留填充词和自然语音模式(如”嗯”、“あの~”),而不是删除它们。减少了实时转录期间的文本闪烁,提供更自然的阅读体验。韩语单词级高亮
韩语转录现在支持逐词高亮播放,可精确导航录制的会议内容。新功能
商业智能仪表板
- 移除”测试版”标签 — BI仪表板成为标准功能
- 修复思维导图生成在日语和英语中的一致性问题
- 恢复缩放状态持久化,您偏好的视图将在会话间保持记忆
会议笔记
- 当没有自定义模板时,默认模板始终显示
- 所有用户(包括成员)现在都可以切换笔记模板
- 修复了没有模板时创建的笔记无法后续编辑的问题
监听模式改进
- 在主持人连接之前即可加入音频提取会话
- 在会话日志中准确跟踪监听者数量,包括主持人未发言的情况
- 活动会话期间更改密码时,会适当通知并断开监听者连接
移动应用更新
iOS · Android 发布 (v0.5.10+)
- Apple Sign-In:通过Apple Sign-In自动创建账户,与现有的Google Sign-In体验一致
- 会议摘要重新生成:可直接从移动应用重新生成AI会议摘要
- 单词高亮播放:修复了转录回放期间的文本闪烁问题,实现流畅准确的逐词高亮
- 3倍速播放:与网页应用的播放速度选项保持一致
- 离线改进:改善了网络中断和离线到在线转换的处理
- Android深层链接修复:从应用外部打开转录URL不再显示黑屏
错误修复
- 修复了服务器暂时不可达时显示的错误**“计划限制超出”通知**,即使使用量在限制范围内
- 修复了移动和桌面会话为同一会议创建两条单独记录的会议记录重复问题
- 修复了原因文本少于15个字符时被阻止的计划取消按钮(日语输入尤其成问题)
- 修复了支付界面显示错误使用分钟数的Stripe计划显示
- 修复了未选择翻译语言时错误显示的翻译进度指示器
- 修复了会话停止后麦克风状态损坏的转录模式清理
- 解决了登录模态框重复在网页和移动平台间的问题
- 修复了因键格式不匹配而未能正确应用的中文词典翻译
UI/UX改进
- 监听模式入口界面:重新设计,配备可滚动的工作区列表(之前限制显示4个)和改进的视觉样式
- 通知提示清理:移除了直播活动期间令人分心的编辑/删除通知 — 对VoicePing在屏幕上显示的演示很重要
- 仪表板区域设置修复:修正了日语界面中的显示格式问题
- 会议摘要显示:移除了移动端和桌面端摘要文本的字符限制,显示完整的AI生成摘要
其他
- 由于许可限制,已停用远程控制功能。受影响的用户已收到通知。
