语音识别·AI
双语语音转文字(预览)
我们开发了日语和英语之间的实时自动语言检测和代码切换。VoicePing现在可以无缝转录多语言对话,无需手动切换语言。早期客户反馈非常积极,测试者表示这消除了直播活动期间手动切换语言的烦恼。 此功能目前处于预览阶段,将于1月向所有用户推出。ASR模型改进
经过18天训练的最新多语言ASR模型涵盖日语、英语、中文、韩语和越南语,达到了历史最佳的词错误率(WER)。- 自定义短语词典容量从150增加到500条(支持空格分隔)
- 支持受限语言候选(例如:将识别限制为仅日语和越南语)
- 通过滑动窗口上下文改进音频缓冲架构,减少分块边界错误
神经话者分离
在生产环境中部署了新的神经话者分离模型,替代了之前基于聚类的方法。新模型在较长的会议中提供更准确的话者分离。我们还开始训练日语专用话者分离模型,以进一步提高日语会议的准确性。话者识别研究
开始评估高级话者识别模型,以改善转录中的自动话者标注。新功能
HENNGE One SSO集成
通过HENNGE One的企业单点登录现在可在网页、iOS和Android上使用。启用SSO后,用户在登录时会自动重定向到其组织的HENNGE认证。非常适合需要集中身份管理的组织。字幕翻译词典
字幕功能现在支持自定义翻译词典。您可以定义在实时字幕翻译期间应用的特定翻译映射,确保行业特定术语、产品名称和专有名词每次都能准确翻译。数据智能改进
- 新的销售分析模板,自动从会议转录中提取客户信息(公司规模、行业、语言、地点、兴趣程度)
- 思维导图节点创建的自定义提示支持
- 改进CJK(中文/日语/韩语)文本处理
注册体验更新
注册表单中添加了使用目的和地区的可选字段,以改善入门体验。还添加了国家/地区字段以支持更好的本地化。移动应用更新
- 包含12月所有改进的iOS · Android更新已发布
- 5项UI修复:会议标题应用、占位符文本、默认消息长度、文件上传按钮标签、AI建议按钮位置
- SSO重定向修复:移动深层链接现在可通过SAML SSO认证正确重定向
- 新设置界面:在主屏幕添加设置齿轮图标,将自定义短语和词典管理移至专用设置区域
错误修复
- 修复短消息翻译停滞:非常短的语音(如”Yeah they do.”)可能无法触发翻译的问题
- 修复计划降级通知重复:降级后取消会产生重复通知的问题
- 修复语言检测回归:检测到目标语言时翻译对未正确切换的问题
- 修复注册数据未保存:注册问卷回答暂时未存储的问题,已通过当日热修复解决
- 修复双语模式消息重复:解决了文本修正和语言切换的时序问题
- 修复自定义短语API速率限制:由于状态管理问题导致API达到速率限制,已立即修复
- 修复监听模式损坏:解决了被动会议参与期间监听模式状态损坏的问题
- 修复词典模态框渲染:词典管理模态框显示在其他UI元素后面的问题
UI/UX改进
定价页面刷新
- 修正所有计划描述,使用准确的功能规格
- 术语更新:所有语言中”访客”更改为”监听者”
- 统一所有计划层级的AI准确度显示
- 在分钟显示中添加缺失的”/月”
- 在每个计划卡片中添加商业智能功能指向
其他UI更新
- 发票设置:账单标签重命名为”发票设置” — 可直接从网页和移动端编辑邮箱、电话号码和姓名
- 计划使用量显示:显示计划名称和STT限制、粗体总使用量、账单确认按钮
- 字幕时间戳漂移修复:更精确的播放同步
- 演示模式:自动隐藏词典和笔记面板
- 从所有功能中移除”测试版”标签
