语音识别·AI
STT推理速度提升40%
升级了STT管道,实现全语言推理速度提升40%。双语模式稳定性修复
3月全月部署了多项关键双语模式修复:- 修复了移动端首次识别时语言检测被交换的问题
- 修复了文本纠正导致语言检测异常(日语语音被错误转录为英语)的问题
- 修复了说话者在对话中切换语言时音频丢失的问题
- 通过自适应音频长度检测恢复了短语音识别准确度
iOS音频质量改善
iOS此前使用的是电话级别的音频模式,而非Android所用的测量模式。已改为正确的STT音频采集模式,使iOS在1-2米距离内的音频质量与Android持平。马来语支持
新增马来语STT支持。同时新增马来语双语模式支持,但印尼语/马来语组合被有意禁用(两者之间的语言切换无法可靠检测)。更快的翻译
部署了新的翻译模型,推理速度大幅提升,改善了实时翻译的响应速度。更多语言即将推出
高棉语ASR模型训练已开始。其他语言正在准备中:粤语、乌兹别克语、波兰语、荷兰语、蒙古语和孟加拉语。会议记录·转录改进
可自定义AI会议摘要模板
用户现在可以在结束会议前选择摘要类型。AI将根据会议类型生成结构化摘要。共提供六种模板:- 通用(默认)— 概述、议题、行动事项
- 客户访谈 — 概述、客户需求与信号、后续步骤与风险
- 定期团队会议 / Scrum — 进展、阻碍与风险、行动事项
- HR招聘面试 — 候选人档案、证据与观察、评估与后续步骤
- 人员评估会议 — 评估背景、讨论证据、决策与跟进
- 正式演示 — 演示概述、关键要点、决策与跟进
转录全文搜索(正式上线)
全文关键词搜索功能通过全新搜索引擎进行了重大升级。主要改进:- 覆盖1年内的转录(约1100万条文档)
- 搜索标题、原始STT文本和翻译文本
- 准确的CJK(日语、中文、韩语)搜索 — 较以往引擎有显著提升
- 支持短语搜索,并提供相关性排序加权
会议记录分享权限
工作区管理员现在可以更新其有读取权限的会议记录的分享设置。旧版已分享的记录会被保留,并可缩小共享范围。每用户摘要模板偏好
每位用户的AI摘要模板偏好会被保存并跨会话持久化。移动端的会议结束弹窗现在也支持标签、备注和摘要类型选择。移动应用更新
v0.5.16 — 重大升级
- 修复初始语音丢失问题:通过完整的音频管道重写解决了移动端问题
- iOS SDK升级至Tahoe(iOS 26)兼容性
- Android现已支持离线翻译
- iOS系统音频翻译:可翻译系统音频播放(如YouTube)而非麦克风输入
- 完整账单流程重构,达到网页端功能对等 — 新增账单记录、发票和收据下载
- 套餐恢复流程修复,覆盖所有升级/降级场景的全面回归测试
其他移动端改进
- 录制结束后移动端自动刷新
- 修复了较短转录音频播放时的滚动闪烁问题
- 音频高亮和文本高亮回归修复,并添加单元测试
- 搜索结果中新增创建者信息(头像和姓名)
- 字幕标签支持所有新增转录语言
- 新增摘要邮件通知开关(与网页端对等)
- 解决了Google登录问题
桌面应用更新
系统托盘菜单重新设计
- 直接从macOS/Windows系统托盘启动/停止录制
- 移除了已弃用的时间追踪和日报菜单项
- 托盘菜单标签完整支持6种语言
错误修复
- 修复了从下拉弹窗点击穿透意外启动会议的问题
- 修复了跨会话麦克风/演示设置持久化不一致的问题
- 修复了切换模式时屏幕/窗口交换闪烁的问题
监听模式改进
- 访客双语语言设置:通过分享URL加入的监听访客现在拥有完整的双语STT/翻译语言设置,与工作区用户一致
- 监听者高精度模式:文本纠正现在对监听会话正确生效
- 中文本地化修复:监听模式中的语言选择器现在正确包含中文
字幕改进
- 字幕标签进度条:文件上传后转录进度条立即可见,且页面刷新后持续显示
- 字级时间戳恢复:修复了字幕标签中缺失的字级时间戳
- 非语音音频处理:上传无语音的音频文件现在会显示清晰的”未检测到语音”提示,而非异常状态
- 文本高亮修复:修复了音频播放时字级高亮失效的问题
UI/UX改进
- 账单/订阅变更页面:改进了订单确认和成功页面,显示按比例计算的金额、生效日期和新的续费日期
- 分享QR码UI重新设计:统一分享对话框已部署至正式环境
- 词汇构建器UI修复:删除确认弹窗、可见文本输入框边框、修复了字母数字组合的发音
- 套餐变更页面:明确说明账单周期重置行为 — 升级时立即重置用量,降级从下一周期生效
错误修复
- 修复双语模式数据损坏:新增马来语后日语语音被错误转录为英语的问题
- 修复错误的语言统计:使用仪表板中语言变体被单独计算 — 现在已正确合并统计
- 修复会议记录数据丢失:并发转录完成和清理操作可能在完成前删除数据的问题
- 修复中文本地化:转录和监听模式的语言选择器列表中缺失中文的问题
