Skip to main content

语音识别·AI

自定义短语自动生成

上传PDF、文本文件或粘贴文本,自动提取领域特定词汇,并建议自定义短语以提高识别准确度。系统识别ASR模型容易误识别的词语,并将其添加到自定义短语词典中。支持所有语言。

幻觉抑制改善

通过改进训练数据过滤和推理调优,减少了常见的转录伪影(如重复填充文本),在所有语言中实现更清洁的转录输出。

短语音检测改善

双语模式下短语音的稳定性提高。短回答现在能更准确地以正确的语言被检测到。

自定义短语容量增加

每个工作区的最大自定义短语数从500增加到1,000。对识别速度的影响极小。

会议记录·转录改进

统一转录视图

会议记录列表(1月引入的关键词搜索功能)已重新设计为统一视图:
  • 日期范围筛选、标签筛选和创建者筛选
  • 可排序结果和通过查询参数的可共享筛选URL
  • 网页和移动端均可使用

批量转录下载

从搜索结果中选择并下载多个转录文件。非常适合企业数据导出。

话者重新分配

扩展了1月引入的话者合并功能,添加了完整的重新分配UI:
  • 在不同转录组之间重新分配话者标签
  • 将一个话者的所有片段批量重新标注给另一个话者

复制到剪贴板

会议记录页面的一键复制按钮,可复制包含摘要在内的完整转录文本。

SRT下载

会议转录现在可以SRT(字幕)格式下载,用于视频编辑和字幕工作流程。

会议记录语言默认值修复

会议记录的语言选择器现在默认使用用户的显示语言,而不是始终默认英语。

移动应用更新

  • 双语模式修复:通过紧急应用商店更新解决了关键错误
  • 双语模式UI:为较小的移动屏幕改进了按钮布局
  • 统一转录列表:移动端现在使用与网页应用相同的搜索和筛选界面
  • 9种新语言:所有新增的ASR语言在移动端可用
  • 离线转录速度:iOS · Android上的设备端性能大幅提升

桌面应用更新

  • 全屏模式:音频提取(转录)模式现在支持全屏,为直播活动提供更好的演示体验
  • 消息显示时间设置:最小消息显示时间缩短至2秒,用于更快的实时字幕显示

字幕·标题改进

  • 换行修复:解决了嵌入式视频文件中字幕文本不自然换行的问题
  • 字幕位置调整:将字幕文本稍微上移,避免与系统任务栏重叠
  • 英语字体大小修复:修正了字幕渲染中英语文本、数字和特殊字符的字体大小

UI/UX改进

  • 组和项目CSV导出:将组和项目成员分配导出为CSV,用于部门成本分配和批量管理
  • 用户反馈收集:增强注册流程以收集角色和反馈数据,包括自由格式评论字段
  • 日语本地化:完成了转录列表标题、筛选标签和导航组件的日语翻译
  • 邮件偏好管理:可从邮件页脚无需登录即可管理营销和系统邮件的订阅偏好

错误修复

  • 修复中文翻译显示:由于语言代码不匹配,某些语言到中文的翻译无法显示的问题已解决
  • 修复摘要无限创建状态:会议记录摘要可能卡在”创建中”状态 — 改进了超时处理
  • 修复分词器加载:新语言的扩展词汇标记未能正确加载,导致空的转录结果
  • 修复印地语单语模式:禁用双语模式时印地语转录有时返回英语 — 现在正确强制为印地语

研究·出版

发布了四篇研究博客文章:
  1. 离线语音翻译
  2. 语音到语音翻译
  3. 离线语音转录基准测试
  4. 离线TTS评估
如有任何问题,请通过此表单与我们联系。
## 官方链接