Skip to main content

音声認識・AI

STT推論40%高速化

STTパイプラインを刷新し、すべての言語で40%高速な推論を実現しました。

バイリンガルモード安定性修正

3月を通じて複数の重要なバイリンガルモード修正を展開:
  • モバイルでの初回認識時に言語検出が入れ替わる問題を修正
  • テキスト補正が言語検出を破壊する問題を修正(日本語音声が英語として誤認識される)
  • 会話中に話者が言語を切り替えた際の音声損失を修正
  • 適応的音声長検出により短い発話の精度を復元

iOSオーディオ品質改善

iOSがAndroidで使用されている計測モードの代わりに電話品質のオーディオモードを使用していました。適切なSTTオーディオキャプチャモードに変更し、1〜2mの距離でのiOSオーディオ品質をAndroidと同等にしました。

マレー語対応

マレー語STTを追加。マレー語のバイリンガルモード対応も追加しましたが、インドネシア語/マレー語ペアは意図的に無効化しています(2言語間の言語切り替えを確実に検出できないため)。

翻訳高速化

大幅に高速な推論を持つ新しい翻訳モデルを展開し、リアルタイム翻訳の応答性を改善しました。

追加予定言語

クメール語ASRモデルのトレーニングを開始。準備中の追加言語:広東語、ウズベク語、ポーランド語、オランダ語、モンゴル語、ベンガル語。

議事録・トランスクリプト改善

カスタマイズ可能なAI議事録サマリーテンプレート

会議終了前にサマリータイプを選択できるようになりました。AIは会議タイプに合わせた構造化されたサマリーを生成します。6つのテンプレートが利用可能:
  1. 一般(デフォルト)— 概要、トピック、アクションアイテム
  2. 顧客インタビュー — 概要、顧客ニーズ・シグナル、次のステップ・リスク
  3. 定例チームミーティング / スクラム — 進捗、ブロッカー・リスク、アクションアイテム
  4. 人事採用面接 — 候補者プロフィール、証拠・観察、評価・次のステップ
  5. 人事評価会議 — 評価コンテキスト、議論された証拠、決定・フォローアップ
  6. 公式プレゼンテーション — プレゼン概要、重要なポイント、決定・フォローアップ
テンプレート選択はユーザーごとに保存され、ウェブとモバイルで同期します。

トランスクリプト全文検索(本番リリース)

新しい検索エンジンでフルテキストキーワード検索が大幅にアップグレードされました。主な改善点:
  • 1年分のトランスクリプト(約1,100万件)に対応
  • タイトル、元のSTTテキスト、翻訳テキストを検索
  • CJK(日本語・中国語・韓国語)検索の精度向上 — 旧エンジンからの大幅改善
  • ブーストされた関連性スコアリングによるフレーズ検索

議事録共有権限

ワークスペース管理者が読み取りアクセス権を持つ議事録の共有設定を更新できるようになりました。既存の共有済み議事録は保持され、範囲を絞り込むことができます。

ユーザーごとのサマリーテンプレート設定

各ユーザーの優先AIサマリーテンプレートが保存され、セッション間で持続します。モバイルの会議終了モーダルでもタグ、メモ、サマリータイプの選択に対応しました。

モバイルアプリ更新

v0.5.16 — 大規模刷新

  • 初回音声損失バグ修正:完全なオーディオパイプライン書き直しにより解決
  • iOS SDKをTahoe(iOS 26)互換にアップグレード
  • Androidでのオフライン翻訳が利用可能に
  • iOSでのシステムオーディオ翻訳:マイク入力の代わりにシステムオーディオ再生(YouTubeなど)を翻訳
  • 請求フロー全面刷新:ウェブアプリと同等 — 請求ログ、請求書・領収書のダウンロードを追加
  • プラン復元フローを修正:すべてのアップグレード・ダウングレードシナリオで完全な回帰テスト済み

その他モバイル改善

  • 録音セッション終了後のモバイル自動更新
  • 短いトランスクリプトでの音声再生中のスクロールちらつき修正
  • 音声ハイライトとテキストハイライトの回帰バグ修正(ユニットテスト付き)
  • 検索結果に作成者情報(アバターと名前)を追加
  • すべての新しい文字起こし言語のキャプションタブ対応
  • サマリーメール通知トグルを追加(ウェブとの同等性)
  • Googleサインインの問題を解決

デスクトップアプリ更新

システムトレイメニューのリデザイン

  • macOS/Windowsシステムトレイから直接録音の開始・停止
  • 廃止されたタイムトラッキングと日次レポートのメニュー項目を削除
  • トレイメニューラベルの6言語対応

バグ修正

  • ドロップダウンモーダルのクリックスルーによる誤った会議開始を修正
  • セッション間でマイク・プレゼンテーション設定が一貫して保持されない問題を修正
  • モード切り替え時の画面・ウィンドウスワップフラッシュを修正

リスナーモード改善

  • ゲストのバイリンガル言語設定:共有URLから参加するリスナーゲストが、ワークスペースユーザーと同様にバイリンガルSTT・翻訳言語設定を持てるようになりました
  • リスナー向け高精度モード:テキスト補正がリスナーセッションで正しく機能するように
  • 中国語ローカライゼーション修正:リスナーモードの言語セレクターに中国語が正しく含まれるように

字幕・キャプション改善

  • キャプションタブ進捗バー:ファイルアップロード直後から文字起こし進捗バーが表示され、ページ再読み込み後も持続
  • 単語レベルタイムスタンプ復元:キャプションタブで欠落していた単語レベルのタイムスタンプを修正
  • 非音声オーディオ処理:音声のないアップロードされたオーディオが壊れた状態ではなく「音声が検出されませんでした」と明確に表示
  • テキストハイライト修正:音声再生中の単語レベルハイライトの不具合を修正

UI/UX改善

  • 請求・プラン変更画面:按分金額、有効日、新しい更新日を表示する注文確認・成功画面を改善
  • QRコード共有UIのリデザイン:新しい統一共有ダイアログを本番環境に展開
  • ボキャブラリービルダーUI修正:削除確認モーダル、テキスト入力ボーダーの可視化、英数字の組み合わせの発音修正
  • プラン変更ページ:請求サイクルリセットの動作を明確化 — アップグレード時に使用量がリセット、ダウングレードは次のサイクルから適用

バグ修正

  • バイリンガルモード破損の修正:マレー語追加後に日本語音声が英語として誤認識される問題を修正
  • 誤った言語統計の修正:使用状況ダッシュボードで言語バリアントが別々にカウントされていた問題を修正 — 適切に集計されるように
  • 議事録データ損失の修正:トランスクリプトの最終処理とクリーンアップが同時に行われ、最終処理完了前にデータが削除される可能性がある問題を修正
  • 中国語ローカライゼーション修正:文字起こしとリスナーモードの言語セレクターリストで中国語が欠落していた問題を修正