Skip to main content

Spracherkennung & KI

40 % schnellere STT-Inferenz

Die STT-Pipeline wurde aktualisiert und liefert 40 % schnellere Inferenz in allen Sprachen.

Stabilitätskorrekturen im zweisprachigen Modus

Mehrere kritische Korrekturen im zweisprachigen Modus wurden im März eingespielt:
  • Fehler behoben, bei dem die Spracherkennung beim ersten Erkennen auf Mobilgeräten vertauscht war
  • Fehler behoben, bei dem Textkorrektur die Spracherkennung unterbrach (japanische Sprache wurde fälschlicherweise als Englisch transkribiert)
  • Audiofehler behoben, wenn Sprecher die Sprache mitten im Gespräch wechseln
  • Genauigkeit bei kurzen Äußerungen mit adaptiver Audiolaengenerkennung wiederhergestellt

iOS-Audioqualitätsverbesserung

iOS verwendete einen Telefonie-Audiomodus anstelle des Messmodus, der auf Android verwendet wird. Auf den korrekten STT-Audioaufnahme-Modus umgestellt, wodurch die iOS-Audioqualität auf Android-Niveau bei Abständen von 1–2 m gebracht wurde.

Malaiisch-Sprachunterstützung

Malaiisches STT hinzugefügt. Zweisprachiger Modus für Malaiisch ebenfalls hinzugefügt, wobei das Indonesisch/Malaiisch-Paar absichtlich deaktiviert wurde (Sprachumschalten zwischen den beiden kann nicht zuverlässig erkannt werden).

Schnellere Übersetzung

Ein neues Übersetzungsmodell mit deutlich schnellerer Inferenz eingeführt, was die Reaktionsfähigkeit der Echtzeit-Übersetzung verbessert.

Weitere Sprachen in Vorbereitung

Khmer-ASR-Modelltraining gestartet. Weitere Sprachen in Vorbereitung: Kantonesisch, Usbekisch, Polnisch, Niederländisch, Mongolisch und Bengalisch.

Verbesserungen bei Meeting-Protokollen & Transkripten

Anpassbare KI-Meeting-Zusammenfassungsvorlagen

Benutzer können jetzt vor dem Beenden eines Meetings einen Zusammenfassungstyp auswählen. Die KI erstellt eine strukturierte Zusammenfassung, die auf den Meeting-Typ zugeschnitten ist. Sechs Vorlagen sind verfügbar:
  1. Allgemein (Standard) — Überblick, Themen, Aufgabenpunkte
  2. Kundeninterview — Überblick, Kundenbedürfnisse & Signale, nächste Schritte & Risiken
  3. Regelmäßiges Teammeeting / Scrum — Fortschritt, Hindernisse & Risiken, Aufgabenpunkte
  4. HR-Bewerbungsinterview — Kandidatenprofil, Nachweise & Beobachtungen, Bewertung & nächste Schritte
  5. Human-Evaluation-Meeting — Bewertungskontext, besprochene Nachweise, Entscheidung & Follow-Up
  6. Formelle Präsentation — Präsentationsüberblick, wichtige Erkenntnisse, Entscheidungen & Follow-Up
Die Vorlagenauswahl wird pro Benutzer gespeichert und zwischen Web und Mobilgerät synchronisiert.

Volltextsuche in Transkripten (Produktionsstart)

Die Keyword-Volltextsuche wurde mit einer neuen Suchmaschine erheblich verbessert. Wesentliche Verbesserungen:
  • Umfasst 1 Jahr an Transkripten (~11 Millionen Dokumente)
  • Durchsucht Titel, originalen STT-Text und übersetzten Text
  • Präzise CJK-Suche (Japanisch, Chinesisch, Koreanisch) — eine wesentliche Verbesserung gegenüber der vorherigen Engine
  • Phrasensuche mit verbesserter Relevanzbewertung

Freigabeberechtigungen für Meeting-Protokolle

Workspace-Administratoren können jetzt Freigabeeinstellungen für Meeting-Protokolle aktualisieren, auf die sie Lesezugriff haben. Bereits freigegebene Legacy-Protokolle werden beibehalten und können eingeschränkt werden.

Benutzerspezifische Zusammenfassungsvorlagen-Einstellung

Die bevorzugte KI-Zusammenfassungsvorlage jedes Benutzers wird gespeichert und bleibt sitzungsübergreifend erhalten. Das Meeting-Ende-Modal auf Mobilgeräten unterstützt jetzt auch Tags, Notizen und die Auswahl des Zusammenfassungstyps.

Mobile App Updates

v0.5.16 — Umfassende Überarbeitung

  • Fehler beim anfänglichen Sprachverlust behoben auf Mobilgeräten durch vollständige Neuentwicklung der Audio-Pipeline
  • iOS SDK aktualisiert für Tahoe (iOS 26)-Kompatibilität
  • Offline-Übersetzung jetzt auf Android verfügbar
  • Systemaudio-Übersetzung auf iOS: Systemaudio-Wiedergabe übersetzen (z. B. YouTube) anstatt Mikrofoneingabe
  • Vollständige Überarbeitung des Abrechnungsablaufs mit Web-App-Parität — Abrechnungsprotokoll, Rechnungs- und Quittungsdownload hinzugefügt
  • Plan-Wiederherstellungsablauf behoben mit vollständigen Regressionstests für alle Upgrade-/Downgrade-Szenarien

Weitere Mobile-Verbesserungen

  • Automatisches Aktualisieren auf Mobilgeräten nach Beenden der Aufzeichnungssitzung
  • Scroll-Flackern bei der Audiowiedergabe bei kürzeren Transkripten behoben
  • Audio-Hervorhebungs- und Text-Hervorhebungs-Regressionskorrekturen mit Unit-Tests
  • Ersteller-Info (Avatar und Name) zu Suchergebnissen hinzugefügt
  • Beschriftungs-Tab-Unterstützung für alle neuen Transkriptionssprachen
  • Zusammenfassungs-E-Mail-Benachrichtigungsumschalter hinzugefügt (Parität mit Web)
  • Google-Anmeldeproblem behoben

Desktop App Updates

Neugestaltung des Systemtray-Menüs

  • Aufnahme direkt aus dem macOS/Windows-Systemtray starten/stoppen
  • Veraltete Zeiterfassungs- und Tagesberichts-Menüelemente entfernt
  • Vollständige 6-Locale-Unterstützung für Tray-Menübezeichnungen

Fehlerbehebungen

  • Versehentlicher Meeting-Start durch Dropdown-Modal-Klick-Durchgang behoben
  • Inkonsistente Persistenz der Mikrofon-/Präsentationseinstellungen über Sitzungen hinweg behoben
  • Bildschirm-/Fenster-Swap-Blitz beim Moduswechsel behoben

Verbesserungen im Zuhörermodus

  • Zweisprachige Spracheinstellungen für Gäste: Zuhörergäste, die über eine freigegebene URL beitreten, haben jetzt vollständige zweisprachige STT/Übersetzungs-Spracheinstellungen, entsprechend den Workspace-Benutzern
  • Hochgenauigkeitsmodus für Zuhörer: Textkorrektur funktioniert jetzt korrekt für Zuhörersitzungen
  • Chinesische Lokalisierung behoben: Sprachauswahl im Zuhörermodus enthält jetzt korrekt Chinesisch

Verbesserungen bei Untertiteln & Beschriftungen

  • Beschriftungs-Tab-Fortschrittsbalken: Transkriptionsfortschrittsbalken jetzt sofort nach dem Datei-Upload sichtbar und bleibt nach dem Neuladen der Seite erhalten
  • Wiederherstellung von Zeitstempeln auf Wortebene: Fehlende Zeitstempel auf Wortebene im Beschriftungs-Tab behoben
  • Behandlung von Nicht-Sprach-Audio: Hochgeladenes Audio ohne Sprache zeigt jetzt eine klare „keine Sprache erkannt”-Meldung anstatt eines fehlerhaften Zustands
  • Text-Hervorhebungs-Korrektur: Unterbrochene Hervorhebung auf Wortebene bei der Audiowiedergabe behoben

UI/UX-Verbesserungen

  • Abrechnungs-/Abonnementänderungsbildschirme: Verbesserte Auftragsbestätigung und Erfolgsbildschirme mit anteiligem Betrag, Wirksamkeitsdatum und neuem Verlängerungsdatum
  • Freigabe-QR-Code-UI-Neugestaltung: Neuer einheitlicher Freigabe-Dialog in Produktion eingesetzt
  • Vocabulary Builder UI-Korrekturen: Löschbestätigungsmodal, sichtbare Texteingaberänder, korrigierte Aussprache für alphanumerische Kombinationen
  • Planänderungsseite: Verhalten bei der Zurücksetzung des Abrechnungszyklus klarer dargestellt — Nutzung wird beim Upgrade zurückgesetzt, Downgrades gelten ab dem nächsten Zyklus

Fehlerbehebungen

  • Zweisprachiger Modus-Korruption behoben: Japanische Sprache wurde nach der Malaiisch-Hinzufügung fälschlicherweise als Englisch transkribiert
  • Falsche Sprachstatistiken behoben: Sprachvarianten wurden im Nutzungs-Dashboard separat gezählt — jetzt korrekt zusammengefasst
  • Datenverlust in Meeting-Protokollen behoben: Gleichzeitige Transkriptabschluss- und Bereinigungsvorgänge konnten Daten löschen, bevor der Abschluss abgeschlossen war
  • Chinesische Lokalisierung behoben: Fehlendes Chinesisch in Sprachauswahllisten über Transkriptions- und Zuhörermodi hinweg