Skip to main content

Spracherkennung & KI

9 neue ASR-Sprachen

VoicePing unterstützt jetzt 9 weitere Sprachen für Echtzeit-Sprache-zu-Text: Deutsch, Thai, Portugiesisch, Spanisch, Französisch, Arabisch, Hindi, Indonesisch und Malaiisch. Nepali und Myanmar wurden ebenfalls hinzugefügt.

Automatische Generierung benutzerdefinierter Phrasen

Laden Sie eine PDF-, Textdatei hoch oder fügen Sie Rohtext ein — VoicePing extrahiert automatisch fachspezifisches Vokabular und schlägt benutzerdefinierte Phrasen vor, um die Erkennungsgenauigkeit zu verbessern. Das System identifiziert Wörter, die das ASR-Modell wahrscheinlich falsch erkennt, und fügt sie Ihrem benutzerdefinierten Phrasenwörterbuch hinzu. Unterstützt alle Sprachen.

Verbesserte Unterdrückung von Halluzinationen

Reduzierte häufige Transkriptionsartefakte (z. B. wiederholter Fülltext) durch verbesserte Trainingsdatenfilterung und Inferenz-Tuning, was zu saubererem Transkriptionsoutput in allen Sprachen führt.

Bessere Erkennung kurzer Äußerungen

Verbesserte Stabilität des zweisprachigen Modus bei sehr kurzen Äußerungen — kurze Antworten werden jetzt zuverlässiger in der richtigen Sprache erkannt.

Erhöhte Kapazität für benutzerdefinierte Phrasen

Die maximale Anzahl benutzerdefinierter Phrasen pro Workspace wurde von 500 auf 1.000 erhöht, mit minimaler Auswirkung auf die Erkennungsgeschwindigkeit.

Offline-Transkriptionsgeschwindigkeit (Mobil)

Deutlich verbesserte On-Device-Transkriptionsleistung auf iOS und Android durch Ersetzen der vorherigen Offline-Inferenz-Engine.

Verbesserungen bei Meeting-Protokollen & Transkripten

Einheitliche Transkriptansicht

Die Meeting-Protokollliste (mit Keyword-Suche, eingeführt im Januar) wurde zu einer einzigen einheitlichen Ansicht umgestaltet und bietet nun:
  • Datumsbereichsfilterung, Tag-Filterung und Ersteller-Filterung
  • Sortierbare Ergebnisse mit teilbaren Filter-URLs über Query-Parameter
  • Verfügbar auf Web und Mobilgerät

Massen-Transkript-Download

Wählen und laden Sie mehrere Transkriptdateien direkt aus den Suchergebnissen herunter — ideal für unternehmensweite Datenexport-Workflows.

Sprecherzuweisung

Erweitert die Funktion „Sprecher zusammenführen” (eingeführt im Januar) mit einer vollständigen Neuzuweisungs-Oberfläche:
  • Sprecherbezeichnungen neu zuweisen über verschiedene Transkriptgruppen hinweg
  • Massenumbenennung aller Segmente von einem Sprecher auf einen anderen

In die Zwischenablage kopieren

Ein-Klick-Kopierschaltfläche auf der Meeting-Protokollseite zum Kopieren des vollständigen Transkripttextes einschließlich Zusammenfassung für schnelles Einfügen in externe Tools.

SRT-Download

Meeting-Transkripte können jetzt im SRT-Format (Untertitel) für die Verwendung in Videobearbeitungs- und Untertitel-Workflows heruntergeladen werden.

Standardsprachenkorrektur im Meeting-Protokoll

Die Sprachauswahl im Meeting-Protokoll verwendet jetzt standardmäßig korrekt die Anzeigesprache des Benutzers anstatt immer Englisch.

Mobile App Updates

  • Zweisprachiger Modus-Fehler behoben: Kritischer Fehler im mobilen zweisprachigen Modus durch beschleunigtes App-Store-Update behoben (v0.5.11)
  • Zweisprachiger Modus UI: Verbessertes Schaltflächenlayout für kleinere Mobilbildschirme
  • Einheitliche Transkriptliste: Mobile verwendet jetzt dieselbe Such- und Filteroberfläche wie die Web-App
  • Neun neue Sprachen: Alle neu hinzugefügten ASR-Sprachen auf Mobilgeräten verfügbar
  • Offline-Transkriptionsgeschwindigkeit: Signifikante Leistungsverbesserungen für On-Device-Transkription auf iOS und Android

Desktop App Updates

  • Vollbildmodus: Der Audioextraktionsmodus (Transkription) unterstützt jetzt den Vollbildmodus für ein besseres Präsentationserlebnis bei Live-Events
  • Konfigurierbare Nachrichtendauer: Mindest-Nachrichtendauer auf 2 Sekunden reduziert für schnellere Untertitelanzeige bei der Echtzeit-Transkription
  • Systemtray-Aufnahmesteuerung: Neues Systemtray-Menü für macOS/Windows zum Starten/Stoppen der Aufnahme direkt aus der Menüleiste ohne Öffnen des Hauptanwendungsfensters

Verbesserungen bei Untertiteln & Beschriftungen

  • Zeilenumbruch-Korrektur: Probleme behoben, bei denen Untertiteltext in eingebetteten Videodateien unvorteilhaft über Zeilen brach
  • Untertitelpositionierung: Untertiteltext leicht nach oben verschoben, um Überlappungen mit der System-Taskleiste zu vermeiden
  • Englische Schriftgröße behoben: Schriftgrößen für englischen Text, Zahlen und Sonderzeichen in der Untertitel-Darstellung korrigiert
  • Spracherweiterung im Beschriftungs-Tab: Beschriftungs-Tab unterstützt jetzt alle neu hinzugefügten Sprachen für Videotranskription, Untertitel-Einbettung und Synchronisation

UI/UX-Verbesserungen

  • CSV-Export für Gruppen und Projekte: Exportieren Sie Gruppen- und Projektmitgliedszuweisungen als CSV für Abteilungskostenzuordnung und Massenverwaltung
  • Benutzer-Feedback-Sammlung: Verbesserter Anmeldevorgang zur Erfassung von Persona- und Feedback-Daten, einschließlich eines Freitext-Kommentarfeldes
  • Japanische Lokalisierung: Japanische Übersetzungen für Transkriptlisten-Header, Filterbezeichnungen und Navigationskomponenten vervollständigt
  • E-Mail-Präferenzverwaltung: Neues E-Mail-Präferenzsystem zugänglich über E-Mail-Fußzeilen — verwalten Sie Marketing- und System-E-Mail-Abonnements ohne Anmelden
  • QR-Code-Freigabe: QR-Code, Download und URL-Freigabe in einem einzigen Dialog vereinheitlicht

Fehlerbehebungen

  • Übersetzungsanzeige für Chinesisch behoben: Übersetzungen aus bestimmten Sprachen ins Chinesische wurden aufgrund einer Sprachcode-Fehlanpassung nicht angezeigt — jetzt behoben
  • Endloser Zusammenfassungsstatus behoben: Meeting-Protokollzusammenfassungen konnten im Status „wird erstellt” hängen bleiben — verbesserte Timeout-Behandlung
  • Hindi-Einsprachigkeitsmodus behoben: Hindi-Transkription gab manchmal Englisch zurück, obwohl der zweisprachige Modus deaktiviert war — jetzt korrekt auf Hindi erzwungen
  • Chinesische Anzeigesprache behoben: App-Sprache auf Chinesisch eingestellt, wurde nach dem Neuladen der Seite nicht übernommen
  • Zuhörermodus-Transkriptverlauf behoben: Unvollständige oder veraltete Transkriptdaten im Zuhörermodus werden jetzt korrekt angezeigt

Forschung & Veröffentlichungen

Vier Forschungs-Blogbeiträge veröffentlicht:
  1. Offline-Sprachübersetzung
  2. Sprache-zu-Sprache-Übersetzung
  3. Offline-Sprachtranskriptions-Benchmark
  4. Offline TTS Evaluation