Skip to main content

Riconoscimento Vocale & AI

9 Nuove Lingue ASR

VoicePing supporta ora 9 lingue aggiuntive per la trascrizione vocale in tempo reale: tedesco, thailandese, portoghese, spagnolo, francese, arabo, hindi, indonesiano e malese. Sono stati aggiunti anche nepalese e birmano.

Generazione Automatica di Frasi Personalizzate

Carica un PDF, un file di testo o incolla testo — VoicePing estrae automaticamente il vocabolario specifico del dominio e suggerisce frasi personalizzate per migliorare la precisione del riconoscimento. Il sistema identifica le parole che il modello ASR probabilmente non riconosce correttamente e le aggiunge al dizionario di frasi personalizzate. Supporta tutte le lingue.

Migliore Soppressione delle Allucinazioni

Ridotti gli artefatti di trascrizione comuni (ad es. testo di riempimento ripetuto) grazie a un migliore filtraggio dei dati di addestramento e alla regolazione dell’inferenza, con output di trascrizione piu pulito in tutte le lingue.

Migliore Rilevamento di Enunciati Brevi

Migliorata la stabilita della modalita bilingue per enunciati molto brevi — le risposte rapide vengono ora rilevate piu affidabilmente nella lingua corretta.

Capacita Frasi Personalizzate Aumentata

Il numero massimo di frasi personalizzate per workspace e stato aumentato da 500 a 1.000, con un impatto minimo sulla velocita di riconoscimento.

Velocita Trascrizione Offline (Mobile)

Prestazioni di trascrizione on-device significativamente migliorate su iOS e Android, sostituendo il precedente motore di inferenza offline.

Miglioramenti al Log Riunioni e alle Trascrizioni

Vista Trascrizioni Unificata

L’elenco dei log riunione (con ricerca per parola chiave introdotta a gennaio) e stato riprogettato in un’unica vista unificata, aggiungendo:
  • Filtro per intervallo di date, filtro per tag e filtro per creatore
  • Risultati ordinabili con URL di filtro condivisibili tramite parametri query
  • Disponibile sia su web che su mobile

Download Multiplo di Trascrizioni

Seleziona e scarica piu file di trascrizione direttamente dai risultati di ricerca — ideale per i flussi di lavoro di esportazione dati enterprise.

Riassegnazione dei Parlanti

Espansa la funzionalita di unione dei parlanti (introdotta a gennaio) con un’interfaccia completa di riassegnazione:
  • Riassegna le etichette dei parlanti tra diversi gruppi di trascrizione
  • Rietichettatura in blocco di tutti i segmenti di un parlante verso un altro

Copia negli Appunti

Pulsante di copia con un clic nella pagina del log riunione per copiare il testo completo della trascrizione incluso il riepilogo, per incollarlo rapidamente in strumenti esterni.

Download SRT

Le trascrizioni delle riunioni possono ora essere scaricate in formato SRT (sottotitoli) per l’uso in flussi di lavoro di montaggio video e sottotitolazione.

Correzione Lingua Predefinita del Log Riunioni

Il selettore della lingua del log riunioni ora imposta correttamente come predefinita la lingua di visualizzazione dell’utente invece di usare sempre l’inglese.

Aggiornamenti App Mobile

  • Correzione modalita bilingue: Risolto il bug critico della modalita bilingue su mobile tramite un aggiornamento urgente nello store (v0.5.11)
  • UI modalita bilingue: Layout pulsanti migliorato per schermi mobile piu piccoli
  • Lista trascrizioni unificata: Mobile usa ora la stessa interfaccia di ricerca e filtro dell’app web
  • Nove nuove lingue: Tutte le nuove lingue ASR disponibili su mobile
  • Velocita trascrizione offline: Significativi miglioramenti delle prestazioni per la trascrizione on-device su iOS e Android

Aggiornamenti App Desktop

  • Modalita schermo intero: La modalita di estrazione audio (trascrizione) supporta ora lo schermo intero per una migliore esperienza di presentazione durante eventi dal vivo
  • Durata messaggi configurabile: Durata minima dei messaggi ridotta a 2 secondi per una visualizzazione piu rapida dei sottotitoli nella trascrizione in tempo reale
  • Controllo registrazione dalla barra di sistema: Nuovo menu nella barra di sistema per macOS/Windows per avviare/interrompere la registrazione direttamente dalla barra dei menu senza aprire la finestra principale dell’app

Miglioramenti a Sottotitoli e Didascalie

  • Correzione a capo: Risolti i problemi dove il testo dei sottotitoli andava a capo in modo scomodo nei file video incorporati
  • Posizionamento sottotitoli: Testo dei sottotitoli spostato leggermente verso l’alto per evitare la sovrapposizione con la barra delle applicazioni
  • Correzione dimensione font inglese: Corretta la dimensione del font per testo inglese, numeri e caratteri speciali nel rendering dei sottotitoli
  • Espansione lingue tab didascalie: Il tab didascalie supporta ora tutte le nuove lingue aggiunte per trascrizione video, incorporamento sottotitoli e doppiaggio

Miglioramenti UI/UX

  • Export CSV gruppi e progetti: Esporta le assegnazioni dei membri a gruppi e progetti come CSV per l’allocazione dei costi per reparto e la gestione in blocco
  • Raccolta feedback utenti: Migliorato il flusso di registrazione per raccogliere dati sulla persona e feedback, incluso un campo commento libero
  • Localizzazione giapponese: Completate le traduzioni giapponesi per le intestazioni dell’elenco trascrizioni, le etichette dei filtri e i componenti di navigazione
  • Gestione preferenze email: Nuovo sistema di preferenze email accessibile dai footer delle email — gestisci le iscrizioni alle email di marketing e di sistema senza effettuare il login
  • Condivisione QR code: QR code, download e condivisione URL unificati in un’unica finestra di dialogo

Correzioni di Bug

  • Corretta la visualizzazione delle traduzioni in cinese: Le traduzioni da alcune lingue verso il cinese non venivano visualizzate a causa di un errore nel codice lingua — ora risolto
  • Corretto stato riepilogo infinito: I riepiloghi del log riunione potevano rimanere bloccati nello stato “creazione” — migliorata la gestione del timeout
  • Corretta la modalita mono-lingua hindi: La trascrizione in hindi a volte restituiva inglese anche con la modalita bilingue disattivata — ora correttamente forzato in hindi
  • Corretta la lingua di visualizzazione cinese: La lingua dell’app impostata su cinese non veniva applicata dopo il ricaricamento della pagina
  • Corretta la cronologia trascrizioni in modalita ascoltatore: I dati di trascrizione parziali o non aggiornati in modalita ascoltatore vengono ora visualizzati correttamente

Ricerca e Pubblicazioni

Pubblicati quattro articoli di ricerca:
  1. Traduzione Vocale Offline
  2. Traduzione Voce-in-Voce
  3. Benchmark Trascrizione Vocale Offline
  4. Valutazione TTS Offline