Skip to main content

Nhận Dạng Giọng Nói & AI

9 Ngôn Ngữ ASR Mới

VoicePing hiện hỗ trợ thêm 9 ngôn ngữ cho chuyển văn bản giọng nói theo thời gian thực: tiếng Đức, Thái, Bồ Đào Nha, Tây Ban Nha, Pháp, Ả Rập, Hindi, Indonesia và Mã Lai. Tiếng Nepal và Myanmar cũng được bổ sung.

Tự Động Tạo Cụm Từ Tùy Chỉnh

Tải lên PDF, file văn bản, hoặc dán văn bản thô — VoicePing tự động trích xuất từ vựng chuyên ngành và đề xuất các cụm từ tùy chỉnh để cải thiện độ chính xác nhận dạng. Hệ thống xác định các từ mà mô hình ASR có khả năng nhận sai và thêm chúng vào từ điển cụm từ tùy chỉnh của bạn. Hỗ trợ tất cả ngôn ngữ.

Cải Thiện Triệt Tiêu Ảo Giác

Giảm thiểu các lỗi phiên âm phổ biến (ví dụ: văn bản điền lặp lại) thông qua cải thiện bộ lọc dữ liệu huấn luyện và tinh chỉnh suy luận, cho ra kết quả phiên âm sạch hơn trên tất cả các ngôn ngữ.

Phát Hiện Câu Ngắn Tốt Hơn

Cải thiện tính ổn định của chế độ song ngữ cho các câu nói rất ngắn — các phản hồi ngắn hiện được nhận diện đúng ngôn ngữ một cách đáng tin cậy hơn.

Tăng Dung Lượng Cụm Từ Tùy Chỉnh

Số lượng cụm từ tùy chỉnh tối đa mỗi workspace đã được tăng từ 500 lên 1.000, với tác động tối thiểu đến tốc độ nhận dạng.

Tốc Độ Phiên Âm Offline (Di Động)

Cải thiện đáng kể hiệu suất phiên âm trên thiết bị cho cả iOS và Android, thay thế engine suy luận offline trước đây.

Cải Tiến Nhật Ký Cuộc Họp & Transcript

Giao Diện Transcript Thống Nhất

Danh sách nhật ký cuộc họp (với tìm kiếm từ khóa được giới thiệu vào tháng 1) đã được thiết kế lại thành một giao diện thống nhất, bổ sung:
  • Lọc theo khoảng thời gian, lọc tag và lọc người tạo
  • Kết quả có thể sắp xếp với URL bộ lọc có thể chia sẻ qua tham số truy vấn
  • Có sẵn trên cả web và di động

Tải Xuống Transcript Theo Lô

Chọn và tải xuống nhiều file transcript trực tiếp từ kết quả tìm kiếm — lý tưởng cho quy trình xuất dữ liệu doanh nghiệp.

Gán Lại Người Nói

Mở rộng tính năng gộp người nói (giới thiệu vào tháng 1) với UI gán lại đầy đủ:
  • Gán lại nhãn người nói trên các nhóm transcript khác nhau
  • Đổi nhãn hàng loạt tất cả đoạn từ một người nói sang người nói khác

Sao Chép Vào Clipboard

Nút sao chép một cú nhấp trên trang nhật ký cuộc họp để sao chép toàn bộ văn bản transcript bao gồm tóm tắt, để dán nhanh vào các công cụ bên ngoài.

Tải Xuống SRT

Transcript cuộc họp hiện có thể được tải xuống định dạng SRT (phụ đề) để sử dụng trong quy trình chỉnh sửa video và phụ đề.

Sửa Ngôn Ngữ Mặc Định Nhật Ký Cuộc Họp

Bộ chọn ngôn ngữ nhật ký cuộc họp hiện mặc định đúng theo ngôn ngữ hiển thị của người dùng thay vì luôn mặc định tiếng Anh.

Cập Nhật Ứng Dụng Di Động

  • Sửa lỗi chế độ song ngữ: Lỗi nghiêm trọng trong chế độ song ngữ di động được giải quyết qua bản cập nhật app store khẩn cấp (v0.5.11)
  • UI chế độ song ngữ: Cải thiện bố cục nút cho màn hình di động nhỏ hơn
  • Danh sách transcript thống nhất: Di động hiện sử dụng cùng giao diện tìm kiếm và lọc như ứng dụng web
  • Chín ngôn ngữ mới: Tất cả ngôn ngữ ASR mới được thêm có sẵn trên di động
  • Tốc độ phiên âm offline: Cải thiện hiệu suất đáng kể cho phiên âm trên thiết bị trên cả iOS và Android

Cập Nhật Ứng Dụng Desktop

  • Chế độ toàn màn hình: Chế độ trích xuất âm thanh (phiên âm) hiện hỗ trợ toàn màn hình để trải nghiệm thuyết trình tốt hơn trong các sự kiện trực tiếp
  • Thời lượng tin nhắn có thể cấu hình: Thời lượng tin nhắn tối thiểu giảm xuống 2 giây để hiển thị phụ đề nhanh hơn trong phiên âm thời gian thực
  • Điều khiển ghi âm qua system tray: Menu system tray mới cho macOS/Windows để bắt đầu/dừng ghi âm trực tiếp từ thanh menu mà không cần mở cửa sổ ứng dụng chính

Cải Tiến Phụ Đề

  • Sửa lỗi ngắt dòng: Giải quyết các vấn đề văn bản phụ đề bị ngắt dòng lạ trong file video nhúng
  • Vị trí phụ đề: Di chuyển văn bản phụ đề lên một chút để tránh chồng lên thanh taskbar của hệ thống
  • Sửa kích thước font tiếng Anh: Sửa kích thước font cho văn bản tiếng Anh, số và ký tự đặc biệt trong hiển thị phụ đề
  • Mở rộng ngôn ngữ tab caption: Tab caption hiện hỗ trợ tất cả ngôn ngữ mới được thêm cho phiên âm video, nhúng phụ đề và lồng tiếng

Cải Tiến UI/UX

  • Xuất CSV nhóm và dự án: Xuất phân công thành viên nhóm và dự án dưới dạng CSV để phân bổ chi phí bộ phận và quản lý hàng loạt
  • Thu thập phản hồi người dùng: Cải tiến luồng đăng ký để thu thập dữ liệu persona và phản hồi, bao gồm trường bình luận tự do
  • Bản địa hóa tiếng Nhật: Hoàn thành bản dịch tiếng Nhật cho tiêu đề danh sách transcript, nhãn bộ lọc và các thành phần điều hướng
  • Quản lý tùy chọn email: Hệ thống tùy chọn email mới có thể truy cập từ footer email — quản lý đăng ký email marketing và hệ thống mà không cần đăng nhập
  • Chia sẻ mã QR: Thống nhất mã QR, tải xuống và chia sẻ URL vào một hộp thoại duy nhất

Sửa Lỗi

  • Sửa hiển thị dịch thuật tiếng Trung: Dịch thuật từ một số ngôn ngữ sang tiếng Trung không hiển thị do lỗi mã ngôn ngữ — đã được giải quyết
  • Sửa trạng thái tóm tắt vô tận: Tóm tắt nhật ký cuộc họp có thể bị kẹt ở trạng thái “đang tạo” — cải thiện xử lý timeout
  • Sửa chế độ đơn ngữ Hindi: Phiên âm tiếng Hindi đôi khi trả về tiếng Anh dù đã tắt chế độ song ngữ — hiện được buộc đúng sang tiếng Hindi
  • Sửa ngôn ngữ hiển thị tiếng Trung: Ngôn ngữ ứng dụng đặt thành tiếng Trung không phản ánh sau khi tải lại trang
  • Sửa lịch sử transcript chế độ nghe: Dữ liệu transcript một phần hoặc cũ trong chế độ nghe hiện hiển thị đúng

Nghiên Cứu & Công Bố

Đã công bố bốn bài nghiên cứu:
  1. Dịch Thuật Giọng Nói Offline
  2. Dịch Thuật Giọng Nói sang Giọng Nói
  3. Benchmark Phiên Âm Giọng Nói Offline
  4. Đánh Giá TTS Offline