Skip to main content

การรู้จำเสียงพูด & AI

โหมดสองภาษา (ใหม่)

VoicePing รองรับการถอดความเสียงพูดสองภาษาแบบเรียลไทม์ — พูดได้สองภาษาในการประชุมเดียวกัน ระบบจะถอดความและแปลทั้งสองภาษาพร้อมกันโดยไม่ต้องสลับเอง จุดเด่นหลัก:
  • ความหน่วงต่ำกว่า 200ms สำหรับการตรวจจับภาษาและการถอดความ
  • รองรับคู่ภาษา ญี่ปุ่น-อังกฤษ, จีนตัวย่อ-อังกฤษ และจีนตัวเต็ม-อังกฤษ
  • ไม่ต้องสลับภาษาเอง — ระบบตรวจจับภาษาที่พูดโดยอัตโนมัติ

ความแม่นยำสำหรับประโยคสั้น

ลดปัญหาการถอดความผิดพลาดกับประโยคสั้น (เช่น คำตอบสั้นๆ อย่าง “ใช่” หรือ “そうですね”) ที่เคยทำให้เกิดการถอดความที่ไม่ถูกต้อง ปรับปรุงเกณฑ์การตรวจจับและการกรองเพื่อการรับรู้วลีสั้นที่เชื่อถือได้มากขึ้น

การปรับปรุง Speaker Diarization

  • โมเดลระบุตัวผู้พูดที่ปรับปรุงแล้ว แม่นยำยิ่งขึ้นสำหรับภาษาที่ไม่ใช่ภาษาอังกฤษ
  • ฟีเจอร์ รวมผู้พูด ใหม่ — รวมผู้พูดที่ถูกแยกผิดพลาดในบันทึกการถอดความด้วยตนเอง
  • ความแม่นยำในการแยกผู้พูดภาษาที่ไม่ใช่ภาษาอังกฤษดีขึ้น

ฟีเจอร์ใหม่

ค้นหาคำสำคัญในบันทึกการถอดความ

ค้นหาในบันทึกการถอดความการประชุมทั้งหมดด้วยคำสำคัญ ผลลัพธ์จะไฮไลต์ข้อความที่ตรงกันและเลื่อนไปยังส่วนที่เกี่ยวข้องโดยตรง ฟีเจอร์ต่างๆ ได้แก่:
  • ค้นหาเต็มรูปแบบในชื่อบันทึกการถอดความ, สรุป และเนื้อหาที่พูด
  • ใช้งานได้กับทุกภาษา
  • รองรับการป้อนข้อมูลด้วย Japanese IME
  • ผลลัพธ์แบบแบ่งหน้าพร้อมตัวอย่างข้อความที่ตรงกัน

การดึงวลีที่กำหนดเองอัตโนมัติ (ตัวอย่าง)

ตัวอย่างล่วงหน้าของระบบอัตโนมัติที่ระบุคำที่โมเดล ASR มักจำผิด และแนะนำวลีที่กำหนดเองเพื่อเพิ่ม เวอร์ชันเต็มพร้อมการอัปโหลด PDF/เอกสารจะเปิดตัวในเดือนกุมภาพันธ์

ประวัติการถอดความในโหมดผู้ฟัง

ผู้ฟังสามารถบันทึกบันทึกการถอดความและแปลไว้ในเบราว์เซอร์มือถือได้แล้ว ข้อความจะรีเซ็ตเมื่อเซสชันของโฮสต์เปลี่ยน โฮสต์สามารถเปิดหรือปิดฟีเจอร์นี้จากตัวเลือกการแชร์

รองรับภาษาจีนตัวย่อและตัวเต็ม

VoicePing รองรับทั้งภาษาจีนตัวย่อ (zh-CN) และจีนตัวเต็ม (zh-TW) อย่างครบถ้วนใน:
  • อินเตอร์เฟซแอปเว็บและแอปมือถือ
  • อีเมลแจ้งเตือน
  • คำอธิบายราคาและแผน
  • ลิงก์เอกสาร (manual.voiceping.net/zh และ manual.voiceping.net/zh-tw)

การปรับปรุง Data Intelligence

  • การวิเคราะห์การขาย: อัตราส่วนการพูด, การตรวจจับคำเติมแต่ละภาษา
  • PM Dashboard: Word cloud, การวิเคราะห์ความรู้สึก, การติดตามความไม่เห็นด้วย และอัตราส่วนการพูด
  • รองรับภาษาญี่ปุ่น, อังกฤษ, จีนตัวย่อ, จีนตัวเต็ม และเกาหลี

การปรับปรุงคำบรรยายและซับไตเติ้ล

  • ความยาวขั้นต่ำสั้นลง: ไฟล์ที่พากย์เสียงสามารถสั้นเพียง 30 วินาที (เดิม 60 วินาที)
  • อัปโหลดหลายไฟล์: เลือกและอัปโหลดไฟล์วิดีโอหลายไฟล์พร้อมกัน
  • แก้ไขข้อความโดยตรง: คลิกที่ข้อความซับไตเติ้ลเพื่อแก้ไข — ไม่ต้องใช้ไอคอนดินสออีกต่อไป บันทึกอัตโนมัติเมื่อออกจากช่องป้อนข้อมูล
  • ความคืบหน้าแบบเรียลไทม์: อัปเดตสถานะสดสำหรับการอัปโหลด, การถอดความ, การแปล, การฝังซับ และการพากย์เสียงพร้อมเปอร์เซ็นต์ความคืบหน้า
  • การแจ้งเตือนการประมวลผล: ข้อความ “เราจะส่งอีเมลถึงคุณ” จะแสดงสำหรับงานฝังซับและพากย์เสียง
  • แก้ไข Thumbnail: ไฟล์ MP4 แบบเสียงอย่างเดียว (ไม่มีสตรีมวิดีโอ) จะแสดง placeholder สีเทาแทนการแสดงข้อผิดพลาด

การปรับปรุง Meeting Log และการดาวน์โหลด

  • จำนวนผู้เข้าร่วมทั้งหมด รวมอยู่ใน meeting log ที่ดาวน์โหลด
  • ดาวน์โหลด PDF: รูปแบบ PDF ใหม่ที่เบากว่า — ขนาดไฟล์ลดจาก 446KB เหลือ 82KB สำหรับบันทึกการถอดความเดียวกัน พร้อมรองรับ CJK font ครบถ้วน
  • ชื่อไฟล์ที่ปรับปรุง: เพิ่มเวลาเริ่มต้นการประชุมเป็น prefix เพื่อการเรียงลำดับที่ง่ายขึ้น
  • ไฟล์พจนานุกรมการแปล: ใช้ชื่อไฟล์เฉพาะภาษาแทนชื่อทั่วไป

อัปเดตแอปมือถือ

  • เปิดตัว v0.5.10 สำหรับทั้ง iOS และ Android
  • โหมดสองภาษา พร้อมใช้งานบนมือถือ
  • แก้ไขการซ้ำกันของข้อความ ในระหว่างการถอดความบนมือถือ
  • แก้ไขการเสียหายของภาษาในบันทึกการถอดความ ในโหมดสองภาษาเมื่อเปิดใช้ AI summary
  • แก้ไขบั๊กคู่ภาษาเดียวกัน: แสดงภาษาที่ถูกต้องเมื่อเลือกคู่ภาษาเดียวกัน

แก้ไขบั๊ก

  • แก้ไขการรั่วไหลของ CPU ในแอปเดสก์ท็อปที่เกิดจาก CSS animation วนลูปไม่สิ้นสุดหลังจากสิ้นสุดเซสชัน
  • แก้ไขภาษาเริ่มต้นเป็นอิตาลี: ผู้ใช้ใหม่ถูกกำหนดภาษาอิตาลีเป็นค่าเริ่มต้นผิดพลาด
  • แก้ไขเลย์เอาต์เสียหาย เมื่อเปลี่ยนภาษาในแอปเว็บ
  • แก้ไขการโหลด avatar/รูปภาพ ในบางเบราว์เซอร์ (Brave, Sidekick)

การปรับปรุง UI/UX

  • Bottom bar responsive layout: ปุ่มแอ็คชันไม่ถูกซ่อนบนหน้าจอแล็ปท็อปขนาดเล็กอีกต่อไป
  • การออกแบบดาวน์โหลดซับไตเติ้ลใหม่: ปุ่มโดยตรงสำหรับดาวน์โหลด Video, Subtitle และ Dubbing พร้อมสถานะสีต่างๆ
  • แก้ไขการเลื่อนด้านซ้าย: เมนู Data Intelligence รวมเป็น dropdown
  • ขนาดไฟล์อัปโหลดสูงสุด (25MB) แสดงอย่างชัดเจนใน UI การอัปโหลด
  • การเลือก meeting log: คลิกได้ทุกที่บนแถวชื่อการประชุม
  • การตั้งค่า virtual office ซ่อนอย่างถูกต้องในโหมดถอดความ