Skip to main content

การรู้จำเสียงพูด & AI

STT Inference เร็วขึ้น 40%

อัปเกรดระบบ STT ให้ inference เร็วขึ้น 40% ในทุกภาษา

แก้ไขความเสถียรของโหมดสองภาษา

แก้ไขโหมดสองภาษาหลายรายการที่สำคัญตลอดเดือนมีนาคม:
  • แก้ไขการตรวจจับภาษาสลับในการรู้จำครั้งแรกบนมือถือ
  • แก้ไขการแก้ไขข้อความที่ทำให้การตรวจจับภาษาเสียหาย (เสียงภาษาญี่ปุ่นถูกถอดความเป็นภาษาอังกฤษผิดพลาด)
  • แก้ไขเสียงหายเมื่อผู้พูดสลับภาษากลางการสนทนา
  • ความแม่นยำสำหรับประโยคสั้นกลับมาพร้อมการตรวจจับความยาวเสียงแบบปรับตัว

การปรับปรุงคุณภาพเสียง iOS

iOS ใช้โหมดเสียงระดับโทรศัพท์แทนโหมดวัดผลที่ใช้บน Android เปลี่ยนเป็นโหมดรับเสียง STT ที่เหมาะสม ทำให้คุณภาพเสียง iOS เทียบเท่า Android ในระยะ 1-2 เมตร

รองรับภาษามาเลย์

เพิ่ม STT ภาษามาเลย์ รองรับโหมดสองภาษาสำหรับภาษามาเลย์ด้วย โดยจงใจปิดใช้งานคู่อินโดนีเซีย/มาเลย์ (ไม่สามารถตรวจจับการสลับภาษาระหว่างทั้งสองได้อย่างน่าเชื่อถือ)

การแปลที่เร็วขึ้น

ใช้งานโมเดลการแปลใหม่ที่ inference เร็วขึ้นอย่างมีนัยสำคัญ ปรับปรุงการตอบสนองการแปลแบบเรียลไทม์

ภาษาเพิ่มเติมกำลังมา

เริ่มฝึก ASR โมเดลภาษาเขมร ภาษาเพิ่มเติมที่อยู่ระหว่างเตรียม: กวางตุ้ง, อุซเบก, โปแลนด์, ดัตช์, มองโกเลีย และเบงกาลี

การปรับปรุง Meeting Log และบันทึกการถอดความ

เทมเพลต AI Summary การประชุมที่ปรับแต่งได้

ผู้ใช้สามารถเลือกประเภทสรุปก่อนสิ้นสุดการประชุมได้แล้ว AI จะสร้างสรุปที่มีโครงสร้างเหมาะสมกับประเภทการประชุม มีเทมเพลตหกแบบ:
  1. ทั่วไป (ค่าเริ่มต้น) — ภาพรวม, หัวข้อ, รายการที่ต้องดำเนินการ
  2. สัมภาษณ์ลูกค้า — ภาพรวม, ความต้องการและสัญญาณของลูกค้า, ขั้นตอนถัดไปและความเสี่ยง
  3. ประชุมทีมประจำ / Scrum — ความคืบหน้า, ปัญหาและความเสี่ยง, รายการที่ต้องดำเนินการ
  4. สัมภาษณ์สรรหา HR — โปรไฟล์ผู้สมัคร, หลักฐานและการสังเกต, การประเมินและขั้นตอนถัดไป
  5. ประชุมประเมินผล — บริบทการประเมิน, หลักฐานที่อภิปราย, การตัดสินใจและติดตาม
  6. การนำเสนอทางการ — ภาพรวมการนำเสนอ, ประเด็นสำคัญ, การตัดสินใจและติดตาม
การเลือกเทมเพลตจะถูกบันทึกต่อผู้ใช้และซิงค์ระหว่างเว็บและมือถือ

ค้นหาเต็มรูปแบบในบันทึกการถอดความ (เปิดตัวในโปรดักชัน)

การค้นหาคำสำคัญแบบ full-text ได้รับการอัปเกรดอย่างมีนัยสำคัญด้วย search engine ใหม่ การปรับปรุงหลัก:
  • ครอบคลุม บันทึกการถอดความ 1 ปี (~11 ล้านเอกสาร)
  • ค้นหาชื่อ, ข้อความ STT ต้นฉบับ และข้อความแปล
  • การค้นหา CJK (ญี่ปุ่น, จีน, เกาหลี) ที่แม่นยำ — ปรับปรุงอย่างมีนัยสำคัญเทียบกับ engine เดิม
  • การค้นหาวลีพร้อมการให้คะแนนความเกี่ยวข้องแบบ boosted

สิทธิ์การแชร์ Meeting Log

ผู้ดูแล workspace สามารถอัปเดตการตั้งค่าการแชร์สำหรับ meeting log ที่ตนมีสิทธิ์อ่านได้แล้ว บันทึกที่แชร์แบบเก่าจะถูกเก็บรักษาและสามารถลดขอบเขตลงได้

การตั้งค่าเทมเพลต Summary ต่อผู้ใช้

เทมเพลต AI summary ที่ผู้ใช้แต่ละคนชื่นชอบจะถูกบันทึกและคงอยู่ข้ามเซสชัน modal สิ้นสุดการประชุมบนมือถือรองรับแท็ก, บันทึก และการเลือกประเภทสรุปด้วย

อัปเดตแอปมือถือ

v0.5.16 — การปรับปรุงครั้งใหญ่

  • แก้ไขบั๊กเสียงต้นหายบนมือถือ ด้วยการเขียน audio pipeline ใหม่ทั้งหมด
  • อัปเกรด iOS SDK เป็น Tahoe (iOS 26) ที่เข้ากันได้
  • การแปลแบบออฟไลน์พร้อมใช้งานบน Android
  • การแปลเสียงของระบบบน iOS: แปลเสียงที่เล่นจากระบบ (เช่น YouTube) แทนการป้อนไมโครโฟน
  • การปรับปรุง billing flow ครั้งใหญ่ เทียบเท่าแอปเว็บ — เพิ่ม billing log, การดาวน์โหลดใบแจ้งหนี้และใบเสร็จ
  • แก้ไข flow การกู้คืนแผน พร้อมการทดสอบ regression ครบถ้วนในทุกสถานการณ์การอัปเกรด/ดาวน์เกรด

การปรับปรุงมือถืออื่นๆ

  • รีเฟรชอัตโนมัติบนมือถือหลังจากเซสชันการบันทึกสิ้นสุด
  • แก้ไขการสั่นของการเลื่อนระหว่างเล่นเสียงบนบันทึกการถอดความสั้น
  • แก้ไข regression ของ audio highlight และ text highlight พร้อม unit tests
  • เพิ่มข้อมูลผู้สร้าง (avatar และชื่อ) ในผลการค้นหา
  • รองรับแท็บ Caption สำหรับภาษาการถอดความใหม่ทั้งหมด
  • เพิ่มการสลับการแจ้งเตือนอีเมลสรุป (เทียบเท่าเว็บ)
  • แก้ไขปัญหาการลงชื่อเข้าใช้ด้วย Google

อัปเดตแอปเดสก์ท็อป

ออกแบบเมนู System Tray ใหม่

  • เริ่ม/หยุดการบันทึกโดยตรงจาก system tray ของ macOS/Windows
  • ลบรายการเมนูติดตามเวลาและรายงานประจำวันที่เลิกใช้แล้ว
  • รองรับ 6 ภาษาครบถ้วนสำหรับป้ายกำกับเมนู tray

แก้ไขบั๊ก

  • แก้ไขการเริ่มการประชุมโดยไม่ตั้งใจจากการคลิกทะลุ dropdown modal
  • แก้ไขการคงอยู่ของการตั้งค่าไมค์/การนำเสนอที่ไม่สอดคล้องกันข้ามเซสชัน
  • แก้ไขแฟลชการสลับหน้าจอ/หน้าต่างเมื่อเปลี่ยนโหมด

การปรับปรุงโหมดผู้ฟัง

  • การตั้งค่าภาษาสองภาษาสำหรับแขก: แขกผู้ฟังที่เข้าร่วมผ่าน URL ที่แชร์มีการตั้งค่าภาษา STT/การแปลสองภาษาครบถ้วน เทียบเท่าผู้ใช้ workspace
  • โหมดความแม่นยำสูงสำหรับผู้ฟัง: การแก้ไขข้อความทำงานอย่างถูกต้องสำหรับเซสชันผู้ฟัง
  • แก้ไขภาษาจีนในโหมดผู้ฟัง: ตัวเลือกภาษาในโหมดผู้ฟังรวมภาษาจีนอย่างถูกต้องแล้ว

การปรับปรุงคำบรรยายและซับไตเติ้ล

  • แถบความคืบหน้าแท็บ Caption: แถบความคืบหน้าการถอดความแสดงทันทีหลังอัปโหลดไฟล์และคงอยู่หลังโหลดหน้าใหม่
  • การกู้คืน timestamp ระดับคำ: แก้ไข timestamp ระดับคำที่หายไปในแท็บ Caption
  • การจัดการเสียงที่ไม่มีการพูด: เสียงที่อัปโหลดที่ไม่มีการพูดจะแสดงข้อความ “ไม่พบการพูด” ที่ชัดเจนแทนสถานะที่เสียหาย
  • แก้ไข text highlight: แก้ไขการไฮไลต์คำที่เสียหายระหว่างเล่นเสียง

การปรับปรุง UI/UX

  • หน้าจอเปลี่ยน billing/subscription: ปรับปรุงหน้าจอยืนยันคำสั่งซื้อและสำเร็จที่แสดงจำนวนตามสัดส่วน, วันมีผล และวันต่ออายุใหม่
  • ออกแบบ UI QR code sharing ใหม่: ใช้งาน dialog การแชร์รวมใหม่ในโปรดักชัน
  • แก้ไข UI Vocabulary Builder: modal ยืนยันการลบ, ขอบช่องป้อนข้อมูลที่มองเห็นได้, แก้ไขการออกเสียงสำหรับการผสมตัวอักษรและตัวเลข
  • หน้าเปลี่ยนแผน: ชี้แจงพฤติกรรมการรีเซ็ตรอบ billing — การใช้งานรีเซ็ตเมื่ออัปเกรด, การดาวน์เกรดมีผลตั้งแต่รอบถัดไป

แก้ไขบั๊ก

  • แก้ไขโหมดสองภาษาเสียหาย: เสียงภาษาญี่ปุ่นถูกถอดความเป็นภาษาอังกฤษผิดพลาดหลังการเพิ่มภาษามาเลย์
  • แก้ไขสถิติภาษาผิดพลาด: ตัวแปรภาษานับแยกกันใน usage dashboard — ตอนนี้รวมอย่างถูกต้องแล้ว
  • แก้ไขการสูญหายข้อมูล meeting log: การสรุปบันทึกการถอดความพร้อมกันและการล้างข้อมูลอาจลบข้อมูลก่อนที่การสรุปจะเสร็จสมบูรณ์
  • แก้ไขภาษาจีน: ภาษาจีนหายไปจากรายการตัวเลือกภาษาในโหมดถอดความและผู้ฟัง