การรู้จำเสียงพูด & AI
STT Inference เร็วขึ้น 40%
อัปเกรดระบบ STT ให้ inference เร็วขึ้น 40% ในทุกภาษาแก้ไขความเสถียรของโหมดสองภาษา
แก้ไขโหมดสองภาษาหลายรายการที่สำคัญตลอดเดือนมีนาคม:- แก้ไขการตรวจจับภาษาสลับในการรู้จำครั้งแรกบนมือถือ
- แก้ไขการแก้ไขข้อความที่ทำให้การตรวจจับภาษาเสียหาย (เสียงภาษาญี่ปุ่นถูกถอดความเป็นภาษาอังกฤษผิดพลาด)
- แก้ไขเสียงหายเมื่อผู้พูดสลับภาษากลางการสนทนา
- ความแม่นยำสำหรับประโยคสั้นกลับมาพร้อมการตรวจจับความยาวเสียงแบบปรับตัว
การปรับปรุงคุณภาพเสียง iOS
iOS ใช้โหมดเสียงระดับโทรศัพท์แทนโหมดวัดผลที่ใช้บน Android เปลี่ยนเป็นโหมดรับเสียง STT ที่เหมาะสม ทำให้คุณภาพเสียง iOS เทียบเท่า Android ในระยะ 1-2 เมตรรองรับภาษามาเลย์
เพิ่ม STT ภาษามาเลย์ รองรับโหมดสองภาษาสำหรับภาษามาเลย์ด้วย โดยจงใจปิดใช้งานคู่อินโดนีเซีย/มาเลย์ (ไม่สามารถตรวจจับการสลับภาษาระหว่างทั้งสองได้อย่างน่าเชื่อถือ)การแปลที่เร็วขึ้น
ใช้งานโมเดลการแปลใหม่ที่ inference เร็วขึ้นอย่างมีนัยสำคัญ ปรับปรุงการตอบสนองการแปลแบบเรียลไทม์ภาษาเพิ่มเติมกำลังมา
เริ่มฝึก ASR โมเดลภาษาเขมร ภาษาเพิ่มเติมที่อยู่ระหว่างเตรียม: กวางตุ้ง, อุซเบก, โปแลนด์, ดัตช์, มองโกเลีย และเบงกาลีการปรับปรุง Meeting Log และบันทึกการถอดความ
เทมเพลต AI Summary การประชุมที่ปรับแต่งได้
ผู้ใช้สามารถเลือกประเภทสรุปก่อนสิ้นสุดการประชุมได้แล้ว AI จะสร้างสรุปที่มีโครงสร้างเหมาะสมกับประเภทการประชุม มีเทมเพลตหกแบบ:- ทั่วไป (ค่าเริ่มต้น) — ภาพรวม, หัวข้อ, รายการที่ต้องดำเนินการ
- สัมภาษณ์ลูกค้า — ภาพรวม, ความต้องการและสัญญาณของลูกค้า, ขั้นตอนถัดไปและความเสี่ยง
- ประชุมทีมประจำ / Scrum — ความคืบหน้า, ปัญหาและความเสี่ยง, รายการที่ต้องดำเนินการ
- สัมภาษณ์สรรหา HR — โปรไฟล์ผู้สมัคร, หลักฐานและการสังเกต, การประเมินและขั้นตอนถัดไป
- ประชุมประเมินผล — บริบทการประเมิน, หลักฐานที่อภิปราย, การตัดสินใจและติดตาม
- การนำเสนอทางการ — ภาพรวมการนำเสนอ, ประเด็นสำคัญ, การตัดสินใจและติดตาม
ค้นหาเต็มรูปแบบในบันทึกการถอดความ (เปิดตัวในโปรดักชัน)
การค้นหาคำสำคัญแบบ full-text ได้รับการอัปเกรดอย่างมีนัยสำคัญด้วย search engine ใหม่ การปรับปรุงหลัก:- ครอบคลุม บันทึกการถอดความ 1 ปี (~11 ล้านเอกสาร)
- ค้นหาชื่อ, ข้อความ STT ต้นฉบับ และข้อความแปล
- การค้นหา CJK (ญี่ปุ่น, จีน, เกาหลี) ที่แม่นยำ — ปรับปรุงอย่างมีนัยสำคัญเทียบกับ engine เดิม
- การค้นหาวลีพร้อมการให้คะแนนความเกี่ยวข้องแบบ boosted
สิทธิ์การแชร์ Meeting Log
ผู้ดูแล workspace สามารถอัปเดตการตั้งค่าการแชร์สำหรับ meeting log ที่ตนมีสิทธิ์อ่านได้แล้ว บันทึกที่แชร์แบบเก่าจะถูกเก็บรักษาและสามารถลดขอบเขตลงได้การตั้งค่าเทมเพลต Summary ต่อผู้ใช้
เทมเพลต AI summary ที่ผู้ใช้แต่ละคนชื่นชอบจะถูกบันทึกและคงอยู่ข้ามเซสชัน modal สิ้นสุดการประชุมบนมือถือรองรับแท็ก, บันทึก และการเลือกประเภทสรุปด้วยอัปเดตแอปมือถือ
v0.5.16 — การปรับปรุงครั้งใหญ่
- แก้ไขบั๊กเสียงต้นหายบนมือถือ ด้วยการเขียน audio pipeline ใหม่ทั้งหมด
- อัปเกรด iOS SDK เป็น Tahoe (iOS 26) ที่เข้ากันได้
- การแปลแบบออฟไลน์พร้อมใช้งานบน Android
- การแปลเสียงของระบบบน iOS: แปลเสียงที่เล่นจากระบบ (เช่น YouTube) แทนการป้อนไมโครโฟน
- การปรับปรุง billing flow ครั้งใหญ่ เทียบเท่าแอปเว็บ — เพิ่ม billing log, การดาวน์โหลดใบแจ้งหนี้และใบเสร็จ
- แก้ไข flow การกู้คืนแผน พร้อมการทดสอบ regression ครบถ้วนในทุกสถานการณ์การอัปเกรด/ดาวน์เกรด
การปรับปรุงมือถืออื่นๆ
- รีเฟรชอัตโนมัติบนมือถือหลังจากเซสชันการบันทึกสิ้นสุด
- แก้ไขการสั่นของการเลื่อนระหว่างเล่นเสียงบนบันทึกการถอดความสั้น
- แก้ไข regression ของ audio highlight และ text highlight พร้อม unit tests
- เพิ่มข้อมูลผู้สร้าง (avatar และชื่อ) ในผลการค้นหา
- รองรับแท็บ Caption สำหรับภาษาการถอดความใหม่ทั้งหมด
- เพิ่มการสลับการแจ้งเตือนอีเมลสรุป (เทียบเท่าเว็บ)
- แก้ไขปัญหาการลงชื่อเข้าใช้ด้วย Google
อัปเดตแอปเดสก์ท็อป
ออกแบบเมนู System Tray ใหม่
- เริ่ม/หยุดการบันทึกโดยตรงจาก system tray ของ macOS/Windows
- ลบรายการเมนูติดตามเวลาและรายงานประจำวันที่เลิกใช้แล้ว
- รองรับ 6 ภาษาครบถ้วนสำหรับป้ายกำกับเมนู tray
แก้ไขบั๊ก
- แก้ไขการเริ่มการประชุมโดยไม่ตั้งใจจากการคลิกทะลุ dropdown modal
- แก้ไขการคงอยู่ของการตั้งค่าไมค์/การนำเสนอที่ไม่สอดคล้องกันข้ามเซสชัน
- แก้ไขแฟลชการสลับหน้าจอ/หน้าต่างเมื่อเปลี่ยนโหมด
การปรับปรุงโหมดผู้ฟัง
- การตั้งค่าภาษาสองภาษาสำหรับแขก: แขกผู้ฟังที่เข้าร่วมผ่าน URL ที่แชร์มีการตั้งค่าภาษา STT/การแปลสองภาษาครบถ้วน เทียบเท่าผู้ใช้ workspace
- โหมดความแม่นยำสูงสำหรับผู้ฟัง: การแก้ไขข้อความทำงานอย่างถูกต้องสำหรับเซสชันผู้ฟัง
- แก้ไขภาษาจีนในโหมดผู้ฟัง: ตัวเลือกภาษาในโหมดผู้ฟังรวมภาษาจีนอย่างถูกต้องแล้ว
การปรับปรุงคำบรรยายและซับไตเติ้ล
- แถบความคืบหน้าแท็บ Caption: แถบความคืบหน้าการถอดความแสดงทันทีหลังอัปโหลดไฟล์และคงอยู่หลังโหลดหน้าใหม่
- การกู้คืน timestamp ระดับคำ: แก้ไข timestamp ระดับคำที่หายไปในแท็บ Caption
- การจัดการเสียงที่ไม่มีการพูด: เสียงที่อัปโหลดที่ไม่มีการพูดจะแสดงข้อความ “ไม่พบการพูด” ที่ชัดเจนแทนสถานะที่เสียหาย
- แก้ไข text highlight: แก้ไขการไฮไลต์คำที่เสียหายระหว่างเล่นเสียง
การปรับปรุง UI/UX
- หน้าจอเปลี่ยน billing/subscription: ปรับปรุงหน้าจอยืนยันคำสั่งซื้อและสำเร็จที่แสดงจำนวนตามสัดส่วน, วันมีผล และวันต่ออายุใหม่
- ออกแบบ UI QR code sharing ใหม่: ใช้งาน dialog การแชร์รวมใหม่ในโปรดักชัน
- แก้ไข UI Vocabulary Builder: modal ยืนยันการลบ, ขอบช่องป้อนข้อมูลที่มองเห็นได้, แก้ไขการออกเสียงสำหรับการผสมตัวอักษรและตัวเลข
- หน้าเปลี่ยนแผน: ชี้แจงพฤติกรรมการรีเซ็ตรอบ billing — การใช้งานรีเซ็ตเมื่ออัปเกรด, การดาวน์เกรดมีผลตั้งแต่รอบถัดไป
แก้ไขบั๊ก
- แก้ไขโหมดสองภาษาเสียหาย: เสียงภาษาญี่ปุ่นถูกถอดความเป็นภาษาอังกฤษผิดพลาดหลังการเพิ่มภาษามาเลย์
- แก้ไขสถิติภาษาผิดพลาด: ตัวแปรภาษานับแยกกันใน usage dashboard — ตอนนี้รวมอย่างถูกต้องแล้ว
- แก้ไขการสูญหายข้อมูล meeting log: การสรุปบันทึกการถอดความพร้อมกันและการล้างข้อมูลอาจลบข้อมูลก่อนที่การสรุปจะเสร็จสมบูรณ์
- แก้ไขภาษาจีน: ภาษาจีนหายไปจากรายการตัวเลือกภาษาในโหมดถอดความและผู้ฟัง
