Skip to main content

음성 인식 · AI

40% 빠른 STT 추론

STT 파이프라인을 업그레이드하여 모든 언어에서 40% 빠른 추론을 실현했습니다.

바이링구얼 모드 안정성 수정

3월 전반에 걸쳐 여러 중요한 바이링구얼 모드 수정이 적용되었습니다:
  • 모바일에서 첫 번째 인식 시 언어 감지가 뒤바뀌는 문제 수정
  • 텍스트 교정이 언어 감지를 방해하는 문제 수정 (일본어 발화가 영어로 잘못 전사되는 문제)
  • 대화 중 화자가 언어를 전환할 때 오디오가 손실되는 문제 수정
  • 적응형 오디오 길이 감지로 짧은 발화 정확도 복원

iOS 오디오 품질 개선

iOS가 Android에서 사용하는 측정 모드 대신 전화 품질 오디오 모드를 사용하고 있었습니다. 적절한 STT 오디오 캡처 모드로 변경하여 1~2m 거리에서 iOS 오디오 품질을 Android와 동등하게 향상시켰습니다.

말레이어 지원 추가

말레이어 STT가 추가되었습니다. 말레이어 바이링구얼 모드 지원도 추가되었으며, 인도네시아어/말레이어 쌍은 두 언어 간 전환 감지가 신뢰성 있게 작동하지 않아 의도적으로 비활성화되었습니다.

번역 속도 향상

추론 속도가 크게 향상된 새 번역 모델을 배포하여 실시간 번역 응답성이 개선되었습니다.

추가 예정 언어

크메르어 ASR 모델 학습이 시작되었습니다. 추가 준비 중인 언어: 광둥어, 우즈베크어, 폴란드어, 네덜란드어, 몽골어, 벵골어.

의사록·전사 개선

커스터마이즈 가능한 AI 회의 요약 템플릿

이제 회의 종료 전에 요약 유형을 선택할 수 있습니다. AI가 회의 유형에 맞게 구조화된 요약을 생성합니다. 6가지 템플릿을 제공합니다:
  1. 일반 (기본값) — 개요, 주요 주제, 액션 아이템
  2. 고객 인터뷰 — 개요, 고객 니즈 및 신호, 다음 단계 및 리스크
  3. 정기 팀 미팅 / 스크럼 — 진행 상황, 차단 요소 및 리스크, 액션 아이템
  4. HR 채용 인터뷰 — 후보자 프로필, 근거 및 관찰, 평가 및 다음 단계
  5. 인사 평가 미팅 — 평가 맥락, 논의된 근거, 결정 및 후속 조치
  6. 공식 발표 — 발표 개요, 핵심 내용, 결정 및 후속 조치
템플릿 선택은 사용자별로 저장되며 웹과 모바일 간에 동기화됩니다.

전사 전문 검색 (본격 출시)

새로운 검색 엔진으로 전문 키워드 검색이 크게 업그레이드되었습니다. 주요 개선 사항:
  • 1년치 전사 (~1,100만 건) 검색 가능
  • 제목, 원본 STT 텍스트, 번역 텍스트 검색
  • 정확한 CJK (일본어, 중국어, 한국어) 검색 — 이전 엔진 대비 크게 향상
  • 부스트된 관련성 점수를 통한 구문 검색

의사록 공유 권한

워크스페이스 관리자가 읽기 권한을 가진 의사록의 공유 설정을 업데이트할 수 있게 되었습니다. 기존 공유 로그는 유지되며 범위를 좁힐 수 있습니다.

사용자별 요약 템플릿 설정

각 사용자의 선호 AI 요약 템플릿이 저장되어 세션 간에 유지됩니다. 모바일의 회의 종료 모달에서도 태그, 메모, 요약 유형 선택을 지원합니다.

모바일 앱 업데이트

v0.5.16 — 주요 개편

  • 초기 음성 손실 버그 수정: 완전한 오디오 파이프라인 재작성으로 수정
  • iOS SDK 업그레이드: Tahoe (iOS 26) 호환성
  • Android에서 오프라인 번역 지원
  • iOS 시스템 오디오 번역: 마이크 입력 대신 시스템 오디오 재생(예: YouTube)을 번역
  • 결제 플로우 전면 개편: 웹 앱과의 동일한 기능 — 결제 로그, 청구서 및 영수증 다운로드 추가
  • 플랜 복구 플로우 수정: 모든 업그레이드/다운그레이드 시나리오에 대한 완전한 회귀 테스트

기타 모바일 개선 사항

  • 녹음 세션 종료 후 모바일 자동 새로고침
  • 짧은 전사에서 오디오 재생 중 스크롤 깜빡임 수정
  • 유닛 테스트를 포함한 오디오 하이라이트 및 텍스트 하이라이트 회귀 수정
  • 검색 결과에 작성자 정보 (아바타 및 이름) 추가
  • 모든 새로운 전사 언어에 대한 캡션 탭 지원
  • 요약 이메일 알림 토글 추가 (웹과 동일)
  • Google 로그인 문제 해결

데스크톱 앱 업데이트

시스템 트레이 메뉴 재설계

  • macOS/Windows 시스템 트레이에서 직접 녹음 시작/중지
  • 더 이상 사용되지 않는 시간 추적 및 일일 보고서 메뉴 항목 제거
  • 트레이 메뉴 레이블에 대한 6개 로케일 완전 지원

버그 수정

  • 드롭다운 모달 클릭 통과로 인한 의도치 않은 회의 시작 수정
  • 세션 간 마이크/프레젠테이션 설정 지속성 불일치 수정
  • 모드 전환 시 화면/창 전환 깜빡임 수정

리스너 모드 개선

  • 게스트를 위한 바이링구얼 언어 설정: 공유 URL로 참여하는 리스너 게스트도 워크스페이스 사용자와 동일한 바이링구얼 STT/번역 언어 설정 지원
  • 리스너를 위한 고정밀 모드: 리스너 세션에서 텍스트 교정이 올바르게 작동
  • 중국어 로컬라이제이션 수정: 리스너 모드의 언어 선택기에 중국어가 올바르게 포함되도록 수정

자막·캡션 개선

  • 캡션 탭 진행 표시줄: 파일 업로드 후 즉시 전사 진행 표시줄이 표시되며 페이지 새로고침 후에도 유지
  • 단어 수준 타임스탬프 복원: 캡션 탭에서 누락된 단어 수준 타임스탬프 수정
  • 비음성 오디오 처리: 음성이 없는 오디오 업로드 시 손상된 상태 대신 명확한 “음성 없음” 메시지 표시
  • 텍스트 하이라이트 수정: 오디오 재생 중 단어 수준 하이라이트가 제대로 작동하지 않는 문제 수정

UI/UX 개선

  • 결제/구독 변경 화면: 비례 금액, 적용 날짜, 새 갱신 날짜를 보여주는 주문 확인 및 완료 화면 개선
  • 공유 QR 코드 UI 재설계: 새 통합 공유 대화상자 출시
  • 어휘 빌더 UI 수정: 삭제 확인 모달, 가시적인 텍스트 입력 테두리, 영숫자 조합의 발음 수정
  • 플랜 변경 페이지: 결제 주기 초기화 동작 명확화 — 업그레이드 시 사용량 초기화, 다운그레이드는 다음 주기부터 적용

버그 수정

  • 바이링구얼 모드 오류 수정: 말레이어 추가 후 일본어 발화가 영어로 잘못 전사되는 문제 수정
  • 잘못된 언어 통계 수정: 사용 대시보드에서 언어 변형이 별도로 집계되던 문제 수정 — 이제 올바르게 합산
  • 의사록 데이터 손실 수정: 동시 전사 완료 및 정리 작업이 완료 전에 데이터를 삭제할 수 있는 문제 수정
  • 중국어 로컬라이제이션 수정: 전사 및 리스너 모드의 언어 선택기 목록에서 중국어 누락 문제 수정