Back to Docs
제품 가이드

음성 전사

음성 기반 프롬프트를 위한 녹음 수명 주기, 장치 관리 및 스트리밍 동작입니다.

5분 read

음성 전사는 플랜 터미널 및 프롬프트 편집기를 포함하여 데스크톱 앱이 받아쓰기 컨트롤을 노출하는 모든 곳에서 사용할 수 있습니다. 이 기능은 오디오를 로컬로 녹음하고, 청크를 전사 서비스로 보내며, 수동 타이핑을 차단하지 않고 인식된 텍스트를 활성 입력 필드에 삽입합니다.

녹음 워크플로우

녹음 훅은 유휴, 녹음, 처리 및 오류 상태를 가진 상태 머신을 유지합니다. 기간을 추적하고, 무음 감지를 관리하며, 10분 후에 녹음이 자동으로 중지되도록 합니다. 청크는 버퍼링되어 전사 작업으로 전달되며, 이는 삽입을 위해 인식된 텍스트를 반환합니다.

프로젝트 인식 설정

녹음 세션이 시작되면 훅은 활성 프로젝트의 전사 구성을 조회합니다. 언어 코드, 선호 모델 및 기타 설정은 오디오 캡처 전에 검색되어 녹음이 프로젝트의 기본 설정을 따릅니다.

장치 관리

이 기능은 마이크 권한을 요청하고, 사용 가능한 오디오 입력을 열거하며, 사용자가 세션 중에 장치를 전환할 수 있도록 합니다. 오디오 레벨은 실시간으로 모니터링되어 마이크가 음소거되거나 연결이 끊어지면 UI가 무음 경고를 표시할 수 있습니다.

음성 전사 - PlanToCode