Back to Docs
Guide produit

Transcription vocale

Cycle de vie d'enregistrement, gestion des périphériques et comportement de streaming pour les prompts vocaux.

5 min read

La transcription vocale est disponible partout où l'application de bureau expose des contrôles de dictée, y compris le terminal de plan et les éditeurs de prompt. La fonctionnalité enregistre l'audio localement, envoie des fragments au service de transcription et insère le texte reconnu dans le champ de saisie actif sans bloquer la saisie manuelle.

Flux de travail d'enregistrement

Le hook d'enregistrement maintient une machine à états avec des états inactif, enregistrement, traitement et erreur. Il suit la durée, gère la détection de silence et garantit que les enregistrements s'arrêtent automatiquement après dix minutes. Les fragments sont mis en tampon et transmis à l'action de transcription, qui renvoie le texte reconnu pour insertion.

Paramètres sensibles au projet

Lorsqu'une session d'enregistrement démarre, le hook recherche la configuration de transcription du projet actif. Les codes de langue, les modèles préférés et d'autres paramètres sont récupérés avant de capturer l'audio afin que les enregistrements suivent les préférences du projet.

Gestion des périphériques

La fonctionnalité demande l'autorisation du microphone, énumère les entrées audio disponibles et permet aux utilisateurs de changer de périphérique pendant une session. Les niveaux audio sont surveillés en direct afin que l'interface utilisateur puisse afficher des avertissements de silence si le microphone est coupé ou déconnecté.

Transcription vocale - PlanToCode