Back to Docs
Produktleitfaden

Sprachtranskription

Aufnahme-Lebenszyklus, Geräteverwaltung und Streaming-Verhalten für sprachgesteuerte Prompts.

5 Min. read

Sprachtranskription ist überall verfügbar, wo die Desktop-App Diktiersteuerungen bereitstellt, einschließlich des Plan-Terminals und Prompt-Editoren. Die Funktion zeichnet Audio lokal auf, sendet Chunks an den Transkriptionsdienst und fügt erkannten Text in das aktive Eingabefeld ein, ohne manuelle Eingabe zu blockieren.

Aufnahme-Workflow

Der Aufnahme-Hook verwaltet eine Zustandsmaschine mit Zuständen für inaktiv, Aufnahme, Verarbeitung und Fehler. Er verfolgt die Dauer, verwaltet Stilleerkennung und stellt sicher, dass Aufnahmen automatisch nach zehn Minuten stoppen. Chunks werden gepuffert und an die Transkriptionsaktion weitergeleitet, die erkannten Text zur Einfügung zurückgibt.

Projektbewusste Einstellungen

Wenn eine Aufnahme-Session startet, sucht der Hook die Transkriptionskonfiguration des aktiven Projekts. Sprachcodes, bevorzugte Modelle und andere Einstellungen werden vor der Audioaufnahme abgerufen, damit Aufnahmen den Projektpräferenzen folgen.

Geräteverwaltung

Die Funktion fordert Mikrofonberechtigung an, zählt verfügbare Audioeingänge auf und ermöglicht Benutzern, Geräte während einer Session zu wechseln. Audiopegel werden live überwacht, damit die UI Stillewarnungen anzeigen kann, wenn das Mikrofon stummgeschaltet oder getrennt ist.