テキスト改善
PlanToCodeがフォーマットを変更せずにハイライトされたテキストを書き換え、結果をワークスペースにリンクする方法について説明します。
AIコンテキストでテキストを洗練します。任意のエディターでテキストを選択し、バックグラウンドジョブをトリガーし、フォーマットをそのままにした改善されたコンテンツを取得します。
選択ポップオーバーの動作
TextImprovementProviderは標準入力とMonacoエディターの選択イベントをリッスンします。空でないテキストをハイライトすると、カーソルの近くにポップオーバーを配置し、選択された範囲を保存し、ポップオーバーを表示するかどうかを追跡します。ボタンをクリックするとジョブが開始され、結果が返されるまでコントロールが無効になります。ジョブが完了すると、プロバイダーは改善されたテキストを同じ選択に適用し、保留中の保存をフラッシュしてセッション状態を同期します。
ポップオーバー自体はTextImprovementPopoverによってレンダリングされる最小限のコンポーネントで、単にプロバイダーフックをトリガーし、書き換えの実行中にローディングインジケーターを表示します。プロバイダーがグローバルリスナーを登録しているため、ポップオーバーは追加の配線なしでMonacoプランビューアー、プランターミナル口述フィールド、任意のタスク説明入力に表示されます。
改善をトリガーしたときに何が起こるか
ポップオーバーボタンを押すとcreateImproveTextJobActionが呼び出されます。アクションは選択を検証し、セッション識別子が存在することを確認し、Tauriを介してRustコマンドimprove_text_commandを呼び出します。コマンドは元のテキストを含むTextImprovementPayloadを構築し、アクティブなセッションに対してバックグラウンドジョブをキューに入れます。
バックエンドでは、TextImprovementProcessorがtext_improvementタスク用に設定されたモデルを解決し、選択をXMLタグでラップし、ストリーミングなしでLlmTaskRunnerを通じてリクエストを実行します。モデルレスポンスが返されると、UIに改善されたテキストを送信する前に、トークン使用量、コスト、システムプロンプトテンプレートを記録します。デフォルト設定はClaude Sonnet 4とGemini 2.5 Flashを承認されたモデルとして、温度0.7で4,096トークンを上限としています。
バックグラウンドジョブサイドバーは、ジョブメタデータに元のテキストを記録するため、書き換えられたコピーと一緒に送信された内容をレビューできます。ジョブの実行中に選択が変更された場合、プロバイダーは手動編集を上書きしないようにテキストの置き換えをスキップします。
音声文字起こし統合
音声録音はuseVoiceTranscriptionフックを使用します。プロジェクトごとの文字起こしデフォルトを読み込み、マイクアクセスを要求し、タスクの説明またはターミナル口述バッファー内のカーソルにトランスクリプトを挿入します。挿入されたテキストは即座にハイライトされ、同じ改善ポップオーバーを通過でき、元の文字起こしジョブ識別子は監査のために改善ペイロードとともに保存されます。
言語、モデル、温度設定はプロジェクトレベルで保持されるため、チームはコピーを洗練する前に一貫した文字起こし品質を得られます。沈黙検出は悪いオーディオレベルについて警告し、10分の上限は大きなペイロードで改善ジョブをブロックすることを防ぎます。
ビデオキャプチャとプロンプトスキャフォールディング
画面録画はビデオ分析ダイアログを通過し、Geminiビデオ分析ジョブにリクエストを送信する前に、セマンティックXMLタグでラップされたオプションのプロンプトブロックと現在のタスクの説明を組み合わせます。録音中に口述したメモは、分析が完了するとテキストとして利用可能になるため、結果の要約を改善ポップオーバーにフィードバックして、計画前に指示を引き締めることができます。
ビデオジョブには、フレームレートコントロール、オーディオキャプチャトグル、コストレポートが含まれます。結果はテキスト改善と同じバックグラウンドジョブサイドバーに表示され、すべてのプロンプト準備アーティファクトが1か所に保持されます。
デスクトップアプリでテキスト改善を試す
PlanToCodeをダウンロードして、実装プランを生成する前に音声キャプチャ、ビデオコンテキスト、インライン書き換えを組み合わせてください。