Configuración de modelo
Listas de modelos a nivel de tarea, controles de selector y barreras de protección de tokens en el cliente de escritorio.
PlanToCode trata la selección de modelo como una decisión a nivel de tarea. Cada flujo de trabajo viene con un modelo predeterminado y una lista permitida, y el cliente de escritorio expone estas opciones a través de un interruptor que evita enviar prompts que excedan la ventana de contexto activa.
Valores predeterminados impulsados por tareas
Los modelos predeterminados y las alternativas permitidas se almacenan en el servidor en la configuración de la aplicación. Cada tipo de tarea, como planes de implementación, fusiones, generación de prompts o transcripción de voz, define un modelo preferido, una lista de opciones permitidas y límites de tokens que la aplicación de escritorio lee en tiempo de ejecución.
Interruptor de selector en el cliente
El panel de Planes de Implementación renderiza los modelos permitidos con el ModelSelectorToggle. El interruptor muestra cada modelo permitido, rastrea la selección activa y verifica si el prompt estimado más los tokens de salida planificados caben dentro de la ventana de contexto anunciada del modelo antes de permitir un cambio.
Si un modelo no puede soportar el requisito total de tokens, el interruptor desactiva el botón y muestra un tooltip con el exceso calculado, manteniendo a los revisores dentro de límites seguros antes de enviar trabajo a un agente.
Estimación de prompts
Los recuentos de tokens se calculan a través del comando de estimación de tokens. El panel envía el ID de sesión, la descripción de la tarea, los archivos relevantes y el modelo seleccionado para que el backend pueda devolver valores de tokens del sistema, usuario y total. Estos números se alimentan directamente en las barreras de protección del selector y permiten a los equipos detectar prompts que superan el límite antes de copiarlos en otra herramienta.