Back to Docs
Guide produit

Configuration de modèle

Listes de modèles par tâche, contrôles de sélecteur et garde-fous de jetons dans le client de bureau.

5 min read

PlanToCode traite la sélection de modèle comme une décision au niveau de la tâche. Chaque flux de travail est livré avec un modèle par défaut et une liste autorisée, et le client de bureau expose ces options via un bouton qui empêche l'envoi de prompts dépassant la fenêtre de contexte active.

Valeurs par défaut basées sur la tâche

Les modèles par défaut et les alternatives autorisées sont stockés côté serveur dans la configuration de l'application. Chaque type de tâche - tels que les plans d'implémentation, les fusions, la génération de prompt ou la transcription vocale - définit un modèle préféré, une liste d'options autorisées et des limites de jetons que l'application de bureau lit au moment de l'exécution.

Bouton de sélection dans le client

Le panneau Plans d'implémentation affiche les modèles autorisés avec le ModelSelectorToggle. Le bouton affiche chaque modèle autorisé, suit la sélection active et vérifie si le prompt estimé plus les jetons de sortie planifiés rentrent dans la fenêtre de contexte annoncée du modèle avant d'autoriser un changement.

Si un modèle ne peut pas supporter l'exigence totale de jetons, le bouton désactive le bouton et affiche une info-bulle avec le dépassement calculé, maintenant les réviseurs dans les limites sûres avant qu'ils n'envoient du travail à un agent.

Estimation de prompt

Les nombres de jetons sont calculés via la commande d'estimation de jetons. Le panneau soumet l'ID de session, la description de la tâche, les fichiers pertinents et le modèle sélectionné afin que le backend puisse retourner les valeurs de jetons système, utilisateur et total. Ces chiffres alimentent directement les garde-fous de sélecteur et permettent aux équipes de repérer les prompts au-delà de la limite avant de les copier dans un autre outil.

Configuration du modèle - PlanToCode