Concepts
Workflows conscients des coûts
Estimer jetons et coût avant exécution ; appliquer budgets et routage.
Workflows conscients des coûts
Problème
Les runs agent peuvent consommer des jetons de façon difficile à prévoir à partir d'une simple description de tâche. Les équipes ont tout de même besoin de prévisions avant exécution, de plafonds budgétaires qui échouent fermés, et d'un routage qui préfère les chemins d'exécution moins chers quand la tâche ne justifie pas un modèle lourd.
Approche AgentFlow
AgentFlow y répond avec quatre mécanismes concrets sous votre config :
- Comptage heuristique de jetons — comptage de caractères par type de contenu, divisé par les ratios
token_estimation(token_estimationdans la config) - Grille tarifaire — entrées manuelles
pricing.modelspour les modèles cloud (pas de prix fournisseur codés en dur) - Budgets — plafonds par run, par tâche et journaliers, avec seuils de confirmation optionnels
- Routage —
routing.strategiesassocie les classes d'étapes aux agents local, cloud-rapide ou cloud-lourd
Points d'entrée CLI typiques :
agentflow estimate billing-v2 --task task-003 --dry-run
agentflow work "develop billing-v2" --estimate-only
agentflow work "develop billing-v2" --budget 0.50 --allow-over-budgetCompromis
| Améliore | Ne résout pas |
|---|---|
Surprises détectées avant dev | Factures au centime près |
| Politique via budgets YAML | Découverte automatique des prix cloud |
| Raisons de routage explicables | Choix optimal de modèle sans votre config |
Configuration
Branchez budgets, règles de routage et réglages d'estimateur via les pages dédiées : Budgets, Routage et Estimation des jetons.