AgentFlow
Concepts

Workflows conscients des coûts

Estimer jetons et coût avant exécution ; appliquer budgets et routage.

Workflows conscients des coûts

Problème

Les runs agent peuvent consommer des jetons de façon difficile à prévoir à partir d'une simple description de tâche. Les équipes ont tout de même besoin de prévisions avant exécution, de plafonds budgétaires qui échouent fermés, et d'un routage qui préfère les chemins d'exécution moins chers quand la tâche ne justifie pas un modèle lourd.

Approche AgentFlow

AgentFlow y répond avec quatre mécanismes concrets sous votre config :

  1. Comptage heuristique de jetons — comptage de caractères par type de contenu, divisé par les ratios token_estimation (token_estimation dans la config)
  2. Grille tarifaire — entrées manuelles pricing.models pour les modèles cloud (pas de prix fournisseur codés en dur)
  3. Budgets — plafonds par run, par tâche et journaliers, avec seuils de confirmation optionnels
  4. Routagerouting.strategies associe les classes d'étapes aux agents local, cloud-rapide ou cloud-lourd

Points d'entrée CLI typiques :

agentflow estimate billing-v2 --task task-003 --dry-run
agentflow work "develop billing-v2" --estimate-only
agentflow work "develop billing-v2" --budget 0.50 --allow-over-budget

Compromis

AmélioreNe résout pas
Surprises détectées avant devFactures au centime près
Politique via budgets YAMLDécouverte automatique des prix cloud
Raisons de routage explicablesChoix optimal de modèle sans votre config

Configuration

Branchez budgets, règles de routage et réglages d'estimateur via les pages dédiées : Budgets, Routage et Estimation des jetons.

Voir aussi