Conceptos
Flujos conscientes del coste
Estimar tokens y coste antes de ejecutar; aplicar presupuestos y enrutamiento.
Flujos conscientes del coste
Problema
Las ejecuciones de agentes pueden consumir tokens de formas difíciles de prever desde una descripción simple de tarea. Los equipos siguen necesitando previsiones antes de ejecutar, techos presupuestarios que fallen en cerrado, y enrutamiento que prefiera rutas de ejecución más baratas cuando la tarea no justifica un modelo pesado.
Enfoque AgentFlow
AgentFlow lo aborda con cuatro mecanismos concretos bajo tu config:
- Conteo heurístico de tokens — conteo de caracteres por tipo de contenido, dividido por ratios
token_estimation(token_estimationen config) - Hoja de precios — entradas manuales
pricing.modelspara modelos cloud (sin precios de proveedor hardcodeados) - Presupuestos — topes por run, por tarea y diarios, con umbrales de confirmación opcionales
- Enrutamiento —
routing.strategiesmapea clases de paso a agentes local, cloud-rápido o cloud-pesado
Puntos de entrada CLI típicos:
agentflow estimate billing-v2 --task task-003 --dry-run
agentflow work "develop billing-v2" --estimate-only
agentflow work "develop billing-v2" --budget 0.50 --allow-over-budgetCompromisos
| Mejora | No resuelve |
|---|---|
Sorpresas detectadas antes de dev | Facturas al céntimo |
| Política vía presupuestos YAML | Descubrimiento automático de precios cloud |
| Razones de enrutamiento explicables | Selección óptima de modelo sin tu config |
Configuración
Conecta presupuestos, reglas de enrutamiento y ajustes del estimador en las páginas dedicadas: Presupuestos, Enrutamiento y Estimación de tokens.