Konzepte
Kostenbewusste Workflows
Token und Kosten vor der Ausführung schätzen; Budgets und Routing durchsetzen.
Kostenbewusste Workflows
Problem
Agentenläufe können Tokens verbrauchen, ohne dass sich der Umfang aus einer kurzen Aufgabenbeschreibung vorher ablesen lässt. Teams brauchen dennoch Vorhersagen vor dem ersten Aufruf, Deckel gegen Budgetüberläufe, die zuverlässig greifen, und Routing, das dort günstigere Ausführungswege wählt, wo die Aufgabenart keine teure Großbaustelle erfordert.
AgentFlows Ansatz
Vier Mechanismen — allesamt über die Konfiguration steuerbar:
- Heuristische Token-Zählung: Zeichen pro Textfragment, nach Art (Code, Markdown, JSON, Standard) klassifiziert, geteilt durch die Verhältnisse unter
token_estimationin der YAML. - Preistabelle: Manuelle Einträge in
pricing.modelsfür Cloud-Modelle — keine fest im Binary eingebauten Anbieterpreise. - Budgets: Obergrenzen pro Lauf, pro Task und als Tagesaggregat, optional mit Bestätigungsschwellen.
- Routing:
routing.strategiesordnet Schrittklassen lokale, schnelle Cloud- oder schwere Cloud-Profile zu.
Typische CLI-Einstiege:
agentflow estimate billing-v2 --task task-003 --dry-run
agentflow work "develop billing-v2" --estimate-only
agentflow work "develop billing-v2" --budget 0.50 --allow-over-budgetAbwägungen
| Hilft gegen | Ersetzt nicht |
|---|---|
Überraschungen vor einem teuren dev-Schritt | Cent-genau vorhersagbare Rechnungen |
| Policies über YAML-Budgets | Automatisches Nachziehen öffentlicher Listenpreise |
| Nachvollziehbare Routing-Gründe | Optimale Modellwahl ohne Ihre Kanten in der Config |
Konfiguration
Budgets, Routing und Feintuning der Schätzer verbinden Sie über Budgets, Routing und Token-Schätzung.