Kostenbewusster Workflow
Vor der Agentenausführung schätzen, Kontext optimieren und Ausgaben begrenzen.
Kostenbewusster Workflow
Diese Seite setzt spec-doc §11.4 in konkrete Schritte um: alle genannten Flags und Konfigurationsschlüssel existieren in AgentFlow. Der Ablauf führt durch Kostenschätzung, Verdichtung des Kontextpakets, Budgetprüfung und — wo das Routing es erlaubt — bevorzugte lokale Ausführung.
1. Schätzung pro Aufgabe
agentflow estimate billing-v2 --task task-003 --dry-runZeigt heuristische Ein- und Ausgabe-Tokens sowie geschätzte Kosten aus Ihrer pricing-Konfiguration.
2. Kontextoptimierung
agentflow context billing-v2 --task task-003 --optimizeErzeugt ein reduziertes Kontextpaket vor großen Agent-Prompts. Reduktion abschalten mit agentflow work … --no-context-reduction.
3. Lauf mit Budget
agentflow work "develop billing-v2" --budget 0.50 --estimate-only
agentflow work "develop billing-v2" --budget 0.50Die in YAML definierten Budgets (budgets.per_run.max_estimated_cost) gelten, wenn die CLI --budget nicht setzt oder null übergibt. Läufe über dem Budget werden blockiert, es sei denn:
- die Bestätigungsaufforderung wird akzeptiert, oder
--yesnachBudgetPendingConfirmError, oder--allow-over-budget, wennbudgets.policies.allow_override_with_flagtrueist
4. Lokale Präferenz
agentflow work "develop billing-v2" --prefer-local --no-cloud--allow-cloud erlaubt ausdrücklich Cloud-Routing, wenn die Konfiguration oder Flags es sonst sperren würden.
Nachvollziehbarkeit
work und estimate geben Kurzfassungen zu Routing, Kontextgröße und Budget aus. Vertiefung: Token-Schätzung.