Workflows local-first
Investiguer et réduire le contexte en local avant d'appeler les modèles cloud.
Workflows local-first
Problème
Envoyer tout un dépôt dans un modèle cloud est lent, coûteux, et fait souvent fuiter plus de code que la tâche ne l'exige. Beaucoup de questions d'ingénierie se réduisent une fois que vous avez cherché dans l'arbre, listé les fichiers candidats et appliqué un empilement structuré — travail qui appartient à votre machine avec des outils ordinaires, pas dans un prompt distant.
Approche AgentFlow
AgentFlow traite l'investigation locale et la réduction de contexte comme prélude de premier ordre. Avant les étapes coûteuses, AgentFlow peut restreindre ce qui quitte le dépôt :
agentflow investigate <feature>— grep borné, fichiers candidats, alertes gros fichiers, tests liésagentflow context <feature> --optimize— collecter, scorer, compresser le contexte en un pack- Routage — préférer Ollama ou profils locaux pour
summarize,classify,pre_reviewetcontext_selectionquandrouting.strategies.cost_awareest actif
Le flux est linéaire en pratique : l'intention utilisateur alimente l'investigation, l'investigation un pack de contexte, le routage choisit local ou cloud, et les deux chemins convergent vers la validation.
flowchart LR
A[User intent] --> B[Investigate]
B --> C[Context pack]
C --> D{Route}
D -->|local step| E[Ollama / local agent]
D -->|cloud step| F[Cursor / Codex / Claude]
E --> G[Validation]
F --> GExemple
La séquence ci-dessous lance investigation et optimisation de contexte pour une feature, puis prévisualise un work avec préférence locale et estimate-only :
agentflow investigate billing-v2 --task task-003
agentflow context billing-v2 --task task-003 --optimize
agentflow work "develop billing-v2" --prefer-local --estimate-onlyCompromis
| Améliore | Ne résout pas |
|---|---|
| Latence et coût du triage | Compréhension sémantique égale à un gros modèle cloud |
| Journaux d'investigation reproductibles | Classement de pertinence parfait (score heuristique) |
| Étapes offline avec Ollama | Conformité air-gapped sans votre propre relecture |
Configuration
L'extrait ci-dessous active le routage cost_aware et fixe des limites d'investigation partagées. Ces limites s'appliquent même si mcp.enabled est false : elles vivent sous mcp.investigation comme config partagée pour les outils locaux.
routing:
default_strategy: cost_aware
strategies:
cost_aware:
prefer_local_for: [summarize, classify, context_selection, pre_review]
mcp:
investigation:
large_file_bytes: 524288
max_grep_output_bytes: 262144