AgentFlow
Concepts

Workflows local-first

Investiguer et réduire le contexte en local avant d'appeler les modèles cloud.

Workflows local-first

Problème

Envoyer tout un dépôt dans un modèle cloud est lent, coûteux, et fait souvent fuiter plus de code que la tâche ne l'exige. Beaucoup de questions d'ingénierie se réduisent une fois que vous avez cherché dans l'arbre, listé les fichiers candidats et appliqué un empilement structuré — travail qui appartient à votre machine avec des outils ordinaires, pas dans un prompt distant.

Approche AgentFlow

AgentFlow traite l'investigation locale et la réduction de contexte comme prélude de premier ordre. Avant les étapes coûteuses, AgentFlow peut restreindre ce qui quitte le dépôt :

  1. agentflow investigate <feature> — grep borné, fichiers candidats, alertes gros fichiers, tests liés
  2. agentflow context <feature> --optimize — collecter, scorer, compresser le contexte en un pack
  3. Routage — préférer Ollama ou profils locaux pour summarize, classify, pre_review et context_selection quand routing.strategies.cost_aware est actif

Le flux est linéaire en pratique : l'intention utilisateur alimente l'investigation, l'investigation un pack de contexte, le routage choisit local ou cloud, et les deux chemins convergent vers la validation.

flowchart LR
  A[User intent] --> B[Investigate]
  B --> C[Context pack]
  C --> D{Route}
  D -->|local step| E[Ollama / local agent]
  D -->|cloud step| F[Cursor / Codex / Claude]
  E --> G[Validation]
  F --> G

Exemple

La séquence ci-dessous lance investigation et optimisation de contexte pour une feature, puis prévisualise un work avec préférence locale et estimate-only :

agentflow investigate billing-v2 --task task-003
agentflow context billing-v2 --task task-003 --optimize
agentflow work "develop billing-v2" --prefer-local --estimate-only

Compromis

AmélioreNe résout pas
Latence et coût du triageCompréhension sémantique égale à un gros modèle cloud
Journaux d'investigation reproductiblesClassement de pertinence parfait (score heuristique)
Étapes offline avec OllamaConformité air-gapped sans votre propre relecture

Configuration

L'extrait ci-dessous active le routage cost_aware et fixe des limites d'investigation partagées. Ces limites s'appliquent même si mcp.enabled est false : elles vivent sous mcp.investigation comme config partagée pour les outils locaux.

routing:
  default_strategy: cost_aware
  strategies:
    cost_aware:
      prefer_local_for: [summarize, classify, context_selection, pre_review]

mcp:
  investigation:
    large_file_bytes: 524288
    max_grep_output_bytes: 262144

Voir aussi