AgentFlow
Agents

Ollama

Lokale Modelle für Enrichment, Routing und Intent-Fallback ausführen.

Ollama

Ollama versorgt die lokalen Anteile von AgentFlow: Anreicherungsschritte, den Intent-Resolver, wenn intent.resolver.use_ollama_fallback aktiv ist, und kostenbewusstes Routing Richtung work.default_enricher. Es gibt keine separate Produktintegration im üblichen Sinne — Sie setzen HTTP-Endpunkt und Modell-Tags unter agents.ollama und spiegeln dieselben Kennungen in passenden models-Einträgen wider.

Konfiguration

Weisen Sie endpoint auf Ihren Daemon, tragen Sie die Chat- und Embedding-Tags ein, die Sie bereits mit ollama pull geholt haben, und ordnen Sie dieselbe Modellkennung einem models-Profil mit provider: ollama und den usage-Klassen zu, die lokal abgedeckt werden sollen.

agents:
  ollama:
    endpoint: http://localhost:11434
    model: qwen2.5-coder:14b
    embedding_model: nomic-embed-text
    timeout: 300

models:
  ollama_local_qwen:
    provider: ollama
    class: local
    model: qwen2.5-coder:14b
    usage: [summarize, classify, pre_review, context_selection]

Voraussetzungen

Daemon starten, referenzierte Modelle ziehen, anschließend mit doctor prüfen, dass Konfiguration und Umgebung zusammenpassen.

ollama serve
ollama pull qwen2.5-coder:14b
agentflow doctor

Nutzung

enrich spricht Ollama an, wenn Sie --agent ollama setzen. work --prefer-local hält alle dafür qualifizierten Schritte auf dem lokalen Profil, das Ihr Routing beschreibt.

agentflow enrich billing-v2 --agent ollama
agentflow work "refactor utils" --prefer-local

Embeddings und RAG

Das Feld embedding_model ist für spätere Abrufpfade reserviert. Der heutige Befehl agentflow index legt Text-Chunks in SQLite ab — eine vektorbasierte Ähnlichkeitssuche ist in einer Standard-Build nicht zu erwarten.

Siehe auch