Fire-and-consolidate — un pattern d'orchestration multi-agents

Le fire-and-consolidate lance N agents en parallèle puis agrège leurs résultats en une seule passe. Mécanique, forces et limites d'un pattern d'orchestration robuste.

En bref

Le fire-and-consolidate est un pattern d’orchestration qui découpe un travail en unités indépendantes, les traite en parallèle via N agents, puis agrège tous les résultats en une seule passe de consolidation. La phase de consolidation ne démarre qu’après complétion de tous les agents parallèles. Nos observations sur plusieurs dizaines d’orchestrations montrent un taux de succès supérieur à 99 %.

Origine : quand un motif spontané devient une architecture

Le pattern ne naît pas d’une décision de conception. Il émerge d’un constat pratique : quand plusieurs agents travaillent en parallèle sur des tâches indépendantes, leurs outputs convergent naturellement vers un format consolidable. L’étape de synthèse finale s’impose d’elle-même.

Ce mouvement — de l’émergence à la formalisation — est caractéristique des patterns d’ingénierie robustes. On ne les invente pas ; on les observe, on les nomme, puis on les codifie. Une fois nommé, le pattern devient prescriptif : on peut le répliquer intentionnellement, l’adapter, le tester.

La distinction entre “pattern émergent” et “architecture choisie” a des conséquences concrètes. Un pattern émergent a été validé par la pratique avant d’être documenté. Son périmètre d’application est mieux connu que celui d’un pattern conçu a priori.

Mécanique : deux phases, une règle

Le pattern se structure en deux phases strictement séquentielles.

Phase 1 — Parallèle (le “fire”)

L’orchestrateur lance N agents simultanément. Chaque agent reçoit un prompt complet et autonome : il n’a pas besoin des autres pour effectuer son travail. Chacun écrit son output dans un fichier dédié. Il n’y a aucune communication entre agents durant cette phase.

La règle d’indépendance est stricte : si les tâches sont interdépendantes, le pattern ne s’applique pas. Le parallélisme n’est possible que quand les unités de travail sont séparables sans perte d’information.

Phase 2 — Séquentielle (le “consolidate”)

Une fois tous les agents de la phase 1 terminés, un agent consolidateur lit l’ensemble des outputs et produit la synthèse finale. Cette phase ne commence pas avant que le dernier agent parallèle ait rendu son travail.

Si un agent de phase 1 échoue, la consolidation se fait sur les résultats partiels disponibles, avec signalement explicite des éléments manquants. Le système dégrade gracieusement plutôt que d’échouer complètement.

La règle centrale : phase 2 attend phase 1. Sans cette contrainte de synchronisation, le consolidateur travaillerait sur un corpus incomplet sans le savoir.

Quand l’appliquer

Le critère de déclenchement est double : les unités de travail doivent être indépendantes entre elles, et leur nombre doit justifier le surcoût de coordination. En pratique, le seuil pertinent se situe à trois unités ou plus.

En dessous, un traitement séquentiel direct est moins coûteux et tout aussi rapide. Au-dessus, le gain en latence devient significatif : N tâches traitées en parallèle prennent le temps de la plus longue, pas la somme de toutes.

Le pattern s’adapte à plusieurs types de travaux : lecture et extraction de sources multiples, génération batch de documents, audit systématique d’un corpus, classification à grande échelle. Dans tous ces cas, la structure commune est la même — N unités indépendantes, puis une synthèse.

Limites et risques

Le herding effect en consolidation

Le risque principal ne vient pas de la phase parallèle mais de la consolidation. Un agent consolidateur confronté à N outputs similaires tend à lisser les différences plutôt qu’à les préserver. Les nuances minoritaires — parfois les plus informatives — disparaissent dans la synthèse.

Ce phénomène s’accentue quand les agents parallèles ont reçu le même prompt de base : leurs outputs se ressemblent structurellement, ce qui renforce la tentation du consolidateur de les fusionner sans discrimination.

Contre-mesure partielle : instruire explicitement le consolidateur à signaler les divergences plutôt qu’à les résoudre. La synthèse devient alors un rapport de convergence/divergence plutôt qu’une fusion aveugle.

L’absence de correction mutuelle

Chaque agent de phase 1 travaille en silo. Une erreur factuelle dans l’output d’un agent ne sera pas corrigée par ses pairs — ils ne le lisent pas. Si la même erreur apparaît dans plusieurs outputs, le consolidateur peut la reprendre comme un fait établi.

Cette limite est structurelle : elle est le revers direct du parallélisme. Permettre aux agents de se corriger mutuellement introduirait des dépendances qui rompraient l’indépendance nécessaire à la phase 1.

La dépendance au prompt initial

La qualité des outputs parallèles dépend entièrement de la qualité du prompt initial. Un prompt ambigu produit N interprétations divergentes que la consolidation ne peut pas toujours réconcilier. Un prompt incomplet produit N outputs lacunaires que la consolidation complète rarement.

Le fire-and-consolidate amplifie la qualité du prompt — dans les deux sens. Un bon prompt produit N bons outputs consolidables proprement. Un mauvais prompt produit N outputs disparates dont la consolidation est difficile ou trompeuse.

Variante : orchestration multi-vagues

Quand le volume de travail dépasse ce qu’une seule vague peut traiter, ou quand les résultats de la première vague doivent informer la seconde, le pattern s’étend en plusieurs vagues séquentielles.

La structure reste identique à chaque vague : N agents parallèles, puis consolidation. Ce qui change, c’est que la consolidation de la vague N devient le point de départ de la vague N+1. L’orchestrateur analyse les écarts après chaque vague et ajuste le prompt de la suivante.

Nos observations montrent que deux vagues suffisent dans la plupart des cas. Au-delà, le coût de coordination augmente sans gain proportionnel sur la qualité de la synthèse finale.

Ce qu’il faut retenir

Le fire-and-consolidate lance N agents en parallèle (phase 1) puis agrège leurs résultats en une seule passe (phase 2), avec synchronisation stricte entre les deux phases.
Applicable uniquement quand les unités de travail sont indépendantes ; le seuil pratique de déclenchement est de trois unités ou plus.
La phase de consolidation est le point de fragilité principal : risque de lissage des divergences (herding effect) et de propagation d’erreurs non corrigées.
La qualité du prompt initial est déterminante — le pattern amplifie les forces et les faiblesses du cadrage.
En multi-vagues, la consolidation de chaque vague informe la vague suivante ; deux vagues couvrent la majorité des cas d’usage.

Sources

Chase, H., “LangGraph: Multi-Agent Workflows”, LangChain Blog 2024
Wu et al., “AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation”, arXiv 2023
Anthropic, “Building effective agents”, Anthropic Engineering Blog 2024
Wang et al., “A Survey on Large Language Model based Autonomous Agents”, arXiv 2023
Nos tests d’orchestration multi-agents sur plusieurs dizaines de sessions, avec 174 agents et 15 orchestrations complètes.