Jeter pour mieux reconstruire

Partager
Jeter pour mieux reconstruire

Un an à jeter des projets à la poubelle

Seize repositories. Deux millions de lignes de code. Cinq à huit projets abandonnés.

Ce bilan des 12 derniers mois pourrait ressembler à un échec. C'est l'inverse. Tandem, Streamjam, Dotflow : chaque projet jeté nous a rapprochés de ce qu'on voulait vraiment construire. On savait dès le début ce qu'on cherchait. On n'avait simplement pas encore les mots pour le formuler.

Wealth Advisor OS nous a permis de parler à une centaine de conseillers financiers et CGP. Ces conversations ont révélé un besoin plus large. Nos missions consulting ont financé notre R&D tout en nous immergeant dans les vrais problèmes. À force de construire pour nos clients fintech, une évidence s'est imposée : tous avaient besoin du même socle.

STANDARDS est né de cette convergence. En décembre, on a pris la décision au fil du rasoir : tout passe sur une seule plateforme. Trois clients migrés au premier trimestre 2026. 300 000 euros de revenus en année une.

Le modèle hybride consulting-produit, souvent considéré comme impossible, a fonctionné parce qu'on a appris à abandonner sans scrupule.


Ce que l'IA a changé dans notre façon de travailler

Le MVP n'existe plus au sens classique.

Il y a trois ans, une équipe de vingt personnes aurait mis deux ans à construire ce qu'on livre aujourd'hui à quatre. Le minimum s'est déplacé vers le maximum. Quand Arthur design une fonctionnalité, il ne se demande plus s'il faut la scopper au minimum. Il la construit en entier, parce que l'IA le permet.

Ce changement a une contrepartie : la parallélisation permanente. Arthur parle plus à des LLM qu'à des humains. Il jongle entre cinq tâches de quatre minutes chacune, lance un agent, passe à la suite, revient quand c'est fini. Karl code avec une file d'attente dans la tête plutôt qu'un backlog rigide.

Notre agent Product Manager dans Notion a transformé la création de backlogs. Avant : trois jours pour synthétiser un audit client. Aujourd'hui : dix minutes. L'agent comprend notre structure, notre vocabulaire, nos bases de données. Il pose des questions de clarification, puis génère cinquante tickets détaillés.

L'agent Feedback Manager a centralisé 250 fiches en trois semaines. Les clients parlent à un chatbot qui analyse leurs captures d'écran, comprend le contexte utilisateur, et évite de créer dix fiches pour le même bug. Ce qui prenait des heures de support improductif se règle en quelques échanges automatisés.

Ce qui a changé en 12 mois, c'est l'économie. Le coût par million de tokens a été divisé par 15 à 20. L'agent Feedback Manager centralise 250 fiches. Aujourd'hui l'arithmétique tient. Ce n'est pas un détail opérationnel, c'est ce qui rend le modèle viable.

Le gain n'est pas seulement en temps. C'est en bande passante mentale. Quand tu ne passes plus tes journées à trier des feedbacks ou rédiger des specs, tu peux te concentrer sur les décisions qui comptent.


La rigidité tue l'IA

Karl a une conviction qui traverse tout son travail : plus tu diriges l'IA, moins elle peut te surprendre.

Le piège classique, c'est de donner des instructions trop catégoriques. On veut un résultat précis, alors on bride l'agent avec des règles strictes. Résultat : il fonctionne dans 80 % des cas et se bloque sur les 20 % restants.

La solution, c'est de ne jamais être bloquant sur les capacités d'interaction. Claude Code ne dit jamais non. Il demande l'autorisation, puis il agit. C'est cette souplesse qui permet des résultats inattendus. Quand tu laisses de l'espace, l'IA ouvre des brèches vers des features que tu n'avais pas imaginées.

Arthur applique le même principe à la création d'agents. Il commence par un workflow précis, itère erreur après erreur, puis généralise. Au début, le prompt grossit avec des règles spécifiques pour chaque cas. Ensuite, il dégraisse en demandant à Claude de trouver des patterns plus larges. Le résultat final est plus robuste qu'un prompt rigide dès le départ.

Deux techniques concrètes qui font la différence :

  • Les balises dans les prompts augmentent la précision de 25 %. Ouvrir une balise pour le contexte, la fermer, puis une autre pour les exclusions. L'IA sait exactement où commence et où finit chaque instruction.
  • La Chain of Verification élimine les approximations. À la fin du prompt, l'agent rédige une première réponse, génère cinq questions d'autocritique, y répond factuellement, puis reformule. Ça transforme la qualité des outputs.

Rester pertinent face à l'IA généraliste

La question qui a traversé notre discussion : comment ne pas être remplacé par un agent qui fait tout ?

Karl voit une forme de fatalité. Tôt ou tard, un agent généraliste fera tout. La seule stratégie : éloigner l'échéance. Construire des infrastructures optimisées pour l'IA. Des données compressées, des temps de réponse légers, des interfaces vocales natives. Devenir un maillon indispensable dans la chaîne d'un agent ultra-performant.

Mais il se pourrait que les wrappers simples soient balayés. Prendre des rendez-vous, classer des fichiers, générer des résumés : tout ça sera commoditisé. Mais la connaissance métier reste protégée. Un agent généraliste ne comprendra pas les subtilités d'une plateforme fintech construite avec des centaines de conversations clients, des dizaines de cas limites réglementaires, des années d'itérations sur les vrais problèmes.

Aussi, le routing devient stratégique. Le workflow "cinq tâches de quatre minutes" fonctionne parce qu'il s'appuie sur des modèles rapides et bon marché. Mais une
bifurcation est en train de s'installer : d'un côté les modèles flash pour les tâches routinières, de l'autre les modèles de raisonnement (extended thinking) pour les décisions architecturales. Prompt engineering, balises, Chain of Verification, tout
ça optimise un seul type de modèle. La vraie compétence qui va compter dans 12 mois, c'est le routing : savoir quel problème mérite un modèle qui "réfléchit" et lequel peut être traité en 200ms pour 0,002€. Les équipes qui automatisent ce routing auront une infrastructure plus robuste que celles qui ont juste de bons prompts.

Numa souligne que pour que les IA se parlent entre elles sans humain dans la boucle, il faudrait des standards de communication universels et faciles à implémenter même pour une PME non tech. Les API ont mis des décennies à se généraliser. Les MCP mettront un peu de temps. L'humain restera le chef de chantier qui branche les tuyaux, qui comprend le contexte, qui valide les décisions critiques.

Notre position collective : on se met dans la tête que la porte se ferme dans trois ans. On bourrine comme des tanks pour être à l'abri. Si c'est faux, on aura simplement bâti plus vite. Si c'est vrai, on fera autre chose de nos vies. On ira profiter du soleil.


Ce qu'on retient des 12 derniers mois

Savoir abandonner très tôt reste plus dur émotionnellement que de s'acharner. Mais c'est rentable.

La dispersion n'est pas toujours une erreur. Parfois, il faut explorer dans tous les sens pour comprendre ce qu'on cherche vraiment. Chaque projet jeté a nourri celui qui a survécu.

L'IA ne remplace pas les développeurs, les designers ou les product managers. Elle repousse les limites de ce qu'une équipe de quatre peut construire. Et ça, c'est déjà une révolution.

STANDARDS, à terme, ce sera un robot vivant. Comme Jarvis qui prend forme dans l'usine de Tony Stark. Et un jour, on l'invitera peut-être dans nos calls.


VEILLE TECHNIQUE

Chain of Verification (CoVe) : Mécanisme de prompt où l'agent génère une réponse, crée ses propres questions critiques, y répond, puis reformule. Réduit drastiquement les hallucinations.

Balises dans les prompts : Structurer les instructions avec des balises ouvertes et fermées. Chaque bloc d'information clairement délimité améliore la précision de 25 %.

Notion Workers : Un Worker est un petit programme backend que vous déployez dans l’infrastructure Notion et que Notion exécute pour faire du travail déterministe, sans raisonnement LLM.

Notion CLI : Vous permet de "build & deploy" du code pour votre workspace Notion depuis votre terminal (syncs, tools, webhooks, uploads) donc en ligne de commande (CLI).


👉 SUIVEZ NOTRE PARCOURS Bastien | Numa | Arthur | Karl

💡 UN DÉFI TECHNIQUE OU PRODUIT ? On accompagne quelques projets par an. Pas de pitch commercial, juste une discussion autour de vos enjeux concrets. Échangeons 15 minutes.


We craft, And You Create

Lire la suite