Flux de travail Claude Code Agency : Comment nous gérons les projets en 2025
RÉSUMÉ
Nous dirigeons une agence web headless où Claude Code gère 60-70% du travail d'implémentation qui nécessitait auparavant une équipe complète. Notre coût par MVP est passé de 35 000 à 50 000 dollars à 8 000 à 15 000 dollars. Le délai jusqu'au premier déploiement est passé de 6 à 8 semaines à 10 à 18 jours. Mais l'IA n'a pas remplacé tout--elle a remplacé des tâches spécifiques et bien délimitées. Voici ce qui fonctionne, ce qui ne fonctionne pas, et pour quoi nous embauchons encore des humains.
Table des matières
- Pourquoi nous avons restructuré notre agence autour de Claude Code
- À quoi ressemble vraiment un flux de travail d'agence Claude Code ?
- Ce que l'IA gère dans nos projets
- Pour quoi nous embauchons encore des humains
- Chiffres réels : coût par MVP et délai de déploiement
- Notre configuration de projet Claude Code
- La startup d'un milliard de dollars en une seule personne est-elle réelle ?
- Ce qui ne fonctionne pas encore
- Comment nous délimitons maintenant la portée des projets clients
- Les calculs du fondateur : répartition des heures par semaine
- FAQ
Pourquoi nous avons restructuré notre agence autour de Claude Code
Nous ne l'avions pas prévu. Fin 2024, nous étions une boutique de développement headless de 4 personnes facturant 150 $ l'heure pour du travail Next.js et de CMS headless. En mars 2025, après avoir intégré Claude Code--spécifiquement Claude 3.5 Sonnet au départ, maintenant Claude 4 Sonnet--dans chaque projet, deux de ces rôles avaient changé fondamentalement. Pas éliminés. Changés. Un développeur senior est devenu un ingénieur dirigé par l'IA à temps plein. L'autre s'est entièrement reconverti dans la révision de code et l'architecture.
Le catalyseur : un projet Sanity + Next.js 14 où nous avons utilisé Claude Code pour scaffolder la couche schéma entière, générer des requêtes GROQ, construire 14 modèles de page et écrire le pipeline de déploiement. Ce qui aurait été 120 heures facturables s'est fait en 34. Nous nous sommes regardés et avons dit : « Nous devons tout restructurer. »
C'est l'origine honnête. Pas une grande stratégie. Un projet qui s'est terminé trop vite.
À quoi ressemble vraiment un flux de travail d'agence Claude Code ?
Voici une semaine type sur une construction client active :
Lundi : Architecture et coup d'envoi
- Moi : 2 heures pour définir l'architecture des composants, le modèle de données, les contrats API
- Moi : 1 heure pour écrire les instructions du projet CLAUDE.md (plus de détails ci-dessous)
- Claude Code : génère le scaffold initial du projet, installe les dépendances, configure le mode strict TypeScript, configure le linting
Mardi-jeudi : Sprint de développement
- Moi : 1-2 heures par jour pour examiner la sortie de Claude Code, détecter les erreurs, rediriger
- Claude Code : 6-8 tâches par jour--composants de page, routes API, définitions de schéma CMS, fonctions utilitaires, fichiers de test
- Moi : pivots d'architecture, décisions complexes de gestion d'état, fil de discussion Slack avec les clients
Vendredi : Intégration et QA
- Moi : 3-4 heures d'assurance qualité manuelle, audit d'accessibilité, test de performance
- Claude Code : correction des bugs identifiés lors de l'assurance qualité, rédaction des tests manquants, génération de documentation
- Moi : préparation de la démo client, déploiement en staging
Heures humaines totales par semaine sur une construction active : 18-24. Contre 35-45 dans notre flux de travail pré-IA.
Ce que l'IA gère dans nos projets
Voici l'inventaire spécifique des tâches--les choses que Claude Code fait sur les vrais projets clients chaque semaine :
Génération de code (70-80% automatisée)
- Composants React/Next.js : Mises en page, composants UI à partir de spécifications Figma décrites dans les invites, gestionnaires de formulaires
- Schémas CMS : Types de schéma Sanity, modèles de contenu Contentful en tant que scripts de migration, configurations de collections Payload CMS
- Routes API : gestionnaires de route Next.js, procédures tRPC, points de terminaison webhook
- Opérations de base de données : Modifications de schéma Prisma, fichiers de migration, scripts de seed
- Types TypeScript : Génération de types à partir de réponses API, schémas de validation Zod, packages de type partagés
Audits de code (économise 4-6 heures/semaine)
- Examen des bases de code existantes avant les projets de refactorisation
- Identification des dépendances inutilisées, du code mort, des incohérences de type
- Génération de rapports d'audit avec des références spécifiques fichier:ligne
Brouillons de contenu (économise 3-5 heures/semaine)
- Réponses aux RFP et propositions techniques
- Documentation du projet et fichiers README
- Explications techniques destinées aux clients
- Premiers brouillons d'énoncé des travaux (toujours examinés et réécrits par un humain)
Tests (économise 5-8 heures/semaine)
- Tests unitaires Vitest pour les fonctions utilitaires
- Scaffolds de test e2e Playwright
- Génération de données de test et fixtures
- Identification des cas limites que nous pourrions manquer
Pour quoi nous embauchons encore des humains
| Tâche | Pourquoi l'IA ne peut pas le faire (encore) | Qui nous embauchons | Coût typique |
|---|---|---|---|
| Stratégie de marque | Nécessite de comprendre la position de marché du client, les concurrents, la psychologie des clients à un niveau que l'IA hallucine | Stratège de marque contractuel | 3 000 à 8 000 $ par projet |
| Direction de la copie | Le ton, la voix et l'architecture de persuasion nécessitent un jugement humain | Rédacteur indépendant | 2 000 à 5 000 $ par projet |
| Appels commerciaux | Les clients veulent parler à une personne qui comprend leur entreprise | Nous faisons cela nous-mêmes | Notre temps |
| Conception visuelle | Travaux Figma, direction artistique, systèmes de conception | Designer contractuel | 4 000 à 12 000 $ par projet |
| DevOps complexe | Configurations Kubernetes, déploiements multi-régions, CI/CD pour les industries réglementées | Ingénieur DevOps contractuel | 150-200 $ l'heure |
| Examen juridique | Contrats, MSA, clauses de propriété intellectuelle | Avocat | 350-500 $ l'heure |
| Audits d'accessibilité | Les outils automatisés détectent 30-40% des problèmes ; le test réel du lecteur d'écran nécessite un humain | Spécialiste en accessibilité | 1 500-3 000 $ par audit |
| Recherche utilisateur | Parler aux vrais utilisateurs, synthétiser les commentaires | Chercheur UX | 100-150 $ l'heure |
Ce sont 8 catégories où les humains sont non négociables.
Chiffres réels : coût par MVP et délai de déploiement
Voici les chiffres réels de nos 6 derniers projets clients (Q1-Q2 2025), anonymisés :
| Projet | Stack | Devis hérité | Réel assisté par IA | Délai de déploiement |
|---|---|---|---|---|
| Site marketing SaaS | Next.js 15 + Sanity v3 | 38 000 $ | 11 500 $ | 12 jours |
| Devanture de commerce électronique | Next.js 15 + API Storefront Shopify | 52 000 $ | 18 200 $ | 18 jours |
| Portfolio/CMS pour agence créative | Astro 5 + Payload CMS 3.0 | 28 000 $ | 8 400 $ | 10 jours |
| MVP de tableau de bord SaaS | Next.js 15 + Supabase + Prisma | 45 000 $ | 14 800 $ | 16 jours |
| Refonte de site à but non lucratif | Next.js 14 + Contentful | 32 000 $ | 9 200 $ | 11 jours |
| Site de documentation pour développeurs | Astro 5 + MDX + Algolia | 22 000 $ | 7 600 $ | 8 jours |
Le « devis hérité » est ce que nous aurions coté en 2023 avec notre ancienne structure d'équipe. Le « réel assisté par IA » est ce que le client a payé en 2025.
Réduction des coûts : 62 %. Délai jusqu'au premier déploiement : 12,5 jours.
Ce sont tous des projets dans notre créneau--sites CMS headless et applications Next.js. Les systèmes RBAC d'entreprise, les applications collaboratives en temps réel ou tout ce qui implique des systèmes distribués complexes auraient un aspect différent.
Notre configuration de projet Claude Code
Chaque projet commence par un fichier CLAUDE.md à la racine du référentiel. C'est la chose la plus impactante que nous ayons faite pour améliorer la qualité de la sortie IA. Voici la structure de notre modèle :
# Projet : [Nom du client]
## Stack technologique
- Framework : Next.js 15.1 (App Router)
- CMS : Sanity v3.72
- Stylage : Tailwind CSS v4.0
- Langage : TypeScript 5.7 (mode strict)
- Gestionnaire de paquets : pnpm 9.x
- Node : 22 LTS
## Décisions d'architecture
- Toute la récupération de données dans les composants serveur
- Composants client uniquement pour l'interactivité
- Requêtes GROQ colocalisées avec les composants de page
- Pas d'exportations en tonnelle
- Préférer les exports nommés
## Conventions de code
- Utiliser l'utilitaire `cn()` pour les classes conditionnelles (déjà dans lib/utils.ts)
- Limites d'erreur au niveau du segment de route
- Toutes les images via next/image avec dimensions explicites
- Les formulaires utilisent react-hook-form + zod
## Structure de fichiers
[sortie d'arborescence du répertoire src/]
## Contraintes connues
- Le client nécessite WCAG 2.2 AA
- Doit supporter IE-- juste blaguant. Chrome 120+, Safari 17+, Firefox 121+
- Cible de déploiement : Vercel (forfait Pro, us-east-1)
## Ne PAS
- Installer de nouvelles dépendances sans demander
- Créer des fichiers en dehors de src/
- Utiliser les exports par défaut (sauf pour les pages/mises en page Next.js)
- Écrire du CSS en dehors des classes Tailwind
Ce fichier élimine environ 40% des incidents « Claude est devenu fou ». Sans lui, vous obtenez du code générique qui ne correspond pas aux modèles de votre projet. Avec lui, Claude Code génère des composants qui ressemblent à ce que votre équipe aurait écrit.
Nous utilisons également claude --dangerously-skip-permissions pendant les phases de scaffolding (jamais dans les branches de production) et passons au mode d'approbation interactive une fois que nous avons dépassé la configuration initiale. Coût par projet en utilisation de l'API : généralement 40-120 $ pour une construction complète, fonctionnant sur Claude 4 Sonnet.
La startup d'un milliard de dollars en une seule personne est-elle réelle ?
Non. Mais c'est une expérience de réflexion qui révèle quelque chose de réel sur où nous en sommes.
L'article d'Evartology sur Substack--« Comment gérer une entreprise seul en 2026 »--présente une pile impressionnante : l'IA pour l'ingénierie, le marketing, les ventes, les opérations, même l'embauche. C'est un manuel bien organisé, et je suis d'accord avec environ 60% de celui-ci. Les parties concernant l'utilisation de l'IA pour les brouillons de contenu, la génération de code et les documents opérationnels correspondent à notre expérience. Mais le morceau sous-estime l'irréductibilité de la confiance. Les clients n'achètent pas du code. Ils achètent la confiance que quelqu'un comprend leur problème. C'est une chose humaine.
L'article d'Henry (henrythe9th sur Substack) sur un fondateur solo qui s'est « cloné » avec des agents IA est plus ancré dans la réalité. L'exemple spécifique de l'utilisation de l'IA pour gérer le triage du support client et les réponses de premier brouillon résonne--nous faisons quelque chose de similaire avec les brouillons de propositions techniques. Mais le cadrage de « clonage » le surestime. Ce qui s'est réellement passé, c'est la délégation de tâches à l'IA. Vous n'avez pas cloné votre jugement. Vous avez externalisé votre dactylographie.
Le mémoire exécutif de Nate sur les entreprises d'une seule personne évoque les données de Carta montrant un pourcentage croissant de startups de fondateurs solitaires. C'est réel. Les données de Carta de début 2025 ont montré une tendance à la hausse des incorporations en solo. Mais une entreprise incorporée en solo sur Carta n'est pas la même qu'une entreprise exploitée en solo. La plupart de ces fondateurs embauchent des entrepreneurs, des agences (comme nous) et des rôles fractionnels. Ils sont seuls sur la table des capitaux, pas seuls en pratique.
Notre point de vue : la version réaliste de ceci n'est pas une personne faisant un milliard de dollars. C'est une personne (ou une très petite équipe) gagnant 1 M à 5 M de dollars de revenus avec des marges de 70-80%, gérant le travail qui nécessitait autrefois 8-12 personnes. Ce n'est pas un fantasme. Nous le voyons se produire. Mais cela nécessite une compétence en IA, une expertise du domaine et un réseau professionnel existant. Pas seulement un abonnement ChatGPT.
Ce qui ne fonctionne pas encore
1. Refactorisations complexes multi-fichiers
Claude Code peut refactoriser un seul fichier de manière brillante. Mais lorsque vous avez besoin de modifications coordonnées sur 15 fichiers ou plus--par exemple, modifier un modèle de données qui affecte les routes API, les composants, les types, les tests et les schémas CMS simultanément--il perd sa cohérence autour du fichier 8-10. Nous l'avons vu introduire des dépendances circulaires cassantes, oublier de mettre à jour les imports dans les fichiers qu'il a touchés plus tôt dans la session et ignorer silencieusement les fichiers. Notre solution : diviser les refactorisations en 3-4 lots de fichiers et vérifier entre chaque.
2. Design vers code depuis Figma
Malgré le battage publicitaire, générer des composants de qualité production à partir de conceptions Figma est toujours une tâche avec une précision d'environ 60% au mieux. Claude Code (ou tout LLM) ne peut pas voir directement votre fichier Figma. Vous décrivez les mises en page en mots ou collez des captures d'écran. La sortie obtient la structure à peu près correctement mais manque l'espacement, les points d'arrêt réactifs et les états d'interaction. Nous avons toujours un humain qui traduit les conceptions en composants, puis utilisons Claude Code pour développer les variantes et les états.
3. Optimisation des performances
Claude Code vous dira d'ajouter React.memo() et c'est tout. Le vrai travail de performance--identifier les re-rendus inutiles via le profilage React DevTools, optimiser les requêtes GROQ en analysant les plans d'exécution de Sanity, réduire CLS en auditant les scripts tiers--nécessite l'observation humaine du comportement d'exécution. L'IA ne peut pas profiler votre application.
4. Débogage des problèmes de production
Lorsque quelque chose se casse à 2 heures du matin et que l'erreur est un délai d'expiration cryptique de Vercel Edge Runtime, Claude Code peut suggérer des possibilités. Mais il ne peut pas consulter votre tableau de bord Datadog, corréler le timing avec un déploiement, vérifier si le cache CDN a été purgé, ou réaliser que le problème est en fait un délai de propagation DNS suite à un transfert de domaine survenu il y a 48 heures. Le débogage de production est lourd en contexte et les fenêtres de contexte d'IA sont toujours trop étroites.
5. Tout ce qui nécessite un jugement visuel
Cette animation est-elle trop rapide ? Cette combinaison de couleurs vous semble-t-elle juste pour une marque de luxe ? L'espace blanc est-il équilibré ? Claude Code n'a aucun avis ici. Ne demandez pas.
6. Cohérence de session longue
Après environ 45-60 minutes de travail continu dans une seule session Claude Code, nous remarquons une dégradation de la qualité. Il commence à répéter les modèles du début de la session même lorsque le contexte a changé. Il oublie les contraintes du CLAUDE.md. Nous redémarrons les sessions toutes les 45 minutes en règle. C'est une vraie taxe de productivité--probablement 20-30 minutes de temps de réorientation par jour.
Comment nous délimitons maintenant la portée des projets clients
Notre processus de délimitation a changé fondamentalement. Voici l'avant et l'après :
Avant (2023)
- Appel de découverte (1 heure)
- Discussion d'architecture interne (2 heures)
- SOW détaillé avec estimations horaires par fonctionnalité (4-6 heures)
- Cycle d'examen du client (1-2 semaines)
- Contrat signé → lancement
Après (2025)
- Appel de découverte (45 minutes)
- Claude Code génère le premier brouillon de l'énoncé des travaux à partir des notes d'appel (15 minutes d'invites)
- Je révise et réécris l'énoncé des travaux (1 heure)
- Nous construisons une preuve de concept jetable du défi technique le plus difficile en utilisant Claude Code (2-3 heures)
- La portée est désormais basée sur des données d'implémentation réelles, pas des suppositions
- Examen du client (3-5 jours)
- Contrat signé → lancement
L'étape 4 est la différence clé. Nous avions l'habitude d'estimer « Intégration de l'API Shopify Storefront : 40 heures » basée sur l'expérience. Maintenant, nous construisons réellement une version approximative en 2-3 heures et savons que c'est 22 heures avec l'assistance de l'IA. Nos estimations sont dans les 15% des actifs. Elles avaient l'habitude d'être dans les 30-40%.
Cela nous coûte 3-4 heures de travail de pré-vente non facturé par projet. Mais notre taux de clôture est passé de ~35% à ~55% car les clients voient un prototype fonctionnel avant de signer.
Les calculs du fondateur : répartition des heures par semaine
Voici comment ma semaine se décompose réellement en tant que fondateur d'agence utilisant Claude Code :
| Activité | Heures/semaine | Assistée par IA ? |
|---|---|---|
| Appels clients et Slack | 6 | Non |
| Architecture et décisions techniques | 5 | Partiellement (Claude Code pour la recherche) |
| Examen du code de sortie de l'IA | 8 | Non |
| Direction des sessions Claude Code | 6 | N/A (c'est le travail de l'IA) |
| Opérations commerciales (facturation, contrats, planification) | 3 | Partiellement (brouillons) |
| Ventes et propositions | 3 | Partiellement (premiers brouillons) |
| Assurance qualité manuelle et tests | 3 | Non |
| Apprentissage et mise à jour des connaissances | 2 | Non |
| Total | 36 |
36 heures par semaine. Pas 80. Pas 20. Et c'est diriger une agence générant 60K à 80K $ par mois de revenus avec 2 projets clients actifs à tout moment.
En pré-IA, ce même résultat nécessitait 3,5 ETP et mes semaines de 50 heures. Les mathématiques sont réelles. Mais remarquez : 22 de ces 36 heures sont toujours entièrement du travail humain. L'IA n'a pas éliminé le travail. Elle a changé le ratio de réflexion à dactylographie.
FAQ
Combien coûte Claude Code par mois pour le travail d'agence ?
Nous dépensons environ 180-300 $ par mois en utilisation de l'API Claude pour Claude Code sur tous les projets. Ceci est sur le modèle Claude 4 Sonnet. Les coûts individuels des projets varient de 40-120 $ selon la portée et le nombre de sessions.
Claude Code peut-il remplacer un développeur junior ?
Il remplace la production d'un développeur junior mais pas le rôle. Quelqu'un doit toujours diriger, examiner et corriger le travail de l'IA. Ce quelqu'un doit avoir un jugement de niveau senior. Le code généré par l'IA sans examen expert livre les bogues plus rapidement.
Quel est le meilleur CMS à associer à un flux de travail Claude Code ?
Sanity v3, car ses définitions de schéma sont des fichiers TypeScript que Claude Code génère exceptionnellement bien. Payload CMS 3.0 est un proche second. Contentful fonctionne mais son API de gestion est plus complexe pour que l'IA le fasse de manière fiable.
Claude Code fonctionne-t-il pour le développement d'applications mobiles ?
Nous l'avons utilisé pour les projets React Native (Expo SDK 52) avec des résultats décents pour la génération de composants et la configuration de navigation. Il a plus de mal avec la configuration des modules natifs et le débogage spécifique à la plateforme. Gain de productivité d'environ 40-50% par rapport à 60-70% pour les projets web.
Comment gérez-vous les préoccupations concernant la PI des clients avec le code généré par l'IA ?
Notre MSA comprend une clause stipulant que tous les livrables sont des travaux originaux quel que soit l'outil utilisé. Les conditions d'Anthropic (à partir de juin 2025) accordent aux utilisateurs des droits sur les sorties. Nous n'envoyons pas de données propriétaires des clients à l'API--uniquement les modèles de code et les implémentations génériques.
Que se passe-t-il lorsque Claude Code génère du code incorrect ?
Cela se produit sur environ 15-20% des tâches. Notre flux de travail en tient compte avec une révision obligatoire du code humain sur chaque PR. Les modes d'échec courants : génériques TypeScript incorrects, modèles d'API périmés des données d'entraînement et gestion des erreurs manquante pour les cas limites. Nous prévoyons du temps d'examen dans chaque estimation.