Fluxo Claude Code Agency -- Social Animal

RESUMO EXECUTIVO

Nós operamos uma agência web headless onde Claude Code controla 60-70% do trabalho de implementação que costumava exigir um time completo. Nosso custo por MVP caiu de $35.000-$50.000 para $8.000-$15.000. O tempo até o primeiro deploy foi de 6-8 semanas para 10-18 dias. Mas a IA não substituiu tudo--ela substituiu tarefas específicas e bem delimitadas. Aqui está o que funciona, o que não funciona, e pelo que ainda pagamos humanos.

Índice

Por que reconstruímos nossa agência em torno do Claude Code
Como é de verdade o fluxo de trabalho de uma agência Claude Code?
O que a IA controla em nossos projetos
Pelo que ainda contratamos humanos
Números reais: custo por MVP e tempo para deploy
Nossa configuração de projeto Claude Code
A empresa de um bilhão de dólares de uma pessoa é real?
O que ainda não funciona
Como scopeamos projetos de clientes agora
A matemática do fundador: detalhamento de horas por semana
FAQ

Por que reconstruímos nossa agência em torno do Claude Code

Não foi planejado. No final de 2024, éramos uma loja de desenvolvimento headless de 4 pessoas cobrando $150/hora por trabalho com Next.js e CMS headless. Em março de 2025, após integrar Claude Code--especificamente Claude 3.5 Sonnet inicialmente, agora Claude 4 Sonnet--em cada projeto, dois desses papéis mudaram fundamentalmente. Não foram eliminados. Mudaram. Um dev sênior se tornou um engenheiro totalmente orientado por IA. O outro mudou inteiramente para revisão de código e arquitetura.

O catalisador: um projeto Sanity + Next.js 14 onde usamos Claude Code para fazer scaffold de toda a camada de schema, gerar queries GROQ, construir 14 templates de página e escrever o pipeline de deploy. O que teria sido 120 horas faturáveis saiu em 34. Olhamos um para o outro e disse: "Precisamos reestruturar tudo."

Essa é a origem honesta. Não uma estratégia grandiosa. Um projeto que terminou muito rápido.

Como é de verdade o fluxo de trabalho de uma agência Claude Code?

Aqui está uma semana típica em uma construção de cliente ativa:

Segunda: Arquitetura + Kickoff

Eu: 2 horas definindo arquitetura de componentes, modelo de dados, contratos de API
Eu: 1 hora escrevendo instruções de projeto CLAUDE.md (mais sobre isso abaixo)
Claude Code: gera scaffold inicial de projeto, instala dependências, configura modo strict do TypeScript, configura linting

Terça-Quinta: Sprint de construção

Eu: 1-2 horas por dia revisando output de Claude Code, capturando erros, redirecionando
Claude Code: 6-8 tarefas por dia--componentes de página, rotas de API, definições de schema de CMS, funções utilitárias, arquivos de teste
Eu: pivôs de arquitetura, decisões complexas de gerenciamento de estado, threads do cliente no Slack

Sexta: Integração + QA

Eu: 3-4 horas de QA manual, auditoria de acessibilidade, teste de performance
Claude Code: corrigindo bugs identificados em QA, escrevendo testes faltantes, gerando documentação
Eu: preparação de demo de cliente, deploy para staging

Total de horas humanas por semana em uma construção ativa: 18-24. Caiu de 35-45 em nosso fluxo de trabalho pré-IA.

O que a IA controla em nossos projetos

Aqui está o inventário específico de tarefas--coisas que Claude Code faz em projetos reais de clientes toda semana:

Geração de código (70-80% automatizada)

Componentes React/Next.js: layouts de página, componentes de UI a partir de specs do Figma descritos em prompts, handlers de formulários
Schemas de CMS: tipos de schema Sanity, modelos de conteúdo Contentful como scripts de migração, configs de collection do Payload CMS
Rotas de API: Next.js Route Handlers, procedimentos tRPC, endpoints de webhook
Operações de banco de dados: mudanças de schema Prisma, arquivos de migração, scripts de seed
Tipos TypeScript: gerando tipos a partir de respostas de API, schemas de validação Zod, pacotes de tipo compartilhado

Auditorias de código (economiza 4-6 horas/semana)

Revisando codebases existentes antes de projetos de refator
Identificando dependências não utilizadas, código morto, inconsistências de tipo
Gerando relatórios de auditoria com referências específicas de arquivo:linha

Rascunhos de conteúdo (economiza 3-5 horas/semana)

Respostas de RFP e propostas técnicas
Documentação de projeto e arquivos README
Explicações técnicas orientadas ao cliente
Primeiros rascunhos de SOW (sempre revisados e reescritos por humanos)

Testes (economiza 5-8 horas/semana)

Testes unitários Vitest para funções utilitárias
Scaffolds de testes e2e Playwright
Geração de dados de teste e fixtures
Identificação de casos extremos que poderíamos perder

Pelo que ainda contratamos humanos

Tarefa	Por que a IA não consegue (ainda)	Quem contratamos	Custo típico
Estratégia de marca	Requer entender a posição de mercado do cliente, concorrentes, psicologia do consumidor em um nível que a IA alucina	Estrategista de marca contratado	$3.000-$8.000/projeto
Direção de copy	Tom, voz e arquitetura de persuasão precisam de julgamento humano	Copywriter freelancer	$2.000-$5.000/projeto
Chamadas de vendas	Clientes querem falar com uma pessoa que entende seu negócio	Nós mesmos fazemos isso	Nosso tempo
Design visual	Trabalho no Figma, art direction, sistemas de design	Designer contratado	$4.000-$12.000/projeto
DevOps complexo	Configs Kubernetes, deployments multi-região, CI/CD para indústrias reguladas	Engenheiro DevOps contratado	$150-$200/hora
Revisão legal	Contratos, MSAs, cláusulas de IP	Advogado	$350-$500/hora
Auditorias de acessibilidade	Ferramentas automatizadas capturam 30-40% dos problemas; testes reais com leitor de tela precisam de um humano	Especialista em A11y	$1.500-$3.000/auditoria
Pesquisa com usuários	Conversar com usuários reais, sintetizar feedback	Pesquisador UX	$100-$150/hora

Essas são 8 categorias onde humanos são inegociáveis.

Números reais: custo por MVP e tempo para deploy

Aqui estão números reais de nossos últimos 6 projetos de clientes (Q1-Q2 2025), anonimizados:

Projeto	Stack	Estimativa herdada	Assistida por IA real	Tempo para deploy
Site de marketing SaaS	Next.js 15 + Sanity v3	$38.000	$11.500	12 dias
Vitrine de e-commerce	Next.js 15 + Shopify Storefront API	$52.000	$18.200	18 dias
Portfólio/CMS para agência criativa	Astro 5 + Payload CMS 3.0	$28.000	$8.400	10 dias
MVP de dashboard SaaS	Next.js 15 + Supabase + Prisma	$45.000	$14.800	16 dias
Redesenho de site de ONG	Next.js 14 + Contentful	$32.000	$9.200	11 dias
Site de documentação para desenvolvedores	Astro 5 + MDX + Algolia	$22.000	$7.600	8 dias

"Estimativa herdada" é o que teríamos cotado em 2023 com nossa estrutura de time antiga. "Assistida por IA real" é o que o cliente pagou em 2025.

Redução de custo: 62%. Tempo até primeiro deploy: 12,5 dias.

Esses são todos os projetos em nossa faixa ideal--sites de CMS headless e aplicações Next.js. Sistemas RBAC empresariais, aplicações colaborativas em tempo real, ou qualquer coisa envolvendo sistemas distribuídos complexos teria aparência diferente.

Nossa configuração de projeto Claude Code

Todo projeto começa com um arquivo CLAUDE.md na raiz do repo. Esta é a coisa única mais impactante que fizemos para melhorar a qualidade do output de IA. Aqui está nossa estrutura de template:

# Projeto: [Nome do Cliente]

## Stack de tecnologia
- Framework: Next.js 15.1 (App Router)
- CMS: Sanity v3.72
- Styling: Tailwind CSS v4.0
- Linguagem: TypeScript 5.7 (strict mode)
- Gerenciador de pacotes: pnpm 9.x
- Node: 22 LTS

## Decisões de arquitetura
- Toda fetching de dados em Server Components
- Componentes de cliente apenas para interatividade
- Queries GROQ co-localizadas com componentes de página
- Sem barrel exports
- Preferir named exports

## Convenções de código
- Usar utilitário `cn()` para classes condicionais (já em lib/utils.ts)
- Error boundaries no nível de segmento de rota
- Todas as imagens através de next/image com dimensões explícitas
- Formulários usam react-hook-form + zod

## Estrutura de arquivo
[saída de tree do diretório src/]

## Restrições conhecidas
- Cliente requer WCAG 2.2 AA
- Deve suportar IE-- só brincando. Chrome 120+, Safari 17+, Firefox 121+
- Target de deploy: Vercel (plano Pro, us-east-1)

## NÃO façam
- Instalar novas dependências sem perguntar
- Criar arquivos fora de src/
- Usar default exports (exceto para páginas/layouts Next.js)
- Escrever CSS fora de classes Tailwind

Este arquivo elimina aproximadamente 40% dos incidentes "Claude saiu dos trilhos". Sem ele, você consegue código genérico que não combina com os padrões do seu projeto. Com ele, Claude Code gera componentes que parecem que seu time escreveu.

Também usamos claude --dangerously-skip-permissions durante fases de scaffolding (nunca em branches de produção) e mudamos para o modo de aprovação interativa uma vez que passamos da configuração inicial. Custo por projeto no uso de API: tipicamente $40-$120 para uma construção completa, rodando em Claude 4 Sonnet.

A empresa de um bilhão de dólares de uma pessoa é real?

Não. Mas é um experimento de pensamento que revela algo real sobre onde estamos.

A peça de Evartology no Substack--"Como manter uma empresa sozinho em 2026"--detalha um stack impressionante: IA para engenharia, marketing, vendas, operações, até contratações. É um playbook bem organizado, e concordo com cerca de 60% dele. As partes sobre usar IA para rascunhos de conteúdo, geração de código e docs operacionais combinam com nossa experiência. Mas a peça subestima a irredutibilidade da confiança. Clientes não compram código. Eles compram confiança de que alguém entende seu problema. Isso é uma coisa humana.

A peça de Henry (henrythe9th no Substack) sobre um fundador solo que se "clonou" com agentes de IA é mais fundamentada. O exemplo específico de usar IA para lidar com triage de suporte ao cliente e respostas de primeiro rascunho ressoa--fazemos algo similar com rascunhos de propostas técnicas. Mas o framing de "clonagem" exagera. O que realmente aconteceu é delegação de tarefas para IA. Você não clonou seu julgamento. Você terceirizou sua digitação.

O briefing executivo de Nate sobre negócios de uma pessoa aborda os dados da Carta mostrando um percentual crescente de startups de fundador solo. Isso é real. Os dados da Carta de início de 2025 mostraram incorporações solo tendendo para cima. Mas uma empresa solo-incorporada em Carta não é o mesmo que uma empresa solo-operada. A maioria desses fundadores contrata contratados, agências (como a nossa) e papéis fracionários. Eles são solo na cap table, não solo na prática.

Nossa posição: a versão realista disso não é uma pessoa fazendo um bilhão de dólares. É uma pessoa (ou um time muito pequeno) fazendo $1M-$5M em receita com margens de 70-80%, lidando com o trabalho que costumava exigir 8-12 pessoas. Isso não é uma fantasia. Nós estamos vendo acontecer. Mas requer competência em IA, expertise de domínio e uma rede profissional existente. Não apenas uma subscrição do ChatGPT.

O que ainda não funciona

1. Refatores complexos de múltiplos arquivos

Claude Code consegue refatorar um arquivo único brilhantemente. Mas quando você precisa de mudanças coordenadas em 15+ arquivos--digamos, mudar um modelo de dados que toca rotas de API, componentes, tipos, testes e schemas de CMS simultaneamente--perde coerência em torno do arquivo 8-10. Temos visto introduzir dependências circulares quebradas, esquecer de atualizar imports em arquivos que tocou anteriormente na sessão, e silenciosamente pular arquivos. Nosso workaround: quebrar refatores em 3-4 lotes de arquivo e verificar entre cada um.

2. Design-para-código do Figma

Apesar da hype, gerar componentes de qualidade produção a partir de designs do Figma ainda é uma tarefa de 60% de precisão no melhor. Claude Code (ou qualquer LLM) não consegue ver seu arquivo Figma diretamente. Você está descrevendo layouts em palavras ou colando screenshots. O output consegue a estrutura aproximadamente certa, mas perde espaçamento, breakpoints responsivos e estados de interação. Ainda temos um humano traduzindo designs para componentes, depois usamos Claude Code para expandir variantes e estados.

3. Otimização de performance

Claude Code vai te dizer para adicionar React.memo() e chamar de quits. Trabalho real de performance--identificando re-renders desnecessários através de profiling React DevTools, otimizando queries GROQ analisando planos de execução Sanity, reduzindo CLS auditando scripts de terceiros--requer observação humana do comportamento em tempo de execução. IA não consegue fazer profile da sua app.

4. Debugar problemas em produção

Quando algo quebra às 2 da manhã e o erro é um timeout Edge Runtime Vercel criptografado, Claude Code consegue sugerir possibilidades. Mas não consegue olhar seu dashboard Datadog, correlacionar o timing com um deploy, checar se o cache CDN foi purgado, ou perceber que o problema é na verdade um atraso de propagação DNS de uma transferência de domínio que aconteceu 48 horas atrás. O debugging de produção é pesado em contexto e as janelas de contexto de IA ainda são muito estreitas.

5. Qualquer coisa exigindo julgamento visual

Essa animação é muito rápida? Essa combinação de cores se sente certa para uma marca de luxo? O espaço em branco está equilibrado? Claude Code não tem opinião zero aqui. Não pergunte.

6. Coerência de sessão de execução longa

Após cerca de 45-60 minutos de trabalho contínuo em uma única sessão de Claude Code, notamos degradação de qualidade. Começa a repetir padrões de mais cedo na sessão mesmo quando o contexto mudou. Esquece restrições do CLAUDE.md. Nós reiniciamos sessões a cada 45 minutos como regra. Esse é um imposto real de produtividade--provavelmente 20-30 minutos de tempo de re-orientação por dia.

Como scopeamos projetos de clientes agora

Nosso processo de scoping mudou fundamentalmente. Aqui está o antes e depois:

Antes (2023)

Chamada de descoberta (1 hora)
Discussão de arquitetura interna (2 horas)
SOW detalhado com estimativas horárias por feature (4-6 horas)
Ciclo de revisão do cliente (1-2 semanas)
Contrato assinado → kickoff

Depois (2025)

Chamada de descoberta (45 minutos)
Claude Code gera primeiro rascunho de SOW a partir de notas de chamada (15 minutos de prompting)
Eu reviso e reescrevo o SOW (1 hora)
Nós construímos um proof-of-concept descartável do desafio técnico mais difícil usando Claude Code (2-3 horas)
O scope agora é baseado em dados de implementação reais, não em suposições
Revisão do cliente (3-5 dias)
Contrato assinado → kickoff

O passo 4 é a diferença chave. Costumávamos estimar "Integração Shopify Storefront API: 40 horas" baseado em experiência. Agora na verdade construímos uma versão aproximada em 2-3 horas e sabemos que são 22 horas com assistência de IA. Nossas estimativas estão dentro de 15% dos valores reais. Elas costumavam estar dentro de 30-40%.

Isso nos custa 3-4 horas de trabalho pré-vendas não faturado por projeto. Mas nossa taxa de fechamento subiu de ~35% para ~55% porque clientes veem um protótipo funcionando antes de assinar.

A matemática do fundador: detalhamento de horas por semana

Aqui está como minha semana realmente se desdobra como fundador de agência usando Claude Code:

Atividade	Horas/semana	Assistida por IA?
Chamadas de cliente e Slack	6	Não
Decisões de arquitetura e técnicas	5	Parcialmente (Claude Code para pesquisa)
Revisão de código de output de IA	8	Não
Dirigindo sessões de Claude Code	6	N/A (isto É o trabalho de IA)
Ops de negócio (faturamento, contratos, planejamento)	3	Parcialmente (rascunhos)
Vendas e propostas	3	Parcialmente (primeiros rascunhos)
QA manual e testes	3	Não
Aprender e permanecer atual	2	Não
Total	36

36 horas por semana. Não 80. Não 20. E isso é rodando uma agência com $60K-$80K/mês em receita com 2 projetos de cliente ativos simultaneamente.

Pré-IA, esse mesmo output exigia 3,5 FTEs e minhas semanas de 50 horas. A matemática é real. Mas repare: 22 dessas 36 horas ainda são inteiramente trabalho humano. IA não eliminou trabalho. Mudou a razão de pensamento para digitação.

FAQ

Quanto custa Claude Code por mês para trabalho de agência?

Gastamos aproximadamente $180-$300/mês em uso de API Claude para Claude Code em todos os projetos. Isto é no modelo Claude 4 Sonnet. Os custos de projetos individuais variam de $40-$120 dependendo do scope e contagem de sessão.

Claude Code consegue substituir um desenvolvedor junior?

Ele substitui o output de um desenvolvedor junior, mas não o papel. Alguém ainda precisa dirigir, revisar e corrigir o trabalho da IA. Esse alguém precisa de julgamento de nível sênior. Código gerado por IA sem revisão de especialista envia bugs mais rápido.

Qual é o melhor CMS para parear com um fluxo de trabalho Claude Code?

Sanity v3, porque suas definições de schema são arquivos TypeScript que Claude Code gera excepcionalmente bem. Payload CMS 3.0 é um segundo lugar próximo. Contentful funciona, mas sua API de gerenciamento é mais complexa para IA trabalhar com confiabilidade.

Claude Code funciona para desenvolvimento de aplicativos móveis?

Usamos para projetos React Native (Expo SDK 52) com resultados decentes para geração de componentes e configuração de navegação. Tem mais dificuldade com configuração de módulos nativos e debugging específico de plataforma. Aproximadamente 40-50% de ganho de produtividade vs. 60-70% para projetos web.

Como vocês lidam com preocupações de IP do cliente com código gerado por IA?

Nosso MSA inclui uma cláusula afirmando que todos os deliverables são trabalho de produto original independentemente de ferramenta utilizada. Os termos de Anthropic (a partir de junho de 2025) concedem aos usuários direitos aos outputs. Não enviamos dados proprietários do cliente para a API--apenas padrões de código e implementações genéricas.

O que acontece quando Claude Code gera código incorreto?

Acontece em aproximadamente 15-20% das tarefas. Nosso fluxo de trabalho responde a isto com revisão de código obrigatória por humanos em cada PR. Modos de falha comuns: generics TypeScript incorretos, padrões de API desatualizados de dados de treinamento, e falta de tratamento de erro para casos extremos. Nós orçamentamos tempo de revisão em cada estimativa.

Fluxo de Trabalho Claude Code Agency: Como Executamos Projetos em 2025

RESUMO EXECUTIVO

Índice

Por que reconstruímos nossa agência em torno do Claude Code

Como é de verdade o fluxo de trabalho de uma agência Claude Code?

Segunda: Arquitetura + Kickoff

Terça-Quinta: Sprint de construção

Sexta: Integração + QA

O que a IA controla em nossos projetos

Geração de código (70-80% automatizada)

Auditorias de código (economiza 4-6 horas/semana)

Rascunhos de conteúdo (economiza 3-5 horas/semana)

Testes (economiza 5-8 horas/semana)

Pelo que ainda contratamos humanos

Números reais: custo por MVP e tempo para deploy

Nossa configuração de projeto Claude Code

A empresa de um bilhão de dólares de uma pessoa é real?

O que ainda não funciona

1. Refatores complexos de múltiplos arquivos

2. Design-para-código do Figma

3. Otimização de performance

4. Debugar problemas em produção

5. Qualquer coisa exigindo julgamento visual

6. Coerência de sessão de execução longa

Como scopeamos projetos de clientes agora

Antes (2023)

Depois (2025)

A matemática do fundador: detalhamento de horas por semana

FAQ

Quanto custa Claude Code por mês para trabalho de agência?

Claude Code consegue substituir um desenvolvedor junior?

Qual é o melhor CMS para parear com um fluxo de trabalho Claude Code?

Claude Code funciona para desenvolvimento de aplicativos móveis?

Como vocês lidam com preocupações de IP do cliente com código gerado por IA?

O que acontece quando Claude Code gera código incorreto?

Let's build
something together.

RESUMO EXECUTIVO

Índice

Por que reconstruímos nossa agência em torno do Claude Code

Como é de verdade o fluxo de trabalho de uma agência Claude Code?

Segunda: Arquitetura + Kickoff

Terça-Quinta: Sprint de construção

Sexta: Integração + QA

O que a IA controla em nossos projetos

Geração de código (70-80% automatizada)

Auditorias de código (economiza 4-6 horas/semana)

Rascunhos de conteúdo (economiza 3-5 horas/semana)

Testes (economiza 5-8 horas/semana)

Pelo que ainda contratamos humanos

Números reais: custo por MVP e tempo para deploy

Nossa configuração de projeto Claude Code

A empresa de um bilhão de dólares de uma pessoa é real?

O que ainda não funciona

1. Refatores complexos de múltiplos arquivos

2. Design-para-código do Figma

3. Otimização de performance

4. Debugar problemas em produção

5. Qualquer coisa exigindo julgamento visual

6. Coerência de sessão de execução longa

Como scopeamos projetos de clientes agora

Antes (2023)

Depois (2025)

A matemática do fundador: detalhamento de horas por semana

FAQ

Quanto custa Claude Code por mês para trabalho de agência?

Claude Code consegue substituir um desenvolvedor junior?

Qual é o melhor CMS para parear com um fluxo de trabalho Claude Code?

Claude Code funciona para desenvolvimento de aplicativos móveis?

Como vocês lidam com preocupações de IP do cliente com código gerado por IA?

O que acontece quando Claude Code gera código incorreto?

Let's build something together.

Let's build
something together.