RESUMO EXECUTIVO

Nós operamos uma agência web headless onde Claude Code controla 60-70% do trabalho de implementação que costumava exigir um time completo. Nosso custo por MVP caiu de $35.000-$50.000 para $8.000-$15.000. O tempo até o primeiro deploy foi de 6-8 semanas para 10-18 dias. Mas a IA não substituiu tudo--ela substituiu tarefas específicas e bem delimitadas. Aqui está o que funciona, o que não funciona, e pelo que ainda pagamos humanos.

Índice

Por que reconstruímos nossa agência em torno do Claude Code

Não foi planejado. No final de 2024, éramos uma loja de desenvolvimento headless de 4 pessoas cobrando $150/hora por trabalho com Next.js e CMS headless. Em março de 2025, após integrar Claude Code--especificamente Claude 3.5 Sonnet inicialmente, agora Claude 4 Sonnet--em cada projeto, dois desses papéis mudaram fundamentalmente. Não foram eliminados. Mudaram. Um dev sênior se tornou um engenheiro totalmente orientado por IA. O outro mudou inteiramente para revisão de código e arquitetura.

O catalisador: um projeto Sanity + Next.js 14 onde usamos Claude Code para fazer scaffold de toda a camada de schema, gerar queries GROQ, construir 14 templates de página e escrever o pipeline de deploy. O que teria sido 120 horas faturáveis saiu em 34. Olhamos um para o outro e disse: "Precisamos reestruturar tudo."

Essa é a origem honesta. Não uma estratégia grandiosa. Um projeto que terminou muito rápido.

Como é de verdade o fluxo de trabalho de uma agência Claude Code?

Aqui está uma semana típica em uma construção de cliente ativa:

Segunda: Arquitetura + Kickoff

  • Eu: 2 horas definindo arquitetura de componentes, modelo de dados, contratos de API
  • Eu: 1 hora escrevendo instruções de projeto CLAUDE.md (mais sobre isso abaixo)
  • Claude Code: gera scaffold inicial de projeto, instala dependências, configura modo strict do TypeScript, configura linting

Terça-Quinta: Sprint de construção

  • Eu: 1-2 horas por dia revisando output de Claude Code, capturando erros, redirecionando
  • Claude Code: 6-8 tarefas por dia--componentes de página, rotas de API, definições de schema de CMS, funções utilitárias, arquivos de teste
  • Eu: pivôs de arquitetura, decisões complexas de gerenciamento de estado, threads do cliente no Slack

Sexta: Integração + QA

  • Eu: 3-4 horas de QA manual, auditoria de acessibilidade, teste de performance
  • Claude Code: corrigindo bugs identificados em QA, escrevendo testes faltantes, gerando documentação
  • Eu: preparação de demo de cliente, deploy para staging

Total de horas humanas por semana em uma construção ativa: 18-24. Caiu de 35-45 em nosso fluxo de trabalho pré-IA.

O que a IA controla em nossos projetos

Aqui está o inventário específico de tarefas--coisas que Claude Code faz em projetos reais de clientes toda semana:

Geração de código (70-80% automatizada)

  • Componentes React/Next.js: layouts de página, componentes de UI a partir de specs do Figma descritos em prompts, handlers de formulários
  • Schemas de CMS: tipos de schema Sanity, modelos de conteúdo Contentful como scripts de migração, configs de collection do Payload CMS
  • Rotas de API: Next.js Route Handlers, procedimentos tRPC, endpoints de webhook
  • Operações de banco de dados: mudanças de schema Prisma, arquivos de migração, scripts de seed
  • Tipos TypeScript: gerando tipos a partir de respostas de API, schemas de validação Zod, pacotes de tipo compartilhado

Auditorias de código (economiza 4-6 horas/semana)

  • Revisando codebases existentes antes de projetos de refator
  • Identificando dependências não utilizadas, código morto, inconsistências de tipo
  • Gerando relatórios de auditoria com referências específicas de arquivo:linha

Rascunhos de conteúdo (economiza 3-5 horas/semana)

  • Respostas de RFP e propostas técnicas
  • Documentação de projeto e arquivos README
  • Explicações técnicas orientadas ao cliente
  • Primeiros rascunhos de SOW (sempre revisados e reescritos por humanos)

Testes (economiza 5-8 horas/semana)

  • Testes unitários Vitest para funções utilitárias
  • Scaffolds de testes e2e Playwright
  • Geração de dados de teste e fixtures
  • Identificação de casos extremos que poderíamos perder

Pelo que ainda contratamos humanos

Tarefa Por que a IA não consegue (ainda) Quem contratamos Custo típico
Estratégia de marca Requer entender a posição de mercado do cliente, concorrentes, psicologia do consumidor em um nível que a IA alucina Estrategista de marca contratado $3.000-$8.000/projeto
Direção de copy Tom, voz e arquitetura de persuasão precisam de julgamento humano Copywriter freelancer $2.000-$5.000/projeto
Chamadas de vendas Clientes querem falar com uma pessoa que entende seu negócio Nós mesmos fazemos isso Nosso tempo
Design visual Trabalho no Figma, art direction, sistemas de design Designer contratado $4.000-$12.000/projeto
DevOps complexo Configs Kubernetes, deployments multi-região, CI/CD para indústrias reguladas Engenheiro DevOps contratado $150-$200/hora
Revisão legal Contratos, MSAs, cláusulas de IP Advogado $350-$500/hora
Auditorias de acessibilidade Ferramentas automatizadas capturam 30-40% dos problemas; testes reais com leitor de tela precisam de um humano Especialista em A11y $1.500-$3.000/auditoria
Pesquisa com usuários Conversar com usuários reais, sintetizar feedback Pesquisador UX $100-$150/hora

Essas são 8 categorias onde humanos são inegociáveis.

Números reais: custo por MVP e tempo para deploy

Aqui estão números reais de nossos últimos 6 projetos de clientes (Q1-Q2 2025), anonimizados:

Projeto Stack Estimativa herdada Assistida por IA real Tempo para deploy
Site de marketing SaaS Next.js 15 + Sanity v3 $38.000 $11.500 12 dias
Vitrine de e-commerce Next.js 15 + Shopify Storefront API $52.000 $18.200 18 dias
Portfólio/CMS para agência criativa Astro 5 + Payload CMS 3.0 $28.000 $8.400 10 dias
MVP de dashboard SaaS Next.js 15 + Supabase + Prisma $45.000 $14.800 16 dias
Redesenho de site de ONG Next.js 14 + Contentful $32.000 $9.200 11 dias
Site de documentação para desenvolvedores Astro 5 + MDX + Algolia $22.000 $7.600 8 dias

"Estimativa herdada" é o que teríamos cotado em 2023 com nossa estrutura de time antiga. "Assistida por IA real" é o que o cliente pagou em 2025.

Redução de custo: 62%. Tempo até primeiro deploy: 12,5 dias.

Esses são todos os projetos em nossa faixa ideal--sites de CMS headless e aplicações Next.js. Sistemas RBAC empresariais, aplicações colaborativas em tempo real, ou qualquer coisa envolvendo sistemas distribuídos complexos teria aparência diferente.

Nossa configuração de projeto Claude Code

Todo projeto começa com um arquivo CLAUDE.md na raiz do repo. Esta é a coisa única mais impactante que fizemos para melhorar a qualidade do output de IA. Aqui está nossa estrutura de template:

# Projeto: [Nome do Cliente]

## Stack de tecnologia
- Framework: Next.js 15.1 (App Router)
- CMS: Sanity v3.72
- Styling: Tailwind CSS v4.0
- Linguagem: TypeScript 5.7 (strict mode)
- Gerenciador de pacotes: pnpm 9.x
- Node: 22 LTS

## Decisões de arquitetura
- Toda fetching de dados em Server Components
- Componentes de cliente apenas para interatividade
- Queries GROQ co-localizadas com componentes de página
- Sem barrel exports
- Preferir named exports

## Convenções de código
- Usar utilitário `cn()` para classes condicionais (já em lib/utils.ts)
- Error boundaries no nível de segmento de rota
- Todas as imagens através de next/image com dimensões explícitas
- Formulários usam react-hook-form + zod

## Estrutura de arquivo
[saída de tree do diretório src/]

## Restrições conhecidas
- Cliente requer WCAG 2.2 AA
- Deve suportar IE-- só brincando. Chrome 120+, Safari 17+, Firefox 121+
- Target de deploy: Vercel (plano Pro, us-east-1)

## NÃO façam
- Instalar novas dependências sem perguntar
- Criar arquivos fora de src/
- Usar default exports (exceto para páginas/layouts Next.js)
- Escrever CSS fora de classes Tailwind

Este arquivo elimina aproximadamente 40% dos incidentes "Claude saiu dos trilhos". Sem ele, você consegue código genérico que não combina com os padrões do seu projeto. Com ele, Claude Code gera componentes que parecem que seu time escreveu.

Também usamos claude --dangerously-skip-permissions durante fases de scaffolding (nunca em branches de produção) e mudamos para o modo de aprovação interativa uma vez que passamos da configuração inicial. Custo por projeto no uso de API: tipicamente $40-$120 para uma construção completa, rodando em Claude 4 Sonnet.

A empresa de um bilhão de dólares de uma pessoa é real?

Não. Mas é um experimento de pensamento que revela algo real sobre onde estamos.

A peça de Evartology no Substack--"Como manter uma empresa sozinho em 2026"--detalha um stack impressionante: IA para engenharia, marketing, vendas, operações, até contratações. É um playbook bem organizado, e concordo com cerca de 60% dele. As partes sobre usar IA para rascunhos de conteúdo, geração de código e docs operacionais combinam com nossa experiência. Mas a peça subestima a irredutibilidade da confiança. Clientes não compram código. Eles compram confiança de que alguém entende seu problema. Isso é uma coisa humana.

A peça de Henry (henrythe9th no Substack) sobre um fundador solo que se "clonou" com agentes de IA é mais fundamentada. O exemplo específico de usar IA para lidar com triage de suporte ao cliente e respostas de primeiro rascunho ressoa--fazemos algo similar com rascunhos de propostas técnicas. Mas o framing de "clonagem" exagera. O que realmente aconteceu é delegação de tarefas para IA. Você não clonou seu julgamento. Você terceirizou sua digitação.

O briefing executivo de Nate sobre negócios de uma pessoa aborda os dados da Carta mostrando um percentual crescente de startups de fundador solo. Isso é real. Os dados da Carta de início de 2025 mostraram incorporações solo tendendo para cima. Mas uma empresa solo-incorporada em Carta não é o mesmo que uma empresa solo-operada. A maioria desses fundadores contrata contratados, agências (como a nossa) e papéis fracionários. Eles são solo na cap table, não solo na prática.

Nossa posição: a versão realista disso não é uma pessoa fazendo um bilhão de dólares. É uma pessoa (ou um time muito pequeno) fazendo $1M-$5M em receita com margens de 70-80%, lidando com o trabalho que costumava exigir 8-12 pessoas. Isso não é uma fantasia. Nós estamos vendo acontecer. Mas requer competência em IA, expertise de domínio e uma rede profissional existente. Não apenas uma subscrição do ChatGPT.

O que ainda não funciona

1. Refatores complexos de múltiplos arquivos

Claude Code consegue refatorar um arquivo único brilhantemente. Mas quando você precisa de mudanças coordenadas em 15+ arquivos--digamos, mudar um modelo de dados que toca rotas de API, componentes, tipos, testes e schemas de CMS simultaneamente--perde coerência em torno do arquivo 8-10. Temos visto introduzir dependências circulares quebradas, esquecer de atualizar imports em arquivos que tocou anteriormente na sessão, e silenciosamente pular arquivos. Nosso workaround: quebrar refatores em 3-4 lotes de arquivo e verificar entre cada um.

2. Design-para-código do Figma

Apesar da hype, gerar componentes de qualidade produção a partir de designs do Figma ainda é uma tarefa de 60% de precisão no melhor. Claude Code (ou qualquer LLM) não consegue ver seu arquivo Figma diretamente. Você está descrevendo layouts em palavras ou colando screenshots. O output consegue a estrutura aproximadamente certa, mas perde espaçamento, breakpoints responsivos e estados de interação. Ainda temos um humano traduzindo designs para componentes, depois usamos Claude Code para expandir variantes e estados.

3. Otimização de performance

Claude Code vai te dizer para adicionar React.memo() e chamar de quits. Trabalho real de performance--identificando re-renders desnecessários através de profiling React DevTools, otimizando queries GROQ analisando planos de execução Sanity, reduzindo CLS auditando scripts de terceiros--requer observação humana do comportamento em tempo de execução. IA não consegue fazer profile da sua app.

4. Debugar problemas em produção

Quando algo quebra às 2 da manhã e o erro é um timeout Edge Runtime Vercel criptografado, Claude Code consegue sugerir possibilidades. Mas não consegue olhar seu dashboard Datadog, correlacionar o timing com um deploy, checar se o cache CDN foi purgado, ou perceber que o problema é na verdade um atraso de propagação DNS de uma transferência de domínio que aconteceu 48 horas atrás. O debugging de produção é pesado em contexto e as janelas de contexto de IA ainda são muito estreitas.

5. Qualquer coisa exigindo julgamento visual

Essa animação é muito rápida? Essa combinação de cores se sente certa para uma marca de luxo? O espaço em branco está equilibrado? Claude Code não tem opinião zero aqui. Não pergunte.

6. Coerência de sessão de execução longa

Após cerca de 45-60 minutos de trabalho contínuo em uma única sessão de Claude Code, notamos degradação de qualidade. Começa a repetir padrões de mais cedo na sessão mesmo quando o contexto mudou. Esquece restrições do CLAUDE.md. Nós reiniciamos sessões a cada 45 minutos como regra. Esse é um imposto real de produtividade--provavelmente 20-30 minutos de tempo de re-orientação por dia.

Como scopeamos projetos de clientes agora

Nosso processo de scoping mudou fundamentalmente. Aqui está o antes e depois:

Antes (2023)

  1. Chamada de descoberta (1 hora)
  2. Discussão de arquitetura interna (2 horas)
  3. SOW detalhado com estimativas horárias por feature (4-6 horas)
  4. Ciclo de revisão do cliente (1-2 semanas)
  5. Contrato assinado → kickoff

Depois (2025)

  1. Chamada de descoberta (45 minutos)
  2. Claude Code gera primeiro rascunho de SOW a partir de notas de chamada (15 minutos de prompting)
  3. Eu reviso e reescrevo o SOW (1 hora)
  4. Nós construímos um proof-of-concept descartável do desafio técnico mais difícil usando Claude Code (2-3 horas)
  5. O scope agora é baseado em dados de implementação reais, não em suposições
  6. Revisão do cliente (3-5 dias)
  7. Contrato assinado → kickoff

O passo 4 é a diferença chave. Costumávamos estimar "Integração Shopify Storefront API: 40 horas" baseado em experiência. Agora na verdade construímos uma versão aproximada em 2-3 horas e sabemos que são 22 horas com assistência de IA. Nossas estimativas estão dentro de 15% dos valores reais. Elas costumavam estar dentro de 30-40%.

Isso nos custa 3-4 horas de trabalho pré-vendas não faturado por projeto. Mas nossa taxa de fechamento subiu de ~35% para ~55% porque clientes veem um protótipo funcionando antes de assinar.

A matemática do fundador: detalhamento de horas por semana

Aqui está como minha semana realmente se desdobra como fundador de agência usando Claude Code:

Atividade Horas/semana Assistida por IA?
Chamadas de cliente e Slack 6 Não
Decisões de arquitetura e técnicas 5 Parcialmente (Claude Code para pesquisa)
Revisão de código de output de IA 8 Não
Dirigindo sessões de Claude Code 6 N/A (isto É o trabalho de IA)
Ops de negócio (faturamento, contratos, planejamento) 3 Parcialmente (rascunhos)
Vendas e propostas 3 Parcialmente (primeiros rascunhos)
QA manual e testes 3 Não
Aprender e permanecer atual 2 Não
Total 36

36 horas por semana. Não 80. Não 20. E isso é rodando uma agência com $60K-$80K/mês em receita com 2 projetos de cliente ativos simultaneamente.

Pré-IA, esse mesmo output exigia 3,5 FTEs e minhas semanas de 50 horas. A matemática é real. Mas repare: 22 dessas 36 horas ainda são inteiramente trabalho humano. IA não eliminou trabalho. Mudou a razão de pensamento para digitação.

FAQ

Quanto custa Claude Code por mês para trabalho de agência?

Gastamos aproximadamente $180-$300/mês em uso de API Claude para Claude Code em todos os projetos. Isto é no modelo Claude 4 Sonnet. Os custos de projetos individuais variam de $40-$120 dependendo do scope e contagem de sessão.

Claude Code consegue substituir um desenvolvedor junior?

Ele substitui o output de um desenvolvedor junior, mas não o papel. Alguém ainda precisa dirigir, revisar e corrigir o trabalho da IA. Esse alguém precisa de julgamento de nível sênior. Código gerado por IA sem revisão de especialista envia bugs mais rápido.

Qual é o melhor CMS para parear com um fluxo de trabalho Claude Code?

Sanity v3, porque suas definições de schema são arquivos TypeScript que Claude Code gera excepcionalmente bem. Payload CMS 3.0 é um segundo lugar próximo. Contentful funciona, mas sua API de gerenciamento é mais complexa para IA trabalhar com confiabilidade.

Claude Code funciona para desenvolvimento de aplicativos móveis?

Usamos para projetos React Native (Expo SDK 52) com resultados decentes para geração de componentes e configuração de navegação. Tem mais dificuldade com configuração de módulos nativos e debugging específico de plataforma. Aproximadamente 40-50% de ganho de produtividade vs. 60-70% para projetos web.

Como vocês lidam com preocupações de IP do cliente com código gerado por IA?

Nosso MSA inclui uma cláusula afirmando que todos os deliverables são trabalho de produto original independentemente de ferramenta utilizada. Os termos de Anthropic (a partir de junho de 2025) concedem aos usuários direitos aos outputs. Não enviamos dados proprietários do cliente para a API--apenas padrões de código e implementações genéricas.

O que acontece quando Claude Code gera código incorreto?

Acontece em aproximadamente 15-20% das tarefas. Nosso fluxo de trabalho responde a isto com revisão de código obrigatória por humanos em cada PR. Modos de falha comuns: generics TypeScript incorretos, padrões de API desatualizados de dados de treinamento, e falta de tratamento de erro para casos extremos. Nós orçamentamos tempo de revisão em cada estimativa.