Como Traduzimos 118 Páginas para 30 Idiomas por $22 Cada
Traduzindo um site para 30 idiomas por $22 por idioma
No mês passado, lançamos um projeto que teria custado entre $150.000 e $300.000 através de uma agência de tradução tradicional. Fizemos por $660 no total. São 118 páginas traduzidas para 30 idiomas a aproximadamente $22 por idioma. Não, não é um erro de digitação. E não, a qualidade não foi ruim.
Quero detalhar exatamente como conseguimos fazer isso -- a arquitetura, as ferramentas, a engenharia de prompts, o processo de garantia de qualidade e as compensações honestas. Porque barato não precisa ser ruim, mas significa que você precisa ser inteligente sobre onde investir seu esforço.
Índice
- O Escopo do Projeto
- Por que a Tradução Tradicional é Tão Cara
- Nossa Arquitetura de Tradução com IA
- A Engenharia de Prompts Que Realmente Importa
- Detalhamento de Custos: Para Onde Vão os $22
- Garantia de Qualidade Sem Falantes Nativos
- Implementação Técnica em Next.js
- O Que a Tradução com IA Erra
- Quando Você Deve Pagar por Tradução Humana
- FAQ
O Escopo do Projeto
O cliente era uma empresa B2B SaaS expandindo para mercados europeus, asiáticos e latino-americanos. Seu site de marketing tinha 118 páginas: páginas de destino, páginas de recursos, posts de blog, páginas legais e documentação. O conteúdo era originalmente em inglês.
Os idiomas-alvo incluíam os suspeitos usuais -- Espanhol, Francês, Alemão, Japonês, Coreano, Chinês Mandarim -- mais alguns que são mais difíceis de encontrar tradutores, como Estoniano, Letão, Lituano e Esloveno. Trinta idiomas no total.
Algumas contas rápidas sobre o volume de conteúdo:
| Métrica | Contagem |
|---|---|
| Total de páginas | 118 |
| Média de palavras por página | ~620 |
| Total de palavras em inglês | ~73.160 |
| Total de palavras traduzidas | ~2.194.800 (73.160 × 30) |
| Idiomas | 30 |
| Custo total | ~$660 |
| Custo por idioma | ~$22 |
| Custo por palavra (traduzida) | $0.0003 |
Para contexto, a tradução humana profissional normalmente custa $0.10 a $0.30 por palavra dependendo do par de idiomas. No ponto médio de $0.20/palavra, estaríamos olhando para $14.632 por idioma ou $438.960 no total. Até as agências de orçamento que usam tradução automática com revisão humana leve cobram $0.05-0.08 por palavra.
Por que a Tradução Tradicional é Tão Cara
Não quero criticar a indústria de tradução. Tradutores humanos fazem um trabalho incrível, e para certos tipos de conteúdo, não há substituto. Mas aqui está o que impulsiona o custo:
Modelos de precificação por palavra foram projetados para um mundo onde cada palavra exigia esforço cognitivo humano. Um tradutor pode lidar com 2.000-3.000 palavras por dia para conteúdo técnico. Com 73.160 palavras, são 24-36 dias de tradutor por idioma. Multiplique por 30 idiomas e você está olhando para 720-1.080 dias de trabalho por pessoa.
Pares de idiomas raros custam mais. Encontrar um tradutor técnico de qualidade de Inglês para Letão não é fácil. A oferta e a demanda entram em ação.
Despesas gerais de gerenciamento de projeto são reais. As agências de tradução têm gerentes de projeto coordenando entre tradutores, revisores e clientes. Essas despesas gerais são incluídas na taxa por palavra, mas são reais.
Custos de troca de contexto levam tempo. Um tradutor trabalhando em sua cópia de marketing precisa entender sua voz de marca, sua terminologia de produto e seu público. Esse tempo de preparação é amortizado ao longo do projeto, mas é real.
Nenhum disso é desperdício -- é apenas caro. E para uma empresa testando novos mercados, gastar $400K em tradução antes de validar o ajuste de produto-mercado nessas regiões é um comprimido difícil de engolir.
Nossa Arquitetura de Tradução com IA
Aqui está o sistema que construímos. Não é uma única chamada de API -- é um pipeline.
Passo 1: Extração e Segmentação de Conteúdo
O site foi construído com Next.js, o que facilitou nosso trabalho. Todo o conteúdo vivia em arquivos de dados estruturados (MDX para posts de blog, JSON para strings de UI e conteúdo estruturado de um CMS headless).
Escrevemos um script que rastreou todas as fontes de conteúdo e produziu um formato intermediário normalizado:
interface TranslationUnit {
id: string; // chave única como "homepage.hero.title"
source: string; // texto em inglês
context: string; // onde isso aparece (página, seção)
type: 'heading' | 'paragraph' | 'ui-string' | 'legal' | 'meta';
maxLength?: number; // para strings de UI com restrições de espaço
glossaryTerms: string[]; // termos específicos do produto encontrados nesta unidade
}
Isso é crítico. Você não quer jogar páginas inteiras em um LLM e esperar pelo melhor. Segmentar conteúdo em unidades de tradução oferece controle sobre contexto, permite que você lide com diferentes tipos de conteúdo de forma diferente e torna possíveis atualizações incrementais posteriores.
Passo 2: Geração de Glossário e Guia de Estilo
Antes de traduzir uma única palavra, construímos um glossário. Isso incluiu:
- Nomes de produtos (nunca traduza estes)
- Termos técnicos com traduções preferenciais
- Frases específicas da marca
- Diretrizes de tom por tipo de conteúdo
Usamos Claude para ajudar a construir o glossário inicial analisando o conteúdo em inglês e identificando termos que precisariam de tradução consistente. Então tivemos o cliente revisá-lo e aprová-lo.
Passo 3: Tradução em Lote com Claude API
Usamos a Claude 3.5 Sonnet API (agora Claude 4 Sonnet está disponível e ainda melhor para isso) para a tradução real. Por que Claude em vez de GPT-4o ou Gemini? Alguns motivos:
- Melhor em seguir prompts de sistema complexos consistentemente
- Saída mais natural em idiomas Românicos e Germânicos em nossos testes
- A janela de contexto de 200K nos permitiu incluir glossários completos e guias de estilo em cada solicitação
- O preço era competitivo para nosso caso de uso
Realizamos tradução em lotes em grupos de 20-30, organizados por página e tipo de conteúdo. Cada lote incluía o glossário, guia de estilo e contexto sobre onde o texto aparecia.
import anthropic
import json
client = anthropic.Anthropic()
def translate_batch(units: list[dict], target_lang: str, glossary: dict, style_guide: str) -> list[dict]:
system_prompt = f"""You are a professional translator specializing in {target_lang}
localization for B2B software companies.
GLOSSARY (use these exact translations):
{json.dumps(glossary[target_lang], indent=2, ensure_ascii=False)}
STYLE GUIDE:
{style_guide}
RULES:
- Preserve all markdown formatting
- Never translate product names listed in the glossary
- Adapt idioms naturally -- don't translate literally
- For UI strings with maxLength, stay within the character limit
- Output valid JSON matching the input structure"""
user_prompt = f"""Translate the following translation units to {target_lang}.
Return JSON array with same structure, replacing 'source' with 'translation'.
{json.dumps(units, indent=2, ensure_ascii=False)}"""
response = client.messages.create(
model="claude-sonnet-4-20250514",
max_tokens=8192,
system=system_prompt,
messages=[{"role": "user", "content": user_prompt}]
)
return json.loads(response.content[0].text)
Passo 4: Verificações de Qualidade Automatizadas
Após a tradução, cada unidade passou por verificações automatizadas:
- Preservação de formato: Markdown, tags HTML e variáveis sobreviveram?
- Validação de comprimento: As strings de UI estão dentro de seu comprimento máximo?
- Conformidade com glossário: Nomes de produtos foram deixados sem tradução?
- Integridade de espaços reservados: Os espaços reservados
{variable}estão intactos? - Amostragem de tradução reversa: Traduzir 10% da saída de volta para inglês e comparar similaridade semântica
Cerca de 3-4% das unidades de tradução falharam em uma ou mais verificações e passaram por uma segunda passagem com instruções de correção específicas.
Passo 5: Montagem e Integração
As unidades traduzidas foram remontadas no formato que o aplicativo Next.js esperava -- arquivos de locale JSON, MDX traduzido e entradas de CMS. Usamos next-intl para o roteamento e gerenciamento de locale.
A Engenharia de Prompts Que Realmente Importa
Vi pessoas jogar texto no ChatGPT e chamá-lo de "tradução com IA". Isso lhe dá talvez 70% de qualidade. A lacuna entre 70% e 95% está inteiramente em como você faz o prompt.
Aqui está o que mudou o jogo:
Contexto é tudo
Dizer ao modelo "traduza isto para o francês" oferece saída genérica. Dizer "traduza este headline de herói para uma página de destino B2B SaaS direcionada a diretores de TI na França, mantendo um tom confiante mas não agressivo" oferece algo usável.
Incluímos o tipo de página, o público-alvo e o propósito de cada bloco de conteúdo em cada solicitação.
Exemplos few-shot por idioma
Para cada idioma, criamos 5-10 exemplos de tradução que capturavam o tom que desejávamos. Estes entraram no prompt do sistema. Para idiomas onde tínhamos um falante nativo na equipe ou em nossa rede (cerca de 8 dos 30), pedimos a eles que escrevessem esses exemplos. Para o resto, geramos e refinamos através de comparação de tradução reversa.
Execução de glossário
Isso soa óbvio mas é a coisa mais impactante que você pode fazer. Sem um glossário, o modelo traduzirá seu nome de produto "CloudSync" para o equivalente de "sincronização em nuvem" em alguns idiomas. Usará termos diferentes para o mesmo recurso em diferentes páginas. Inconsistência destrói confiança.
Estratégia de chunking
Descobrimos que traduzir 500-800 palavras por vez, agrupadas por seção de página, forneceu os melhores resultados. Muito pequeno (sentenças individuais) e você perde contexto. Muito grande (páginas inteiras) e a qualidade se degrada em direção ao final da saída.
Detalhamento de Custos: Para Onde Vão os $22
Vamos ser específicos sobre o dinheiro.
| Componente de Custo | Por Idioma | Total (30 idiomas) |
|---|---|---|
| Claude API (tradução) | $16.40 | $492.00 |
| Claude API (QA/tradução reversa) | $3.20 | $96.00 |
| Claude API (geração de glossário) | $0.80 | $24.00 |
| Chamadas de API diversas (retentativas, correções) | $1.60 | $48.00 |
| Custos totais de API | $22.00 | $660.00 |
Isso não inclui o tempo de engenharia para construir o pipeline, que foi cerca de 40 horas. Mas esse pipeline agora é reutilizável. Quando o cliente adiciona um novo post de blog, traduzi-lo para todos os 30 idiomas custa cerca de $2-4 em taxas de API e é executado automaticamente em seu pipeline CI/CD.
O preço da Claude API no momento de nosso projeto (usando Claude 3.5 Sonnet) era $3 por milhão de tokens de entrada e $15 por milhão de tokens de saída. Com Claude 4 Sonnet, o preço é comparável mas você obtém melhor qualidade, o que significa menos retentativas.
Garantia de Qualidade Sem Falantes Nativos
Esta é a parte sobre a qual as pessoas são mais céticas, e honestamente, deveriam ser. Aqui está nosso processo real de QA:
Verificações automatizadas (captura ~60% dos problemas)
A preservação de formato, comprimento e verificações de glossário que mencionei. Estas são determinísticas e capturam os erros mais embaraçosos -- HTML quebrado, variáveis ausentes, nomes de marca traduzidos.
Comparação de tradução reversa (captura ~25% dos problemas restantes)
Traduzimos uma amostra aleatória de 10% de cada idioma de volta para o inglês usando um modelo diferente (GPT-4o) e comparamos similaridade semântica com o original. Se a tradução reversa divergisse significativamente, a sinalizamos para revisão.
Verificações de falante nativo (captura problemas de nuance)
Para os 8 idiomas onde tínhamos acesso a falantes nativos (Espanhol, Francês, Alemão, Português, Japonês, Coreano, Mandarim, Holandês), pedimos a eles que revisassem 15-20 páginas cada. Seu feedback foi iluminador:
- Qualidade geral: 8-9/10 para conteúdo informativo
- Headlines de marketing: 6-7/10 (precisavam de mais adaptação criativa)
- Documentação técnica: 9/10
- Páginas legais: 7/10 (aceitável mas não perfeito)
Com base em seu feedback, fizemos uma segunda passagem em headlines de marketing com prompt mais criativo, o que as elevou para 8/10.
Loop de feedback da comunidade
O cliente adicionou um pequeno link "Sugira uma melhor tradução" em cada página. No primeiro mês após o lançamento, receberam cerca de 140 sugestões em todos os idiomas -- aproximadamente 0.04% de todo o conteúdo traduzido. A maioria das sugestões eram preferências estilísticas em vez de erros.
Implementação Técnica em Next.js
O site usa Next.js App Router com next-intl para internacionalização. Aqui está a configuração em alto nível:
// middleware.ts
import createMiddleware from 'next-intl/middleware';
export default createMiddleware({
locales: ['en', 'es', 'fr', 'de', 'ja', 'ko', 'zh', /* ... 23 mais */],
defaultLocale: 'en',
localePrefix: 'as-needed'
});
Para a integração de CMS headless, o conteúdo traduzido é armazenado como variantes de locale. Posts de blog em MDX recebem arquivos separados por locale. Strings de UI vivem em arquivos de mensagem JSON.
A compilação gera páginas estáticas para todas as combinações de locale/página. São 118 × 31 (incluindo inglês) = 3.658 páginas. Com ISR (Regeneração Estática Incremental), isso é totalmente gerenciável.
Uma coisa digna de nota: implementamos tags hreflang programaticamente para SEO. Cada página liga para todas as suas variantes de idioma. Isso é crítico para o Google entender a estrutura do seu site multilíngue.
// app/[locale]/layout.tsx
export function generateMetadata({ params: { locale } }) {
const alternates = {
languages: Object.fromEntries(
locales.map(l => [l, `/${l}${pathname}`])
)
};
return { alternates };
}
O Que a Tradução com IA Erra
Seria desonesto da minha parte dizer que a tradução com IA é perfeita. Aqui está onde ela consistentemente falha:
Wordplay e trocadilhos de marketing. Se seu headline é inteligente em inglês, a IA o traduzirá literalmente (perdendo a inteligência) ou tentará um trocadilho em idioma-alvo que não funciona bem. Reescrevemos cerca de 15% dos headlines de marketing manualmente com direção criativa.
Adaptação cultural. Tradução e localização não são a mesma coisa. A IA não saberá que seu estudo de caso americano sobre um "provedor de 401(k)" não significa nada no Japão. Não trocará seus sinais de dólar por moeda local nos exemplos. Não saberá que vermelho significa sorte na China mas perigo no Ocidente. Isso exige pensamento humano.
Precisão legal. Para termos de serviço e políticas de privacidade, a tradução com IA lhe dá 90% do caminho. Mas linguagem legal precisa ser precisa, e em algumas jurisdições, você precisa de traduções legalmente certificadas. Sinalizamos páginas legais para revisão profissional nos 12 mercados onde o cliente estava fazendo negócio real (em vez dos outros 18 que eram exploratórios).
Sistemas honoríficos. Japonês, Coreano e Tailandês têm sistemas complexos de formalidade. A IA às vezes misturava registros formais e informais na mesma página. Nosso glossário e guia de estilo ajudaram, mas as verificações de spot-check capturam algumas inconsistências.
Concordância de gênero em idiomas generizados. Francês, Espanhol, Alemão, Árabe -- quando o inglês original é neutro em gênero, a IA precisa fazer escolhas. Às vezes é inconsistente. Nossas verificações automatizadas capturam a maioria delas comparando marcadores de gênero entre unidades de tradução relacionadas.
Quando Você Deve Pagar por Tradução Humana
A tradução com IA a $22 por idioma é a escolha certa quando:
- Você está testando novos mercados e precisa de velocidade sobre perfeição
- Seu conteúdo é principalmente informativo ou técnico
- Você tem 10+ idiomas-alvo (a economia por idioma se compõe)
- Você precisa traduzir frequentemente (posts de blog, changelogs, docs)
Pague por tradução humana quando:
- Responsabilidade legal está envolvida (contratos, documentos de conformidade)
- A voz de marca é crítica (taglines, campanhas)
- Você está em um setor regulamentado (médico, financeiro)
- Você tem 1-3 idiomas-alvo e o orçamento para isso
- A adaptação cultural é tão importante quanto a precisão linguística
O doce ponto que encontramos para a maioria dos clientes? Tradução com IA para a maior parte, revisão humana para os 10-20% críticos. Isso normalmente traz o custo total para $50-100 por idioma em vez de $22, mas com qualidade quase humana em todos os tipos de conteúdo.
Se você está considerando um build de site multilíngue, entre em contato conosco -- refinamos este pipeline em vários projetos e podemos adaptá-lo à sua pilha, seja Next.js, Astro ou outro framework. Confira nossa página de preços para saber como definimos o escopo de projetos de internacionalização.
FAQ
Como a qualidade da tradução com IA se compara à tradução humana em 2025?
Para conteúdo informativo e técnico, a lacuna se estreitou dramaticamente. Em testes às cegas, falantes nativos classificam traduções de Claude e GPT-4o em 85-92% da qualidade de tradução humana para a maioria dos idiomas europeus e do Leste Asiático. A lacuna é maior para cópia de marketing criativa (70-80%) e texto legal (75-85%). Para idiomas menos comuns como Letão ou Estoniano, a qualidade da IA é comparável ao que você obteria de agências de tradução humana de orçamento, que frequentemente usam tradução automática com edição leve de qualquer forma.
Qual é a forma mais barata de traduzir um site em 2025?
A abordagem mais barata é acesso direto de API para modelos como Claude ou GPT-4o, que custa $0.0002-0.0005 por palavra. Serviços como Weglot ($15-50/mês) ou Lokalise são mais caros por palavra mas lidam com a infraestrutura para você. Google Translate API é mais barato por palavra (~$20 por milhão de caracteres) mas a qualidade é notavelmente inferior aos LLMs de fronteira. Nossa abordagem de pipeline com Claude custou cerca de $0.0003 por palavra traduzida incluindo passagens de QA.
A tradução com IA funciona para idiomas da direita para a esquerda como Árabe e Hebraico?
Sim, mas você precisa lidar com a implementação técnica com cuidado. A qualidade de tradução para Árabe e Hebraico do Claude é boa -- nossa verificação de spot-check em Árabe pontuou 8/10. A parte mais difícil é a implementação de layout RTL no seu frontend. Propriedades lógicas de CSS (margin-inline-start em vez de margin-left) e atributos dir="rtl" apropriados são essenciais. Planeje elementos de UI que precisam ser espelhados.
Como você lida com SEO para um site traduzido para 30 idiomas?
Três coisas são mais importantes: tags hreflang apropriadas em cada página, URLs específicas de locale (subdiretórios como /fr/ ou /de/ funcionam bem) e metadados traduzidos (títulos, descrições, tags Open Graph). Geramos tudo isso programaticamente. Não esqueça de enviar sitemaps específicos de locale para Google Search Console. Dentro de 3 meses do lançamento do site de 30 idiomas, o cliente viu tráfego orgânico de consultas em não-inglês aumentar em 340%.
A IA pode traduzir conteúdo de site que inclui jargão técnico?
Este é na verdade o lugar onde a tradução com IA brilha. Jargão técnico é geralmente consistente e bem definido, o que joga a favor dos pontos fortes do modelo. A chave é construir um glossário de seus termos específicos com traduções aprovadas. Sem um glossário, o modelo pode traduzir "deployment pipeline" de três formas diferentes em seu site. Com um, é consistente e sólido.
Quanto tempo leva para traduzir com IA um site inteiro?
Nosso pipeline traduziu todas as 118 páginas para todos os 30 idiomas em cerca de 6 horas de tempo de computação, executando solicitações de API paralelas com limitação de taxa. O tempo de engenharia para construir o pipeline foi cerca de 40 horas para o primeiro projeto. Projetos subsequentes usando o mesmo pipeline levam 8-15 horas de tempo de engenharia para setup e customização, mais o tempo de computação.
O que acontece quando você precisa atualizar conteúdo em um site traduzido?
É aqui que a abordagem de unidade de tradução segmentada compensa enormemente. Quando uma página muda, realizamos diff das unidades de tradução contra a versão anterior. Apenas unidades alteradas ou novas são retraduzidas. Atualizar um post de blog em todos os 30 idiomas custa centavos e acontece automaticamente em CI/CD. Rastreamos hashes de unidade de tradução para saber exatamente o que está obsoleto.
$22 por idioma é realista para qualquer site, ou apenas certos tipos?
O valor de $22 é específico para o volume de conteúdo do nosso projeto (~73K palavras) e tipo de conteúdo (marketing B2B SaaS e docs). Seus resultados variarão. Um site com muito conteúdo com 500K palavras pode custar $100-150 por idioma. Um site de marketing simples de 10 páginas pode custar $3-5 por idioma. O custo se escala linearmente com a contagem de palavras e ligeiramente com complexidade. O custo fixo é o tempo de engenharia para construir ou configurar o pipeline.