Traducción Web con IA: 118 Págs, 30 Idiomas, $22

El mes pasado entregamos un proyecto que habría costado entre $150,000 y $300,000 a través de una agencia de traducción tradicional. Lo hicimos por $660 en total. Eso son 118 páginas traducidas a 30 idiomas a aproximadamente $22 por idioma. No, no es un error tipográfico. Y no, la calidad no fue basura.

Quiero recorrer exactamente cómo lo logramos -- la arquitectura, las herramientas, la ingeniería de prompts, el proceso de garantía de calidad, y los compromisos honestos. Porque barato no tiene que significar malo, pero sí significa que necesitas ser inteligente sobre dónde inviertes tu esfuerzo.

Tabla de contenidos

El alcance del proyecto
Por qué la traducción tradicional es tan cara
Nuestra arquitectura de traducción con IA
La ingeniería de prompts que realmente importa
Desglose de costos: a dónde va el $22
Garantía de calidad sin hablantes nativos
Implementación técnica en Next.js
Lo que la traducción con IA hace mal
Cuándo aún deberías pagar por traducción humana
Preguntas frecuentes

El alcance del proyecto

El cliente era una empresa B2B SaaS que se expandía a mercados europeos, asiáticos y latinoamericanos. Su sitio de marketing tenía 118 páginas: landing pages, páginas de características, publicaciones de blog, páginas legales y documentación. El contenido era originalmente en inglés.

Los idiomas objetivo incluían los sospechosos habituales -- español, francés, alemán, japonés, coreano, chino mandarín -- más algunos para los que es más difícil encontrar traductores, como estonio, letón, lituano y esloveno. Treinta idiomas en total.

Matemática rápida sobre el volumen de contenido:

Métrica	Cantidad
Total de páginas	118
Promedio de palabras por página	~620
Total de palabras en inglés	~73,160
Total de palabras traducidas	~2,194,800 (73,160 × 30)
Idiomas	30
Costo total	~$660
Costo por idioma	~$22
Costo por palabra (traducida)	$0.0003

Para el contexto, la traducción humana profesional típicamente cuesta $0.10 a $0.30 por palabra dependiendo del par de idiomas. En el punto medio de $0.20/palabra, estaríamos hablando de $14,632 por idioma o $438,960 en total. Incluso las agencias presupuestarias que usan traducción automática con revisión humana ligera cobran $0.05-0.08 por palabra.

Por qué la traducción tradicional es tan cara

No quiero criticar la industria de la traducción. Los traductores humanos hacen un trabajo increíble, y para ciertos tipos de contenido, no hay sustituto. Pero aquí está lo que impulsa el costo:

Los modelos de precios por palabra fueron diseñados para un mundo donde cada palabra requería esfuerzo cognitivo humano. Un traductor podría manejar 2,000-3,000 palabras por día para contenido técnico. Con 73,160 palabras, eso son 24-36 días de traductor por idioma. Multiplica por 30 idiomas y estás mirando 720-1,080 días-persona de trabajo.

Los pares de idiomas raros cuestan más. Encontrar un traductor técnico de calidad de inglés a letón no es fácil. La oferta y la demanda entran en juego.

La sobrecarga de gestión de proyectos es real. Las agencias de traducción tienen gerentes de proyecto coordinando entre traductores, revisores y clientes. Esa sobrecarga se incluye en la tarifa por palabra.

El cambio de contexto cuesta tiempo. Un traductor que trabaja en tu copia de marketing necesita entender tu voz de marca, tu terminología de producto y tu audiencia. Ese tiempo de preparación se amortiza entre el proyecto, pero es real.

Nada de esto es desperdicio -- simplemente es caro. Y para una empresa probando nuevos mercados, gastar $400K en traducción antes de haber validado el product-market fit en esas regiones es una píldora difícil de tragar.

Nuestra arquitectura de traducción con IA

Aquí está el sistema que construimos. No es una llamada API única -- es un pipeline.

Paso 1: Extracción de contenido y segmentación

El sitio fue construido con Next.js, lo que facilitó nuestro trabajo. Todo el contenido vivía en archivos de datos estructurados (MDX para publicaciones de blog, JSON para cadenas de interfaz de usuario, y contenido estructurado desde un CMS sin encabezado).

Escribimos un script que rastreó todas las fuentes de contenido y produjo un formato intermedio normalizado:

interface TranslationUnit {
  id: string;           // clave única como "homepage.hero.title"
  source: string;       // texto en inglés
  context: string;      // dónde aparece esto (página, sección)
  type: 'heading' | 'paragraph' | 'ui-string' | 'legal' | 'meta';
  maxLength?: number;   // para cadenas de interfaz con restricciones de espacio
  glossaryTerms: string[]; // términos específicos del producto encontrados en esta unidad
}

Esto es crítico. No quieres lanzar páginas completas a un LLM y esperar lo mejor. Segmentar el contenido en unidades de traducción te da control sobre el contexto, te permite manejar diferentes tipos de contenido de manera diferente, y hace posibles actualizaciones incrementales después.

Paso 2: Generación de glosario y guía de estilo

Antes de traducir una sola palabra, construimos un glosario. Esto incluía:

Nombres de productos (nunca traducir estos)
Términos técnicos con traducciones preferidas
Frases específicas de la marca
Directrices de tono por tipo de contenido

Realmente usamos Claude para ayudar a construir el glosario inicial analizando el contenido en inglés e identificando términos que necesitarían traducción consistente. Luego hicimos que el cliente lo revisara y aprobara.

Paso 3: Traducción por lotes con Claude API

Usamos la API de Claude 3.5 Sonnet (ahora Claude 4 Sonnet está disponible y es aún mejor para esto) para la traducción real. ¿Por qué Claude sobre GPT-4o o Gemini? Algunas razones:

Mejor en seguir prompts de sistema complejos de manera consistente
Más salida natural en idiomas románicos y germánicos en nuestras pruebas
La ventana de contexto de 200K nos permitió incluir glosarios y guías de estilo completas en cada solicitud
Los precios eran competitivos para nuestro caso de uso

Agrupamos unidades de traducción en grupos de 20-30, organizadas por página y tipo de contenido. Cada lote incluía el glosario, la guía de estilo, y contexto sobre dónde aparecía el texto.

import anthropic
import json

client = anthropic.Anthropic()

def translate_batch(units: list[dict], target_lang: str, glossary: dict, style_guide: str) -> list[dict]:
    system_prompt = f"""You are a professional translator specializing in {target_lang} 
    localization for B2B software companies.
    
    GLOSSARY (use these exact translations):
    {json.dumps(glossary[target_lang], indent=2, ensure_ascii=False)}
    
    STYLE GUIDE:
    {style_guide}
    
    RULES:
    - Preserve all markdown formatting
    - Never translate product names listed in the glossary
    - Adapt idioms naturally -- don't translate literally
    - For UI strings with maxLength, stay within the character limit
    - Output valid JSON matching the input structure"""
    
    user_prompt = f"""Translate the following translation units to {target_lang}.
    Return JSON array with same structure, replacing 'source' with 'translation'.
    
    {json.dumps(units, indent=2, ensure_ascii=False)}"""
    
    response = client.messages.create(
        model="claude-sonnet-4-20250514",
        max_tokens=8192,
        system=system_prompt,
        messages=[{"role": "user", "content": user_prompt}]
    )
    
    return json.loads(response.content[0].text)

Paso 4: Controles de calidad automatizados

Después de la traducción, cada unidad se ejecutó a través de controles automatizados:

Preservación de formato: ¿Sobrevivió el markdown, las etiquetas HTML, y las variables?
Validación de longitud: ¿Están las cadenas de interfaz dentro de su longitud máxima?
Cumplimiento del glosario: ¿Se dejaron sin traducir los nombres de productos?
Integridad de marcadores de posición: ¿Están intactos los marcadores de posición {variable}?
Muestreo de traducción inversa: Traducir el 10% de la salida de vuelta al inglés y comparar similitud semántica

Aproximadamente el 3-4% de las unidades de traducción fallaron una o más verificaciones y pasaron por una segunda pasada con instrucciones de corrección específicas.

Paso 5: Ensamblaje e integración

Las unidades traducidas se volvieron a ensamblar en el formato que esperaba la aplicación Next.js -- archivos de configuración regional JSON, MDX traducido, y entradas de CMS. Usamos next-intl para el enrutamiento y la gestión de configuración regional.

La ingeniería de prompts que realmente importa

He visto a personas lanzar texto a ChatGPT y llamarlo "traducción con IA". Eso te da quizás 70% de calidad. La brecha entre 70% y 95% está completamente en cómo haces prompts.

Aquí está lo que movió la aguja:

El contexto lo es todo

Decirle al modelo "traduce esto al francés" te da salida genérica. Decirle "traduce este titular de héroe para una landing page B2B SaaS dirigida a directores de TI en Francia, manteniendo un tono confiado pero no agresivo" te da algo usable.

Incluimos el tipo de página, la audiencia objetivo, y el propósito de cada bloque de contenido en cada solicitud.

Ejemplos few-shot por idioma

Para cada idioma, creamos 5-10 traducciones de ejemplo que capturaron el tono que queríamos. Estas fueron al prompt del sistema. Para idiomas donde teníamos un hablante nativo en el equipo o en nuestra red (aproximadamente 8 de los 30), les pedimos que escribieran estos ejemplos. Para el resto, los generamos y luego refinamos a través de comparación de traducción inversa.

Cumplimiento del glosario

Esto suena obvio pero es lo más impactante que puedes hacer. Sin un glosario, el modelo traducirá tu nombre de producto "CloudSync" al equivalente de "sincronización en la nube" en algunos idiomas. Usará diferentes términos para la misma característica en diferentes páginas. La inconsistencia mata la confianza.

Estrategia de división en chunks

Encontramos que traducir 500-800 palabras a la vez, agrupadas por sección de página, daba los mejores resultados. Muy pequeño (oraciones individuales) y pierdes contexto. Muy grande (páginas enteras) y la calidad se degrada hacia el final de la salida.

Desglose de costos: a dónde va el $22

Seamos específicos sobre el dinero.

Componente de costo	Por idioma	Total (30 idiomas)
Claude API (traducción)	$16.40	$492.00
Claude API (QA/traducción inversa)	$3.20	$96.00
Claude API (generación de glosario)	$0.80	$24.00
Llamadas API diversas (reintentos, correcciones)	$1.60	$48.00
Costos totales de API	$22.00	$660.00

Esto no incluye el tiempo de ingeniería para construir el pipeline, que fue aproximadamente 40 horas. Pero ese pipeline ahora es reutilizable. Cuando el cliente agrega una nueva publicación de blog, traducirla a los 30 idiomas cuesta aproximadamente $2-4 en tarifas de API y se ejecuta automáticamente en su pipeline CI/CD.

Los precios de Claude API en el momento de nuestro proyecto (usando Claude 3.5 Sonnet) eran $3 por millón de tokens de entrada y $15 por millón de tokens de salida. Con Claude 4 Sonnet, los precios son comparables pero obtienes mejor calidad, lo que significa menos reintentos.

Garantía de calidad sin hablantes nativos

Esta es la parte en la que la gente es más escéptica, y honestamente, deberían serlo. Aquí está nuestro proceso de QA real:

Controles automatizados (captura ~60% de problemas)

La preservación de formato, validación de longitud, y controles de glosario que mencioné. Estos son deterministas y atrapan los errores más vergonzosos -- HTML roto, variables faltantes, nombres de marca traducidos.

Comparación de traducción inversa (captura ~25% de problemas restantes)

Tradujimos una muestra aleatoria del 10% de cada idioma de vuelta al inglés usando un modelo diferente (GPT-4o) y comparamos similitud semántica con el original. Si la traducción inversa divergía significativamente, la marcamos para revisión.

Revisiones puntuales de hablantes nativos (captura problemas de matiz)

Para los 8 idiomas donde teníamos acceso a hablantes nativos (español, francés, alemán, portugués, japonés, coreano, mandarín, holandés), les pedimos que revisaran 15-20 páginas cada uno. Sus comentarios fueron esclarecedores:

Calidad general: 8-9/10 para contenido informativo
Titulares de marketing: 6-7/10 (necesitaban más adaptación creativa)
Documentación técnica: 9/10
Páginas legales: 7/10 (aceptable pero no perfecto)

Basado en su comentarios, hicimos una segunda pasada en titulares de marketing con prompting más creativo, lo que los llevó a 8/10.

Bucle de retroalimentación comunitaria

El cliente agregó un pequeño enlace "Sugiere una mejor traducción" en cada página. En el primer mes después del lanzamiento, recibieron aproximadamente 140 sugerencias en todos los idiomas -- aproximadamente 0.04% de todo el contenido traducido. La mayoría de las sugerencias fueron preferencias estilísticas en lugar de errores.

Implementación técnica en Next.js

El sitio usa Next.js App Router con next-intl para internacionalización. Aquí está la configuración de alto nivel:

// middleware.ts
import createMiddleware from 'next-intl/middleware';

export default createMiddleware({
  locales: ['en', 'es', 'fr', 'de', 'ja', 'ko', 'zh', /* ... 23 más */],
  defaultLocale: 'en',
  localePrefix: 'as-needed'
});

Para la integración de CMS sin encabezado, el contenido traducido se almacena como variantes de configuración regional. Las publicaciones de blog en MDX obtienen archivos separados por configuración regional. Las cadenas de interfaz de usuario viven en archivos de mensajes JSON.

La compilación genera páginas estáticas para todas las combinaciones de configuración regional/página. Eso son 118 × 31 (incluyendo inglés) = 3,658 páginas. Con ISR (Regeneración estática incremental), esto es totalmente manejable.

Una cosa que vale la pena notar: implementamos etiquetas hreflang programáticamente para SEO. Cada página enlaza a todas sus variantes de idioma. Esto es crítico para que Google entienda la estructura de tu sitio multilingüe.

// app/[locale]/layout.tsx
export function generateMetadata({ params: { locale } }) {
  const alternates = {
    languages: Object.fromEntries(
      locales.map(l => [l, `/${l}${pathname}`])
    )
  };
  return { alternates };
}

Lo que la traducción con IA hace mal

Sería deshonesto si dijera que la traducción con IA es perfecta. Aquí está donde consistentemente lucha:

Juegos de palabras y puns de marketing. Si tu titular es ingenioso en inglés, la IA lo traducirá literalmente (perdiendo la ingeniosidad) o intentará un pun en el idioma objetivo que no sale bien. Reescribimos aproximadamente el 15% de los titulares de marketing manualmente con dirección creativa.

Adaptación cultural. Traducción y localización no son lo mismo. La IA no sabrá que tu estudio de caso estadounidense sobre un "proveedor de 401(k)" no significa nada en Japón. No canjeará tus signos de dólar por moneda local en los ejemplos. No sabrá que el rojo significa suerte en China pero peligro en Occidente. Esto requiere pensamiento humano.

Precisión legal. Para términos de servicio y políticas de privacidad, la traducción con IA te lleva al 90%. Pero el lenguaje legal necesita ser preciso, y en algunas jurisdicciones, necesitas traducciones legalmente certificadas. Marcamos páginas legales para revisión profesional en los 12 mercados donde el cliente estaba haciendo negocios reales (a diferencia de los otros 18 que eran exploratorios).

Sistemas honoríficos. Japonés, coreano, y tailandés tienen sistemas complejos de formalidad. La IA a veces mezcló registros formales e informales dentro de la misma página. Nuestro glosario y guía de estilo ayudaron, pero las revisiones puntuales atraparon algunas inconsistencias.

Concordancia de género en idiomas genéricos. Francés, español, alemán, árabe -- cuando el inglés fuente es género-neutral, la IA tiene que hacer elecciones. A veces es inconsistente. Nuestros controles automatizados capturaron la mayoría de estos comparando marcadores de género en unidades de traducción relacionadas.

Cuándo aún deberías pagar por traducción humana

La traducción con IA a $22 por idioma es la opción correcta cuando:

Estás probando nuevos mercados y necesitas velocidad sobre perfección
Tu contenido es principalmente informativo o técnico
Necesitas traducir a 10+ idiomas objetivo (los ahorros por idioma se componen)
Necesitas traducir frecuentemente (publicaciones de blog, changelogs, documentación)

Paga por traducción humana cuando:

La responsabilidad legal está involucrada (contratos, documentos de cumplimiento)
La voz de marca es crítica (lemas, campañas)
Estás en una industria regulada (médica, financiera)
Tienes 1-3 idiomas objetivo y el presupuesto para ello
La adaptación cultural importa tanto como la precisión lingüística

El punto óptimo que hemos encontrado para la mayoría de clientes es: traducción con IA para la mayor parte, revisión humana para el 10-20% crítico. Eso típicamente lleva el costo total a $50-100 por idioma en lugar de $22, pero con calidad casi humana en todos los tipos de contenido.

Si estás considerando una compilación de sitio multilingüe, contáctanos -- hemos refinado este pipeline en varios proyectos y podemos adaptarlo a tu stack, ya sea Next.js, Astro, u otro framework. Consulta nuestra página de precios para ver cómo alcanzamos proyectos de internacionalización.

Preguntas frecuentes

¿Cómo se compara la calidad de la traducción con IA a la traducción humana en 2025?

Para contenido informativo y técnico, la brecha se ha estrechado dramáticamente. En pruebas ciegas, hablantes nativos califican las traducciones de Claude y GPT-4o en 85-92% de la calidad de la traducción humana para la mayoría de idiomas europeos y del Este Asiático. La brecha es más amplia para copias de marketing creativas (70-80%) y texto legal (75-85%). Para idiomas menos comunes como letón o estonio, la calidad de la IA es realmente comparable a lo que obtendrías de agencias de traducción humana presupuestarias, que a menudo usan traducción automática con edición ligera de todos modos.

¿Cuál es la forma más barata de traducir un sitio web en 2025?

El enfoque más barato es acceso directo a APIs de modelos como Claude o GPT-4o, que cuesta aproximadamente $0.0002-0.0005 por palabra. Servicios como Weglot ($15-50/mes) o Lokalise son más caros por palabra pero manejan la infraestructura para ti. Google Translate API es más barato por palabra (~$20 por millón de caracteres) pero la calidad es notablemente más baja que LLMs fronterizos. Nuestro enfoque de pipeline con Claude nos costó aproximadamente $0.0003 por palabra traducida incluyendo pasadas de QA.

¿Funciona la traducción con IA para idiomas de derecha a izquierda como árabe y hebreo?

Sí, pero necesitas manejar la implementación técnica cuidadosamente. La calidad de traducción de árabe e hebreo desde Claude es buena -- nuestra revisión puntual de árabe puntuó 8/10. La parte más difícil es la implementación de diseño RTL en tu frontend. Las propiedades lógicas CSS (margin-inline-start en lugar de margin-left) y atributos dir="rtl" apropiados son esenciales. Planifica los elementos de interfaz que necesitan ser reflejados.

¿Cómo manejas SEO para un sitio web traducido a 30 idiomas?

Tres cosas importan más: etiquetas hreflang apropiadas en cada página, URLs específicas de configuración regional (subdirectorios como /fr/ o /de/ funcionan bien), y metadatos traducidos (títulos, descripciones, etiquetas Open Graph). Generamos todo esto programáticamente. No olvides enviar sitemaps específicos de configuración regional a Google Search Console. Dentro de 3 meses del lanzamiento del sitio de 30 idiomas, el cliente vio el tráfico orgánico de consultas en idiomas no ingleses aumentar un 340%.

¿Puede la IA traducir contenido de sitio web que incluye jerga técnica?

Esto es realmente donde la traducción con IA brilla. La jerga técnica es generalmente consistente y bien definida, lo que juega con las fortalezas del modelo. La clave es construir un glosario de tus términos específicos con traducciones aprobadas. Sin un glosario, el modelo podría traducir "deployment pipeline" de tres formas diferentes en tu sitio. Con uno, es consistente sólido.

¿Cuánto tiempo tarda traducir un sitio web completo con IA?

Nuestro pipeline tradujo todas las 118 páginas a los 30 idiomas en aproximadamente 6 horas de tiempo de cómputo, ejecutando solicitudes de API paralelas con limitación de velocidad. El tiempo de ingeniería para construir el pipeline fue aproximadamente 40 horas para el primer proyecto. Los proyectos posteriores usando el mismo pipeline toman 8-15 horas de tiempo de ingeniería para configuración y personalización, más el tiempo de cómputo.

¿Qué sucede cuando necesitas actualizar contenido en un sitio traducido?

Aquí es donde el enfoque segmentado de unidad de traducción te beneficia enormemente. Cuando una página cambia, comparamos las unidades de traducción contra la versión anterior. Solo las unidades cambiadaso nuevas se vuelven a traducir. Actualizar una publicación de blog en los 30 idiomas cuesta centavos y sucede automáticamente en CI/CD. Rastreamos hashes de unidades de traducción para saber exactamente qué está obsoleto.

¿Es $22 por idioma realista para cualquier sitio web, o solo ciertos tipos?

La cifra de $22 es específica para el volumen de contenido de nuestro proyecto (~73K palabras) y tipo de contenido (documentación y marketing de B2B SaaS). Tu kilometeraje variará. Un sitio con mucho contenido con 500K palabras podría costar $100-150 por idioma. Un simple sitio de marketing de 10 páginas podría costar $3-5 por idioma. El costo se escala linealmente con el recuento de palabras y ligeramente con la complejidad. El costo fijo es el tiempo de ingeniería para construir o configurar el pipeline.

Cómo Tradujimos 118 Páginas a 30 Idiomas por $22 Cada Una

Tabla de contenidos

El alcance del proyecto

Por qué la traducción tradicional es tan cara

Nuestra arquitectura de traducción con IA

Paso 1: Extracción de contenido y segmentación

Paso 2: Generación de glosario y guía de estilo

Paso 3: Traducción por lotes con Claude API

Paso 4: Controles de calidad automatizados

Paso 5: Ensamblaje e integración

La ingeniería de prompts que realmente importa

El contexto lo es todo

Ejemplos few-shot por idioma

Cumplimiento del glosario

Estrategia de división en chunks

Desglose de costos: a dónde va el $22

Garantía de calidad sin hablantes nativos

Controles automatizados (captura ~60% de problemas)

Comparación de traducción inversa (captura ~25% de problemas restantes)

Revisiones puntuales de hablantes nativos (captura problemas de matiz)

Bucle de retroalimentación comunitaria

Implementación técnica en Next.js

Lo que la traducción con IA hace mal

Cuándo aún deberías pagar por traducción humana

Preguntas frecuentes

Let's build
something together.

Tabla de contenidos

El alcance del proyecto

Por qué la traducción tradicional es tan cara

Nuestra arquitectura de traducción con IA

Paso 1: Extracción de contenido y segmentación

Paso 2: Generación de glosario y guía de estilo

Paso 3: Traducción por lotes con Claude API

Paso 4: Controles de calidad automatizados

Paso 5: Ensamblaje e integración

La ingeniería de prompts que realmente importa

El contexto lo es todo

Ejemplos few-shot por idioma

Cumplimiento del glosario

Estrategia de división en chunks

Desglose de costos: a dónde va el $22

Garantía de calidad sin hablantes nativos

Controles automatizados (captura ~60% de problemas)

Comparación de traducción inversa (captura ~25% de problemas restantes)

Revisiones puntuales de hablantes nativos (captura problemas de matiz)

Bucle de retroalimentación comunitaria

Implementación técnica en Next.js

Lo que la traducción con IA hace mal

Cuándo aún deberías pagar por traducción humana

Preguntas frecuentes

Let's build something together.

Let's build
something together.