El Agente de Content QA Que No Lee: Por Qué la Gramática Es La Última Dimensión Que Debes Puntuar

Agente IA que audita contenido publicado: descubre las 7 dimensiones reales que puntúa un Content QA agent. Gramática es la menos importante. Framework en español.

jun 01, 2026

Tu Agente de Content QA No Está Auditando Nada. Solo Está Corrigiendo Comas.

Crees que un agente de calidad de contenido es un corrector ortográfico con esteroides. Que le pasas un artículo, te devuelve los errores de gramática, detecta si hay plagio, y listo. Contenido auditado.

*Te has equivocado de diagnóstico.*

Llevo auditando contenido publicado desde que lancé conversoriaecnae.es y gestoriascercademi.com. Más de 4.800 páginas indexadas entre ambos proyectos. Y te digo lo que he aprendido: la gramática es la dimensión menos importante que puntúa un agente de Content QA.

El problema no es que tu contenido tenga faltas de ortografía. El problema es que no convierte, no posiciona y no retiene — y tu revisor de Grammarly no te va a avisar de eso.

En 2026, con los LLMs actuales — Opus 4.5, Gemini 3.1 Pro, los modelos de Anthropic — construir un agente que puntúa contenido es trivial. Lo difícil es saber qué puntuar y por qué cada dimensión importa.

Vamos a construir el framework que uso en producción.

---

Las 7 Dimensiones Que Un Content QA Agent Debe Puntuar (Y Por Qué Este Orden)

La mayoría de equipos implementan un agente de Content QA que revisa:

❌ Gramática y ortografía — primero

❌ Legibilidad — después

❌ Longitud — al final

Ese agente no sirve para nada. Literalmente. Te va a decir que un texto está bien escrito cuando está matando tu conversión.

El orden correcto de las dimensiones, de más importante a menos:

1. Claridad de Propósito — La Dimensión Que Mata el Rebote

Tu agente debe responder primero: ¿sabe el lector qué va a obtener en los primeros 10 segundos?

Si un usuario llega a tu página y no entiende en 5 segundos si eso responde a su problema, se va. No lee el artículo. No convierte.

✅ Cómo lo puntuamos: El agente analiza el primer párrafo y el H1. Si no contienen explícitamente el problema que resuelve el contenido, la puntuación de claridad es 0.

En producción, usamos un prompt que evalúa: "¿Un usuario que busca X solución encontraría esto en los primeros 10 segundos?" El LLM devuelve un score de 0 a 10.

2. Alineamiento con Intención de Búsqueda — Donde Muere el SEO Real

Puedes tener el texto mejor escrito del mundo. Si no responde a lo que el usuario buscó, no existe.

Google ya no rankea palabras clave. Rankea respuestas a intenciones. Tu agente debe cruzar el contenido contra las SERPs reales y puntuar si el texto cubre las sub-intenciones que aparecen en los primeros resultados.

✅ Cómo lo puntuamos: El agente extrae las 3-5 preguntas relacionadas que aparecen en "People also ask" de Google y verifica si el contenido las responde explícitamente.

```python

def puntua_intencion(content, serp_questions):

prompt = f"""

Contenido: {content[:2000]}

Preguntas relacionadas en Google:

{serp_questions}

Puntúa del 0 al 10 cuántas de estas preguntas

responde el contenido de forma explícita y directa.

Devuelve solo el número.

"""

response = llm.invoke(prompt)

return int(response.strip())

```

Si el score es menor de 7, el agente rechaza el contenido. No importa lo bien escrito que esté.

3. Estructura de Argumentación — El Esqueleto Que Retiene

El 80% de los contenidos que auditamos tienen una estructura débil. Van de idea en idea sin jerarquía.

Tu agente debe identificar si el contenido sigue una estructura lógica: problema → evidencia → solución → acción. Si salta entre ideas sin conector, la dimensión de estructura falla.

✅ Cómo lo puntuamos: El agente identifica si hay transiciones entre secciones, si cada H2 se sostiene con datos, y si hay una conclusión que resume y empuja a acción.

4. Densidad de Evidencia — La Dimensión Que Construye Autoridad

Un párrafo sin números, sin fuentes, sin ejemplos concretos, es ruido.

Tu agente debe contar cuántas afirmaciones respaldadas hay por cada 500 palabras. Si la densidad es menor de 2 evidencias por cada 500 palabras, el contenido es débil.

✅ Cómo lo puntuamos: El agente busca: cifras, nombres de herramientas, estudios citados, casos reales, capturas de pantalla mencionadas. Si no hay al menos 3 evidencias en un artículo de 1.000 palabras, se marca como "necesita revisión".

5. Accionabilidad — La Dimensión Que Convierte

El contenido más valioso del mundo no sirve si el lector termina y no sabe qué hacer.

Tu agente debe detectar si hay al menos una llamada a la acción explícita (no un "contáctanos" genérico). Un paso concreto que el lector pueda ejecutar en los próximos 5 minutos.

✅ Cómo lo puntuamos: El agente busca verbos en imperativo ("descarga", "implementa", "configura", "abre", "crea") seguidos de un objeto tangible. Si no hay al menos 2 llamadas a la acción específicas, la puntuación de accionabilidad es 0.

6. Legibilidad — La Que Todo el Mundo Mide (Pero Mal)

Aquí sí entra la legibilidad tradicional. Pero ojo: no es longitud de frase. Es carga cognitiva.

Tu agente debe puntuar si el contenido es entendible por alguien con nivel de lectura de 12-14 años. No es "escribir para tontos". Es no perder al 80% de tu audiencia porque usas palabras que nadie usa.

✅ Cómo lo puntuamos: Usamos la fórmula de legibilidad de Fernández-Huerta (adaptación española de Flesch). Pero añadimos un matiz: el agente detecta si hay jerga innecesaria. Si usas términos técnicos que no se explican, baja la puntuación.

7. Gramática y Ortografía — La Última Dimensión y la Menos Importante

Aquí está la clave que la mayoría no entiende.

Un contenido con faltas de ortografía pero con las 6 dimensiones anteriores bien puntuadas funciona mejor que un contenido impecable gramaticalmente pero sin estructura, sin evidencia y sin intención de búsqueda.

No digo que publiques con faltas. Digo que no es el bottleneck.

✅ Cómo lo puntuamos: Corrección ortográfica estándar. Pero el peso de esta dimensión en la puntuación total es del 5%. Literalmente. Las otras 6 dimensiones suman el 95%.

---

El Framework de las 7 Dimensiones de Content QA — Cómo Implementarlo

He llamado a esto El Framework de las 7 Dimensiones de Content QA. No es teoría. Es el sistema que ejecuto en cada deploy de contenido nuevo.

Paso 1: Configura el Pipeline de Auditoría

Usa una Edge Function en Vercel o un cron job en Railway. Cada vez que publiques contenido nuevo — o cada 30 días para contenido existente — el pipeline se ejecuta.

```javascript

// Edge Function schedule o webhook trigger

export default async function handler(req) {

const content = await getPageContent(req.body.url)

const dimensions = {

claridad: await scoreClaridad(content),

intencion: await scoreIntencion(content),

estructura: await scoreEstructura(content),

evidencia: await scoreEvidencia(content),

accionabilidad: await scoreAccionabilidad(content),

legibilidad: await scoreLegibilidad(content),

gramatica: await scoreGramatica(content)

}

const totalScore = calculateWeighted(dimensions)

if (totalScore < 7) {

await notifySlack(`Contenido necesita revisión: ${req.body.url}`)

await queueForRevision(req.body.url, dimensions)

}

return { status: 'ok', score: totalScore }

}

```

Paso 2: Define los Pesos

| Dimensión | Peso |

|---|---|

| Claridad de propósito | 20% |

| Alineamiento con intención | 20% |

| Estructura de argumentación | 15% |

| Densidad de evidencia | 15% |

| Accionabilidad | 15% |

| Legibilidad | 10% |

| Gramática y ortografía | 5% |

Paso 3: Crea un Sistema de Alertas

No basta con puntuar. Necesitas acción.

Configura tu agente para que cuando una dimensión baje de 5, dispare una alerta a tu equipo de contenido o a tu webhook de revisión.

En gestoriascercademi.com tengo esto configurado contra un canal de Slack. Cada semana recibo un resumen de qué páginas necesitan revisión y por qué dimensión están fallando.

Paso 4: Revisiones Automáticas + Humanas

El agente puntúa. El humano decide.

No dejes que el agente publique contenido automáticamente. Que genere un reporte, y que un editor valide antes de aprobar. El agente es el primer filtro, no el decisor final.

---

Lo Que He Aprendido Auditando 4.800+ Páginas

Los números no mienten.

De las 4.800+ páginas indexadas entre conversoriaecnae.es y gestoriascercademi.com, el 73% de los contenidos que fallaban en las primeras 3 dimensiones (claridad, intención, estructura) tenían una tasa de rebote superior al 70% — independientemente de su calidad gramatical.

El patrón se repite siempre: contenidos perfectamente escritos que nadie lee porque no responden a lo que el usuario buscaba.

El Content QA agent real no es un corrector. Es un guardián de intención.

---

Resumen y Próximo Paso

Las 7 dimensiones reales son: claridad, intención, estructura, evidencia, accionabilidad, legibilidad, gramática
La gramática pesa solo el 5% en la puntuación total
Implementa un pipeline que ejecute auditorías cada 30 días
No automatices la publicación — el agente puntúa, el humano decide
Mide rebote vs puntuación, no solo corrección gramatical

El próximo paso que voy a compartir es cómo construir el agente que no solo puntúa contenido, sino que lo reescribe automáticamente respetando las 7 dimensiones. Ese es el salto de auditor a editor.

Pero eso es para otro artículo.

Por ahora, ve y revisa tu último contenido publicado. Pásalo por las 7 dimensiones. Si solo miraste la gramática, no has auditado nada.

Lee el artículo completo en brianmenagomez.com

Más sobre mis servicios en brianmenagomez.com

Herramientas: Conversor IAE CNAE · Gestorias cerca de ti · Calculadora IRPF

Brian's Notes

Discusión sobre este post

Por supuesto, sigue adelante.