El 40% de las búsquedas en línea pasan hoy por interfaces de inteligencia artificial — ChatGPT, Perplexity, Gemini, Claude. Ese número va a duplicarse antes de finales de 2026. La pregunta ya no es "¿me encuentra Google?" sino "¿me citan las IA?"

Si nunca has oído hablar de LLM Readiness, probablemente ya vas tarde. Pero sin pánico — esta guía te da exactamente lo que necesitas para entender, auditar y corregir la situación.

Parte 1: Qué es el LLM Readiness — y por qué importa más que tu PageRank

El PageRank no está muerto — pero es secundario. En 2026, la pregunta real es: ¿está tu contenido estructurado para ser comprendido y citado por un modelo de lenguaje?

El LLM Readiness (o "legibilidad IA") designa la capacidad de un sitio web para ser correctamente ingerido, comprendido y restituido por los grandes modelos de lenguaje. No es una puntuación de Google. Es una combinación de señales técnicas, semánticas y editoriales que determina si una IA como ChatGPT va a citar tu sitio — o el de tu competidor — cuando un usuario hace una pregunta sobre tu sector.

Por qué es diferente del SEO clásico

El SEO clásico optimiza para crawlers que indexan palabras clave y analizan enlaces. Los LLM, en cambio, buscan:

Claridad semántica: ¿el contenido responde directamente a una pregunta?
Autoridad de la fuente: ¿el sitio está citado en otros lugares sobre temas similares?
Estructura legible por máquina: ¿los datos estructurados, los títulos H1-H2-H3 y el marcado Schema.org son coherentes?
Accesibilidad al crawler IA: ¿el robots.txt bloquea a GPTBot o Anthropic-AI?

Un sitio con un PageRank correcto pero sin datos estructurados, sin respuestas directas a las preguntas, sin archivo llms.txt — ese sitio es invisible para las IA. Existe para Google, no existe para Perplexity.

La Generative Engine Optimization (GEO): el nuevo terreno de juego

La GEO — Generative Engine Optimization — es la adaptación del SEO a la era de los motores generativos. Se apoya en tres pilares:

Contenido citable: afirmaciones claras, contrastadas, factuales
Estructura legible por máquina: Schema.org, Open Graph, datos estructurados
Accesibilidad a los crawlers IA: configuración de robots.txt y llms.txt

Si tu agencia SEO todavía no habla de GEO, pregúntaselo. En serio.

Parte 2: Las 8 señales que las IA miran en tu sitio

Aquí está el checklist original que debes tener en mente antes de cualquier auditoría.

Señal 1 — ¿Tu robots.txt autoriza los crawlers IA?

GPTBot (OpenAI), Anthropic-AI, PerplexityBot, Google-Extended — estos bots tienen sus propios user agents. Si tu robots.txt los bloquea, aunque sea implícitamente mediante una regla genérica, tu sitio no será crawleado para alimentar los modelos.

Ejemplo problemático:

User-agent: *
Disallow: /

Ejemplo correcto:

User-agent: GPTBot
Allow: /

User-agent: anthropic-ai
Allow: /

User-agent: PerplexityBot
Allow: /

Señal 2 — ¿Tienes un archivo llms.txt?

El archivo llms.txt es la convención emergente de 2026. Ubicado en la raíz del sitio (/llms.txt), indica a los modelos de lenguaje qué páginas son prioritarias, cuál es la misión del sitio y cómo interpretar el contenido.

Ejemplo mínimo:

# RoastMySite
> Herramienta de auditoría IA para landing pages — 90 segundos, 10 categorías.

## Páginas principales
- [Inicio](https://www.roastmysite.dev/)
- [Funcionalidades](https://www.roastmysite.dev/features)
- [Precios](https://www.roastmysite.dev/pricing)

## Sobre nosotros
RoastMySite analiza landing pages con IA y genera una puntuación sobre 100 en 90 segundos.

Este archivo no es todavía un estándar oficial W3C, pero OpenAI, Anthropic y Perplexity ya lo reconocen en sus documentaciones técnicas.

Señal 3 — ¿Tus datos Schema.org están presentes y son válidos?

Los LLM se entrenan sobre HTML. El Schema.org permite etiquetar explícitamente lo que cada elemento representa. Una Organization, un Product, una FAQPage, un HowTo — estos tipos dan a las IA el contexto para citar correctamente tu contenido.

Ejemplo para una FAQ:

{
  "@context": "https://schema.org",
  "@type": "FAQPage",
  "mainEntity": [{
    "@type": "Question",
    "name": "¿Qué es el LLM Readiness?",
    "acceptedAnswer": {
      "@type": "Answer",
      "text": "El LLM Readiness designa la capacidad de un sitio web para ser correctamente comprendido y citado por los grandes modelos de lenguaje."
    }
  }]
}

Señal 4 — ¿Tu contenido responde directamente a las preguntas?

A los LLM les encanta el contenido que empieza respondiendo a la pregunta y luego explica. El formato "pregunta → respuesta directa → contexto" es exactamente el patrón que Perplexity y ChatGPT extraen para construir sus respuestas.

Si tus artículos empiezan por "En este artículo vamos a explorar..." — estás perdiendo citas.

Señal 5 — ¿Tus metadatos Open Graph están completos?

og:title, og:description, og:image, og:url — estas etiquetas no sirven solo para Twitter y LinkedIn. Algunos LLM las usan para comprender el tema principal de una página antes incluso de analizar el contenido.

Señal 6 — ¿El contenido es accesible sin JavaScript?

Cuando crawlea, ChatGPT no renderiza sistemáticamente el JavaScript. Si tu contenido principal se carga mediante JS en el lado cliente (React SPA sin SSR), puede ser completamente invisible. El Server-Side Rendering (SSR) o la generación estática (SSG) son obligatorios para el LLM Readiness.

Señal 7 — ¿Tienes enlaces entrantes desde fuentes citadas por los LLM?

Wikipedia, estudios académicos, medios reconocidos — estas fuentes están sobre-representadas en los corpus de entrenamiento de los LLM. Ser citado por estas fuentes, o ser mencionado en contenido que estas fuentes reproducen, aumenta tu probabilidad de ser citado a tu vez.

Señal 8 — ¿Tu sitio tiene una página "Sobre nosotros" estructurada?

Los LLM intentan validar la autoridad de una fuente. Una página "Sobre nosotros" con un Organization Schema.org, referencias verificables, un equipo identificado — es una señal fuerte de fiabilidad.

Parte 3: Cómo auditar tu sitio manualmente

Aquí tienes un proceso en 5 pasos que puedes ejecutar hoy, sin herramientas de pago.

Paso 1 — Verifica tu robots.txt

Accede a https://tusitio.com/robots.txt. Busca las directivas User-agent: GPTBot, User-agent: anthropic-ai, User-agent: PerplexityBot. Si no existen, tus páginas son accesibles por defecto — verifica que ninguna regla Disallow: / genérica las bloquee.

Comando curl para probar:

curl -A "GPTBot" https://tusitio.com/robots.txt

Paso 2 — Prueba tu renderizado sin JavaScript

En Chrome DevTools, desactiva JavaScript (Settings > Debugger > Disable JavaScript) y recarga la página. Si el contenido principal desaparece, tienes un problema de LLM Readiness.

Alternativa: usa curl https://tusitio.com y verifica que el contenido principal está en el HTML devuelto.

Paso 3 — Valida tus datos estructurados

Usa el Rich Results Test de Google (search.google.com/test/rich-results) o el Schema Markup Validator (validator.schema.org). Estas herramientas te muestran exactamente lo que ven los crawlers.

Objetivos mínimos para 2026:

Organization en la página de inicio
WebPage o Article en cada artículo del blog
FAQPage en las páginas FAQ
Product o SoftwareApplication en las páginas de producto

Paso 4 — Analiza la legibilidad semántica de tu contenido

Toma tus 5 páginas más importantes. Para cada una, pregúntate: "Si una IA lee únicamente el H1, los H2 y el primer párrafo de cada sección — ¿entiende lo que ofrezco?"

Si la respuesta es no, reestructura.

Paso 5 — Verifica las meta-etiquetas y Open Graph

En línea de comandos:

curl -s https://tusitio.com | grep -E '(og:|twitter:|description)'

O usa una herramienta como opengraph.xyz para visualizar cómo las IA y las redes sociales ven tu página.

¿Quieres ir más rápido? RoastMySite hace exactamente este trabajo en 90 segundos. Obtienes una puntuación de LLM Readiness entre 10 categorías analizadas por la IA — con las correcciones prioritarias a aplicar.

Parte 4: Qué debes corregir primero

No todos los problemas valen lo mismo. Aquí está la clasificación por impacto.

Prioridad 1 (crítica) — Desbloquear los crawlers IA en robots.txt

Impacto inmediato. Si GPTBot o Anthropic-AI están bloqueados, nada más importa. Es el muro antes de la puerta.

Tiempo de corrección: 10 minutos.

Prioridad 2 (alta) — Activar el SSR en las páginas clave

Si tu sitio es una SPA de React o Vue sin renderizado en servidor, los LLM ven una página en blanco. Para Next.js, pasa a export default async function Page() con datos obtenidos en el lado servidor. Para las SPA puras, considera un pre-renderizado estático de las páginas clave.

Tiempo de corrección: 1 a 3 días según el stack.

Prioridad 3 (alta) — Implementar Schema.org en las páginas prioritarias

Empieza por la homepage (Organization), los artículos (Article) y las páginas FAQ (FAQPage). Usa Google Tag Manager o impleméntalo directamente en el <head> en JSON-LD.

Tiempo de corrección: 2 a 4 horas por tipo de página.

Prioridad 4 (media) — Crear el archivo llms.txt

30 minutos de trabajo para una señal que diferencia tu sitio del 99% de tus competidores en 2026. Este archivo será cada vez más valorado a medida que los modelos lo integren en sus protocolos de crawl.

Tiempo de corrección: 30 minutos.

Prioridad 5 (media) — Reestructurar el contenido en formato P&R

Para las páginas que apuntan a consultas informacionales, reestructura en secciones "Pregunta directa → Respuesta en 1-2 frases → Detalle". Este formato es exactamente lo que los LLM extraen para sus respuestas.

Tiempo de corrección: 1 a 2 horas por página.

Conclusión: ¿tu sitio existe de verdad?

En 2026, tener un sitio bien posicionado en Google ya no es suficiente. Los usuarios plantean sus preguntas a las IA, y esas IA responden con las fuentes que han ingerido correctamente. Si tu sitio no respeta las señales de LLM Readiness, estás regalando clientes potenciales a tus competidores que sí hicieron el trabajo.

La auditoría manual descrita en esta guía lleva medio día. Te dará una imagen clara de dónde estás.

¿No quieres hacerlo manualmente? RoastMySite calcula tu puntuación de LLM Readiness en 90 segundos — con un análisis de 10 categorías, los puntos críticos identificados y un plan de acción priorizado. El plan Free te da acceso a 1 roast por semana y 2 categorías sin pagar nada. Si quieres el informe completo con las 10 categorías y el plan de acción detallado, son 19.99€/mes con el plan Pro.

Tu sitio quizás ya es invisible. Mejor saberlo ahora.

LLM Readiness: auditar y corregir tu sitio para las IA en 2026