GEO en 2026: ser citado por ChatGPT, Perplexity y Google AI Overviews
El GEO (Optimización para Motores Generativos) optimiza para ser citado por motores IA, no solo indexado por Google. Estudio Princeton 2024: citas con fuente (+40,6%), citas de expertos (+41%) y estadísticas numéricas (+37,2%) aumentan las probabilidades de extracción. Stack 2026: estructura extraíble (chunks autónomos), schemas ricos (FAQPage, HowTo, Speakable), llms.txt, robots.txt que autorice OAI-SearchBot/PerplexityBot, y entidad Wikidata + Knowledge Graph.
El 65% de las búsquedas en Google ya no generan clic en 2026 según SparkToro. Los usuarios obtienen sus respuestas directamente en AI Overviews, ChatGPT Search, Perplexity, Gemini o Copilot. Si tu sitio no es citado como fuente en esas respuestas, eres invisible — sin importar tu posición SEO clásica. La Optimización para Motores Generativos (GEO) responde a este nuevo juego. Aquí las técnicas concretas que OptionWeb aplica en 2026 sobre los sitios cliente.
1. GEO vs SEO: la diferencia fundamental
El SEO optimiza para aparecer en una lista de resultados. El GEO optimiza para ser la respuesta extraída por un LLM. Dos juegos distintos con técnicas que se solapan parcialmente.
| Aspecto | SEO clásico | GEO |
|---|---|---|
| Objetivo | Top 10 SERP Google | Cita en síntesis LLM |
| Formato ganador | Página completa optimizada | Pasajes autónomos extraíbles |
| Señales | Backlinks, autoridad, relevancia | Citas con fuente, estadísticas, estructura clara |
| Medición | Posición, clics, impresiones | Share of Model, citation rate, sentiment |
| Rol entidades | Importante | Crítico (Knowledge Graph, Wikidata) |
| Formato de contenido | Long-form, completo | Modular, chunks independientes |
2. Cartografía de los motores IA en 2026
Conocer las fuentes de retrieval de cada motor permite enfocar los esfuerzos.
| Motor | Fuente retrieval | Modelo síntesis | Cuota mercado IA |
|---|---|---|---|
| Google AI Overviews | Índice Google | Gemini | ~55-60% |
| ChatGPT Search | Bing + crawl OAI-SearchBot + partnerships | GPT-4o/o-series | ~20-25% |
| Perplexity | Bing + Google + crawl PerplexityBot | Claude/GPT-4o (a elección) | ~8-10% |
| Microsoft Copilot | Bing | GPT-4o | ~5-8% |
| Gemini app | Índice Google | Gemini | ~5% |
| Claude (web search) | Brave Search | Claude | ~1-2% |
Conclusión estratégica: optimizar para Google + Bing = cubrir el 95% del retrieval IA. El SEO Bing (a menudo descuidado) se vuelve crítico para ChatGPT Search y Copilot.
3. Comprender el RAG para optimizar
El RAG (Retrieval Augmented Generation) sigue un pipeline en 5 etapas:
- Query rewriting: el LLM reformula la consulta del usuario en 3-10 sub-consultas
- Retrieval: un motor de búsqueda (Google, Bing, Brave) devuelve 10-20 documentos
- Chunk extraction: los documentos se dividen en pasajes de 100-500 tokens
- Similarity scoring: embedding vectorial para rankear los chunks más relevantes
- Synthesis: el LLM genera una respuesta a partir de los top-K chunks y elige cuáles citar
Implicaciones concretas: cada párrafo debe ser autónomo (comprensible aislado), las entidades nombradas deben ser explícitas (sin pronombres ambiguos), las estadísticas y citas refuerzan la 'fiabilidad' percibida por el LLM.
4. Las 9 técnicas del estudio Princeton
Aggarwal et al. (NeurIPS 2024) testaron 9 optimizaciones en GPT-4 en condiciones RAG reales. Resultados sobre la métrica Subjective Impression (peso en la respuesta generada):
| Técnica | Lift de extracción | Implementación |
|---|---|---|
| Citas de expertos | +41,0% | Citas con nombre, cargo, organización |
| Citas con fuente | +40,6% | Refs académicas o autoritarias inline |
| Estadísticas numéricas | +37,2% | 3+ stats por artículo, fuentes enlazadas |
| Autoridad estilística | +13,8% | Tono experto, vocabulario técnico preciso |
| Términos técnicos | +9,1% | Lenguaje de dominio |
| Ease of reading | +7,9% | Estructura clara, párrafos cortos |
| Unique words | -1,2% | Vocabulario diverso — poco efecto |
| Keyword stuffing | -10,3% | Penalizador — evitar |
| Fluency optimization | -1,8% | Marketing-speak — penalizador |
5. Estructura de contenido extraíble
Patrón atómico chunk-friendly:
- H2 o H3 en pregunta/afirmación factual — Match con las consultas user. Ej.: '¿Qué es el Consent Mode v2?' en lugar de 'Consent Mode v2'.
- 1ª frase = respuesta autónoma — Self-contained, sin pronombres, con entidad nombrada. Comprensible fuera del contexto del documento.
- 2-4 frases de pruebas — Estadísticas, citas, ejemplos concretos. Refuerza la fiabilidad.
- Detalles opcionales después — El LLM extrae las primeras frases. Los detalles son para el lector humano.
Anti-patrones a evitar: frases río >40 palabras, pronombres sin antecedente cercano ("él", "esto", "estos"), info clave escondida en el párrafo 5, contenido en imagen sin alt rico, jerarquía de headings rota (H2 → H4 sin H3).
6. llms.txt y robots.txt para IA
El llms.txt es un estándar emergente (Jeremy Howard, fast.ai, septiembre 2024). Archivo Markdown en la raíz de public/ que resume curado la estructura del sitio para los LLMs.
# OptionWeb
> Agence web belge depuis 2014. Spécialisée Next.js, hébergement cloud EU, SEO technique pour PME européennes.
## Services
- [Création de sites web](https://optionweb.dev/fr/creation-sites-web): sites Next.js 100/100 SEO
- [Hébergement cloud](https://optionweb.dev/fr/hebergement-cloud): infrastructure managed EU
- [SEO Marketing](https://optionweb.dev/fr/seo-marketing): SEO technique + AEO + GEO
## Blog
- [Hébergement Belgique 2026](https://optionweb.dev/fr/blog/hebergement-belgique-2026/)
- [Next.js vs WordPress](https://optionweb.dev/fr/blog/nextjs-vs-wordpress/)Para el robots.txt, configuración equilibrada 2026 para pyme que quiera maximizar visibilidad IA:
# Autoriser tous les bots de retrieval IA
User-agent: OAI-SearchBot
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: ChatGPT-User
Allow: /
User-agent: Perplexity-User
Allow: /
User-agent: Google-Extended
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: anthropic-ai
Allow: /
User-agent: GPTBot
Allow: /
# Default
User-agent: *
Allow: /
Sitemap: https://optionweb.dev/sitemap.xml7. Entity SEO: Wikidata y Knowledge Graph
Los LLMs razonan sobre entidades, no keywords. Una entidad bien definida en Wikidata + Google Knowledge Graph = señal de fiabilidad masiva para los LLMs.
Plan de acción:
- Crear un item Wikidata (Q-number) para tu organización. Más accesible que Wikipedia (criterios de notoriedad menos estrictos).
- Añadir identificadores externos serios: P856 (sitio oficial), P3608 (IVA UE), P3376 (BCE Bélgica), P4264 (LinkedIn), P2671 (Google Knowledge Graph ID si lo tienes).
- Emitir Schema.org Organization en el sitio con sameAs hacia Wikidata, LinkedIn, Crunchbase, perfiles sociales oficiales.
- Para los autores: Schema Person + sameAs hacia perfiles verificables (LinkedIn, ORCID, Google Scholar, etc.).
Cómo medir tu visibilidad IA
Tres enfoques según el presupuesto:
| Método | Coste | Precisión |
|---|---|---|
| Tests manuales (50 prompts mensuales) | 0 € | Buena pero subjetiva |
| Herramientas SaaS (Profound, Athena, Otterly) | 100-500 €/mes | Excelente, automatizada |
| Canal custom GA4 'AI Search' | 0 € | Tráfico real pero indicador retrasado |
KPIs core a trackear:
- Share of Model (SoM) — % de prompts objetivo donde tu marca se menciona en la respuesta
- Citation Rate — % de prompts donde estás linkeado como fuente cliqueable
- Sentiment — Tonalidad (neutro/positivo/negativo) en respuestas que te mencionan
- Posición en la síntesis — 1ª fuente citada = más clics que las siguientes
- Referral GA4 AI Search — Tráfico real medible vía UTMs o atribución de canal
Read next
SEO técnico para un sitio estático Next.js: checklist completa 2026
Todo lo que configurar técnicamente para que un sitio Next.js en static export alcance 100/100 en SEO: metadata, JSON-LD, sitemap, hreflang, robots, Speakable, schemas avanzados.
SEO multilingüe y hreflang en la práctica: guía de experiencia 11 idiomas
Guía completa SEO multilingüe: arquitectura URL, hreflang recíproco, x-default, sub-sitemaps, language detection, content strategy y trampas típicas tras 18 meses en producción.
Accesibilidad web y European Accessibility Act 2025: guía WCAG 2.2
El European Accessibility Act entró en vigor el 28 de junio de 2025. Qué empresas están afectadas, qué obligaciones WCAG 2.2 y 2.4 aplican, y cómo auditar y corregir un sitio pyme en 2026.
