Live · status OK
Retour au blog
SEO & AEO13 min

GEO en 2026 : être cité par ChatGPT, Perplexity et Google AI Overviews

TL;DR

Le GEO (Generative Engine Optimization) optimise pour être cité par les moteurs IA, pas juste indexé par Google. Étude Princeton 2024 : citations sourcées (+40,6%), quotations d'experts (+41%) et statistiques chiffrées (+37,2%) augmentent les chances d'extraction. Stack 2026 : structure extractible (chunks autonomes), schemas riches (FAQPage, HowTo, Speakable), llms.txt, robots.txt qui autorise OAI-SearchBot/PerplexityBot, et Wikidata + Knowledge Graph entité.

Julien Daniel
ParJulien Daniel
Founder & CTO, OptionWeb
Partager
Logos ChatGPT, Perplexity, Gemini avec flèches d'extraction de citations

65% des recherches Google ne génèrent plus de clic en 2026 selon SparkToro. Les utilisateurs obtiennent leurs réponses directement dans AI Overviews, ChatGPT Search, Perplexity, Gemini ou Copilot. Si votre site n'est pas cité comme source dans ces réponses, vous êtes invisible — peu importe votre position SEO classique. Le Generative Engine Optimization (GEO) répond à ce nouveau jeu. Voici les techniques concrètes appliquées par OptionWeb sur les sites clients en 2026.

1. GEO vs SEO : la différence fondamentale

Le SEO optimise pour apparaître dans une liste de résultats. Le GEO optimise pour être la réponse extraite par un LLM. Deux jeux différents avec des techniques qui se chevauchent partiellement.

AspectSEO classiqueGEO
CibleTop 10 SERP GoogleCitation dans synthèse LLM
Format gagnantPage complète optimiséePassages autonomes extractibles
SignauxBacklinks, autorité, pertinenceCitations sourcées, statistiques, structure claire
MesurePosition, clics, impressionsShare of Model, citation rate, sentiment
Rôle entitésImportantCritique (Knowledge Graph, Wikidata)
Format de contenuLong-form, completModulaire, chunks indépendants

2. Cartographie des moteurs IA en 2026

Connaître les sources de retrieval de chaque moteur permet de cibler les efforts.

MoteurSource retrievalModèle synthèsePart de marché IA
Google AI OverviewsIndex GoogleGemini~55-60%
ChatGPT SearchBing + crawl OAI-SearchBot + partenariatsGPT-4o/o-series~20-25%
PerplexityBing + Google + crawl PerplexityBotClaude/GPT-4o (au choix)~8-10%
Microsoft CopilotBingGPT-4o~5-8%
Gemini appIndex GoogleGemini~5%
Claude (web search)Brave SearchClaude~1-2%

Conclusion stratégique : optimiser pour Google + Bing = couvrir 95% du retrieval IA. Le SEO Bing (souvent négligé) devient critique pour ChatGPT Search et Copilot.

3. Comprendre le RAG pour optimiser

Le RAG (Retrieval Augmented Generation) suit un pipeline en 5 étapes :

  1. Query rewriting : le LLM reformule la requête utilisateur en 3-10 sous-requêtes
  2. Retrieval : un moteur de recherche (Google, Bing, Brave) retourne 10-20 documents
  3. Chunk extraction : les documents sont découpés en passages de 100-500 tokens
  4. Similarity scoring : embedding vectoriel pour ranker les chunks les plus pertinents
  5. Synthesis : le LLM génère une réponse à partir des top-K chunks et choisit lesquels citer

Implications concrètes : chaque paragraphe doit être autonome (compréhensible isolément), les entités nommées doivent être explicites (pas de pronoms ambigus), les statistiques et citations renforcent la 'fiabilité' perçue par le LLM.

4. Les 9 techniques de l'étude Princeton

Aggarwal et al. (NeurIPS 2024) ont testé 9 optimisations sur GPT-4 en conditions RAG réelles. Les résultats sur la métrique Subjective Impression (poids dans la réponse générée) :

TechniqueLift d'extractionImplémentation
Quotations d'experts+41,0%Citations avec nom, titre, organisation
Citations sourcées+40,6%Refs académiques ou autoritaires inline
Statistiques chiffrées+37,2%3+ stats par article, sources liées
Autorité stylistique+13,8%Ton expert, vocabulaire technique précis
Termes techniques+9,1%Langage de domaine
Ease of reading+7,9%Structure claire, paragraphes courts
Unique words-1,2%Vocabulaire diversifié — peu d'effet
Keyword stuffing-10,3%Pénalisant — éviter
Fluency optimization-1,8%Marketing-speak — pénalisant

5. Structure de contenu extractible

Pattern atomique chunk-friendly :

  • H2 ou H3 en question/affirmation factuelleMatch les requêtes user. Ex : 'Qu'est-ce que le Consent Mode v2 ?' plutôt que 'Consent Mode v2'.
  • 1ère phrase = réponse autonomeSelf-contained, sans pronoms, avec entité nommée. Compréhensible hors contexte du document.
  • 2-4 phrases de preuvesStatistiques, citations, exemples concrets. Renforce la fiabilité.
  • Détails optionnels aprèsLe LLM extrait les premières phrases. Les détails sont pour le lecteur humain.

Anti-patterns à éviter : phrases fleuves >40 mots, pronoms sans antécédent proche ("il", "cela", "ces"), info clé cachée au paragraphe 5, contenu en image sans alt riche, hiérarchie de headings cassée (H2 → H4 sans H3). Le GEO se construit sur des fondations SEO solides — voir notre guide SEO technique Next.js pour la base d'extraction propre par les crawlers.

6. llms.txt et robots.txt pour IA

Le llms.txt est un standard émergent (Jeremy Howard, fast.ai, septembre 2024). Fichier Markdown à la racine de public/ qui résume curé la structure du site pour les LLMs.

public/llms.txtmarkdown
# OptionWeb

> Agence web belge depuis 2014. Spécialisée Next.js, hébergement cloud EU, SEO technique pour PME européennes.

## Services
- [Création de sites web](https://optionweb.dev/fr/creation-sites-web): sites Next.js 100/100 SEO
- [Hébergement cloud](https://optionweb.dev/fr/hebergement-cloud): infrastructure managed EU
- [SEO Marketing](https://optionweb.dev/fr/seo-marketing): SEO technique + AEO + GEO

## Blog
- [Hébergement Belgique 2026](https://optionweb.dev/fr/blog/hebergement-belgique-2026/)
- [Next.js vs WordPress](https://optionweb.dev/fr/blog/nextjs-vs-wordpress/)

Pour le robots.txt, configuration équilibrée 2026 pour PME qui veut maximiser visibilité IA :

public/robots.txttxt
# Autoriser tous les bots de retrieval IA
User-agent: OAI-SearchBot
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: ChatGPT-User
Allow: /

User-agent: Perplexity-User
Allow: /

User-agent: Google-Extended
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: anthropic-ai
Allow: /

User-agent: GPTBot
Allow: /

# Default
User-agent: *
Allow: /
Sitemap: https://optionweb.dev/sitemap.xml

7. Entity SEO : Wikidata et Knowledge Graph

Les LLMs raisonnent sur des entités, pas des keywords. Une entité bien définie dans Wikidata + Google Knowledge Graph = signal de fiabilité massif pour les LLMs.

Plan d'action :

  1. Créer un item Wikidata (Q-number) pour votre organisation. Plus accessible que Wikipedia (pas de critère de notoriété aussi strict).
  2. Ajouter les identifiants externes sérieux : P856 (site officiel), P3608 (TVA EU), P3376 (BCE Belgique), P4264 (LinkedIn), P2671 (Google Knowledge Graph ID si vous l'avez).
  3. Émettre Schema.org Organization sur le site avec sameAs vers Wikidata, LinkedIn, Crunchbase, profils sociaux officiels.
  4. Pour les auteurs : Schema Person + sameAs vers profils vérifiables (LinkedIn, ORCID, Google Scholar, etc.).

Comment mesurer sa visibilité IA

Trois approches selon le budget :

MéthodeCoûtPrécision
Tests manuels (50 prompts mensuels)0 €Bonne mais subjective
Outils SaaS (Profound, Athena, Otterly)100-500 €/moisExcellente, automatisée
Channel custom GA4 'AI Search'0 €Trafic réel mais lagging indicator

KPIs core à tracker :

  • Share of Model (SoM)% de prompts cibles où votre marque est mentionnée dans la réponse
  • Citation Rate% de prompts où vous êtes linké comme source cliquable
  • SentimentTonalité (neutre/positif/négatif) dans les réponses qui vous mentionnent
  • Position dans la synthèse1ère source citée = plus de clics que les suivantes
  • Referral GA4 AI SearchTrafic réel mesurable via UTMs ou attribution de canal
Tags#geo#aeo#ai-overviews#chatgpt-search#perplexity#llms-txt