Live · status OK
Back to blog
SEO & AEO13 min

GEO 2026: Von ChatGPT, Perplexity und Google AI Overviews zitiert werden

TL;DR

GEO (Generative Engine Optimization) optimiert dafür, von KI-Engines zitiert zu werden, nicht nur von Google indexiert. Princeton-Studie 2024: belegte Zitate (+40,6%), Experten-Quotes (+41%) und Zahlenstatistiken (+37,2%) erhöhen die Extraktionschancen. Stack 2026: extrahierbare Struktur (autonome Chunks), reiche Schemas (FAQPage, HowTo, Speakable), llms.txt, robots.txt mit Erlaubnis für OAI-SearchBot/PerplexityBot, plus Wikidata + Knowledge Graph Entität.

Julien Daniel
ByJulien Daniel
Founder & CTO, OptionWeb
Share
Logos von ChatGPT, Perplexity, Gemini mit Pfeilen zur Zitatextraktion

65% der Google-Suchen erzeugen 2026 keinen Klick mehr laut SparkToro. Nutzer bekommen ihre Antworten direkt in AI Overviews, ChatGPT Search, Perplexity, Gemini oder Copilot. Wird Ihre Website nicht als Quelle in diesen Antworten zitiert, sind Sie unsichtbar — unabhängig von Ihrer klassischen SEO-Position. Generative Engine Optimization (GEO) beantwortet dieses neue Spiel. Hier die konkreten Techniken, die OptionWeb 2026 auf Kundensites einsetzt.

1. GEO vs SEO: der grundlegende Unterschied

SEO optimiert für das Erscheinen in einer Ergebnisliste. GEO optimiert dafür, die Antwort zu sein, die ein LLM extrahiert. Zwei verschiedene Spiele mit teilweise überlappenden Techniken.

AspektKlassische SEOGEO
ZielTop 10 Google-SERPZitat in LLM-Synthese
GewinnformatVollständig optimierte SeiteAutonome extrahierbare Passagen
SignaleBacklinks, Autorität, RelevanzBelegte Zitate, Statistiken, klare Struktur
MessungPosition, Klicks, ImpressionenShare of Model, Citation Rate, Sentiment
Rolle EntitätenWichtigKritisch (Knowledge Graph, Wikidata)
InhaltsformatLong-Form, vollständigModular, unabhängige Chunks

2. Kartografie der KI-Engines 2026

Die Retrieval-Quelle jeder Engine zu kennen, hilft die Anstrengungen zu fokussieren.

EngineRetrieval-QuelleSynthese-ModellKI-Marktanteil
Google AI OverviewsGoogle-IndexGemini~55-60%
ChatGPT SearchBing + OAI-SearchBot-Crawl + PartnershipsGPT-4o/o-Series~20-25%
PerplexityBing + Google + PerplexityBot-CrawlClaude/GPT-4o (wählbar)~8-10%
Microsoft CopilotBingGPT-4o~5-8%
Gemini appGoogle-IndexGemini~5%
Claude (web search)Brave SearchClaude~1-2%

Strategische Schlussfolgerung: Optimierung für Google + Bing = 95% des KI-Retrieval abgedeckt. Bing-SEO (oft vernachlässigt) wird kritisch für ChatGPT Search und Copilot.

3. RAG verstehen, um zu optimieren

RAG (Retrieval Augmented Generation) folgt einer 5-Schritt-Pipeline:

  1. Query Rewriting: Das LLM formuliert die User-Query in 3-10 Sub-Queries um
  2. Retrieval: Eine Suchmaschine (Google, Bing, Brave) liefert 10-20 Dokumente zurück
  3. Chunk Extraction: Dokumente werden in Passagen von 100-500 Tokens zerlegt
  4. Similarity Scoring: Vector Embedding zur Rangfolge der relevantesten Chunks
  5. Synthesis: Das LLM generiert eine Antwort aus den Top-K-Chunks und wählt, welche zu zitieren sind

Konkrete Implikationen: Jeder Absatz muss autonom sein (isoliert verständlich), benannte Entitäten müssen explizit sein (keine mehrdeutigen Pronomen), Statistiken und Zitate verstärken die vom LLM wahrgenommene 'Zuverlässigkeit'.

4. Die 9 Techniken der Princeton-Studie

Aggarwal et al. (NeurIPS 2024) testeten 9 Optimierungen auf GPT-4 unter realen RAG-Bedingungen. Ergebnisse zur Subjective-Impression-Metrik (Gewicht in der generierten Antwort):

TechnikExtraktions-LiftImplementierung
Experten-Quotes+41,0%Zitate mit Name, Titel, Organisation
Belegte Zitate+40,6%Inline akademische oder maßgebliche Refs
Zahlenstatistiken+37,2%3+ Stats pro Artikel, Quellen verlinkt
Stilistische Autorität+13,8%Expertenton, präzises technisches Vokabular
Technische Begriffe+9,1%Domänensprache
Ease of Reading+7,9%Klare Struktur, kurze Absätze
Unique Words-1,2%Vielfältiges Vokabular — geringer Effekt
Keyword Stuffing-10,3%Bestrafend — vermeiden
Fluency Optimization-1,8%Marketing-Speak — bestrafend

5. Extrahierbare Inhaltsstruktur

Chunk-freundliches atomares Muster:

  • H2 oder H3 als Frage/FaktenaussageUser-Queries matchen. Bsp.: 'Was ist Consent Mode v2?' statt 'Consent Mode v2'.
  • Erster Satz = autonome AntwortSelf-contained, ohne Pronomen, mit benannter Entität. Außerhalb des Dokumentkontexts verständlich.
  • 2-4 BeweissätzeStatistiken, Zitate, konkrete Beispiele. Stärkt die Zuverlässigkeit.
  • Optionale Details danachDas LLM extrahiert die ersten Sätze. Details sind für den menschlichen Leser.

Anti-Patterns zu vermeiden: Bandwurmsätze >40 Wörter, Pronomen ohne nahen Antezedenten ("er", "das", "diese"), Schlüsselinfo in Absatz 5 versteckt, Inhalt in Bildern ohne reichen Alt, gebrochene Heading-Hierarchie (H2 → H4 ohne H3).

6. llms.txt und robots.txt für KI

llms.txt ist ein aufkommender Standard (Jeremy Howard, fast.ai, September 2024). Markdown-Datei im Root von public/, die die kuratierte Site-Struktur für LLMs zusammenfasst.

public/llms.txtmarkdown
# OptionWeb

> Agence web belge depuis 2014. Spécialisée Next.js, hébergement cloud EU, SEO technique pour PME européennes.

## Services
- [Création de sites web](https://optionweb.dev/fr/creation-sites-web): sites Next.js 100/100 SEO
- [Hébergement cloud](https://optionweb.dev/fr/hebergement-cloud): infrastructure managed EU
- [SEO Marketing](https://optionweb.dev/fr/seo-marketing): SEO technique + AEO + GEO

## Blog
- [Hébergement Belgique 2026](https://optionweb.dev/fr/blog/hebergement-belgique-2026/)
- [Next.js vs WordPress](https://optionweb.dev/fr/blog/nextjs-vs-wordpress/)

Für robots.txt, ausgewogene 2026-Konfiguration für ein KMU, das die KI-Sichtbarkeit maximieren will:

public/robots.txttxt
# Autoriser tous les bots de retrieval IA
User-agent: OAI-SearchBot
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: ChatGPT-User
Allow: /

User-agent: Perplexity-User
Allow: /

User-agent: Google-Extended
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: anthropic-ai
Allow: /

User-agent: GPTBot
Allow: /

# Default
User-agent: *
Allow: /
Sitemap: https://optionweb.dev/sitemap.xml

7. Entity SEO: Wikidata und Knowledge Graph

LLMs argumentieren über Entitäten, nicht Keywords. Eine in Wikidata + Google Knowledge Graph gut definierte Entität = massives Zuverlässigkeitssignal für LLMs.

Aktionsplan:

  1. Ein Wikidata-Item (Q-Number) für Ihre Organisation anlegen. Zugänglicher als Wikipedia (Notabilitätskriterien weniger streng).
  2. Seriöse externe Identifier ergänzen: P856 (offizielle Website), P3608 (EU-USt.), P3376 (Belgische BCE), P4264 (LinkedIn), P2671 (Google Knowledge Graph ID falls vorhanden).
  3. Schema.org Organization auf der Site emittieren mit sameAs zu Wikidata, LinkedIn, Crunchbase, offiziellen Social-Profilen.
  4. Für Autoren: Schema Person + sameAs zu verifizierbaren Profilen (LinkedIn, ORCID, Google Scholar usw.).

Wie man die KI-Sichtbarkeit misst

Drei Ansätze je nach Budget:

MethodeKostenGenauigkeit
Manuelle Tests (50 Prompts/Monat)0 €Gut, aber subjektiv
SaaS-Tools (Profound, Athena, Otterly)100-500 €/MonatExzellent, automatisiert
GA4-Custom-Channel 'AI Search'0 €Echter Traffic, aber nachlaufender Indikator

Kern-KPIs zum Tracken:

  • Share of Model (SoM)% der Zielprompts, in denen Ihre Marke in der Antwort erwähnt wird
  • Citation Rate% der Prompts, bei denen Sie als klickbare Quelle verlinkt sind
  • SentimentTonalität (neutral/positiv/negativ) in Antworten, die Sie erwähnen
  • Position in der Synthese1. zitierte Quelle = mehr Klicks als die folgenden
  • GA4 AI Search ReferralEchter messbarer Traffic via UTMs oder Channel-Attribution
Tags#geo#aeo#ai-overviews#chatgpt-search#perplexity#llms-txt