Live · status OK
Back to blog
SEO e AEO13 min

GEO em 2026: ser citado pelo ChatGPT, Perplexity e Google AI Overviews

TL;DR

O GEO (Otimização para Mecanismos Generativos) otimiza para ser citado pelos motores IA, não apenas indexado pelo Google. Estudo Princeton 2024: citações com fonte (+40,6%), citações de especialistas (+41%) e estatísticas numéricas (+37,2%) aumentam as chances de extração. Stack 2026: estrutura extraível (chunks autónomos), schemas ricos (FAQPage, HowTo, Speakable), llms.txt, robots.txt que autoriza OAI-SearchBot/PerplexityBot, e entidade Wikidata + Knowledge Graph.

Julien Daniel
ByJulien Daniel
Founder & CTO, OptionWeb
Share
Logos do ChatGPT, Perplexity, Gemini com setas de extração de citações

65% das pesquisas Google já não geram clique em 2026 segundo o SparkToro. Os utilizadores obtêm respostas diretamente em AI Overviews, ChatGPT Search, Perplexity, Gemini ou Copilot. Se o teu site não é citado como fonte nessas respostas, és invisível — independentemente da tua posição SEO clássica. A Otimização para Mecanismos Generativos (GEO) responde a este novo jogo. Eis as técnicas concretas aplicadas pela OptionWeb em 2026 nos sites cliente.

1. GEO vs SEO: a diferença fundamental

O SEO otimiza para aparecer numa lista de resultados. O GEO otimiza para ser a resposta extraída por um LLM. Dois jogos diferentes com técnicas que se sobrepõem parcialmente.

AspetoSEO clássicoGEO
AlvoTop 10 SERP GoogleCitação na síntese LLM
Formato vencedorPágina completa otimizadaPassagens autónomas extraíveis
SinaisBacklinks, autoridade, relevânciaCitações com fonte, estatísticas, estrutura clara
MediçãoPosição, cliques, impressõesShare of Model, citation rate, sentiment
Papel das entidadesImportanteCrítico (Knowledge Graph, Wikidata)
Formato de conteúdoLong-form, completoModular, chunks independentes

2. Cartografia dos motores IA em 2026

Conhecer as fontes de retrieval de cada motor permite mirar os esforços.

MotorFonte retrievalModelo sínteseQuota mercado IA
Google AI OverviewsÍndice GoogleGemini~55-60%
ChatGPT SearchBing + crawl OAI-SearchBot + parceriasGPT-4o/o-series~20-25%
PerplexityBing + Google + crawl PerplexityBotClaude/GPT-4o (à escolha)~8-10%
Microsoft CopilotBingGPT-4o~5-8%
Gemini appÍndice GoogleGemini~5%
Claude (web search)Brave SearchClaude~1-2%

Conclusão estratégica: otimizar para Google + Bing = cobrir 95% do retrieval IA. O SEO Bing (frequentemente negligenciado) torna-se crítico para ChatGPT Search e Copilot.

3. Compreender o RAG para otimizar

O RAG (Retrieval Augmented Generation) segue um pipeline em 5 etapas:

  1. Query rewriting: o LLM reformula a query do utilizador em 3-10 sub-queries
  2. Retrieval: um motor de pesquisa (Google, Bing, Brave) devolve 10-20 documentos
  3. Chunk extraction: os documentos são divididos em passagens de 100-500 tokens
  4. Similarity scoring: embedding vetorial para ranking dos chunks mais relevantes
  5. Synthesis: o LLM gera uma resposta a partir dos top-K chunks e escolhe quais citar

Implicações concretas: cada parágrafo deve ser autónomo (compreensível isoladamente), as entidades nomeadas devem ser explícitas (sem pronomes ambíguos), as estatísticas e citações reforçam a fiabilidade percebida pelo LLM.

4. As 9 técnicas do estudo Princeton

Aggarwal et al. (NeurIPS 2024) testaram 9 otimizações no GPT-4 em condições RAG reais. Resultados na métrica Subjective Impression (peso na resposta gerada):

TécnicaLift de extraçãoImplementação
Citações de especialistas+41,0%Citações com nome, cargo, organização
Citações com fonte+40,6%Refs académicas ou autorizadas inline
Estatísticas numéricas+37,2%3+ stats por artigo, fontes ligadas
Autoridade estilística+13,8%Tom de especialista, vocabulário técnico preciso
Termos técnicos+9,1%Linguagem de domínio
Ease of reading+7,9%Estrutura clara, parágrafos curtos
Unique words-1,2%Vocabulário diversificado — pouco efeito
Keyword stuffing-10,3%Penalizador — evitar
Fluency optimization-1,8%Marketing-speak — penalizador

5. Estrutura de conteúdo extraível

Padrão atómico chunk-friendly:

  • H2 ou H3 em pergunta/afirmação factualMatch com queries do utilizador. Ex.: 'O que é o Consent Mode v2?' em vez de 'Consent Mode v2'.
  • 1ª frase = resposta autónomaSelf-contained, sem pronomes, com entidade nomeada. Compreensível fora do contexto do documento.
  • 2-4 frases de provasEstatísticas, citações, exemplos concretos. Reforça a fiabilidade.
  • Detalhes opcionais depoisO LLM extrai as primeiras frases. Os detalhes são para o leitor humano.

Anti-padrões a evitar: frases-rio >40 palavras, pronomes sem antecedente próximo ("ele", "isto", "estes"), info-chave escondida no parágrafo 5, conteúdo em imagem sem alt rico, hierarquia de headings partida (H2 → H4 sem H3).

6. llms.txt e robots.txt para IA

O llms.txt é um padrão emergente (Jeremy Howard, fast.ai, setembro 2024). Ficheiro Markdown na raiz de public/ que resume curado a estrutura do site para os LLMs.

public/llms.txtmarkdown
# OptionWeb

> Agence web belge depuis 2014. Spécialisée Next.js, hébergement cloud EU, SEO technique pour PME européennes.

## Services
- [Création de sites web](https://optionweb.dev/fr/creation-sites-web): sites Next.js 100/100 SEO
- [Hébergement cloud](https://optionweb.dev/fr/hebergement-cloud): infrastructure managed EU
- [SEO Marketing](https://optionweb.dev/fr/seo-marketing): SEO technique + AEO + GEO

## Blog
- [Hébergement Belgique 2026](https://optionweb.dev/fr/blog/hebergement-belgique-2026/)
- [Next.js vs WordPress](https://optionweb.dev/fr/blog/nextjs-vs-wordpress/)

Para o robots.txt, configuração equilibrada 2026 para PME que queira maximizar a visibilidade IA:

public/robots.txttxt
# Autoriser tous les bots de retrieval IA
User-agent: OAI-SearchBot
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: ChatGPT-User
Allow: /

User-agent: Perplexity-User
Allow: /

User-agent: Google-Extended
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: anthropic-ai
Allow: /

User-agent: GPTBot
Allow: /

# Default
User-agent: *
Allow: /
Sitemap: https://optionweb.dev/sitemap.xml

7. Entity SEO: Wikidata e Knowledge Graph

Os LLMs raciocinam sobre entidades, não keywords. Uma entidade bem definida em Wikidata + Google Knowledge Graph = sinal de fiabilidade massivo para os LLMs.

Plano de ação:

  1. Criar um item Wikidata (Q-number) para a tua organização. Mais acessível que a Wikipedia (critérios de notoriedade menos rígidos).
  2. Adicionar identificadores externos sérios: P856 (site oficial), P3608 (IVA UE), P3376 (BCE Bélgica), P4264 (LinkedIn), P2671 (Google Knowledge Graph ID se o tens).
  3. Emitir Schema.org Organization no site com sameAs para Wikidata, LinkedIn, Crunchbase, perfis sociais oficiais.
  4. Para os autores: Schema Person + sameAs para perfis verificáveis (LinkedIn, ORCID, Google Scholar, etc.).

Como medir a visibilidade IA

Três abordagens conforme o orçamento:

MétodoCustoPrecisão
Testes manuais (50 prompts mensais)0 €Boa mas subjetiva
Ferramentas SaaS (Profound, Athena, Otterly)100-500 €/mêsExcelente, automatizada
Canal custom GA4 'AI Search'0 €Tráfego real mas indicador atrasado

KPIs core a trackear:

  • Share of Model (SoM)% de prompts-alvo onde a tua marca é mencionada na resposta
  • Citation Rate% de prompts onde estás linkado como fonte clicável
  • SentimentTom (neutro/positivo/negativo) nas respostas que te mencionam
  • Posição na síntese1ª fonte citada = mais cliques que as seguintes
  • Referral GA4 AI SearchTráfego real mensurável via UTMs ou atribuição de canal
Tags#geo#aeo#ai-overviews#chatgpt-search#perplexity#llms-txt