Antes de tudo: a diferença entre rastrear e indexar
Rastrear é o Google visitar a URL. Indexar é decidir guardar no banco de dados. Muitos sites são rastreados mas não indexados — geralmente por conteúdo fraco, duplicado ou bloqueado. Entender essa distinção é o primeiro passo para diagnosticar problemas reais em vez de tratar sintomas.
O Search Console expõe esse fluxo claramente: páginas podem aparecer como "Descobertas — não indexadas", "Rastreadas — não indexadas", "Excluídas por noindex" ou "Indexadas". Cada estado pede uma ação diferente.
Checklist
- robots.txt acessível e sem bloqueios acidentais
- sitemap.xml enviado no Search Console e referenciado no robots.txt
- canonical correto em cada página, apontando sempre para a versão preferencial
- meta robots sem "noindex" indevido (auditoria comum em sites WordPress)
- Core Web Vitals dentro do verde em mobile
- Conteúdo único e substancial (>300 palavras úteis por página, idealmente 600+)
- HTTPS válido e sem mixed content
- Internal linking que conecte páginas órfãs à navegação principal
- URLs estáveis, legíveis e sem parâmetros desnecessários
- Schema.org adequado ao tipo de página (Article, Product, LocalBusiness…)
- Mobile-first: layout responsivo de verdade, não só viewport meta
- Velocidade de TTFB < 800ms em conexões médias
Como diagnosticar
Use a Inspeção de URL do Search Console para cada página crítica. Se aparecer "Descoberta — não indexada", o problema é qualidade ou link interno: a página foi vista mas o Google não achou que valia a pena visitar. Se aparecer "Rastreada — não indexada", o conteúdo precisa ser reforçado — geralmente é fino, duplicado ou similar a páginas já indexadas.
Cuidados com conteúdo gerado dinamicamente
Sites que dependem de JavaScript para renderizar conteúdo crítico têm taxa de indexação significativamente menor. Mesmo com renderização do Googlebot via Chromium, o orçamento de rastreamento JS é limitado e priorizado para domínios consolidados. Para conteúdo importante, prefira SSR ou pré-renderização estática.
Monitorando ao longo do tempo
Indexação não é tarefa "uma vez e pronto". Configure alertas no Search Console para quedas bruscas em páginas indexadas e revise mensalmente o relatório de Cobertura. Sites grandes devem segmentar sitemaps por tipo de conteúdo (produtos, blog, categorias) para isolar problemas com mais precisão.
Sinais de qualidade que o Google realmente lê
Além do checklist técnico, vale lembrar que indexação também depende de sinais editoriais: data visível de publicação, autoria com bio, presença de imagens próprias (não apenas banco de imagens) e ausência de blocos repetidos entre páginas. Sites que parecem "templates preenchidos" tendem a ser deixados de lado, mesmo passando em todas as auditorias técnicas.
Quando "não indexar" é a estratégia certa
Nem toda página precisa estar no índice. Filtros, ordenações, páginas de busca interna e variações de paginação devem usar noindex ou ser canonicalizadas. Páginas legais (termos, política), embora indexáveis, raramente precisam ranquear — o foco é não desperdiçar orçamento de rastreamento.