A navegação por facetas é o sistema de filtros presente nas páginas de categoria das lojas e-commerce: filtrar por cor, tamanho, preço, marca, classificação, disponibilidade. Indispensável para a experiência do utilizador em catálogos extensos, é também uma das principais causas de problemas técnicos de SEO: cada combinação de filtros gera um novo URL, o que pode criar milhões de páginas com conteúdo duplicado e esgotar o orçamento de rastreamento do Google em poucos dias.
O problema SEO da navegação por facetas
Imagine uma loja com 1.000 produtos na categoria Sapatos e 10 filtros disponíveis (cor, tamanho, marca, material, estilo, estação, preço, género, classificação, promoção). Cada filtro pode ter múltiplos valores. Se o PrestaShop gerar um URL diferente para cada combinação, pode chegar-se a centenas de milhares ou até milhões de URLs — para páginas com conteúdo quase idêntico ou muito pouco diferente. O Google desperdiça o seu orçamento de rastreamento nestas páginas duplicadas em vez de rastrear as páginas do site com valor real.
Multiplicação exponencial de URLs
Soluções para gerir a navegação por facetas
Várias abordagens permitem controlar o impacto SEO dos filtros. A primeira é o bloqueio via robots.txt: impedir que os bots rastreiem URLs que contenham parâmetros de filtro (ex. todos os URLs com ?id_feature, ?orderby, ?price_min). Simples de implementar mas radical — as páginas filtradas nunca serão indexadas, mesmo que tenham valor comercial. A segunda abordagem é o uso de tags canonical: cada página filtrada aponta para a página de categoria principal via rel=canonical, sinalizando ao Google qual é a página de referência a indexar.
A terceira solução — e frequentemente a mais eficaz a longo prazo — é a filtragem AJAX sem alterações de URL. Os filtros atualizam a exibição de produtos em JavaScript sem modificar o URL da página. O Google vê um único URL por categoria, e os filtros não existem do ponto de vista do rastreamento. Esta abordagem requer uma implementação técnica cuidadosa para garantir que o conteúdo dinâmico permaneça acessível para o renderização JavaScript do Google.
Encontrar o equilíbrio certo: algumas páginas filtradas têm valor
Nem todas as páginas filtradas são inúteis para SEO. Algumas combinações correspondem a intenções de pesquisa reais com volume: sapatos Nike vermelhos número 42, vestido de noiva plus size barato, telemóvel Samsung recondicionado abaixo de 200 euros. Estas páginas têm o potencial de captar tráfego long tail altamente qualificado. A decisão de indexar uma página filtrada deve basear-se em: o volume de pesquisa dessa combinação, a concorrência e a capacidade do site para satisfazer essa intenção específica.
Estratégia: permitir seletivamente certas facetas
Outras ferramentas de controlo
- Google Search Console: parâmetros de URL (agora menos ativa mas útil para assinalar os parâmetros de ordenação e filtragem)
- Tag meta robots noindex: em páginas filtradas menos relevantes, noindex impede a indexação sem bloquear o rastreamento
- Atributo rel=canonical: aponta todas as variantes para a página canónica de categoria
- robots.txt Disallow: bloqueia completamente o rastreamento de URLs com parâmetros específicos
- Paginação correta: evitar gerar páginas de paginação combinadas com filtros
Navegação por facetas no PrestaShop
O PrestaShop dispõe de um módulo nativo de pesquisa por facetas (ps_facetedsearch) que gera URLs por defeito para cada combinação de filtros. Este módulo oferece opções de configuração importantes para SEO: desativar a indexação de páginas filtradas (via noindex), gerar URLs limpos sem parâmetros GET, configurar tags canonical automáticas nas páginas filtradas. A configuração ótima depende do tamanho do catálogo, número de filtros e da estratégia SEO global da loja.
É fortemente recomendado auditar a configuração da navegação por facetas antes de qualquer trabalho SEO num site PrestaShop existente. O relatório de Cobertura da Google Search Console permite identificar rapidamente se centenas de páginas filtradas foram indexadas por erro, o que pode diluir a autoridade do domínio e desperdiçar o orçamento de rastreamento.