Il budget di scansione indica il numero di pagine che un motore di ricerca come Googlebot è disposto a esplorare sul vostro sito in un determinato intervallo di tempo. Per i negozi PrestaShop con migliaia di schede prodotto, comprendere e ottimizzare questo budget è fondamentale per garantire che tutte le pagine importanti vengano indicizzate correttamente.
Cos'è il budget di scansione?
Google definisce il budget di scansione attraverso due componenti: il limite di frequenza di scansione (crawl rate limit) e la domanda di scansione (crawl demand). Il limite di frequenza indica quante volte Googlebot può scansionare il vostro sito senza sovraccaricarlo — dipende dalla velocità di risposta del server e dai segnali di salute del sito. La domanda di scansione riflette l'interesse di Google per le vostre pagine, in base alla loro popolarità, aggiornamento e autorità.
Perché il budget di scansione è cruciale per l'e-commerce
Un negozio online di medie dimensioni genera facilmente decine di migliaia di URL: pagine prodotto, varianti, pagine di categoria, risultati di filtri, pagine di paginazione e altro ancora. Googlebot dispone di risorse limitate. Se il budget di scansione viene sprecato su URL di scarso valore, le pagine prodotto importanti rischiano di essere esplorate meno frequentemente — o addirittura ignorate durante gli aggiornamenti dell'indice.
PrestaShop e la navigazione a faccette
Come Google priorizza le pagine da scansionare
PageRank interno
Le pagine con più link interni ricevono maggiore attenzione da Googlebot. Una solida struttura di collegamenti interni indirizza il budget di scansione verso le pagine prioritarie.
Freschezza dei contenuti
Le pagine aggiornate frequentemente (nuovi prodotti, variazioni di prezzo) vengono revisitate più spesso. Le pagine statiche e più datate ricevono meno visite di scansione.
Popolarità e autorità
Gli URL che ricevono backlink esterni o un elevato traffico organico sono considerati più importanti e vengono scansionati con priorità maggiore.
Come ottimizzare il budget di scansione
- Bloccare gli URL inutili tramite robots.txt (parametri di ordinamento, paginazione profonda, URL filtri a faccette)
- Correggere tutti gli errori 404 e le catene di reindirizzamento che sprecano il budget
- Inviare una sitemap XML aggiornata in Google Search Console per guidare Googlebot
- Usare i tag canonical per indicare la versione principale delle pagine duplicate
- Migliorare la velocità di risposta del server per aumentare il limite di frequenza consentito
- Rimuovere o applicare noindex alle pagine di scarso valore (pagine di filtri, duplicati di paginazione)