Sitemap e-commerce: quali prodotti, quanti, come
Su un catalogo da 50.000 SKU, un sitemap strutturato male può costare settimane di indicizzazione. Ecco il metodo che funziona davvero.
Sitemap e-commerce: quali prodotti, quanti, come
Un sitemap XML dovrebbe aiutare Google a scoprire le vostre pagine. Su un sito piccolo è quasi automatico. Su un catalogo e-commerce da 10.000 o 100.000 SKU, un sitemap strutturato male è una delle prime cause di sotto-indicizzazione: migliaia di prodotti che Google non crawla mai perché il vostro sitemap gli invia un segnale sbagliato.
Ecco il metodo per strutturare un sitemap prodotti che funziona, con le regole e i limiti reali che si vedono in produzione.
Il limite delle 50.000 URL (e cosa significa davvero)
Un file sitemap XML può contenere solo 50.000 URL al massimo, con una dimensione massima di 50 MB uncompressed. È specificato nel protocollo sitemap.xml.
Ma 50.000 URL è il limite tecnico — il limite pratico è più basso. Google raccomanda implicitamente di restare sotto 10.000-20.000 URL per file, in modo che il crawler elabori ogni URL correttamente. Oltre questa soglia, può campionare e ignorare le URL in coda.
Regola operativa: 5.000-20.000 URL per file sitemap è la fascia ottimale. Sopra, fate sharding.
Sitemap index e sharding
Per un catalogo da 50.000 prodotti, si costruisce un sitemap index che punta a più sitemap figli:
/sitemap.xml (index, contiene i link ai file figli):
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://example.com/sitemap-products-1.xml</loc>
<lastmod>2026-04-23</lastmod>
</sitemap>
<sitemap>
<loc>https://example.com/sitemap-products-2.xml</loc>
<lastmod>2026-04-23</lastmod>
</sitemap>
<sitemap>
<loc>https://example.com/sitemap-products-3.xml</loc>
<lastmod>2026-04-23</lastmod>
</sitemap>
<sitemap>
<loc>https://example.com/sitemap-pages.xml</loc>
<lastmod>2026-04-23</lastmod>
</sitemap>
<sitemap>
<loc>https://example.com/sitemap-blog.xml</loc>
<lastmod>2026-04-23</lastmod>
</sitemap>
</sitemapindex>
Strategia di sharding consigliata per un catalogo:
sitemap-products-{N}.xml— prodotti, 10.000 URL per filesitemap-pages.xml— pagine statiche (home, about, pricing, ecc.)sitemap-blog.xml— articoli del blogsitemap-categories.xml— pagine delle categorie prodotto
Regola: un solo sitemap index per dominio, più sitemap figli. Inviate solo l'index a Google Search Console — non ogni file figlio.
Il lastmod che mente (e perché è tossico)
Molti negozi impostano <lastmod> alla data del giorno per "dire a Google che la pagina è stata modificata". È un trucco che Google ha imparato a rilevare: se ogni giorno dichiarate 10.000 pagine modificate ma in realtà non sono cambiate, Google ignora tutti i vostri lastmod dopo 2-3 settimane.
La buona pratica:
<lastmod>= data reale dell'ultima modifica del contenuto della pagina (non la data di crawl né la data del giorno)- Formato ISO 8601:
2026-04-23o2026-04-23T14:30:00+02:00 - Aggiornato solo quando il prodotto cambia davvero (prezzo, descrizione, immagini, stock)
Se non sapete determinare la data dell'ultima modifica, omettete il campo — è meglio di un falso lastmod che peggiora la vostra credibilità agli occhi del crawler.
Escludere le varianti (la regola che fa guadagnare il 30% di crawl budget)
Su Shopify, ogni variante di prodotto può avere una URL con query params:
/products/chaussure-derby?variant=44-noir
/products/chaussure-derby?variant=44-marron
/products/chaussure-derby?variant=45-noir
...
Queste URL NON devono essere nel sitemap. Perché:
- Sono tutte canonicalizzate verso la pagina padre
/products/chaussure-derby - Indicizzarle crea contenuto duplicato nell'indice Google
- Consumano il vostro crawl budget senza motivo
Il sitemap prodotti deve contenere solo le URL canoniche dei prodotti padre, non le varianti.
Stessa logica per:
- Pagine di ricerca interna (
/search?q=...) - Pagine filtrate (
/collections/chaussures?color=noir) - Pagine con parametri di tracking (
?utm_source=...)
Regola semplice: se una URL ha un canonical verso un'altra URL, non deve essere nel sitemap.
Escludere gli out-of-stock permanenti
I prodotti temporaneamente esauriti (pochi giorni) devono restare nel sitemap — il loro ranking è un capitale da preservare per quando lo stock torna disponibile.
I prodotti definitivamente fuori catalogo (mai più in vendita) devono essere rimossi dal sitemap E dall'indice Google (tramite redirect 301 o meta robots noindex).
Cattiva pratica frequente: eliminare le schede dei prodotti fuori catalogo e restituire 404. Risultato: perdete i backlink esterni, le recensioni, e Google impiega 6-12 mesi per ripulire il suo indice. Meglio un redirect 301 verso un prodotto simile o verso la categoria padre.
Inviare a GSC + Bing (e perché inviarlo anche a Bing)
Una volta costruito il sitemap, inviatelo a:
- Google Search Console: Settings → Sitemaps → Submit
https://example.com/sitemap.xml - Bing Webmaster Tools: Sitemaps → Submit sitemap
- Yandex Webmaster (se puntate alla Russia) — raro nel 2026
Inviare a Bing è sottovalutato. Bing + Yahoo = 6-8% del traffico di ricerca mondiale, ~15-20% negli USA e nel Regno Unito. DuckDuckGo usa anch'esso l'indice Bing. Ignorare Bing = ignorare il 10-20% del traffico potenziale.
Monitoraggio dopo l'invio:
- GSC → Indexing → Sitemaps: verificate che "Discovered" = numero di URL inviate e che "Indexed" salga progressivamente
- Se
Indexed / Discovered< 50% dopo 8 settimane, c'è un problema di qualità delle pagine (non del sitemap)
Frequenza di nuovo invio
Con un sitemap dinamico (rigenerato ogni giorno lato backend), Google lo ricrawla automaticamente secondo il proprio ritmo. Non serve inviarlo a ogni aggiornamento.
Reinviatelo manualmente quando:
- Aggiungete 1000+ nuovi prodotti in una volta
- Fate un grosso rifacimento del catalogo
- Migrate da una piattaforma a un'altra
Per piattaforma
Shopify
Sitemap generato automaticamente su https://<yourshop>.myshopify.com/sitemap.xml e /sitemap_products_1.xml, ecc. Non potete personalizzarlo direttamente. Limiti:
- Esclude automaticamente i prodotti non pubblicati e gli out-of-stock con "continue selling = off"
- Aggiorna correttamente il lastmod
- Genera un index se >5000 prodotti
WooCommerce
Sitemap non nativo. Opzioni:
- Yoast SEO: genera un sitemap
/sitemap_index.xmlcon sitemap figli - RankMath: idem, più rapido da configurare
- XML Sitemaps (plugin dedicato): se volete solo un sitemap senza una suite SEO completa
Configurazione consigliata: escludete le pagine autore, i tag con <5 articoli, gli archivi per data.
Headless o custom
Generate dinamicamente lato server. Su Next.js, tramite app/sitemap.ts o pages/api/sitemap.xml. Attenzione allo sharding se >10.000 URL.
Audit sitemap in 15 min
Verifiche essenziali sul vostro sitemap attuale:
-
https://example.com/sitemap.xmlrestituisce un 200 con un Content-Typeapplication/xml - Il sitemap è referenziato in
robots.txttramiteSitemap: ... - Numero di URL nel sitemap coerente con il numero di pagine pubblicate (uno scarto >10% = problema)
- Nessuna URL con 301/404/500 nel sitemap (test con Screaming Frog)
- Nessuna URL di varianti, parametri, ricerca interna
- lastmod coerente con la realtà (non il falso "oggi" su tutto)
- Inviato a GSC + Bing Webmaster Tools
FAQ
Con quale frequenza Google ricrawla il mio sitemap?
Google crawla il sitemap con la frequenza che ritiene pertinente — tipicamente ogni giorno per i grandi cataloghi attivi, ogni settimana per i siti meno dinamici. Potete forzare un nuovo crawl tramite GSC cliccando "Submit" su un sitemap già inviato.
Devo includere il sitemap in robots.txt?
Sì, sempre. Riga: Sitemap: https://example.com/sitemap.xml alla fine del robots.txt. I crawler che non hanno accesso alla vostra GSC (Bing, DuckDuckGo, AI bots) lo trovano così.
Posso avere più sitemap index?
No. Un solo index per dominio. Se vi serve più struttura, gestitela tramite il numero di sitemap figli nell'index unico.
I sitemap bloccano il crawl delle pagine non elencate?
No. Il sitemap è un aiuto, non un'esclusione. Le pagine non elencate possono comunque essere crawlate se sono collegate da altre pagine. Per bloccarle davvero, usate robots.txt o meta name="robots" content="noindex".
Sitemap immagini e video: utile per l'e-commerce?
Sitemap immagini: sì in alcune verticali (moda, arredamento), sblocca l'indicizzazione su Google Images e può raddoppiare il traffico su alcuni tipi di prodotto. Sitemap video: meno critico, salvo se avete molti video prodotto.
Il mio sitemap contiene 45.000 URL in un solo file e funziona. Bisogna fare sharding?
Sì, anche se funziona, fare sharding a 10.000 URL per file migliora la frequenza di re-crawl e rende gli aggiustamenti più rapidi (invalidare uno shard invece dell'intero file). La migrazione richiede solo poche ore e porta un guadagno del 5-15% sul tasso di indicizzazione.
Ecomptimize genera automaticamente un sitemap ottimizzato per il vostro catalogo Shopify o WooCommerce. Vedi Ecomptimize per Shopify o Ecomptimize per WooCommerce.
Ti è piaciuto questo articolo?