Een XML sitemap hoort Google te helpen uw pagina's te ontdekken. Op een kleine site gaat dat bijna automatisch. Bij een e-commercecatalogus van 10.000 of 100.000 SKU is een slecht gestructureerde sitemap een van de eerste oorzaken van onderindexatie: duizenden producten die Google nooit crawlt omdat uw sitemap een verkeerd signaal afgeeft.
Hier is de methode om een productsitemap te structureren die werkt, met de echte regels en limieten die u in productie ontdekt.
Een XML sitemap-bestand mag maximaal 50.000 URL's bevatten, met een maximale grootte van 50 MB uncompressed. Dat staat in het sitemap.xml-protocol.
Maar 50.000 URL's is de technische limiet — de praktische limiet ligt lager. Google raadt impliciet aan om onder 10.000-20.000 URL's per bestand te blijven, zodat de crawler elke URL correct verwerkt. Daarboven kan Google steekproeven nemen en URL's aan het einde negeren.
Operationele regel: 5.000-20.000 URL's per sitemap-bestand is de optimale zone. Daarboven: sharden.
Regel: één sitemap index per domein, meerdere onderliggende sitemaps. Dien alleen de index in bij Google Search Console — niet elk onderliggend bestand.
Veel webshops zetten <lastmod> op de datum van vandaag om "tegen Google te zeggen dat de pagina is gewijzigd". Dat is een truc die Google heeft leren herkennen: als u elke dag meldt dat 10.000 pagina's zijn gewijzigd terwijl er niets is veranderd, negeert Google al uw lastmod-waarden na 2-3 weken.
De juiste werkwijze:
<lastmod> = echte datum van de laatste wijziging van de inhoud van de pagina (niet de crawldatum en niet de datum van vandaag)
ISO 8601-formaat: 2026-04-23 of 2026-04-23T14:30:00+02:00
Alleen bijwerken wanneer het product echt verandert (prijs, beschrijving, afbeeldingen, voorraad)
Als u de datum van de laatste wijziging niet betrouwbaar kunt bepalen, laat het veld dan weg — dat is beter dan een valse lastmod die uw geloofwaardigheid voor crawlers schaadt.
Producten die tijdelijk niet op voorraad zijn (enkele dagen) moeten in de sitemap blijven — hun ranking is kapitaal dat u wilt behouden tot de voorraad terug is.
Producten die definitief uit het assortiment zijn (nooit meer te koop) moeten uit de sitemap EN uit de Google-index worden verwijderd (via 301-redirect of meta robots noindex).
Veelgemaakte fout: uitgefaseerde productpagina's verwijderen en 404 teruggeven. Resultaat: u verliest externe backlinks, reviews, en Google doet er 6-12 maanden over om de index op te schonen. Kies liever een 301-redirect naar een vergelijkbaar product of de bovenliggende categorie.
Google Search Console: Settings → Sitemaps → Submit https://example.com/sitemap.xml
Bing Webmaster Tools: Sitemaps → Submit sitemap
Yandex Webmaster (als u zich op Rusland richt) — zeldzaam in 2026
Indienen bij Bing wordt onderschat. Bing + Yahoo = 6-8% van het wereldwijde zoekverkeer, ~15-20% in de VS en het VK. DuckDuckGo gebruikt ook de Bing-index. Bing negeren = 10-20% potentieel verkeer negeren.
Monitoring na indiening:
GSC → Indexing → Sitemaps: controleer of "Discovered" = aantal ingediende URL's, en of "Indexed" geleidelijk stijgt
Als Indexed / Discovered < 50% is na 8 weken, is er een probleem met de kwaliteit van de pagina's (niet met de sitemap)
Met een dynamische sitemap (dagelijks opnieuw gegenereerd aan de backend-kant) crawlt Google die automatisch opnieuw volgens zijn eigen ritme. U hoeft niet bij elke update opnieuw in te dienen.
Dien handmatig opnieuw in wanneer:
U in één keer 1000+ nieuwe producten toevoegt
U een grote herstructurering van de catalogus uitvoert
Sitemap automatisch gegenereerd op https://<yourshop>.myshopify.com/sitemap.xml en /sitemap_products_1.xml, enz. U kunt die niet direct aanpassen. Beperkingen:
Sluit niet-gepubliceerde producten en out-of-stock producten met "continue selling = off" automatisch uit
Google crawlt de sitemap met de frequentie die het relevant acht — meestal dagelijks voor grote actieve catalogi, wekelijks voor minder dynamische sites. U kunt een recrawl forceren via GSC door op "Submit" te klikken bij een sitemap die al is ingediend.
Ja, altijd. Regel: Sitemap: https://example.com/sitemap.xml aan het einde van robots.txt. Crawlers die geen toegang hebben tot uw GSC (Bing, DuckDuckGo, AI bots) vinden de sitemap zo.
Nee. De sitemap is een hulpmiddel, geen uitsluiting. Niet-vermelde pagina's kunnen nog steeds worden gecrawld als er vanaf andere pagina's naar wordt gelinkt. Om echt te blokkeren gebruikt u robots.txt of meta name="robots" content="noindex".
Afbeeldingssitemap: ja, in sommige verticals (mode, interieur), helpt het de indexatie in Google Images en kan het verkeer voor bepaalde producttypes verdubbelen. Videositemap: minder kritisch, behalve als u veel productvideo's hebt.
Ja, ook als het werkt. Sharden naar 10.000 URL's per bestand verbetert de frequentie van recrawls en maakt aanpassingen sneller (één shard ongeldig maken in plaats van het hele bestand). De migratie kost maar een paar uur en levert 5-15% winst op in de indexatiegraad.