Un sitemap XML debería ayudar a Google a descubrir tus páginas. En un sitio pequeño, es casi automático. En un catálogo e-commerce de 10.000 o 100.000 SKU, un sitemap mal estructurado es una de las primeras causas de infraindexación: miles de productos que Google nunca rastrea porque tu sitemap le envía una señal equivocada.
Aquí tienes el método para estructurar un sitemap de productos que funciona, con las reglas y límites reales que se ven en producción.
Un archivo sitemap XML solo puede contener 50.000 URLs como máximo, con un tamaño máximo de 50 MB uncompressed. Está especificado en el protocolo sitemap.xml.
Pero 50.000 URLs es el límite técnico; el límite práctico es más bajo. Google recomienda de forma implícita quedarse por debajo de 10.000-20.000 URLs por archivo para que su crawler procese cada URL correctamente. Por encima de eso, puede muestrear e ignorar las URLs del final.
Regla operativa: 5.000-20.000 URLs por archivo sitemap es la zona óptima. Por encima, hay que fragmentar.
Muchas tiendas ponen <lastmod> con la fecha del día para “decirle a Google que la página ha cambiado”. Es una trampa que Google ha aprendido a detectar: si cada día declaras 10.000 páginas modificadas pero no han cambiado, Google ignora todos tus lastmod al cabo de 2-3 semanas.
La buena práctica:
<lastmod> = fecha real de la última modificación del contenido de la página (no la fecha de rastreo ni la fecha del día)
Formato ISO 8601: 2026-04-23 o 2026-04-23T14:30:00+02:00
Actualizar solo cuando el producto cambie de verdad (precio, descripción, imágenes, stock)
Si no sabes determinar la fecha de última modificación, omite el campo: es mejor que un lastmod falso que degrade tu credibilidad ante el crawler.
Los productos sin stock temporalmente (unos días) deben seguir en el sitemap: su ranking es un activo que conviene conservar para cuando vuelva el stock.
Los productos descatalogados de forma definitiva (ya no volverán a venderse) deben retirarse del sitemap y del índice de Google (mediante redirect 301 o meta robots noindex).
Mala práctica habitual: eliminar las fichas descatalogadas y devolver 404. Resultado: pierdes los backlinks externos, las reviews, y Google tarda 6-12 meses en limpiar su índice. Es mejor hacer redirect 301 hacia un producto similar o la categoría padre.
Google Search Console: Settings → Sitemaps → Submit https://example.com/sitemap.xml
Bing Webmaster Tools: Sitemaps → Submit sitemap
Yandex Webmaster (si apuntas a Rusia) — poco habitual en 2026
Enviar a Bing suele infravalorarse. Bing + Yahoo = 6-8 % del tráfico de búsqueda mundial, ~15-20 % en EE. UU. y Reino Unido. DuckDuckGo también usa el índice de Bing. Ignorar Bing = ignorar un 10-20 % de tráfico potencial.
Monitorización después del envío:
GSC → Indexing → Sitemaps: comprobar que "Discovered" = número de URLs enviadas y que "Indexed" sube de forma progresiva
Si Indexed / Discovered < 50 % después de 8 semanas, hay un problema de calidad de página (no del sitemap)
Con un sitemap dinámico (regenerado a diario en el backend), Google lo vuelve a rastrear automáticamente según su propio ritmo. No hace falta enviarlo en cada actualización.
Sitemap generado automáticamente en https://<yourshop>.myshopify.com/sitemap.xml y /sitemap_products_1.xml, etc. No puedes personalizarlo directamente. Límites:
Excluye automáticamente los productos no publicados y out-of-stock con "continue selling = off"
Genéralo dinámicamente del lado del servidor. En Next.js, mediante app/sitemap.ts o pages/api/sitemap.xml. Ojo con la fragmentación si hay >10.000 URLs.
Google rastrea el sitemap con la frecuencia que considera pertinente: normalmente a diario para catálogos grandes y activos, semanalmente para sitios menos dinámicos. Puedes forzar un nuevo rastreo desde GSC haciendo clic en "Submit" sobre un sitemap ya enviado.
Sí, siempre. Línea: Sitemap: https://example.com/sitemap.xml al final de robots.txt. Así lo encuentran los crawlers que no tienen acceso a tu GSC (Bing, DuckDuckGo, AI bots).
No. El sitemap es una ayuda, no una exclusión. Las páginas no listadas pueden seguir siendo rastreadas si están enlazadas desde otras páginas. Para bloquear de verdad, usa robots.txt o meta name="robots" content="noindex".
Sitemap de imágenes: sí en algunos verticales (moda, decoración), desbloquea la indexación en Google Images y puede duplicar el tráfico en ciertos tipos de producto. Sitemap de vídeos: menos crítico, salvo que tengas muchos vídeos de producto.
Sí. Aunque funcione, fragmentarlo en 10.000 URLs por archivo mejora la frecuencia de re-rastreo y hace que los ajustes sean más rápidos (invalidar un fragmento en lugar de todo el archivo). La migración solo lleva unas horas y aporta una mejora del 5-15 % en la tasa de indexación.