Extractor de URLs de sitemap

Extrae URLs de sitemap.xml o robots.txt; exporta JSON, CSV o texto

¿Necesitas un borrador de llms.txt a partir de una lista de URLs? Usa el Constructor llms.txt.

Resultados (0)

Aún no hay URLs — pega el XML y pulsa Analizar, o carga el ejemplo.

Herramientas relacionadas

Preguntas frecuentes

La mayoría de sitios no envían headers CORS que permitan a otras webs leer su sitemap.xml. Es normal. Usa Fetch cuando funcione (por ejemplo, mismo sitio o CORS abierto), o abre el sitemap en una pestaña nueva, copia el XML y pégalo aquí, o sube el archivo: esas opciones siempre funcionan.

Un sitemap index es un archivo XML que lista otros sitemaps en lugar de incluir todas las URLs de páginas. Si al parsear ves principalmente enlaces .xml, tendrás que obtener o pegar el XML de cada sitemap hijo para recopilar las URLs reales.

Sí. Pega el contenido de tu robots.txt. La herramienta detecta líneas Sitemap: y lista esas URLs. Puedes probar Fetch en cada URL de sitemap cuando CORS lo permita.

No. El parseo y la exportación se ejecutan completamente en tu navegador. No se envía nada a los servidores de JSONTech.

Usa la herramienta llms.txt Builder: copia la lista de URLs extraídas, pégala allí, añade un título y una descripción, y descarga llms.txt.