Extrator de URLs do sitemap

Extrai URLs de sitemap.xml ou robots.txt; exporta JSON, CSV ou texto

Precisa de um rascunho de llms.txt a partir de uma lista de URLs? Use o Construtor llms.txt.

Resultados (0)

Ainda sem URLs — cole o XML e clique em Analisar, ou carregue o exemplo.

Ferramentas relacionadas

Perguntas frequentes

A maioria dos sites não envia headers de CORS permitindo que outros sites leiam o sitemap.xml. Isso é normal. Use Fetch quando funcionar (por exemplo, no mesmo site ou com CORS aberto) ou abra o sitemap em uma nova aba, copie o XML e cole aqui, ou faça upload do arquivo — essas opções sempre funcionam.

Um sitemap index é um XML que lista outros arquivos de sitemap, em vez de listar todas as URLs de páginas. Se após o parse você vir principalmente links .xml, faça fetch/cole o XML de cada sitemap filho para coletar as URLs reais das páginas.

Sim. Cole o conteúdo do seu robots.txt. A ferramenta encontra linhas Sitemap: e lista essas URLs. Você pode tentar Fetch em cada URL de sitemap quando o CORS permitir.

Não. O parsing e a exportação rodam totalmente no seu navegador. Nada é enviado para os servidores do JSONTech.

Use a ferramenta llms.txt Builder: copie a lista de URLs extraídas, cole lá, adicione um título e uma descrição e faça o download do llms.txt.