Extrator de URLs do sitemap
Extrai URLs de sitemap.xml ou robots.txt; exporta JSON, CSV ou texto
Precisa de um rascunho de llms.txt a partir de uma lista de URLs? Use o Construtor llms.txt.
Resultados (0)
Ainda sem URLs — cole o XML e clique em Analisar, ou carregue o exemplo.
Ferramentas relacionadas
Construtor llms.txt
Crie um llms.txt inicial para crawlers de IA a partir da sua lista de URLs
URL codificar / decodificar
Codifique e decodifique componentes de URL com segurança
Explorador de API
Teste APIs REST no navegador com respostas JSON formatadas
Formatador JSON
Embeleza e formata JSON com recuo configurável
Perguntas frequentes
A maioria dos sites não envia headers de CORS permitindo que outros sites leiam o sitemap.xml. Isso é normal. Use Fetch quando funcionar (por exemplo, no mesmo site ou com CORS aberto) ou abra o sitemap em uma nova aba, copie o XML e cole aqui, ou faça upload do arquivo — essas opções sempre funcionam.
Um sitemap index é um XML que lista outros arquivos de sitemap, em vez de listar todas as URLs de páginas. Se após o parse você vir principalmente links .xml, faça fetch/cole o XML de cada sitemap filho para coletar as URLs reais das páginas.
Sim. Cole o conteúdo do seu robots.txt. A ferramenta encontra linhas Sitemap: e lista essas URLs. Você pode tentar Fetch em cada URL de sitemap quando o CORS permitir.
Não. O parsing e a exportação rodam totalmente no seu navegador. Nada é enviado para os servidores do JSONTech.
Use a ferramenta llms.txt Builder: copie a lista de URLs extraídas, cole lá, adicione um título e uma descrição e faça o download do llms.txt.