サイトマップ URL 抽出
sitemap.xml / robots.txt から URL を抽出・出力
URL リストから llms.txt の下書きが必要ですか?次をご利用ください: llms.txt ビルダー.
結果 (0)
URL がありません — XML を貼り付けて「解析」を押すか、サンプルを読み込んでください。
Pull URLs out of sitemap.xml or robots.txt fast
Sitemaps are the source of truth for what a site wants indexed. Extracting their URLs gives you a clean list for SEO audits, archive snapshots, llms.txt builders, AI training datasets, or migration checks — without writing a parser yourself or paying for a desktop tool to do it.
Use the extractor when you need to
Audit a competitor's site structure
Pull every URL from their sitemap to map out content categories and depth in minutes.
Build a list for an llms.txt file
Extract URLs and feed them into the llms.txt builder to publish an LLM-friendly content map.
Migrate or archive a site
Pull all URLs before a redesign so you can set up redirects or capture an archive of the old structure.
How to extract sitemap URLs
- 1
Paste sitemap.xml or robots.txt content, or fetch a public URL when CORS allows.
- 2
Click Extract to list every URL with its lastmod, priority, and changefreq if present.
- 3
Filter or sort the list, then export as JSON, CSV, or plain text.
Keep going
Turn URLs into llms.txt
Feed the extracted URL list into a generator that builds a clean llms.txt for AI crawlers.
Encode URL components
Encode special characters before using URLs in queries or scripts.
Test URL endpoints
Send requests to extracted URLs to verify status, redirects, or content type.
Format the JSON export
Beautify the exported JSON for inclusion in docs or downstream pipelines.
Common extraction workflows
Pull every indexed URL and look for thin pages, duplicates, or missing content categories.
Extract sitemap URLs once and use them as the foundation of your llms.txt content list.
Capture the full URL inventory before changing CMS or restructuring sections.
関連ツール
よくある質問
多くのサイトは、他サイトからsitemap.xmlを読み取れるようなCORSヘッダーを返しません。これは通常の挙動です。Fetchが使える場合(同一サイト、またはCORSが開いている場合)はFetchを使い、無理な場合はsitemapを新しいタブで開いてXMLをコピーしてここに貼り付けるか、ファイルをアップロードしてください。この方法なら常に動作します。
sitemap indexは、全ページURLを列挙する代わりに、別のsitemapファイル群を列挙するXMLです。パース結果が主に.xmlリンクになる場合は、子sitemapのXMLをそれぞれ取得(Fetchまたは貼り付け)して、実際のページURLを集めてください。
はい。robots.txtの内容を貼り付けると、Sitemap: 行を見つけてURL一覧にします。CORSが許可されていれば、各sitemap URLに対してFetchも試せます。
いいえ。解析とエクスポートはすべてブラウザ内で実行されます。JSONTechのサーバーへ送信されることはありません。
llms.txt Builderツールを使ってください。抽出したURLリストをコピーして貼り付け、タイトルと説明を追加してからllms.txtをダウンロードできます。