Sitemap 与 URL 发现:找出任意网站每一个 URL,每 1,000 sitemap $1

解析 robots.txt、sitemap.xml 和嵌套 sitemap 索引以发现任意网站上每一个已发布 URL。返回每个 URL 及其最后修改日期、变更频率和优先级。支持 gzip sitemap 和 sitemap 索引链。为批量而生:输入域名列表,返回每个域名的完整 URL 清单。适用于 SEO 审计、内容监控、竞争情报和爬取前 URL 发现。

在 Apify 上打开 → 立即试用
价格
$0.001/sitemap
内存
128MB
覆盖
任意域名
输出字段
8+
代理
Apify 数据中心
技术
原生 XML + gzip

您能获得什么

主要使用场景

API 示例

# 通过 Apify API 启动运行
curl -X POST "https://api.apify.com/v2/acts/santamaria-automations~sitemap-url-discovery/runs?token=YOUR_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "domains": [
      "https://example.com",
      "https://competitor.com",
      "https://news-site.com"
    ],
    "maxUrlsPerSite": 10000,
    "followSitemapIndexes": true,
    "parseRobotsTxt": true
  }'

# 或通过 MCP 与 AI 代理配合使用:
# https://mcp.apify.com?tools=santamaria-automations/sitemap-url-discovery

集成

输出字段

字段类型示例
source_domainstringexample.com
sitemap_urlstringhttps://example.com/sitemap.xml
total_urlsinteger12,486
urlstringhttps://example.com/blog/post-1
lastmodstring2026-06-10T14:00:00Z
changefreqstringweekly
prioritynumber0.8
robots_sitemapsarray["https://example.com/sitemap.xml"]
is_gzippedbooleanfalse
scraped_atstring2026-06-13T10:15:42Z

相关 Actor

在 Apify 上打开 → 立即试用(免费套餐可用)