Sitemap et découverte d'URL : trouver toutes les URL de tout site, 1$ pour 1 000 sitemaps

Parsez robots.txt, sitemap.xml et index de sitemaps imbriqués pour découvrir chaque URL publiée sur tout site. Retourne chaque URL avec date de dernière modification, fréquence de changement et priorité. Supporte sitemaps gzippés et chaînes d'index. Construit pour le bulk : liste de domaines en entrée, inventaire complet d'URLs pour chacun en sortie. Idéal pour audits SEO, surveillance de contenu, intelligence concurrentielle et découverte d'URL avant crawl.

Ouvrir sur Apify → Essayez maintenant
Tarif
0,001$/sitemap
RAM
128MB
Couverture
Tout domaine
Champs de sortie
8+
Proxy
Apify datacenter
Tech
XML natif + gzip

Ce que vous obtenez

Cas d'usage principaux

Exemple d'API

# Lancer une exécution via l'API Apify
curl -X POST "https://api.apify.com/v2/acts/santamaria-automations~sitemap-url-discovery/runs?token=YOUR_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "domains": [
      "https://example.com",
      "https://competitor.com",
      "https://news-site.com"
    ],
    "maxUrlsPerSite": 10000,
    "followSitemapIndexes": true,
    "parseRobotsTxt": true
  }'

# Ou utiliser avec des agents IA via MCP :
# https://mcp.apify.com?tools=santamaria-automations/sitemap-url-discovery

Intégrations

Champs de sortie

ChampTypeExemple
source_domainstringexample.com
sitemap_urlstringhttps://example.com/sitemap.xml
total_urlsinteger12 486
urlstringhttps://example.com/blog/post-1
lastmodstring2026-06-10T14:00:00Z
changefreqstringweekly
prioritynumber0,8
robots_sitemapsarray["https://example.com/sitemap.xml"]
is_gzippedbooleanfalse
scraped_atstring2026-06-13T10:15:42Z

Acteurs associés

Ouvrir sur Apify → Essayez maintenant (version gratuite disponible)