Crawlez tout site ou liste d'URLs pour détecter les liens cassés et le mode de défaillance exact. Retourne code de statut HTTP, catégorie d'erreur (4xx, 5xx, DNS, timeout, SSL, boucle de redirection), temps de réponse, page source, texte d'ancre du lien et chaîne complète de redirection. Profondeur de crawl, filtres par type de lien (interne / externe / asset) et concurrence configurables. Construit pour le bulk : 100 000 URLs en entrée ou un domaine de départ pour tout découvrir. Idéal pour maintenance SEO, QA de migration, audits de contenu et surveillance d'hygiène des liens.
# Lancer une exécution via l'API Apify curl -X POST "https://api.apify.com/v2/acts/santamaria-automations~broken-link-checker/runs?token=YOUR_TOKEN" \ -H "Content-Type: application/json" \ -d '{ "startUrls": [ "https://example.com", "https://docs.example.com" ], "maxDepth": 3, "followExternal": true, "includeAssets": false, "maxLinksPerPage": 200 }' # Ou utiliser avec des agents IA via MCP : # https://mcp.apify.com?tools=santamaria-automations/broken-link-checker
| Champ | Type | Exemple |
|---|---|---|
| url | string | https://example.com/old-page |
| source_page | string | https://example.com/blog/bilan-2024 |
| anchor_text | string | notre feuille de route 2024 |
| status_code | integer | 404 |
| error_category | string | client_error |
| is_broken | boolean | true |
| response_time_ms | integer | 142 |
| link_type | string | internal |
| redirect_count | integer | 0 |
| checked_at | string | 2026-06-13T10:15:42Z |