Website Email Scraper : extraction multi-pages email, téléphone, social
Extraire emails, numéros de téléphone, URLs sociales et adresses physiques depuis tout site web. Pour chaque URL d'entrée, le scraper visite la page d'accueil, découvre tous les liens internes, priorise les pages contact, mentions légales et à propos, crawle plusieurs pages par site, puis déduplique tout en un seul enregistrement propre. Pas de clé API, pas de login.
Étendue
Multi-pages par site
Extrait
Email, tél., social, adresse
Pages prioritaires
Contact, mentions, à propos
Ce que vous pouvez extraire
- Emails : toutes les adresses trouvées sur les pages crawlées, dédupliquées
- Numéros de téléphone : format international, depuis liens tel: et texte
- URLs sociales : LinkedIn, Facebook, Instagram, Twitter/X, YouTube, TikTok
- Adresse physique : depuis données structurées schema.org si présentes
- URL de la page contact : la page contact la plus profonde découverte
- Métadonnées de crawl : nombre pages_crawled plus domaine
Cas d'usage principaux
- Enrichissement de liste. Une liste de domaines en entrée, emails et téléphones en sortie
- Hygiène CRM. Re-crawler une liste de clients ou prospects pour capter les mises à jour
- Enrichissement de leads à grande échelle. Listes d'un million d'URL à $1/1k pages
- Prospection commerciale. Combiner avec nos scrapers d'annuaires pour récolter des contacts
- Nettoyage de liste. Éliminer les entrées sans contact après crawl multi-pages
- Audits de conformité. Vérifier que chaque site possède une page contact accessible
Exemple API
curl -X POST "https://api.apify.com/v2/acts/santamaria-automations~website-email-scraper/runs?token=YOUR_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"urls": [
"https://www.example-company.ch",
"https://www.another-business.de"
],
"maxPagesPerSite": 10
}'
Intégrations
- n8n, Make, Zapier : déclencher les crawls et router les résultats vers votre CRM
- Agents IA (MCP) : Claude Desktop, Cursor, VS Code, LangChain, LlamaIndex
- Python, Node.js : SDK Apify pour accès programmatique
- Google Sheets, Airtable : liste de domaines en entrée, contacts en sortie
Exemple de sortie
{
"url": "https://www.example-company.ch",
"domain": "example-company.ch",
"emails": ["[email protected]", "[email protected]"],
"phones": ["+41 44 123 45 67"],
"social_urls": {
"linkedin": "https://www.linkedin.com/company/example-company",
"facebook": "https://www.facebook.com/examplecompany"
},
"address": "Bahnhofstrasse 1, 8001 Zurich, Switzerland",
"pages_crawled": 8,
"contact_page_url": "https://www.example-company.ch/kontakt"
}
Actors associés