Website Email Scraper: Mehrseitige E-Mail-, Telefon- und Social-Extraktion
E-Mails, Telefonnummern, Social-Media-URLs und physische Adressen aus jeder Website extrahieren. Für jede Eingabe-URL besucht der Scraper die Homepage, findet alle internen Links, priorisiert Kontakt-, Impressum- und About-Seiten, crawlt mehrere Seiten pro Site und dedupliziert dann alles zu einem sauberen Datensatz. Keine API-Keys, kein Login.
Crawl-Umfang
Mehrseitig pro Site
Extrahiert
E-Mail, Telefon, Social, Adresse
Priorisierte Seiten
Kontakt, Impressum, About
Was Sie extrahieren können
- E-Mails: alle gefundenen E-Mail-Adressen über die gecrawlten Seiten, dedupliziert
- Telefonnummern: internationales Format, aus tel: Links und Text
- Social-URLs: LinkedIn, Facebook, Instagram, Twitter/X, YouTube, TikTok
- Physische Adresse: aus schema.org-Strukturdaten, sofern vorhanden
- Kontaktseiten-URL: die tiefste während des Crawls gefundene Kontaktseite
- Crawl-Metadaten: pages_crawled Anzahl plus Domain
Hauptanwendungsfälle
- Listen-Anreicherung. Liste von Unternehmensdomains rein, E-Mails und Telefone pro Unternehmen raus
- CRM-Hygiene. Liste von Kunden- oder Prospekt-Websites erneut crawlen, um Updates zu erfassen
- Lead-Anreicherung at Scale. Millionen-URL-Listen verarbeitet zu $1/1.000 Seiten
- Sales-Prospecting. Mit unseren Verzeichnis-Scrapern kombinieren für Outreach-Kontaktdaten
- Listen-Bereinigung. Einträge ohne Kontaktdaten nach Mehrseiten-Crawl ausschließen
- Compliance-Audits. Sicherstellen, dass jede Site eine erreichbare Kontaktseite hat
API-Beispiel
curl -X POST "https://api.apify.com/v2/acts/santamaria-automations~website-email-scraper/runs?token=YOUR_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"urls": [
"https://www.example-company.ch",
"https://www.another-business.de"
],
"maxPagesPerSite": 10
}'
Integrationen
- n8n, Make, Zapier: Crawls auslösen und Ergebnisse ins CRM leiten
- KI-Agenten (MCP): Claude Desktop, Cursor, VS Code, LangChain, LlamaIndex
- Python, Node.js: Apify SDK für programmatischen Zugriff
- Google Sheets, Airtable: Domain-Liste rein, Kontaktdaten raus
Output-Beispiel
{
"url": "https://www.example-company.ch",
"domain": "example-company.ch",
"emails": ["[email protected]", "[email protected]"],
"phones": ["+41 44 123 45 67"],
"social_urls": {
"linkedin": "https://www.linkedin.com/company/example-company",
"facebook": "https://www.facebook.com/examplecompany"
},
"address": "Bahnhofstrasse 1, 8001 Zurich, Switzerland",
"pages_crawled": 8,
"contact_page_url": "https://www.example-company.ch/kontakt"
}
Verwandte Actors