Google News scrapen -- Schlagzeilen, Artikel & Trends im grossen Stil
Strukturierte Nachrichtendaten aus Google News extrahieren. Liefert Schlagzeilen, Artikeltitel, Quellennamen, Erscheinungsdaten und URLs. Suche nach Stichwort, Thema oder Region. Rein HTTP-basiert -- kein Chrome, kein Playwright.
Anti-Bot
TLS-Fingerprinting
Was Sie scrapen können
- Top-Schlagzeilen -- aktuelle Nachrichten aus allen Kategorien oder zu bestimmten Themen
- Suchergebnisse -- Artikel passend zu beliebigen Stichworten oder Phrasen
- Artikel-Metadaten -- Titel, Quelle, Erscheinungsdatum, Snippet, URL
- Themenbasierte Nachrichten -- Wirtschaft, Technologie, Sport, Gesundheit, Wissenschaft, Unterhaltung
- Regionale Nachrichten -- Filter nach Land oder Sprachausgabe
- Trendthemen -- aktuell angesagte Themen und Berichtscluster
Typische Anwendungsfälle
- Medienbeobachtung -- Markenerwähnungen, Wettbewerbsnachrichten und Branchenentwicklungen verfolgen
- Stimmungsanalyse -- Schlagzeilen in NLP-Pipelines für Markt-Sentiment einspeisen
- Trenderkennung -- aufkommende Themen identifizieren, bevor sie Mainstream werden
- Content-Aggregation -- Newsfeeds, Zusammenfassungen oder Dashboards erstellen
- Akademische Forschung -- Medienberichterstattungsmuster und Nachrichtenframing analysieren
API-Beispiel
curl -X POST "https://api.apify.com/v2/acts/santamaria-automations~google-news-scraper/runs?token=YOUR_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"searchQueries": ["kuenstliche intelligenz"],
"language": "de",
"maxResults": 100
}'
Integrationen
- n8n / Make / Zapier -- Läufe auslösen und Ergebnisse per Webhook verarbeiten
- KI-Agenten (MCP) -- Claude Desktop, Cursor, VS Code, LangChain, LlamaIndex
- Python / Node.js -- Apify SDK für programmatischen Zugriff
- Google Sheets / Airtable -- Export über Apify-Integrationen
Im Vergleich
| Merkmal | NanoScrape | Browser-basierte Scraper |
| Docker-Image | ~12MB | 500MB - 2GB |
| RAM-Verbrauch | 128MB | 1-4GB |
| Kosten pro 1k Artikel | Pay-per-Result | $5 - $20 |
| Anti-Bot-Ansatz | TLS-Fingerprinting | Vollständiger Chrome-Browser |
| Geschwindigkeit | Schnell | Langsam (Browser-Overhead) |
| Abdeckung | Global | Variiert |
Ausgabefelder
| Feld | Typ | Beispiel |
| title | string | OpenAI stellt neues GPT-Modell vor |
| source | string | Reuters |
| url | string | https://reuters.com/... |
| published_at | string | 2026-04-23T10:30:00Z |
| snippet | string | OpenAI hat heute... |
| topic | string | Technology |
| search_query | string | kuenstliche intelligenz |