Google News Scraper: Artikel, Quellen und Publikationsdaten
Nachrichten-Artikel aus Google News für jede Suchanfrage scrapen. Liefert saubere strukturierte Daten: Artikeltitel (ohne Source-Suffix), Verlagsname, Verlags-URL, direkte Artikel-URL, Publikationsdatum im RFC 2822-Format und die Suchquery, die den Artikel ergab. Filter nach Land und Sprache. HTTP-only Go-Binary, kein Browser.
Abdeckung
Global, 100+ Länder
Was Sie extrahieren können
- Artikeltitel: bereinigt, ohne den Source-Suffix den Google News anhängt
- Verlag: Quellenname (Reuters, CNN, TechCrunch etc.) und publisher_url
- Artikel-URL: direkter Link zum publizierten Artikel (nicht der Google News-Redirect)
- Publikationsdatum: RFC 2822 Format, bereit zum Parsen in jede Datetime-Library
- Suchquery: die passende Query, nützlich bei Multi-Query-Batches
- Filter: Sprachcode (en, de, fr etc.) und Ländercode für regionale Ergebnisse
Hauptanwendungsfälle
- Medien-Monitoring. Markenerwähnungen, Wettbewerber-News und Branchen-Entwicklungen über Verlage tracken
- Sentiment-Analyse. Saubere Headlines in NLP-Pipelines für Markt-Sentiment-Scoring einspeisen
- Trend-Erkennung. Aufkommende Themen vor dem Mainstream über wöchentliche Artikelzahlen identifizieren
- Content-Aggregation. Newsfeeds, Executive-Digests oder Themen-Dashboards bauen
- Akademische Forschung. Medien-Berichterstattungsmuster und News-Framing länderübergreifend analysieren
- SEO- und AEO-Recherche. Sehen, welche Quellen für Ihre Zielthemen im Google News-Ökosystem ranken
API-Beispiel
curl -X POST "https://api.apify.com/v2/acts/santamaria-automations~google-news-scraper/runs?token=YOUR_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"searchQueries": ["artificial intelligence", "climate change"],
"language": "en",
"country": "US",
"maxResults": 100,
"maxResultsPerQuery": 50
}'
Integrationen
- n8n, Make, Zapier: Suchen auslösen und Artikel an Slack, E-Mail oder BI leiten
- KI-Agenten (MCP): Claude Desktop, Cursor, VS Code, LangChain, LlamaIndex
- Python, Node.js: Apify SDK für programmatischen Zugriff
- Google Sheets, Airtable, BigQuery: Query-Liste rein, Artikel-Datensätze raus
Output-Beispiel
{
"title": "OpenAI Announces New GPT Model with Multimodal Capabilities",
"source": "Reuters",
"publisher_url": "https://www.reuters.com",
"url": "https://www.reuters.com/technology/openai-announces-new-gpt-model-...",
"published_at": "Thu, 12 Jun 2026 14:30:00 +0000",
"search_query": "artificial intelligence"
}
Verwandte Actors