Google News Scraper : articles, sources et dates de publication
Scraper les articles d'actualité depuis Google News pour toute requête. Renvoie des données structurées propres : titre d'article (sans suffixe source), nom de l'éditeur, URL éditeur, URL directe de l'article, date de publication au format RFC 2822 et la requête qui a matché l'article. Filtres par pays et langue. Binaire Go HTTP-only, sans navigateur.
Couverture
Globale, 100+ pays
Langues
Toutes Google News
Ce que vous pouvez extraire
- Titre d'article : nettoyé, sans le suffixe source que Google News ajoute
- Éditeur : nom de la source (Reuters, CNN, TechCrunch, etc.) et publisher_url
- URL article : lien direct vers l'article publié (pas la redirection Google News)
- Date de publication : format RFC 2822, prêt pour parsing dans toute librairie datetime
- Requête : la requête qui a matché, utile en batches multi-requêtes
- Filtres : code langue (en, de, fr, etc.) et code pays pour résultats régionaux
Cas d'usage principaux
- Veille média. Suivre mentions de marque, actualités concurrents et évolutions sectorielles à travers les éditeurs
- Analyse de sentiment. Alimenter les pipelines NLP avec des titres propres pour scoring de sentiment marché
- Détection de tendance. Identifier les sujets émergents avant le mainstream via décomptes hebdomadaires d'articles
- Agrégation de contenu. Construire flux d'actu, digests exécutifs ou dashboards thématiques
- Recherche académique. Analyser patterns de couverture média et framing à travers pays
- Recherche SEO et AEO. Voir quelles sources rankent pour vos sujets cibles dans l'écosystème Google News
Exemple API
curl -X POST "https://api.apify.com/v2/acts/santamaria-automations~google-news-scraper/runs?token=YOUR_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"searchQueries": ["artificial intelligence", "climate change"],
"language": "en",
"country": "US",
"maxResults": 100,
"maxResultsPerQuery": 50
}'
Intégrations
- n8n, Make, Zapier : déclencher des recherches et router les articles vers Slack, email ou BI
- Agents IA (MCP) : Claude Desktop, Cursor, VS Code, LangChain, LlamaIndex
- Python, Node.js : SDK Apify pour accès programmatique
- Google Sheets, Airtable, BigQuery : liste de requêtes en entrée, articles en sortie
Exemple de sortie
{
"title": "OpenAI Announces New GPT Model with Multimodal Capabilities",
"source": "Reuters",
"publisher_url": "https://www.reuters.com",
"url": "https://www.reuters.com/technology/openai-announces-new-gpt-model-...",
"published_at": "Thu, 12 Jun 2026 14:30:00 +0000",
"search_query": "artificial intelligence"
}
Actors associés