Extrayez des articles Wikipedia par titre, URL ou ID Wikidata via l'API officielle MediaWiki. Retourne titre de l'article, résumé (premier paragraphe), contenu complet en texte brut, miniature, image principale, toutes les catégories, coordonnées géographiques quand applicable, ID Wikidata Q, pageviews des 30 derniers jours et références aux autres langues. Supporte 12+ langues incluant anglais, allemand, français, espagnol, chinois et japonais. Idéal pour données d'entraînement IA, enrichissement de graphe de connaissances, ingestion RAG et bases de référence.
# Lancer une exécution via l'API Apify curl -X POST "https://api.apify.com/v2/acts/santamaria-automations~wikipedia-scraper/runs?token=YOUR_TOKEN" \ -H "Content-Type: application/json" \ -d '{ "queries": [ "Stripe (entreprise)", "OpenAI", "Tour Eiffel", "Albert Einstein", "Transformer (modèle d\u0027apprentissage automatique)" ], "language": "fr", "extractFullContent": true, "includePageviews": true }' # Ou utiliser avec des agents IA via MCP : # https://mcp.apify.com?tools=santamaria-automations/wikipedia-scraper
| Champ | Type | Exemple |
|---|---|---|
| title | string | Tour Eiffel |
| page_id | integer | 9202 |
| wikidata_id | string | Q243 |
| summary | string | La tour Eiffel est une tour de fer puddlé... |
| content | string | La tour Eiffel est une tour de fer puddlé de 330 mètres... |
| thumbnail_url | string | https://upload.wikimedia.org/wikipedia/commons/... |
| categories | array | ["Tour Eiffel","Tours de Paris"] |
| coordinates | object | {"lat":48,8584,"lon":2,2945} |
| pageviews_30d | integer | 512 847 |
| canonical_url | string | https://fr.wikipedia.org/wiki/Tour_Eiffel |