Wikipedia-Artikel per Titel, URL oder Wikidata-ID über die offizielle MediaWiki-API extrahieren. Liefert Artikeltitel, Summary (erster Absatz), Plaintext-Volltext, Thumbnail, Lead-Image, alle Kategorien, geografische Koordinaten wenn anwendbar, die Wikidata-Q-ID, Pageviews der letzten 30 Tage und Referenzen zu anderen Sprachen. Unterstützt 12+ Sprachen inklusive Englisch, Deutsch, Französisch, Spanisch, Chinesisch und Japanisch. Ideal für KI-Trainingsdaten, Knowledge-Graph-Anreicherung, RAG-Ingestion und Referenzdatenbanken.
# Einen Lauf über die Apify-API starten curl -X POST "https://api.apify.com/v2/acts/santamaria-automations~wikipedia-scraper/runs?token=YOUR_TOKEN" \ -H "Content-Type: application/json" \ -d '{ "queries": [ "Stripe (Unternehmen)", "OpenAI", "Eiffelturm", "Albert Einstein", "Transformer (Machine-Learning-Modell)" ], "language": "de", "extractFullContent": true, "includePageviews": true }' # Oder mit KI-Agenten via MCP verwenden: # https://mcp.apify.com?tools=santamaria-automations/wikipedia-scraper
| Feld | Typ | Beispiel |
|---|---|---|
| title | string | Eiffelturm |
| page_id | integer | 9202 |
| wikidata_id | string | Q243 |
| summary | string | Der Eiffelturm ist ein Stahlfachwerkturm... |
| content | string | Der Eiffelturm (französisch La Tour Eiffel)... |
| thumbnail_url | string | https://upload.wikimedia.org/wikipedia/commons/... |
| categories | array | ["Eiffelturm","Türme in Paris"] |
| coordinates | object | {"lat":48,8584,"lon":2,2945} |
| pageviews_30d | integer | 512.847 |
| canonical_url | string | https://de.wikipedia.org/wiki/Eiffelturm |