HTML zu Markdown Converter: Bulk Webseiten zu sauberem MD, $1 pro 1.000 Seiten

Jede HTML-Seite in sauberes, LLM-fertiges Markdown konvertieren. Entfernt Chrome (Navigation, Werbung, Sidebars), erhält Überschriften, Tabellen, fenced Code-Blöcke, Bilder mit Alt-Text und Links. Liefert Seitentitel, Hauptinhalt als Markdown, Wortanzahl, extrahierte Bild- und Link-Arrays sowie die abgeleitete Main-URL. Für Batch gebaut: 10.000 Artikel-URLs rein, eine Zeile pro Seite raus. Perfekt für LLM-Training-Korpora, RAG-Ingestion, Dokumentations-Spiegel und Content-Monitoring.

Auf Apify öffnen → Jetzt testen
Preise
$0,001/Seite
RAM
128MB
Abdeckung
Beliebige URL
Ausgabefelder
10+
Proxy
Apify Datacenter
Technik
HTTP + Readability

Was Sie erhalten

Wichtige Anwendungsfälle

API-Beispiel

# Einen Lauf über die Apify-API starten
curl -X POST "https://api.apify.com/v2/acts/santamaria-automations~html-to-markdown/runs?token=YOUR_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "urls": [
      "https://blog.example.com/post-1",
      "https://docs.example.com/getting-started",
      "https://news.example.com/article-2026"
    ],
    "extractImages": true,
    "extractLinks": true,
    "mainContentOnly": true
  }'

# Oder mit KI-Agenten via MCP verwenden:
# https://mcp.apify.com?tools=santamaria-automations/html-to-markdown

Integrationen

Ausgabefelder

FeldTypBeispiel
source_urlstringhttps://blog.example.com/post-1
titlestringRAG-Pipelines bauen
main_contentstring# RAG-Pipelines bauen\n\nEin Praxisleitfaden...
word_countinteger1.842
reading_time_minutesinteger8
languagestringde
canonical_urlstringhttps://blog.example.com/post-1
imagesarray[{"src":"...","alt":"Diagramm"}]
linksarray[{"href":"...","text":"docs"}]
scraped_atstring2026-06-13T10:15:42Z

Verwandte Aktoren

Auf Apify öffnen → Jetzt testen (kostenloses Kontingent verfügbar)