Convertisseur HTML vers Markdown : Bulk pages web vers MD propre, 1$ pour 1 000 pages

Convertissez toute page HTML en Markdown propre, prêt pour LLM. Supprime le chrome (nav, pubs, barres latérales), conserve titres, tableaux, blocs de code, images avec alt et liens. Retourne titre de page, contenu principal en Markdown, nombre de mots, tableaux d'images et de liens extraits, et l'URL principale inférée. Construit pour le batch : 10 000 URLs d'articles en entrée, une ligne par page en sortie. Parfait pour corpus d'entraînement LLM, ingestion RAG, miroirs de documentation et surveillance de contenu.

Ouvrir sur Apify → Essayez maintenant
Tarif
0,001$/page
RAM
128MB
Couverture
Toute URL
Champs de sortie
10+
Proxy
Apify datacenter
Tech
HTTP + Readability

Ce que vous obtenez

Cas d'usage principaux

Exemple d'API

# Lancer une exécution via l'API Apify
curl -X POST "https://api.apify.com/v2/acts/santamaria-automations~html-to-markdown/runs?token=YOUR_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "urls": [
      "https://blog.example.com/post-1",
      "https://docs.example.com/getting-started",
      "https://news.example.com/article-2026"
    ],
    "extractImages": true,
    "extractLinks": true,
    "mainContentOnly": true
  }'

# Ou utiliser avec des agents IA via MCP :
# https://mcp.apify.com?tools=santamaria-automations/html-to-markdown

Intégrations

Champs de sortie

ChampTypeExemple
source_urlstringhttps://blog.example.com/post-1
titlestringConstruire des pipelines RAG
main_contentstring# Construire des pipelines RAG\n\nUn guide pratique...
word_countinteger1 842
reading_time_minutesinteger8
languagestringfr
canonical_urlstringhttps://blog.example.com/post-1
imagesarray[{"src":"...","alt":"diagramme"}]
linksarray[{"href":"...","text":"docs"}]
scraped_atstring2026-06-13T10:15:42Z

Acteurs associés

Ouvrir sur Apify → Essayez maintenant (version gratuite disponible)