Scraper Hacker News — Stories, emplois, commentaires et utilisateurs
Extrayez des données structurées de Hacker News de Y Combinator. Top stories, nouvelles stories, offres d'emploi, threads Ask HN, projets Show HN, commentaires et profils utilisateurs. HTTP-only — sans Chrome, sans Playwright.
Ce que vous pouvez extraire
- Top stories — titre, URL, score, auteur, nombre de commentaires
- Offres d'emploi — postes de startups YC issus des threads mensuels "Who is Hiring"
- Commentaires — threads complets avec imbrication et info auteur
- Profils utilisateurs — karma, date de création, description
- Ask HN / Show HN — questions communautaires et présentations de projets
- Recherche — recherche plein texte sur tout le contenu HN
Cas d'utilisation
- Veille technologique — suivez ce que la communauté tech discute
- Données de recrutement startup — analysez les offres des startups YC pour l'intelligence marché
- Analyse de sentiment — analysez les réactions communautaires aux lancements produits
- Recherche de contenu — trouvez les sujets performants pour les blogs tech
- Intelligence concurrentielle — surveillez les mentions de votre entreprise ou de vos concurrents
Exemple API
curl -X POST "https://api.apify.com/v2/acts/santamaria-automations~ycombinator-scraper/runs?token=YOUR_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"mode": "top",
"maxResults": 100,
"includeComments": true
}'
Intégrations
- n8n / Make / Zapier — déclencher des exécutions et traiter les résultats via webhook
- Agents IA (MCP) — Claude Desktop, Cursor, VS Code, LangChain, LlamaIndex
- Python / Node.js — SDK Apify pour l'accès programmatique
- Google Sheets / Airtable — export via les intégrations Apify
Comparaison
| Caractéristique | NanoScrape | Wrappers HN API |
| Image Docker | ~12MB | Variable |
| RAM | 128MB | Variable |
| Coût pour 1k éléments | 0,50$ | 2$ - 10$ |
| Format de sortie | JSON structuré | Format API brut |
| Commentaires inclus | Oui (imbriqués) | Appels séparés |
| Recherche | Intégrée | API Algolia |
Champs de sortie
| Champ | Type | Exemple |
| title | string | Show HN: I built a new database |
| url | string | https://example.com/article |
| score | number | 342 |
| author | string | pg |
| comment_count | number | 187 |
| created_at | string | 2026-04-23T08:15:00Z |
| type | string | story |
| hn_url | string | https://news.ycombinator.com/item?id=... |