n8n-Web-Scraping — diff-getrieben, webhook-first
Zeigen Sie DiffHook die Seiten, die gescrapt werden sollen, beschreiben Sie mit einem CSS-Selektor, was extrahiert werden muss, und n8n bekommt das HTML-Diff jedes Mal, wenn es sich bewegt — bereits gecached, bereits dedupliziert, bereits signiert.
Der übliche n8n-Scraper besteht aus einem Schedule-Trigger + HTTP Request + HTML Extract + etwas Diff-Code in einem Code-Node gegen einen Datastore. Das funktioniert, scrapt aber bei jedem Tick selbst dann, wenn sich nichts geändert hat, und die Logik „Ist das anders als beim letzten Mal?" verwandelt sich in eine kleine, selbst gebaute Datenbank innerhalb von n8n. DiffHook verschiebt Fetch, HTML-Parsing und Diff aus n8n heraus — der Workflow läuft nur bei echten Änderungen, nicht öfter.
Der vollstaendige n8n-+-DiffHook-Hub
Alle n8n-Rezepte, Templates und Preise an einem Ort.
Workflow
Scrapen, diffen und an n8n zustellen in 5 Schritten
Fünf Einstellungen, kein Code-Node, kein Storage-Gefummel. Alles deklarativ.
Festlegen, was gescrapt wird
Wählen Sie die Ziel-URL und den CSS-Selektor, der den relevanten Block isoliert — eine Produktkarte, eine Preistabelle, einen Changelog-Eintrag. DiffHook rendert die Seite und behält nur das passende HTML.
Entscheiden, was als Änderung zählt
Text-only-Diff, um Style-Änderungen zu ignorieren, oder vollständiges HTML-Diff, um jedes Attribut einzufangen. Setzen Sie include_html: true, wenn n8n das Rohmarkup neben dem extrahierten Text sehen soll.
Monitor anlegen
Einmalig POST an /v1/monitors mit URL, Selektor, Intervall und einer Webhook-Zustellung, die auf Ihren n8n-Workflow zeigt. Kein Cron, kein Storage, keine Duplikaterkennung — das gehört alles zu DiffHook.
Das Diff in n8n empfangen
Der Webhook-Trigger von n8n feuert mit einem signierten JSON-Body aus previous_html, current_html und dem extrahierten Text. Verifizieren Sie den HMAC im Crypto-Node und gehen Sie dann in die nachgelagerten Schritte.
Parsen, anreichern, routen
Nutzen Sie den HTML-Extract- oder den Code-Node von n8n, um strukturierte Felder aus dem Diff zu ziehen, reichern Sie bei Bedarf mit einem AI-Node an, und schicken Sie das Ergebnis an Slack, Airtable, Notion oder eine Datenbank.
API-Beispiel
Scrapen und diffen in einem Request
Deklarative Monitor-Definition — include_html liefert das Rohmarkup mit, damit n8n es weiter unten im Pipeline parsen kann.
POST https://api.diffhook.com/v1/monitors
Authorization: Bearer $DIFFHOOK_API_KEY
Content-Type: application/json
{
"type": "html_css",
"url": "https://competitor.example.com/products",
"css_selector": "main .product-card",
"include_html": true,
"interval_seconds": 900,
"deliveries": [
{
"type": "webhook",
"url": "https://n8n.yourdomain.com/webhook/scrape-products"
}
]
}Importierbarer Workflow
Drop-in-Scraping-Workflow für n8n
Das Template parst das Diff, extrahiert Produktkarten mit HTML Extract und schickt die strukturierten Zeilen an ein Google Sheet. Tauschen Sie einfach den Ziel-Node gegen Ihren eigenen aus.
FAQ
n8n-Web-Scraping — häufige Fragen
Warum Scraping von n8n nach DiffHook auslagern?
Kann DiffHook JavaScript-gerenderte Seiten scrapen?
Wie bekomme ich strukturierte Daten statt rohem HTML?
Respektiert der Scraper robots.txt und Rate Limits?
Was, wenn die Site ein CAPTCHA einführt oder den Scraper blockiert?
Verwandte Workflows
Auch großartig mit DiffHook
n8n-Webhook
Dasselbe Webhook-Zustellmuster ohne den HTML-Scraping-Teil — reines Change-zu-Trigger.
n8n + Playwright
Scrapen Sie client-gerenderte SPAs mit der Playwright-Engine von DiffHook und schieben Sie das Post-Render-HTML an n8n.
n8n + Puppeteer
Dasselbe SPA-Scraping im Chromium-Puppeteer-Style — nehmen Sie die Engine, die zur Ziel-Site passt.
Zapier-Web-Scraping
Dasselbe Muster in Zapier Catch Hooks — ohne Code by Zapier.
Make.com-Web-Scraping
Scrapen und diffen in ein Make.com-Webhook-Modul — identische Monitor-Form, andere Destination.
Ein Scraping-Skript ersetzen
Sie migrieren von einem Python-/Node-Scraper? Hier der Seite-an-Seite-Vergleich mit dem Managed-Monitor.
Hören Sie auf, per Cron zu scrapen. Scrapen Sie bei Änderungen.
Kostenloser Tarif, 60-Sekunden-Checks, HMAC-signierte Payloads, Playwright- und Puppeteer-Engines inklusive. Keine Karte, keine Bindung.