Zapier-Web-Scraping — Seite scrapen, in einen Zap routen
DiffHook übernimmt Scraping und Diff. Ihr Zap erhält bei jeder Seitenänderung einen signierten Webhook mit extrahiertem Text und rohem HTML-Fragment — ohne Code-Step, ohne Drittanbieter-Scraping-Add-on.
Teams scrapen in Zapier üblicherweise mit Schedule by Zapier + Webhooks GET + Code by Zapier + Formatter-Akrobatik. Der Stack ist fragil: Zapier kürzt Response-Bodies über 6 MB, Regex in einem Code-Step altert schlecht und jedes Polling verbrennt eine Task. DiffHook verschiebt Fetch, Rendering und Diff aus Zapier heraus — der Zap bekommt nur echte Änderungen und bereits extrahierte Felder.
Workflow
In Zapier scrapen in 5 Schritten
Standard-Catch-Hook-Trigger. Kein Code-Step, keine Premium-App, keine Response-Size-Überraschungen.
Zap mit Catch Hook starten
Wählen Sie Webhooks by Zapier → Catch Hook. Zapier gibt Ihnen eine eindeutige URL — sie wird das Zustellungsziel in DiffHook.
Den Scrape in einem DiffHook-Monitor beschreiben
Setzen Sie type auf html_css und geben Sie URL plus den CSS-Selektor an, der das relevante Element isoliert. Aktivieren Sie include_html: true, wenn der Zap auch den Roh-Markup braucht, nicht nur den extrahierten Text.
Monitor mit dem Catch Hook verknüpfen
POST an /v1/monitors mit Scrape-Konfig, Intervall und der Zapier-URL als Webhook-Zustellung. DiffHook übernimmt sofort Polling, Caching und Diff-Erkennung.
In Zapier verifizieren und filtern
Fügen Sie einen Filter-Step hinzu, der den X-DiffHook-Signature-Header gegen Ihr Signing-Secret prüft. Optional filtern auf extracted_text oder url, damit ein Zap mehrere Monitore abdecken kann.
Felder in nachgelagerte Aktionen mappen
Zapier auto-parst den JSON-Body, sodass extracted_text, previous_value, current_value und url als benannte Felder verfügbar sind. Lassen Sie sie in eine Slack-Nachricht, eine Google-Sheets-Zeile oder einen Airtable-Datensatz fließen.
API-Beispiel
In einen Zap scrapen, ein POST
include_html: true schickt das rohe HTML-Fragment neben dem extrahierten Text — nützlich, wenn der Zap eine Liste parsen muss.
POST https://api.diffhook.com/v1/monitors
Authorization: Bearer $DIFFHOOK_API_KEY
Content-Type: application/json
{
"type": "html_css",
"url": "https://directory.example.com/listings",
"css_selector": "article.listing",
"include_html": true,
"interval_seconds": 900,
"deliveries": [
{
"type": "webhook",
"url": "https://hooks.zapier.com/hooks/catch/000000/scrape123/"
}
]
}Importierbarer Workflow
Einen fertigen Zap kopieren
Zap-Template mit Catch Hook, Signaturprüfungs-Filter, Formatter-Step, der den Text säubert, und Slack-Ziel. Importieren, Keys einfügen, veröffentlichen.
FAQ
Zapier-Web-Scraping — häufige Fragen
Brauche ich Code by Zapier, um den gescrapten Payload zu verarbeiten?
Kann DiffHook JavaScript-gerenderte Seiten für meinen Zap scrapen?
Was ist mit Pagination und Infinite Scroll?
Wie vermeide ich doppelte Zap-Runs bei winzigen Diffs?
Gibt es eine Obergrenze für den gescrapten Payload?
Verwandte Workflows
Auch großartig mit DiffHook
Zapier-Webhook
Minimalistisches Change-zu-Zap-Muster — derselbe Catch Hook, ohne HTML-Scraping-Teil.
n8n-Web-Scraping
Lieber Self-Hosted-Automatisierung? Derselbe DiffHook-Monitor, n8n-Webhook als Ziel.
Make.com-Web-Scraping
Low-Code-Alternative zu Zapier mit ähnlicher Webhook-Ergonomie. Derselbe DiffHook-Payload.
n8n + Playwright
Playwright-gerendertes Scraping für JS-lastige Seiten, in n8n-Workflows geroutet.
n8n + Puppeteer
Puppeteer-gerendertes Scraping — kommt manchmal an Bot-Schutz vorbei, wo Playwright scheitert.
Ein Scraping-Skript ersetzen
Migration von einem Cron-plus-Scraper? Hier der Seite-an-Seite-Vergleich mit dem Managed-Monitor.
In Zapier scrapen, ohne Code by Zapier anzufassen
Gemanagter Scraper, extrahierter Text + rohes HTML, HMAC-signierte Catch Hooks, kostenloser Tarif. Ein POST reicht.