Zapier+DiffHook

Zapier-Web-Scraping — Seite scrapen, in einen Zap routen

DiffHook übernimmt Scraping und Diff. Ihr Zap erhält bei jeder Seitenänderung einen signierten Webhook mit extrahiertem Text und rohem HTML-Fragment — ohne Code-Step, ohne Drittanbieter-Scraping-Add-on.

Teams scrapen in Zapier üblicherweise mit Schedule by Zapier + Webhooks GET + Code by Zapier + Formatter-Akrobatik. Der Stack ist fragil: Zapier kürzt Response-Bodies über 6 MB, Regex in einem Code-Step altert schlecht und jedes Polling verbrennt eine Task. DiffHook verschiebt Fetch, Rendering und Diff aus Zapier heraus — der Zap bekommt nur echte Änderungen und bereits extrahierte Felder.

Workflow

In Zapier scrapen in 5 Schritten

Standard-Catch-Hook-Trigger. Kein Code-Step, keine Premium-App, keine Response-Size-Überraschungen.

01

Zap mit Catch Hook starten

Wählen Sie Webhooks by Zapier → Catch Hook. Zapier gibt Ihnen eine eindeutige URL — sie wird das Zustellungsziel in DiffHook.

02

Den Scrape in einem DiffHook-Monitor beschreiben

Setzen Sie type auf html_css und geben Sie URL plus den CSS-Selektor an, der das relevante Element isoliert. Aktivieren Sie include_html: true, wenn der Zap auch den Roh-Markup braucht, nicht nur den extrahierten Text.

03

Monitor mit dem Catch Hook verknüpfen

POST an /v1/monitors mit Scrape-Konfig, Intervall und der Zapier-URL als Webhook-Zustellung. DiffHook übernimmt sofort Polling, Caching und Diff-Erkennung.

04

In Zapier verifizieren und filtern

Fügen Sie einen Filter-Step hinzu, der den X-DiffHook-Signature-Header gegen Ihr Signing-Secret prüft. Optional filtern auf extracted_text oder url, damit ein Zap mehrere Monitore abdecken kann.

05

Felder in nachgelagerte Aktionen mappen

Zapier auto-parst den JSON-Body, sodass extracted_text, previous_value, current_value und url als benannte Felder verfügbar sind. Lassen Sie sie in eine Slack-Nachricht, eine Google-Sheets-Zeile oder einen Airtable-Datensatz fließen.

API-Beispiel

In einen Zap scrapen, ein POST

include_html: true schickt das rohe HTML-Fragment neben dem extrahierten Text — nützlich, wenn der Zap eine Liste parsen muss.

POST /v1/monitors
POST https://api.diffhook.com/v1/monitors
Authorization: Bearer $DIFFHOOK_API_KEY
Content-Type: application/json

{
  "type": "html_css",
  "url": "https://directory.example.com/listings",
  "css_selector": "article.listing",
  "include_html": true,
  "interval_seconds": 900,
  "deliveries": [
    {
      "type": "webhook",
      "url": "https://hooks.zapier.com/hooks/catch/000000/scrape123/"
    }
  ]
}

Importierbarer Workflow

Einen fertigen Zap kopieren

Zap-Template mit Catch Hook, Signaturprüfungs-Filter, Formatter-Step, der den Text säubert, und Slack-Ziel. Importieren, Keys einfügen, veröffentlichen.

FAQ

Zapier-Web-Scraping — häufige Fragen

Brauche ich Code by Zapier, um den gescrapten Payload zu verarbeiten?
Nein. DiffHook sendet einen flachen JSON-Body mit extracted_text und, falls aktiviert, current_html. Zapier parst das JSON automatisch, sodass jedes Feld als benannte Variable in nachgelagerten Schritten verfügbar ist. Behalten Sie einen Filter-Step für die Signaturprüfung, und Sie sind fertig — der Premium-Code-Step ist optional.
Kann DiffHook JavaScript-gerenderte Seiten für meinen Zap scrapen?
Ja. Setzen Sie type auf html_rendered und render.engine auf playwright oder puppeteer. DiffHook startet den Browser, wartet, bis die Seite fertig geladen ist, und wendet Ihren CSS-Selektor auf das gerenderte DOM an. Der Zap sieht nur das Post-Render-Diff — die Rendering-Kosten leben in DiffHook, nicht in Ihrem Zap-Plan.
Was ist mit Pagination und Infinite Scroll?
Zwei saubere Muster. Muster A — ein Monitor pro paginierter Seite (p=1, p=2, p=3), alle auf denselben Catch Hook feuernd. Muster B — scroll_to_bottom auf einem gerenderten Monitor aktivieren, damit Playwright die komplette Liste vor dem Snapshot lädt. Beide halten den Zap-Body klein und vorhersagbar.
Wie vermeide ich doppelte Zap-Runs bei winzigen Diffs?
Den CSS-Selektor enger machen, damit DiffHook nur den relevanten Block beobachtet (Preiskarte, Produktreihe, Changelog-Zeile) statt der gesamten Seite. Für lärmanfällige Quellen einen Filter-Step im Zap einbauen, der nur weitergeht, wenn die Diff-Länge einen Schwellwert überschreitet.
Gibt es eine Obergrenze für den gescrapten Payload?
DiffHook deckelt die HTML-Payload pro Zustellung bei 256 KB, was die große Mehrheit der Scrape-zu-Zap-Cases abdeckt. Bei größeren Seiten den CSS-Selektor eng halten — Sie brauchen selten das ganze Dokument, nur den sich bewegenden Abschnitt.

Verwandte Workflows

Auch großartig mit DiffHook

In Zapier scrapen, ohne Code by Zapier anzufassen

Gemanagter Scraper, extrahierter Text + rohes HTML, HMAC-signierte Catch Hooks, kostenloser Tarif. Ein POST reicht.