Web scraping Zapier — scrapa un sito, instrada in uno Zap
DiffHook si occupa di scraping e diff. Il tuo Zap riceve un webhook firmato con il testo estratto e il frammento HTML grezzo a ogni cambiamento della pagina — senza step Code, senza add-on di scraping di terze parti.
Di solito i team scrapano in Zapier con Schedule by Zapier + Webhooks GET + Code by Zapier + acrobazie di Formatter. Quello stack è fragile: Zapier tronca i body di risposta oltre i 6 MB, le regex in uno step Code invecchiano male e ogni polling brucia una task. DiffHook sposta fetch, rendering e diff fuori da Zapier — lo Zap riceve solo cambiamenti reali e campi già estratti.
Flusso
Scrapa in Zapier in 5 passi
Trigger Catch Hook standard. Niente step Code, niente app premium, niente sorprese sulla dimensione della risposta.
Avvia uno Zap con un Catch Hook
Scegli Webhooks by Zapier → Catch Hook. Zapier ti consegna un URL univoco — diventa la destinazione di consegna in DiffHook.
Descrivi lo scrape in un monitor DiffHook
Imposta type su html_css, fornisci l'URL e il selettore CSS che isola l'elemento che ti interessa. Attiva include_html: true quando lo Zap ha bisogno anche del markup grezzo oltre al testo estratto.
Registra il monitor con il Catch Hook
POST a /v1/monitors con la configurazione dello scrape, un intervallo e l'URL di Zapier come consegna webhook. DiffHook prende subito in carico polling, caching e rilevamento del diff.
Verifica e filtra dentro Zapier
Aggiungi uno step Filter che confronta l'header X-DiffHook-Signature col tuo signing secret. In opzione filtra per extracted_text o url, così uno Zap solo può coprire più monitor.
Mappa i campi nelle azioni successive
Zapier auto-parsa il body JSON, quindi extracted_text, previous_value, current_value e url sono disponibili come campi con nome. Usali in un messaggio Slack, in una riga Google Sheets o in un record Airtable.
Esempio API
Scrapa in uno Zap, un POST
include_html: true invia il frammento HTML grezzo accanto al testo estratto — utile quando lo Zap deve parsare una lista di item.
POST https://api.diffhook.com/v1/monitors
Authorization: Bearer $DIFFHOOK_API_KEY
Content-Type: application/json
{
"type": "html_css",
"url": "https://directory.example.com/listings",
"css_selector": "article.listing",
"include_html": true,
"interval_seconds": 900,
"deliveries": [
{
"type": "webhook",
"url": "https://hooks.zapier.com/hooks/catch/000000/scrape123/"
}
]
}Flusso importabile
Copia uno Zap già pronto
Zap template con Catch Hook, Filter di verifica firma, step Formatter che ripulisce il testo e destinazione Slack. Importa, incolla le chiavi, pubblica.
FAQ
Web scraping Zapier — domande frequenti
Mi serve Code by Zapier per gestire il payload scrapato?
DiffHook può scrapare pagine renderizzate in JavaScript per il mio Zap?
E la paginazione e l'infinite scroll?
Come evito run duplicati dello Zap quando il diff è piccolissimo?
C'è un limite alla dimensione del payload scrapato?
Flussi correlati
Perfetti anche con DiffHook
Webhook Zapier
Pattern change-verso-Zap minimo — stesso Catch Hook, senza la parte di scraping HTML.
Web scraping n8n
Preferisci l'automazione self-hosted? Stesso monitor DiffHook, webhook n8n come destinazione.
Web scraping Make.com
Alternativa low-code a Zapier con ergonomia webhook simile. Stesso payload DiffHook.
n8n + Playwright
Scraping renderizzato con Playwright per siti pesanti di JS, instradato in flussi n8n.
n8n + Puppeteer
Scraping renderizzato con Puppeteer — a volte supera la protezione anti-bot dove Playwright si blocca.
Sostituire uno script di scraping
Stai migrando da un cron + scraper? Confronta il monitor gestito fianco a fianco.
Scrapa in Zapier senza toccare Code by Zapier
Scraper gestito, testo estratto + HTML grezzo, Catch Hooks firmati HMAC, piano gratuito. Un POST per partire.