Web scraping Zapier — raspa un sitio y enruta a un Zap
DiffHook se ocupa del scraping y del diff. Tu Zap recibe un webhook firmado con el texto extraído y el fragmento HTML en crudo cada vez que la página cambia — sin paso Code, sin add-on de scraping de terceros.
Los equipos suelen raspar hacia Zapier con Schedule by Zapier + Webhooks GET + Code by Zapier + acrobacias de Formatter. Ese montaje es frágil: Zapier trunca los cuerpos de respuesta por encima de 6 MB, las regex en un paso Code envejecen mal y cada polling quema una tarea. DiffHook saca el fetch, el renderizado y el diff fuera de Zapier — el Zap solo recibe cambios reales y campos ya extraídos.
Flujo
Raspa hacia Zapier en 5 pasos
Trigger Catch Hook estándar. Sin paso Code, sin app premium, sin sorpresas de tamaño de respuesta.
Arranca un Zap con un Catch Hook
Elige Webhooks by Zapier → Catch Hook. Zapier te entrega una URL única — esa es el destino de entrega en DiffHook.
Describe el scrape en un monitor DiffHook
Pon type a html_css, proporciona la URL y el selector CSS que aísla el elemento que te importa. Activa include_html: true cuando el Zap necesite también el markup en crudo además del texto extraído.
Registra el monitor con el Catch Hook
POST a /v1/monitors con la config del scrape, un intervalo y la URL de Zapier como entrega webhook. DiffHook asume al instante el polling, la caché y la detección del diff.
Verifica y filtra dentro de Zapier
Añade un paso Filter que compare la cabecera X-DiffHook-Signature con tu secreto de firma. Opcionalmente filtra por extracted_text o url para que un único Zap cubra varios monitores.
Mapea campos en acciones posteriores
Zapier auto-parsea el cuerpo JSON, así que extracted_text, previous_value, current_value y url quedan disponibles como campos nombrados. Mételos en un mensaje de Slack, una fila de Google Sheets o un registro de Airtable.
Ejemplo de API
Raspa hacia un Zap, un POST
include_html: true envía el fragmento HTML en crudo junto al texto extraído — útil cuando el Zap tiene que parsear una lista de ítems.
POST https://api.diffhook.com/v1/monitors
Authorization: Bearer $DIFFHOOK_API_KEY
Content-Type: application/json
{
"type": "html_css",
"url": "https://directory.example.com/listings",
"css_selector": "article.listing",
"include_html": true,
"interval_seconds": 900,
"deliveries": [
{
"type": "webhook",
"url": "https://hooks.zapier.com/hooks/catch/000000/scrape123/"
}
]
}Flujo importable
Copia un Zap ya hecho
Zap plantilla con Catch Hook, Filter de verificación de firma, paso Formatter que limpia el texto y destino Slack. Importa, pega tus claves, publica.
FAQ
Web scraping Zapier — preguntas frecuentes
¿Necesito Code by Zapier para manejar el payload raspado?
¿Puede DiffHook raspar páginas renderizadas en JavaScript para mi Zap?
¿Y la paginación y el scroll infinito?
¿Cómo evito ejecuciones duplicadas del Zap cuando el diff es pequeño?
¿Hay límite en el tamaño del payload raspado?
Flujos relacionados
También geniales con DiffHook
Webhook Zapier
Patrón cambio-a-Zap minimalista — mismo Catch Hook, sin la parte de scraping HTML.
Web scraping n8n
¿Prefieres automatización autoalojada? Mismo monitor DiffHook, webhook n8n como destino.
Web scraping Make.com
Alternativa low-code a Zapier con ergonomía webhook parecida. Mismo payload DiffHook.
n8n + Playwright
Scraping renderizado por Playwright para sitios JS pesados, enrutado a flujos n8n.
n8n + Puppeteer
Scraping renderizado por Puppeteer — a veces pasa la protección antibots donde Playwright se atasca.
Sustituir un script de scraping
¿Migras de un cron + scraper? Compara el monitor gestionado punto por punto.
Rasca hacia Zapier sin tocar Code by Zapier
Scraper gestionado, texto extraído + HTML en crudo, Catch Hooks firmados con HMAC, plan gratuito. Un POST para arrancar.