n8n + Puppeteer — scraping Chrome headless senza l'operatività
DiffHook pilota Puppeteer per te, aspetta che il DOM si assesti, diffa il risultato contro lo snapshot precedente e consegna le modifiche a n8n tramite webhook firmato. Nessun binario Chromium, nessuna immagine Docker, nessun riavvio-su-OOM.
Ospitare Puppeteer dentro un deployment di n8n è un classico footgun: il binario Chromium gonfia la dimensione dell'immagine, i worker perdono memoria dopo poche centinaia di run e qualunque cambio di pagina rompe lo script di selettori alle 3 di notte. DiffHook porta il browser in una flotta gestita. Tu descrivi una volta cosa osservare e n8n vede solo il diff post-render — mai i crash del browser, mai la latenza a freddo, mai il drift di versione degli stealth plugin.
L hub completo di n8n + DiffHook
Tutte le ricette, i template e i prezzi n8n in un unico posto.
Flusso
Collega i diff renderizzati da Puppeteer a n8n in 5 passi
Il browser gira dalla nostra parte. n8n vede solo i cambiamenti — niente cold start, niente processi Chromium zombi.
Esporre un webhook n8n
Aggiungi un nodo trigger Webhook a un flusso n8n nuovo o esistente e annota l'URL di produzione. È la destinazione a cui DiffHook farà POST quando il DOM renderizzato cambia.
Scegliere html_rendered e il motore Puppeteer
Imposta type su html_rendered e render.engine su puppeteer. Aggiungi wait_for_selector o wait_until: networkidle perché DiffHook faccia lo snapshot solo dopo che la pagina ha finito di caricare JS e dati.
Colpire l'elemento giusto con un selettore
DiffHook esegue il selettore CSS contro il DOM renderizzato. Un selettore stretto (una specifica card prodotto, una riga di prezzo, un banner di status) mantiene il diff focalizzato e fa sì che n8n si attivi solo sul segnale che conta.
Creare il monitor
POST su /v1/monitors con URL, configurazione di rendering, selettore, intervallo e una consegna webhook verso il tuo URL n8n. DiffHook pianifica le run Puppeteer — tu non possiedi nulla a forma di browser.
Reagire al cambiamento in n8n
Quando l'output del selettore renderizzato cambia, il nodo Webhook di n8n parte con un body JSON firmato: previous_value, current_value, url, detected_at. Verifica l'HMAC e instrada il diff ai passi successivi.
Esempio API
Monitor renderizzato da Puppeteer in un POST
render.engine sceglie il browser. Puppeteer è un ottimo default per i siti che testano specificamente fingerprint della famiglia Chrome.
POST https://api.diffhook.com/v1/monitors
Authorization: Bearer $DIFFHOOK_API_KEY
Content-Type: application/json
{
"type": "html_rendered",
"url": "https://spa.example.com/pricing",
"render": { "engine": "puppeteer", "wait_for_selector": "[data-ready]" },
"css_selector": "main .plan",
"interval_seconds": 600,
"deliveries": [
{
"type": "webhook",
"url": "https://n8n.yourdomain.com/webhook/spa-pricing"
}
]
}Flusso importabile
Parti da un flusso n8n già pronto
Il template verifica l'HMAC, parsa l'HTML renderizzato da Puppeteer con HTML Extract e spinge righe strutturate in un database Notion. Modifica il nodo di destinazione a piacere.
FAQ
n8n Puppeteer — domande frequenti
Puppeteer vs Playwright — quale motore scegliere?
Devo tenere il mio Chromium in esecuzione da qualche parte?
Come gestisce DiffHook le pagine che caricano contenuti a scroll?
Posso passare cookie di auth a Puppeteer?
Qual è la cadenza minima sui monitor renderizzati?
Flussi correlati
Perfetti anche con DiffHook
n8n + Playwright
L'altro motore renderizzato — a volte uno passa un WAF dove l'altro resta bloccato.
Web scraping n8n
Scraping di HTML statico per pagine che non hanno bisogno di un browser — più economico e veloce quando è possibile.
Webhook n8n
Verificare l'HMAC, deduplicare le consegne, rigiocare gli eventi falliti — dettagli sulla pagina webhook generica.
Web scraping Zapier
Lo stesso motore renderizzato verso Catch Hooks di Zapier — forma di monitor identica.
Web scraping Make.com
Instrada il diff post-render al modulo webhook di Make.com per automazione low-code.
Sostituire uno script di scraping
Migri da uno script Puppeteer + cron fatto in casa? Ecco il monitor gestito.
Smetti di spedire Chromium con la tua immagine n8n
Flotta Puppeteer gestita, webhook firmati HMAC, check ogni 60 secondi, piano gratuito. In produzione in pochi minuti.