Caratteristiche
L’integrazione offre 6 potenti operazioni per l’estrazione automatizzata dei dati web:Scrape Website
Search
Answers (AI)
Batch Scrape URLs
Create Crawl
Create Map
Installazione
1. Installa il Nodo
Installa il pacchetto del nodo Olostep tramite npm:2. Connetti il Tuo Account
Quando usi per la prima volta il nodo Olostep in un flusso di lavoro, dovrai configurare le credenziali:- Aggiungi il nodo “Olostep Scrape” al tuo flusso di lavoro
- Clicca sul nodo per aprire le sue impostazioni
- Clicca su “Crea Nuova Credenziale” o seleziona credenziali esistenti
- Inserisci la tua chiave API di Olostep
- Clicca su “Salva” per memorizzare la credenziale
Azioni Disponibili
Scrape Website
Estrai contenuti da un singolo URL. Supporta più formati e il rendering JavaScript. Casi d’Uso:- Monitora modifiche su pagine specifiche
- Estrai informazioni sui prodotti da siti di e-commerce
- Raccogli dati da articoli di notizie o post di blog
- Recupera contenuti per l’aggregazione di contenuti
- ID Scrape
- URL Scraped
- Contenuto Markdown
- Contenuto HTML
- Contenuto JSON
- Contenuto Testo
- Stato
- Timestamp
- URL Screenshot (se disponibile)
- Metadata della Pagina
Monitor Competitor Pricing
Monitor Competitor Pricing
- URL: Pagina prodotto del concorrente
- Formato: JSON
- Parser: @olostep/amazon-product
- Aggiungi dati sui prezzi al foglio di monitoraggio
- Avvisa il team sui cambiamenti di prezzo
Extract and Save Blog Posts
Extract and Save Blog Posts
- URL: {{$json.link}}
- Formato: Markdown
- Salva il contenuto dell’articolo nel database di Notion
Lead Enrichment
Lead Enrichment
- URL: Sito web dell’azienda dal foglio
- Formato: Markdown
- Estrai informazioni sull’azienda usando l’AI
- Aggiungi dati arricchiti al foglio
Search
Cerca sul Web per una determinata query e ottieni risultati strutturati (risultati di ricerca basati su parser, non AI). Casi d’Uso:- Flussi di lavoro di ricerca automatizzata
- Scoperta e arricchimento di lead
- Analisi competitiva
- Ricerca di contenuti
Automated Research
Automated Research
- Query: “ultimi sviluppi AI”
- Estrai e formatta le informazioni chiave
- Archivia i risultati della ricerca
Lead Discovery
Lead Discovery
- Query: ”{{$json.searchTerm}}”
- Archivia lead con informazioni di contatto
Batch Scrape URLs
Scrape fino a 10k URL contemporaneamente. Perfetto per l’estrazione di dati su larga scala. Casi d’Uso:- Scrape di interi cataloghi di prodotti
- Estrazione di dati da più risultati di ricerca
- Elaborazione di elenchi di URL da fogli di calcolo
- Estrazione di contenuti in blocco
[{"url":"https://example.com","custom_id":"site1"}]- ID Batch (usalo per recuperare i risultati in seguito)
- Stato
- Totale URL
- Creato il
- Formato Richiesto
- Codice Paese
- Parser Usato
Scrape Product Catalog
Scrape Product Catalog
- Converti CSV/elenco in formato array JSON
- URL: {{$json.urlArray}}
- Formato: JSON
- Parser: @olostep/amazon-product
- Invia ID batch al tuo sistema per il recupero
Daily Content Monitoring
Daily Content Monitoring
- Recupera URL da monitorare
- Converti in formato array batch
- Elabora tutti gli URL contemporaneamente
- Notifica al team che lo scraping è completo
Create Crawl
Ottieni il contenuto delle sottopagine di un URL. Scopri e fai scraping autonomamente di interi siti web seguendo i link. Perfetto per siti di documentazione, blog e repository di contenuti. Casi d’Uso:- Crawl e archivia interi siti di documentazione
- Estrai tutti i post di blog da un sito web
- Crea basi di conoscenza da contenuti web
- Monitora cambiamenti nella struttura del sito
- ID Crawl (usalo per recuperare i risultati in seguito)
- Tipo di Oggetto
- Stato
- URL di Partenza
- Pagine Massime
- Segui Link
- Timestamp Creato
- Formati
Archive Documentation Site
Archive Documentation Site
- URL di Partenza: https://docs.example.com
- Pagine Massime: 500
- Segui Link: true
- Formato: Markdown
- Invia ID crawl al tuo sistema di archiviazione
- Notifica al team che il crawl è in corso
Competitor Content Analysis
Competitor Content Analysis
- URL di Partenza: URL del blog del concorrente
- Pagine Massime: 100
- Formato: Markdown
- Attendi il completamento del crawl
- Archivia dati del crawl per analisi
Create Map
Ottieni tutti gli URL di un sito web. Estrai tutti gli URL da un sito web per la scoperta di contenuti e l’analisi della struttura del sito. Casi d’Uso:- Crea sitemap e diagrammi della struttura del sito
- Scopri tutte le pagine prima di fare scraping in batch
- Trova pagine rotte o mancanti
- Audit e analisi SEO
- ID Mappa
- Tipo di Oggetto
- URL del Sito Web
- Totale URL Trovati
- URL (array JSON)
- Query di Ricerca
- Limite Top N
Discover and Scrape
Discover and Scrape
- URL: https://example.com
- Include Patterns: /products/**
- Top N: 500
- Analizza URL dal risultato della mappa
- URL: {{$json.urls}}
- Formato: JSON
- Aggiungi tutti i dati dei prodotti al foglio di calcolo
SEO Site Audit
SEO Site Audit
- URL: Il tuo sito web
- Top N: 1000
- Archivia tutti gli URL per il monitoraggio
- Riporta il totale delle pagine trovate
Esempi di Flussi di Lavoro Popolari
Monitoraggio Prezzi E-commerce
Monitora i prezzi dei concorrenti e ricevi avvisi istantanei:Aggregazione di Contenuti
Aggrega contenuti da più fonti:Pipeline di Arricchimento Lead
Arricchisci i dati dei lead con informazioni web:Automazione della Ricerca
Automatizza la ricerca da più fonti:Monitoraggio dei Social Media
Traccia menzioni e contenuti:Flussi di Lavoro Multi-Step
Pipeline Completa di Scraping di Prodotti
Costruisci una pipeline completa di dati sui prodotti:Scopri URL dei Prodotti
- Include patterns:
/products/** - Exclude patterns:
/cart/**,/checkout/**
Elabora Prodotti in Batch
- Formato: JSON
- Parser: Parser specifico per il prodotto se disponibile
Archivia nel Database
- Usa Airtable, Google Sheets o il tuo database
Strategia di Contenuti SEO
Analizza i concorrenti e pianifica i contenuti:Mappa i Siti dei Concorrenti
- Estrai tutti i post di blog e le pagine di contenuti
Scrape Contenuti
- Formato: Markdown per un’analisi facile
Analisi AI
- Identifica lacune nei contenuti
- Trova argomenti di tendenza
Parser Specializzati
Olostep fornisce parser pre-costruiti per siti web popolari. Usali con il campoParser:
Amazon Product
@olostep/amazon-productEstrai: titolo, prezzo, valutazione, recensioni, immagini, variantiGoogle Search
@olostep/google-searchEstrai: risultati di ricerca, titoli, frammenti, URLGoogle Maps
@olostep/google-mapsEstrai: informazioni aziendali, recensioni, valutazioni, posizioneExtract Emails
@olostep/extract-emailsEstrai: email da pagine, elenchi di contatti e footerExtract Socials
@olostep/extract-socialsEstrai: link ai profili social (X/Twitter, GitHub, ecc.)Extract Calendars
@olostep/extract-calendarsEstrai: link a calendari (Google Calendar, ICS) dalle pagineUso dei Parser
Aggiungi semplicemente l’ID del parser al campo Parser. Due esempi:Integrazione con App Popolari
Google Sheets
Perfetto per la raccolta e il monitoraggio dei dati:- Fogli di monitoraggio dei prezzi
- Database di arricchimento lead
- Inventario dei contenuti
- Fogli di analisi della concorrenza
Airtable
Costruisci potenti database con dati estratti:- Cataloghi di prodotti
- Database di ricerca
- Calendari dei contenuti
- Database di link
Slack
Ricevi notifiche istantanee:- Avvisi di calo prezzi
- Notifiche di aggiornamento contenuti
- Monitoraggio errori
- Digest giornalieri
HubSpot / Salesforce
Arricchisci automaticamente i dati CRM:- Arricchimento lead
- Ricerca aziendale
- Intelligenza competitiva
- Mappatura degli account
Notion
Costruisci basi di conoscenza:- Specchi di documentazione
- Repository di ricerca
- Librerie di contenuti
- Wiki di team
Best Practices
Usa Elaborazione in Batch per Più URL
Usa Elaborazione in Batch per Più URL
- Molto più veloce (elaborazione parallela)
- Più conveniente
- Più facile da gestire
- Migliore per i limiti di velocità
Imposta Tempi di Attesa Adeguati
Imposta Tempi di Attesa Adeguati
- Siti semplici: 0-1000ms
- Siti dinamici: 2000-3000ms
- JavaScript pesante: 5000-8000ms
Usa Parser Specializzati
Usa Parser Specializzati
- Ottieni dati strutturati automaticamente
- Estrazione più affidabile
- Nessun bisogno di parsing personalizzato
- Mantenuti da Olostep
Filtra Prima di Fare Scraping
Filtra Prima di Fare Scraping
- Controlla se l’URL è cambiato
- Verifica che i dati non siano stati già fatti scraping di recente
- Applica logica aziendale prima di fare scraping
Gestisci Operazioni Asincrone
Gestisci Operazioni Asincrone
- Memorizza l’ID restituito (batch_id, crawl_id, map_id)
- Usa un nodo Wait se recuperi immediatamente
- Considera callback webhook per il completamento
- Imposta flussi di lavoro separati per il recupero
Archivia i Risultati Correttamente
Archivia i Risultati Correttamente
- Google Sheets: Tracciamento semplice, collaborazione di team
- Airtable: Dati relazionali, formattazione ricca
- Database: Su larga scala, query complesse
- Notion: Base di conoscenza, documentazione
Monitora e Avvisa
Monitora e Avvisa
- Usa flussi di lavoro di errore in n8n
- Invia avvisi a Slack/Email in caso di fallimenti
- Monitora l’uso dell’API nella dashboard di Olostep
- Registra metriche importanti
Casi d’Uso Comuni per Settore
E-commerce
- Monitoraggio Prezzi: Traccia i prezzi dei concorrenti in tempo reale
- Ricerca Prodotti: Scopri prodotti di tendenza e lacune di mercato
- Monitoraggio Inventario: Monitora la disponibilità di stock
- Analisi Recensioni: Aggrega e analizza le recensioni dei clienti
Marketing & SEO
- Scoperta di Contenuti: Trova opportunità di contenuti
- Analisi della Concorrenza: Traccia le strategie dei concorrenti
- Ricerca Backlink: Scopri opportunità di link
- Ricerca Parole Chiave: Estrai dati sulle parole chiave dai risultati di ricerca
Vendite & Generazione Lead
- Arricchimento Lead: Migliora i dati CRM con informazioni web
- Ricerca Aziendale: Raccogli informazioni aziendali
- Scoperta Contatti: Trova decisori
- Intelligenza Competitiva: Traccia le mosse dei concorrenti
Ricerca & Analitica
- Raccolta Dati: Raccogli dati da più fonti
- Ricerca di Mercato: Traccia le tendenze del settore
- Ricerca Accademica: Raccogli dati di ricerca
- Intelligenza sui Prezzi: Analizza le strategie di prezzo
Media & Editoria
- Aggregazione di Contenuti: Cura contenuti da più siti
- Monitoraggio Notizie: Traccia notizie e menzioni
- Social Media: Monitora le piattaforme social
- Rilevamento Tendenze: Identifica argomenti di tendenza
Risoluzione dei Problemi
Autenticazione Fallita
Autenticazione Fallita
- Controlla la chiave API dalla dashboard
- Assicurati che non ci siano spazi extra nella chiave API
- Ricrea la credenziale in n8n
- Verifica che la chiave API sia attiva
Scrape Restituisce Contenuto Vuoto
Scrape Restituisce Contenuto Vuoto
- Aumenta il tempo di “Wait Before Scraping”
- Controlla se il sito richiede il login
- Prova un formato diverso (HTML vs Markdown)
- Verifica che l’URL sia accessibile
- Controlla se il sito blocca l’accesso automatizzato
Errore di Formato Array Batch
Errore di Formato Array Batch
- Usa il formato:
[{"url":"https://example.com","custom_id":"id1"}] - Assicurati della corretta sintassi JSON
- Usa il nodo Code per formattare correttamente gli URL
- Testa il JSON con un validatore online
Limite di Velocità Superato
Limite di Velocità Superato
- Distribuisci le esecuzioni dei flussi di lavoro con nodi Wait
- Usa l’elaborazione in batch invece di scraping individuali
- Aggiorna il tuo piano Olostep
- Controlla il limite di velocità nella dashboard
URL Non Scraped
URL Non Scraped
- Verifica il formato dell’URL (includi http:// o https://)
- Controlla se l’URL richiede autenticazione
- Testa l’URL prima nel browser
- Prova con il parametro paese
- Contatta il supporto per domini bloccati
Vantaggi di n8n
Self-Hosted
n8n è self-hosted, dandoti il controllo completo sui tuoi flussi di lavoro e dati. Nessun vincolo del fornitore, nessun dato che lascia la tua infrastruttura.Nessun Limite di Task
A differenza delle piattaforme di automazione basate su cloud, n8n non impone limiti di task. Esegui quanti flussi di lavoro desideri senza costi aggiuntivi.Open Source
n8n è open source, permettendoti di personalizzarlo ed estenderlo per adattarlo alle tue esigenze specifiche.Conveniente
n8n self-hosted è gratuito, con hosting cloud opzionale disponibile. Paga solo per l’uso dell’API Olostep.Prezzi
Olostep addebita in base all’uso dell’API, indipendentemente da n8n:- Scrapes: Paga per ogni scraping
- Batches: Paga per ogni URL nel batch
- Crawls: Paga per ogni pagina fatta crawling
- Maps: Paga per ogni operazione mappa