Vai al contenuto principale
L’integrazione di Olostep con n8n porta potenti capacità di ricerca web, scraping e crawling nei flussi di lavoro di n8n. Crea flussi di lavoro automatizzati che cercano, estraggono e strutturano i dati web da qualsiasi sito senza scrivere codice. Inizia con Olostep su n8n →

Caratteristiche

L’integrazione offre 6 potenti operazioni per l’estrazione automatizzata dei dati web:

Scrape Website

Estrai contenuti da qualsiasi singolo URL in più formati (Markdown, HTML, JSON, testo)

Search

Cerca sul Web e ottieni risultati strutturati

Answers (AI)

Cerca sul Web con l’AI e ottieni risposte strutturate con fonti e citazioni

Batch Scrape URLs

Scrape fino a 10k URL contemporaneamente. Perfetto per l’estrazione di dati su larga scala

Create Crawl

Ottieni il contenuto delle sottopagine di un URL. Scopri e fai scraping autonomamente di interi siti web

Create Map

Ottieni tutti gli URL di un sito web per l’analisi della struttura del sito e la scoperta di contenuti

Installazione

1. Installa il Nodo

Installa il pacchetto del nodo Olostep tramite npm:
npm install n8n-nodes-olostep
Quindi riavvia n8n per caricare il nuovo nodo. In alternativa, segui la guida all’installazione dei nodi della comunità n8n per istruzioni dettagliate.

2. Connetti il Tuo Account

Quando usi per la prima volta il nodo Olostep in un flusso di lavoro, dovrai configurare le credenziali:
  1. Aggiungi il nodo “Olostep Scrape” al tuo flusso di lavoro
  2. Clicca sul nodo per aprire le sue impostazioni
  3. Clicca su “Crea Nuova Credenziale” o seleziona credenziali esistenti
  4. Inserisci la tua chiave API di Olostep
  5. Clicca su “Salva” per memorizzare la credenziale
Ottieni la tua chiave API dalla Dashboard di Olostep.

Azioni Disponibili

Scrape Website

Estrai contenuti da un singolo URL. Supporta più formati e il rendering JavaScript. Casi d’Uso:
  • Monitora modifiche su pagine specifiche
  • Estrai informazioni sui prodotti da siti di e-commerce
  • Raccogli dati da articoli di notizie o post di blog
  • Recupera contenuti per l’aggregazione di contenuti
Configurazione:
URL to Scrape
string
obbligatorio
URL del sito web da fare scraping (deve includere http:// o https://)
Output Format
dropdown
predefinito:"Markdown"
Scegli il formato: Markdown, HTML, JSON o Testo Semplice
Country Code
string
Codice paese per contenuti specifici della località (es. “US”, “GB”, “CA”)
Wait Before Scraping
integer
Tempo di attesa in millisecondi per il rendering JavaScript (0-10000)
Parser
string
ID parser opzionale per estrazione specializzata (es. “@olostep/amazon-product”)
Campi di Output:
  • ID Scrape
  • URL Scraped
  • Contenuto Markdown
  • Contenuto HTML
  • Contenuto JSON
  • Contenuto Testo
  • Stato
  • Timestamp
  • URL Screenshot (se disponibile)
  • Metadata della Pagina
Esempi di Flussi di Lavoro:
Trigger: Schedule (Ogni giorno alle 9 AM)Azione: Olostep - Scrape Website
  • URL: Pagina prodotto del concorrente
  • Formato: JSON
  • Parser: @olostep/amazon-product
Azione: Google Sheets - Aggiungi Riga
  • Aggiungi dati sui prezzi al foglio di monitoraggio
Azione: Email - Invia Email (Se il prezzo scende)
  • Avvisa il team sui cambiamenti di prezzo
Trigger: RSS Feed - Nuovo ElementoAzione: Olostep - Scrape Website
  • URL: {{$json.link}}
  • Formato: Markdown
Azione: Notion - Crea Pagina
  • Salva il contenuto dell’articolo nel database di Notion
Trigger: Google Sheets - Nuova RigaAzione: Olostep - Scrape Website
  • URL: Sito web dell’azienda dal foglio
  • Formato: Markdown
Azione: OpenAI - Completa Testo
  • Estrai informazioni sull’azienda usando l’AI
Azione: Google Sheets - Aggiorna Riga
  • Aggiungi dati arricchiti al foglio
Cerca sul Web per una determinata query e ottieni risultati strutturati (risultati di ricerca basati su parser, non AI). Casi d’Uso:
  • Flussi di lavoro di ricerca automatizzata
  • Scoperta e arricchimento di lead
  • Analisi competitiva
  • Ricerca di contenuti
Configurazione:
Query
string
obbligatorio
Query di ricerca
Output: Restituisce risultati di ricerca strutturati come JSON con titoli, URL, frammenti e metadata. Esempi di Flussi di Lavoro:
Trigger: Schedule (Giornaliero alle 8 AM)Azione: Olostep - Search
  • Query: “ultimi sviluppi AI”
Azione: Code - Processa Risultati
  • Estrai e formatta le informazioni chiave
Azione: Notion - Crea Pagine
  • Archivia i risultati della ricerca
Trigger: Manuale (Pulsante)Azione: Olostep - Search
  • Query: ”{{$json.searchTerm}}”
Azione: Airtable - Crea Record
  • Archivia lead con informazioni di contatto

Batch Scrape URLs

Scrape fino a 10k URL contemporaneamente. Perfetto per l’estrazione di dati su larga scala. Casi d’Uso:
  • Scrape di interi cataloghi di prodotti
  • Estrazione di dati da più risultati di ricerca
  • Elaborazione di elenchi di URL da fogli di calcolo
  • Estrazione di contenuti in blocco
Configurazione:
URLs to Scrape
text
obbligatorio
Array JSON di oggetti con campi url e custom_id.Esempio: [{"url":"https://example.com","custom_id":"site1"}]
Output Format
dropdown
predefinito:"Markdown"
Scegli il formato per tutti gli URL: Markdown, HTML, JSON o Testo Semplice
Country Code
string
Codice paese per scraping specifico della località
Wait Before Scraping
integer
Tempo di attesa in millisecondi per il rendering JavaScript
Parser
string
ID parser opzionale per estrazione specializzata
Campi di Output:
  • ID Batch (usalo per recuperare i risultati in seguito)
  • Stato
  • Totale URL
  • Creato il
  • Formato Richiesto
  • Codice Paese
  • Parser Usato
Esempi di Flussi di Lavoro:
Trigger: Webhook - Ricevi Richiesta POSTAzione: Code - Format URLs
  • Converti CSV/elenco in formato array JSON
Azione: Olostep - Batch Scrape URLs
  • URL: {{$json.urlArray}}
  • Formato: JSON
  • Parser: @olostep/amazon-product
Azione: Webhook - POST
  • Invia ID batch al tuo sistema per il recupero
Trigger: Schedule - Ogni giorno alle 6 AMAzione: Google Sheets - Leggi Righe
  • Recupera URL da monitorare
Azione: Code - Format URLs
  • Converti in formato array batch
Azione: Olostep - Batch Scrape URLs
  • Elabora tutti gli URL contemporaneamente
Azione: Slack - Invia Messaggio
  • Notifica al team che lo scraping è completo

Create Crawl

Ottieni il contenuto delle sottopagine di un URL. Scopri e fai scraping autonomamente di interi siti web seguendo i link. Perfetto per siti di documentazione, blog e repository di contenuti. Casi d’Uso:
  • Crawl e archivia interi siti di documentazione
  • Estrai tutti i post di blog da un sito web
  • Crea basi di conoscenza da contenuti web
  • Monitora cambiamenti nella struttura del sito
Configurazione:
Start URL
string
obbligatorio
URL di partenza per il crawl (deve includere http:// o https://)
Maximum Pages
integer
predefinito:"10"
Numero massimo di pagine da fare crawling
Se seguire i link trovati sulle pagine
Output Format
dropdown
predefinito:"Markdown"
Formato per il contenuto estratto
Country Code
string
Codice paese opzionale per crawling specifico della località
Parser
string
ID parser opzionale per estrazione di contenuti specializzati
Campi di Output:
  • ID Crawl (usalo per recuperare i risultati in seguito)
  • Tipo di Oggetto
  • Stato
  • URL di Partenza
  • Pagine Massime
  • Segui Link
  • Timestamp Creato
  • Formati
Esempi di Flussi di Lavoro:
Trigger: Schedule - Mensile il 1° alle 12 AMAzione: Olostep - Create CrawlAzione: Webhook - POST
  • Invia ID crawl al tuo sistema di archiviazione
Azione: Slack - Invia Messaggio
  • Notifica al team che il crawl è in corso
Trigger: Schedule - Settimanale il lunedì alle 9 AMAzione: Olostep - Create Crawl
  • URL di Partenza: URL del blog del concorrente
  • Pagine Massime: 100
  • Formato: Markdown
Azione: Wait - Per 10 minuti
  • Attendi il completamento del crawl
Azione: Airtable - Crea Record
  • Archivia dati del crawl per analisi

Create Map

Ottieni tutti gli URL di un sito web. Estrai tutti gli URL da un sito web per la scoperta di contenuti e l’analisi della struttura del sito. Casi d’Uso:
  • Crea sitemap e diagrammi della struttura del sito
  • Scopri tutte le pagine prima di fare scraping in batch
  • Trova pagine rotte o mancanti
  • Audit e analisi SEO
Configurazione:
Website URL
string
obbligatorio
URL del sito web da cui estrarre i link (deve includere http:// o https://)
Search Query
string
Query di ricerca opzionale per filtrare gli URL (es. “blog”)
Top N URLs
integer
Limita il numero di URL restituiti
Include URL Patterns
string
Pattern glob per includere percorsi specifici (es. “/blog/**”)
Exclude URL Patterns
string
Pattern glob per escludere percorsi specifici (es. “/admin/**”)
Campi di Output:
  • ID Mappa
  • Tipo di Oggetto
  • URL del Sito Web
  • Totale URL Trovati
  • URL (array JSON)
  • Query di Ricerca
  • Limite Top N
Esempi di Flussi di Lavoro:
Trigger: Manuale (Pulsante)Azione: Olostep - Create MapAzione: Code - Extract URLs
  • Analizza URL dal risultato della mappa
Azione: Olostep - Batch Scrape URLs
  • URL: {{$json.urls}}
  • Formato: JSON
Azione: Google Sheets - Aggiungi Righe
  • Aggiungi tutti i dati dei prodotti al foglio di calcolo
Trigger: Schedule - MensileAzione: Olostep - Create Map
  • URL: Il tuo sito web
  • Top N: 1000
Azione: Airtable - Crea Record
  • Archivia tutti gli URL per il monitoraggio
Azione: Slack - Invia Messaggio
  • Riporta il totale delle pagine trovate

Esempi di Flussi di Lavoro Popolari

Monitoraggio Prezzi E-commerce

Monitora i prezzi dei concorrenti e ricevi avvisi istantanei:
Trigger: Schedule (Ogni ora)

Azione: Olostep - Scrape Website
  - URL: Pagina prodotto del concorrente
  - Formato: JSON
  - Parser: @olostep/amazon-product

Azione: IF - Controlla se il prezzo è cambiato

Azione: Slack - Invia Messaggio
  - Avviso: "Il prezzo è cambiato a $\{\{price\}\}"

Aggregazione di Contenuti

Aggrega contenuti da più fonti:
Trigger: Google Sheets - Nuova Riga

Azione: Olostep - Scrape Website
  - URL: \{\{$json.url\}\}
  - Formato: Markdown

Azione: OpenAI - Riassumi
  - Riassumi il contenuto

Azione: Airtable - Crea Record
  - Archivia l'articolo con il riassunto

Pipeline di Arricchimento Lead

Arricchisci i dati dei lead con informazioni web:
Trigger: HubSpot - Nuovo Contatto

Azione: Olostep - Scrape Website
  - URL: \{\{$json.companyWebsite\}\}
  - Formato: Markdown

Azione: OpenAI - Estrai Dati
  - Estrai: dimensioni azienda, settore, prodotti

Azione: HubSpot - Aggiorna Contatto
  - Aggiungi dati arricchiti al contatto

Automazione della Ricerca

Automatizza la ricerca da più fonti:
Trigger: Airtable - Nuovo Record

Azione: Olostep - Create Map
  - URL: Sito web target di ricerca
  - Include: /research/**

Azione: Code - Analizza URL

Azione: Olostep - Batch Scrape URLs
  - URL: \{\{$json.discoveredUrls\}\}
  - Formato: Markdown

Azione: Notion - Crea Pagine
  - Crea database di ricerca

Monitoraggio dei Social Media

Traccia menzioni e contenuti:
Trigger: Schedule (Ogni 6 ore)

Azione: Olostep - Scrape Website
  - URL: Pagina di ricerca del sito di notizie
  - Formato: HTML

Azione: Code - Estrai Menzioni
  - Trova menzioni del marchio

Azione: Google Sheets - Aggiungi Riga
  - Registra menzioni con timestamp

Flussi di Lavoro Multi-Step

Pipeline Completa di Scraping di Prodotti

Costruisci una pipeline completa di dati sui prodotti:
1

Scopri URL dei Prodotti

Usa Create Map per trovare tutte le pagine dei prodotti sul sito target
  • Include patterns: /products/**
  • Exclude patterns: /cart/**, /checkout/**
2

Elabora Prodotti in Batch

Usa Batch Scrape URLs per estrarre tutti i dati dei prodotti
  • Formato: JSON
  • Parser: Parser specifico per il prodotto se disponibile
3

Archivia nel Database

Invia ID batch al tuo sistema o attendi e recupera i risultati
  • Usa Airtable, Google Sheets o il tuo database
4

Monitora le Modifiche

Pianifica scraping giornalieri per monitorare cambiamenti di prezzo/disponibilità
  • Confronta con i dati esistenti
  • Avvisa su cambiamenti significativi

Strategia di Contenuti SEO

Analizza i concorrenti e pianifica i contenuti:
1

Mappa i Siti dei Concorrenti

Usa Create Map sui siti dei concorrenti
  • Estrai tutti i post di blog e le pagine di contenuti
2

Scrape Contenuti

Usa Batch Scrape URLs per ottenere il contenuto completo
  • Formato: Markdown per un’analisi facile
3

Analisi AI

Usa OpenAI per analizzare argomenti e parole chiave
  • Identifica lacune nei contenuti
  • Trova argomenti di tendenza
4

Crea Calendario dei Contenuti

Aggiungi approfondimenti a Notion o Airtable
  • Pianifica la tua strategia di contenuti

Parser Specializzati

Olostep fornisce parser pre-costruiti per siti web popolari. Usali con il campo Parser:

Amazon Product

@olostep/amazon-productEstrai: titolo, prezzo, valutazione, recensioni, immagini, varianti

Google Search

@olostep/google-searchEstrai: risultati di ricerca, titoli, frammenti, URL

Google Maps

@olostep/google-mapsEstrai: informazioni aziendali, recensioni, valutazioni, posizione

Extract Emails

@olostep/extract-emailsEstrai: email da pagine, elenchi di contatti e footer

Extract Socials

@olostep/extract-socialsEstrai: link ai profili social (X/Twitter, GitHub, ecc.)

Extract Calendars

@olostep/extract-calendarsEstrai: link a calendari (Google Calendar, ICS) dalle pagine

Uso dei Parser

Aggiungi semplicemente l’ID del parser al campo Parser. Due esempi:
Azione: Olostep - Scrape Website
  - URL: https://www.amazon.com/dp/PRODUCT_ID
  - Formato: JSON
  - Parser: @olostep/amazon-product
Azione: Olostep - Scrape Website
  - URL: https://example.com/contact
  - Formato: JSON
  - Parser: @olostep/extract-emails
Il parser estrae automaticamente dati strutturati specifici per il compito.

Integrazione con App Popolari

Google Sheets

Perfetto per la raccolta e il monitoraggio dei dati:
1. Olostep esegue lo scraping del sito web
2. Filtra o trasforma i dati
3. Google Sheets - Aggiungi Riga
Casi d’Uso:
  • Fogli di monitoraggio dei prezzi
  • Database di arricchimento lead
  • Inventario dei contenuti
  • Fogli di analisi della concorrenza

Airtable

Costruisci potenti database con dati estratti:
1. Olostep esegue lo scraping o il crawling
2. Code - Format dati
3. Airtable - Crea Record
Casi d’Uso:
  • Cataloghi di prodotti
  • Database di ricerca
  • Calendari dei contenuti
  • Database di link

Slack

Ricevi notifiche istantanee:
1. Olostep monitora la pagina
2. IF - Controlla per cambiamenti
3. Slack - Invia Messaggio
Casi d’Uso:
  • Avvisi di calo prezzi
  • Notifiche di aggiornamento contenuti
  • Monitoraggio errori
  • Digest giornalieri

HubSpot / Salesforce

Arricchisci automaticamente i dati CRM:
1. Nuovo contatto aggiunto
2. Olostep esegue lo scraping del sito aziendale
3. OpenAI estrae informazioni chiave
4. CRM - Aggiorna contatto
Casi d’Uso:
  • Arricchimento lead
  • Ricerca aziendale
  • Intelligenza competitiva
  • Mappatura degli account

Notion

Costruisci basi di conoscenza:
1. Olostep esegue il crawling della documentazione
2. Code - Analizza contenuti
3. Notion - Crea Pagine
Casi d’Uso:
  • Specchi di documentazione
  • Repository di ricerca
  • Librerie di contenuti
  • Wiki di team

Best Practices

Quando fai scraping di più di 3-5 URL, usa Batch Scrape URLs invece di più azioni Scrape Website. L’elaborazione in batch è:
  • Molto più veloce (elaborazione parallela)
  • Più conveniente
  • Più facile da gestire
  • Migliore per i limiti di velocità
Per i siti pesanti in JavaScript, usa il parametro “Wait Before Scraping”:
  • Siti semplici: 0-1000ms
  • Siti dinamici: 2000-3000ms
  • JavaScript pesante: 5000-8000ms
Prova con valori diversi per trovare il tempo di attesa ottimale.
Usa parser pre-costruiti (es. Amazon, Google e parser specifici per il compito dallo Store di Olostep come email, social, calendari):
  • Ottieni dati strutturati automaticamente
  • Estrazione più affidabile
  • Nessun bisogno di parsing personalizzato
  • Mantenuti da Olostep
Usa il nodo IF di n8n per evitare scraping non necessari:
  • Controlla se l’URL è cambiato
  • Verifica che i dati non siano stati già fatti scraping di recente
  • Applica logica aziendale prima di fare scraping
Questo risparmia crediti API e tempo di esecuzione.
Le operazioni Batch, Crawl e Map sono asincrone:
  • Memorizza l’ID restituito (batch_id, crawl_id, map_id)
  • Usa un nodo Wait se recuperi immediatamente
  • Considera callback webhook per il completamento
  • Imposta flussi di lavoro separati per il recupero
Scegli l’archiviazione giusta in base alle tue esigenze:
  • Google Sheets: Tracciamento semplice, collaborazione di team
  • Airtable: Dati relazionali, formattazione ricca
  • Database: Su larga scala, query complesse
  • Notion: Base di conoscenza, documentazione
Imposta il monitoraggio per i tuoi flussi di lavoro di scraping:
  • Usa flussi di lavoro di errore in n8n
  • Invia avvisi a Slack/Email in caso di fallimenti
  • Monitora l’uso dell’API nella dashboard di Olostep
  • Registra metriche importanti

Casi d’Uso Comuni per Settore

E-commerce

  • Monitoraggio Prezzi: Traccia i prezzi dei concorrenti in tempo reale
  • Ricerca Prodotti: Scopri prodotti di tendenza e lacune di mercato
  • Monitoraggio Inventario: Monitora la disponibilità di stock
  • Analisi Recensioni: Aggrega e analizza le recensioni dei clienti

Marketing & SEO

  • Scoperta di Contenuti: Trova opportunità di contenuti
  • Analisi della Concorrenza: Traccia le strategie dei concorrenti
  • Ricerca Backlink: Scopri opportunità di link
  • Ricerca Parole Chiave: Estrai dati sulle parole chiave dai risultati di ricerca

Vendite & Generazione Lead

  • Arricchimento Lead: Migliora i dati CRM con informazioni web
  • Ricerca Aziendale: Raccogli informazioni aziendali
  • Scoperta Contatti: Trova decisori
  • Intelligenza Competitiva: Traccia le mosse dei concorrenti

Ricerca & Analitica

  • Raccolta Dati: Raccogli dati da più fonti
  • Ricerca di Mercato: Traccia le tendenze del settore
  • Ricerca Accademica: Raccogli dati di ricerca
  • Intelligenza sui Prezzi: Analizza le strategie di prezzo

Media & Editoria

  • Aggregazione di Contenuti: Cura contenuti da più siti
  • Monitoraggio Notizie: Traccia notizie e menzioni
  • Social Media: Monitora le piattaforme social
  • Rilevamento Tendenze: Identifica argomenti di tendenza

Risoluzione dei Problemi

Errore: “Chiave API non valida”Soluzioni:
  • Controlla la chiave API dalla dashboard
  • Assicurati che non ci siano spazi extra nella chiave API
  • Ricrea la credenziale in n8n
  • Verifica che la chiave API sia attiva
Errore: I campi di contenuto sono vuotiSoluzioni:
  • Aumenta il tempo di “Wait Before Scraping”
  • Controlla se il sito richiede il login
  • Prova un formato diverso (HTML vs Markdown)
  • Verifica che l’URL sia accessibile
  • Controlla se il sito blocca l’accesso automatizzato
Errore: “Formato JSON non valido per l’array batch”Soluzioni:
  • Usa il formato: [{"url":"https://example.com","custom_id":"id1"}]
  • Assicurati della corretta sintassi JSON
  • Usa il nodo Code per formattare correttamente gli URL
  • Testa il JSON con un validatore online
Errore: “Limite di velocità superato”Soluzioni:
  • Distribuisci le esecuzioni dei flussi di lavoro con nodi Wait
  • Usa l’elaborazione in batch invece di scraping individuali
  • Aggiorna il tuo piano Olostep
  • Controlla il limite di velocità nella dashboard
Errore: URL specifici non vengono fatti scrapingSoluzioni:
  • Verifica il formato dell’URL (includi http:// o https://)
  • Controlla se l’URL richiede autenticazione
  • Testa l’URL prima nel browser
  • Prova con il parametro paese
  • Contatta il supporto per domini bloccati

Vantaggi di n8n

Self-Hosted

n8n è self-hosted, dandoti il controllo completo sui tuoi flussi di lavoro e dati. Nessun vincolo del fornitore, nessun dato che lascia la tua infrastruttura.

Nessun Limite di Task

A differenza delle piattaforme di automazione basate su cloud, n8n non impone limiti di task. Esegui quanti flussi di lavoro desideri senza costi aggiuntivi.

Open Source

n8n è open source, permettendoti di personalizzarlo ed estenderlo per adattarlo alle tue esigenze specifiche.

Conveniente

n8n self-hosted è gratuito, con hosting cloud opzionale disponibile. Paga solo per l’uso dell’API Olostep.

Prezzi

Olostep addebita in base all’uso dell’API, indipendentemente da n8n:
  • Scrapes: Paga per ogni scraping
  • Batches: Paga per ogni URL nel batch
  • Crawls: Paga per ogni pagina fatta crawling
  • Maps: Paga per ogni operazione mappa
Controlla i prezzi attuali su olostep.com/pricing. n8n: n8n self-hosted è gratuito. Hosting cloud disponibile con piani a pagamento opzionali.

Supporto

Hai bisogno di aiuto con l’integrazione n8n?

Risorse Correlate

Inizia Subito

Pronto per automatizzare i tuoi flussi di lavoro di ricerca web, scraping e crawling?

Installa il Nodo

Installa n8n-nodes-olostep e inizia a costruire flussi di lavoro automatizzati
Connetti Olostep con n8n e automatizza oggi stesso l’estrazione dei tuoi dati web!