Vai al contenuto principale
Il nodo verificato Olostep Web Scraper ti offre sei operazioni all’interno del builder visivo di n8n: eseguire lo scraping di un URL, cercare sul web, ottenere risposte AI, eseguire lo scraping in batch di migliaia di URL, eseguire un crawl di un sito o mappare tutti i suoi link. Visualizza su n8n →

Prima di iniziare

  • Un account Olostep con una chiave API: ottienine uno gratuito, non è richiesta la carta di credito. I tuoi primi 500 crediti sono inclusi.
  • n8n in esecuzione: sia n8n Cloud che un’istanza self-hosted. I nodi della comunità devono essere abilitati (lo sono per impostazione predefinita nella maggior parte delle configurazioni).
  • Non è richiesto codice: tutto in questa guida viene fatto tramite l’editor visivo di n8n.

Configurazione

1

Cerca il nodo Olostep

Apri qualsiasi workflow, clicca su + e cerca Olostep. Seleziona Olostep Web Scraper dai risultati.Cerca Olostep nel selettore di nodi di n8n
2

Installa il nodo

Clicca sul risultato per aprire il pannello dei dettagli del nodo, quindi clicca su Installa nodo. n8n installerà n8n-nodes-olostep e ti chiederà di riavviare. Fai questo prima di continuare.Dettagli del nodo Olostep Web Scraper con pulsante Installa nodo
Se Nodi della Comunità è disabilitato per il tuo workspace, un amministratore deve abilitarlo prima. Vedi la guida ai nodi della comunità di n8n.
3

Aggiungi la tua chiave API

Apri il nodo Olostep nel tuo workflow, clicca su Configura Credenziali (nella scheda Parametri), aggiungi la tua chiave API e clicca su Salva.Modulo credenziali Olostep in n8n con campo Chiave APIOttieni la tua chiave dalla dashboard di Olostep →
4

Collegalo ed esegui

Collega il nodo Olostep a un trigger e a qualsiasi passaggio a valle, quindi esegui il tuo workflow.Canvas del workflow n8n con Schedule Trigger collegato al nodo Olostep

Azioni

Scrape Website

Estrai contenuti da qualsiasi URL come Markdown, HTML, JSON o testo semplice. Gestisce pagine renderizzate in JS con tempi di attesa opzionali e targeting per paese.

Search

Esegui una ricerca sul web e ottieni risultati strutturati (titoli, URL e snippet) come JSON.

Answers (AI)

Fai una domanda in linguaggio naturale e ottieni una risposta con fonti citate. Utile prima dei nodi LLM quando hai bisogno di risposte fondate.

Batch Scrape URLs

Invia fino a 10.000 URL in un unico lavoro, elaborati in parallelo. Restituisce un batch_id; recupera i risultati in modo asincrono.

Create Crawl

Parti da un URL, segui i link ed esegui lo scraping di tutte le sottopagine. Ideale per siti di documentazione, blog o ingestione completa del sito. Restituisce un crawl_id.

Create Map

Ottieni ogni URL su un sito senza eseguire lo scraping dei contenuti. Usalo per la scoperta prima di un lavoro in batch. Restituisce un map_id.
Batch, Crawl e Map sono asincroni. Memorizza l’ID restituito e usa un nodo Wait o un secondo workflow per recuperare i risultati una volta completata l’elaborazione.

Esempio di workflow: Arricchimento dei lead da Google Sheets

Cosa fa: Quando incolli un URL di un’azienda in un foglio di Google, questo workflow esegue automaticamente lo scraping del sito web dell’azienda, estrae informazioni chiave con un nodo AI e scrive i risultati nella stessa riga, trasformando un foglio di calcolo vuoto in un database di lead completo. Nodi usati: Trigger Google Sheets → Olostep Scrape Website → OpenAI → Code → Aggiornamento Google Sheets Workflow di arricchimento dei lead in n8n: trigger Google Sheets collegato ai nodi Olostep, OpenAI, Code e aggiornamento Google Sheets

Step 1: Configura il tuo Google Sheet

Crea un foglio con queste colonne: Company URL, Industry, Description, Company Size, Enriched. Il workflow legge da Company URL e compila il resto.

Step 2: Aggiungi un trigger Google Sheets

In n8n, aggiungi un nodo trigger Google Sheets. Imposta l’evento su Row Added, puntalo al tuo foglio e impostalo per monitorare la colonna Company URL. Ora ogni volta che incolli un nuovo URL nel foglio, questo workflow si attiva.

Step 3: Aggiungi Olostep Scrape Website

Collega un nodo Olostep Web Scraper dopo il trigger. Imposta:
  • Action: Scrape Website
  • URL: {{ $json["Company URL"] }} (estrae l’URL dalla nuova riga)
  • Output Format: Markdown
Markdown funziona meglio qui perché elimina navigazione, annunci e boilerplate. Il nodo AI nel passaggio successivo ottiene un testo pulito sull’azienda invece di rumore HTML grezzo.

Step 4: Aggiungi un nodo OpenAI

Collega un nodo OpenAI. Imposta il modello su gpt-4o-mini (veloce ed economico per compiti di estrazione) e usa questo prompt:
Sei un ricercatore di vendite. Basandoti sul contenuto del sito web dell'azienda qui sotto, estrai:
1. Settore (una frase, es. "B2B SaaS", "E-commerce", "Healthcare")
2. Descrizione dell'azienda in una frase (max 20 parole)
3. Dimensione stimata dell'azienda (Startup / SMB / Mid-market / Enterprise)

Ritorna solo un oggetto JSON con chiavi: industry, description, company_size.

Contenuto del sito web:
{{ $json.markdownContent }}
Il campo markdownContent è ciò che Olostep restituisce dallo scraping, come testo semplice pulito.

Step 5: Analizza la risposta AI e scrivi indietro

Aggiungi un nodo Code per analizzare il JSON da OpenAI:
const parsed = JSON.parse($input.first().json.message.content);
return [{ json: parsed }];
Quindi collega un nodo Google Sheets impostato su Update Row. Mappa le colonne:
  • Industry{{ $json.industry }}
  • Description{{ $json.description }}
  • Company Size{{ $json.company_size }}
  • EnrichedYes

Cosa ottieni

Incolla un URL come https://notion.so nel tuo foglio e in circa 10 secondi la riga si riempie:
Company URLIndustryDescriptionCompany SizeEnriched
https://notion.soProductivity SaaSAll-in-one workspace for notes, docs, and databasesMid-marketYes
Da qui puoi estendere questo workflow: aggiungi una notifica Slack quando l’arricchimento è completato, filtra per settore prima di scrivere indietro, o sostituisci Google Sheets con HubSpot per aggiornare i contatti direttamente.

Template

Workflow n8n pronti da importare costruiti con Olostep:

Crawl docs → AI knowledge base

Esegui il crawl dei siti di documentazione con Olostep e struttura l’output in una knowledge base pronta per l’AI.

Google Maps leads → decision-maker enrichment

Esegui lo scraping dei lead aziendali da Google Maps e arricchiscili con dettagli sui decisori.

Mine user complaints → insight report

Analizza i reclami con Olostep + Gemini e genera report di approfondimento strutturati in Google Docs.

Amazon product extraction → Google Sheets

Estrai URL e metadati dei prodotti Amazon con Olostep, quindi sincronizza i risultati su Sheets.
Esplora tutti i workflow Olostep su n8n.io →

Parser

Aggiungi un ID parser al campo Parser su qualsiasi azione Scrape o Batch per ottenere dati strutturati invece di contenuti grezzi:
ParserEstrae
@olostep/amazon-productTitolo, prezzo, valutazione, recensioni, immagini, varianti
@olostep/google-searchTitoli dei risultati, URL, snippet
@olostep/google-mapsNome azienda, indirizzo, valutazione, recensioni
@olostep/extract-emailsIndirizzi email da qualsiasi pagina
@olostep/extract-socialsLink ai profili social (X, GitHub, LinkedIn, ecc.)
@olostep/extract-calendarsLink a Google Calendar e ICS
Vedi l’elenco completo nel negozio di parser Olostep →

Risoluzione dei problemi

Copia la chiave direttamente da olostep.com/dashboard senza spazi finali. Elimina e ricrea la credenziale in n8n se l’errore persiste.
Aumenta Wait Before Scraping (prova 2000–5000ms per pagine pesanti in JS). Conferma che l’URL sia pubblicamente accessibile senza login. Se un dominio specifico fallisce costantemente, contatta info@olostep.com.
Il campo URLs to Scrape si aspetta un array JSON:
[
  { "url": "https://example.com/page-1", "custom_id": "p1" },
  { "url": "https://example.com/page-2", "custom_id": "p2" }
]
Usa un nodo Code a monte per costruire questo array dai tuoi dati se necessario.
Aggiungi un nodo Wait tra i passaggi di scraping, o passa a Batch Scrape URLs invece di eseguire scraping singoli in loop. Controlla l’uso corrente nella dashboard.
Su n8n Cloud, i nodi della comunità devono essere abilitati da un proprietario del workspace. Su self-hosted, assicurati che N8N_COMMUNITY_PACKAGES_ENABLED=true sia impostato nel tuo ambiente. Vedi la guida all’installazione di n8n.

Correlati

Scrapes API

Riferimento completo per l’endpoint di scraping

Batches API

Come funzionano i lavori batch e come recuperare i risultati

Crawls API

Configurazione del crawl e recupero dei risultati

Maps API

Scoperta degli URL e opzioni di filtraggio

Inizia

Pronto per automatizzare le tue ricerche web, scraping e workflow di crawling?

Sito Web n8n

Piattaforma n8n

Installa il Nodo

Installa n8n-nodes-olostep e inizia a costruire workflow automatizzati
Connetti Olostep con n8n e automatizza oggi stesso l’estrazione dei tuoi dati web!