Cosa puoi costruire
Scrape Sito Web
Estrai contenuti da qualsiasi URL singolo in Markdown, HTML, JSON o Testo
Scraping di URL in Batch
Elabora grandi liste di URL in parallelo con output strutturati
Crea Crawl
Scopri e fai scraping delle pagine collegate per costruire dataset completi
Crea Mappa
Estrai tutti gli URL da un sito web (scoperta simile a una sitemap)
Risposte AI
Fai domande e ottieni risposte JSON strutturate con fonti
Inizio rapido
1) Installa Apify CLI
2) Ottieni la tua chiave API di Olostep
Dal Dashboard di Olostep → Chiavi API.3) Esegui l’Attore Olostep localmente
olostep-tools/integrations/apify/storage/key_value_stores/default/INPUT.json
Esempio di input:
4) Distribuisci su Apify (cloud)
Esegui in Apify Console (passo dopo passo)
- Apri il tuo Attore in Apify Console → Sorgente → Input.
- Nella scheda Manuale vedrai un campo visibile “Chiave API Olostep”. Incolla la tua chiave dal Dashboard di Olostep.
- Scegli un’operazione (predefinita “scrape”).
- Compila i campi rilevanti (per “scrape”, imposta “URL da Scrape”).
- Clicca Salva → Avvia.
- Quando l’esecuzione termina, apri la scheda Dataset per scaricare i risultati (JSON/CSV/Excel).
- Per “URL da Scrape”, puoi incollare con o senza schema. Se mancante, l’attore premette automaticamente
https://. - Se un sito è pesante in JavaScript e vedi un timeout, imposta “Attendi Prima di Scrape” a 2000–5000 ms e esegui di nuovo.
Operazioni disponibili
Scrape Sito Web
Estrai contenuti da un singolo URL. Ottimo per l’automazione a livello di pagina.Deve essere “scrape”
La tua chiave API di Olostep (Bearer)
L’URL da scrape (deve includere http:// o https://)
Uno di: Markdown, HTML, JSON, Testo
Codice paese opzionale (es., “US”, “GB”, “CA”)
Tempo di attesa opzionale in ms per il rendering JavaScript (0–10000)
ID parser opzionale (es., “@olostep/amazon-product”)
- id, url, status, formats
- markdown_content / html_content / json_content / text_content
- URL ospitati (se disponibili), metadati della pagina
Scraping di URL in Batch
Elabora molti URL contemporaneamente con formattazione e struttura coerenti.Deve essere “batch”
La tua chiave API di Olostep
Array JSON di oggetti con
Esempio:
url e custom_id opzionaleEsempio:
[{"url":"https://example.com","custom_id":"site1"}]Uno di: Markdown, HTML, JSON, Testo
Codice paese opzionale
Tempo di attesa opzionale in ms per siti JS
ID parser opzionale
- batch_id, status, total_urls, created_at, formats, country, parser, urls[]
Crea Crawl
Segui i link e fai scraping di più pagine da un URL di partenza.Deve essere “crawl”
La tua chiave API di Olostep
URL di partenza per il crawl
Pagine massime da crawlare
Segui i link sulla pagina
Uno di: Markdown, HTML, JSON, Testo
Codice paese opzionale
ID parser opzionale
- crawl_id, object, status, start_url, max_pages, follow_links, created, formats
Crea Mappa
Scopri tutti gli URL su un sito web e preparati per lo scraping batch successivo.Deve essere “map”
La tua chiave API di Olostep
Il sito web da mappare
Filtro query opzionale
Limita il numero di URL
Includi glob, es. “/products/**”
Escludi glob, es. “/admin/**”
- map_id, object, website_url, total_urls, urls[], search_query, top_n
Esempi di JSON da copiare e incollare (Console → Input → JSON)
Scrape
Batch
Crawl
Mappa
Risposte
Esempi di flussi di lavoro
Scopri e Fai Scraping di Prodotti
Scopri e Fai Scraping di Prodotti
- Crea Mappa → include “/products/**”
- Analizza URL → costruisci array batch
- Scraping di URL in Batch → formati: JSON
- Invia a Google Sheets / Airtable
Monitoraggio Contenuti Quotidiano
Monitoraggio Contenuti Quotidiano
- Pianifica attore (giornaliero)
- Scrape Sito Web → formati: Markdown
- Riassumi con LLM
- Notifica su Slack
Base di Conoscenza dei Competitor
Base di Conoscenza dei Competitor
- Crea Crawl (blog/docs)
- Memorizza output in Notion
- Aggiorna settimanalmente con Pianificazione
Parser specializzati
Olostep supporta parser per strutturare dati per siti popolari.Prodotto Amazon
@olostep/amazon-product → titolo, prezzo, valutazione, recensioni, immagini, variantiRicerca Google
@olostep/google-search → risultati, titoli, snippet, URLGoogle Maps
@olostep/google-maps → informazioni aziendali, recensioni, valutazioni, posizioneAltri Parser
Esplora estrattori di email, cercatori di handle sociali, estrattori di link di calendario e altro
Best practices
Preferisci batch per 3+ URL
Preferisci batch per 3+ URL
Più veloce, economico, facile da monitorare e rispettare i limiti di velocità.
Usa tempi di attesa appropriati
Usa tempi di attesa appropriati
Siti pesanti in JS: aumenta
wait_before_scraping (es., 2000–5000ms).Filtra prima di fare scraping
Filtra prima di fare scraping
Evita compiti non necessari — controlla i cambiamenti prima, mantieni lo stato di deduplicazione.
Memorizza grandi contenuti tramite URL ospitati
Memorizza grandi contenuti tramite URL ospitati
Usa output ospitati per bypassare i limiti di dimensione del payload nei flussi Apify.
Tratta le operazioni asincrone come a lungo termine
Tratta le operazioni asincrone come a lungo termine
Batch/Crawl/Map restituiscono ID; recuperali più tardi o concatenali con un ritardo.
Gestisci i timeout transitori in modo pulito
Gestisci i timeout transitori in modo pulito
Se vedi un 504 o un timeout transitorio, l’attore ritenta automaticamente una volta con un breve tempo di attesa.
Puoi anche impostare “Attendi Prima di Scrape” a 2000–5000 ms per pagine pesanti in JS.
Puoi anche impostare “Attendi Prima di Scrape” a 2000–5000 ms per pagine pesanti in JS.
Risoluzione dei problemi
Autenticazione fallita
Autenticazione fallita
- Controlla la chiave API dal dashboard
- Rimuovi spazi finali
- Reinserisci nel modulo di input di Apify
Contenuto vuoto
Contenuto vuoto
- Aumenta il tempo di attesa
- Verifica che l’URL sia pubblico / non protetto da login
- Prova un formato di output diverso
Limite di velocità superato
Limite di velocità superato
- Distribuisci le esecuzioni tramite pianificazione
- Preferisci batch per molti URL
- Aggiorna il piano Olostep se necessario
Siti bloccati o dinamici
Siti bloccati o dinamici
- Prova il parametro paese
- Regola attesa e parser
- Contatta il supporto per assistenza
Prezzi
Olostep addebita in base all’uso dell’API (indipendentemente da Apify):- Scrapes → per scrape
- Batches → per URL
- Crawls → per pagina
- Maps → per operazione
https://olostep.com/pricing.
Sicurezza
- La tua chiave API viene inviata come token Bearer a runtime.
- Non commettere chiavi nel controllo versione; Apify memorizza gli input nel Key-Value Store.
- Nello sviluppo locale, conserva le chiavi in
storage/key_value_stores/default/INPUT.json(gitignored).
Risorse correlate
API Scrapes
Estrai Markdown, HTML, testo o JSON strutturato compatibile con LLM da qualsiasi URL.
API Batches
Elabora fino a 10k URL contemporaneamente e recupera i risultati successivamente.
API Crawls
Scopri e fai scraping ricorsivamente del contenuto di un sito.
API Maps
Ottieni tutti gli URL su un sito web per preparare scraping batch.