Cosa puoi costruire
Scrape Website
Estrai contenuti da qualsiasi singolo URL in Markdown, HTML, JSON o Testo
Batch Scrape URLs
Processa grandi liste di URL in parallelo con output strutturati
Create Crawl
Scopri e fai scraping delle pagine collegate per costruire dataset completi
Create Map
Estrai tutti gli URL da un sito web (scoperta tipo sitemap)
AI-powered Answers
Fai domande e ottieni risposte strutturate in JSON con fonti
Inizio rapido
1) Installa Apify CLI
2) Ottieni la tua chiave API di Olostep
Dal Dashboard di Olostep → Chiavi API.3) Esegui l’Attore Olostep localmente
olostep-tools/integrations/apify/storage/key_value_stores/default/INPUT.json
Esempio di input:
4) Distribuisci su Apify (cloud)
Esegui nella Console di Apify (passo dopo passo)
- Apri il tuo Attore nella Console di Apify → Sorgente → Input.
- Nella scheda Manuale vedrai un campo visibile “Olostep API Key”. Incolla la tua chiave dal Dashboard di Olostep.
- Scegli un’operazione (predefinito “scrape”).
- Compila i campi pertinenti (per “scrape”, imposta “URL to Scrape”).
- Clicca Salva → Avvia.
- Quando l’esecuzione termina, apri la scheda Dataset per scaricare i risultati (JSON/CSV/Excel).
- Per “URL to Scrape”, puoi incollare con o senza schema. Se manca, l’attore premette automaticamente
https://. - Se un sito è pesante in JavaScript e vedi un timeout, imposta “Wait Before Scraping” a 2000–5000 ms e riprova.
Operazioni disponibili
Scrape Website
Estrai contenuti da un singolo URL. Ottimo per l’automazione a livello di pagina.Deve essere “scrape”
La tua chiave API di Olostep (Bearer)
L’URL da fare scraping (deve includere http:// o https://)
Uno di: Markdown, HTML, JSON, Testo
Codice paese opzionale (es., “US”, “GB”, “CA”)
Tempo di attesa opzionale in ms per il rendering JavaScript (0–10000)
ID parser opzionale (es., “@olostep/amazon-product”)
- id, url, status, formats
- markdown_content / html_content / json_content / text_content
- URL ospitati (se disponibili), metadati della pagina
Batch Scrape URLs
Processa molti URL contemporaneamente con formattazione e struttura coerenti.Deve essere “batch”
La tua chiave API di Olostep
Array JSON di oggetti con
Esempio:
url e custom_id opzionaleEsempio:
[{"url":"https://example.com","custom_id":"site1"}]Uno di: Markdown, HTML, JSON, Testo
Codice paese opzionale
Tempo di attesa opzionale in ms per siti JS
ID parser opzionale
- batch_id, status, total_urls, created_at, formats, country, parser, urls[]
Create Crawl
Segui i link e fai scraping di più pagine da un URL iniziale.Deve essere “crawl”
La tua chiave API di Olostep
URL iniziale per il crawl
Pagine massime da fare crawling. Imposta a
1 per fare scraping solo dell’URL iniziale.Uno di: Markdown, HTML, JSON, Testo
Codice paese opzionale
ID parser opzionale
- crawl_id, object, status, start_url, max_pages, created, formats
Create Map
Scopri tutti gli URL su un sito web e preparati per uno scraping batch successivo.Deve essere “map”
La tua chiave API di Olostep
Il sito web da mappare
Filtro query opzionale
Limita il numero di URL
Includi glob(s), es. “/products/**”
Escludi glob(s), es. “/admin/**”
- map_id, object, website_url, total_urls, urls[], search_query, top_n
Esempi JSON da copiare e incollare (Console → Input → JSON)
Scrape
Batch
Crawl
Map
Answers
Esempi di flussi di lavoro
Scopri e fai scraping dei prodotti
Scopri e fai scraping dei prodotti
- Crea Mappa → includi “/products/**”
- Analizza URL → costruisci array batch
- Batch Scrape URLs → formati: JSON
- Invia a Google Sheets / Airtable
Monitoraggio contenuti giornaliero
Monitoraggio contenuti giornaliero
- Pianifica attore (giornaliero)
- Scrape Website → formati: Markdown
- Riassumi con LLM
- Notifica su Slack
Base di conoscenza dei concorrenti
Base di conoscenza dei concorrenti
- Crea Crawl (blog/docs)
- Memorizza output in Notion
- Aggiorna settimanalmente con Pianificazione
Parser specializzati
Olostep supporta parser per strutturare dati per siti popolari.Prodotto Amazon
@olostep/amazon-product → titolo, prezzo, valutazione, recensioni, immagini, variantiRicerca Google
@olostep/google-search → risultati, titoli, frammenti, URLGoogle Maps
@olostep/google-maps → informazioni aziendali, recensioni, valutazioni, posizioneAltri Parser
Esplora estrattori di email, trovatori di handle social, estrattori di link di calendario e altro
Migliori pratiche
Preferisci batch per 3+ URL
Preferisci batch per 3+ URL
Più veloce, economico, più facile da monitorare e rispettare i limiti di velocità.
Usa tempi di attesa appropriati
Usa tempi di attesa appropriati
Siti pesanti in JS: aumenta
wait_before_scraping (es., 2000–5000ms).Filtra prima dello scraping
Filtra prima dello scraping
Evita compiti non necessari — controlla prima i cambiamenti, mantieni lo stato di deduplicazione.
Memorizza grandi contenuti tramite URL ospitati
Memorizza grandi contenuti tramite URL ospitati
Usa output ospitati per superare i limiti di dimensione del payload nei flussi Apify.
Tratta le operazioni asincrone come a lungo termine
Tratta le operazioni asincrone come a lungo termine
Batch/Crawl/Map restituiscono ID; recuperali più tardi o concatenali con un ritardo.
Gestisci i timeout transitori in modo pulito
Gestisci i timeout transitori in modo pulito
Se vedi un 504 o un timeout transitorio, l’attore riprova automaticamente una volta con un breve tempo di attesa.
Puoi anche impostare “Wait Before Scraping” a 2000–5000 ms per pagine pesanti in JS.
Puoi anche impostare “Wait Before Scraping” a 2000–5000 ms per pagine pesanti in JS.
Risoluzione dei problemi
Autenticazione fallita
Autenticazione fallita
- Controlla la chiave API dal dashboard
- Rimuovi spazi finali
- Reinserisci nel modulo di input Apify
Contenuto vuoto
Contenuto vuoto
- Aumenta il tempo di attesa
- Verifica che l’URL sia pubblico / non bloccato da login
- Prova un formato di output diverso
Limite di velocità superato
Limite di velocità superato
- Distribuisci le esecuzioni tramite pianificazione
- Preferisci batch per molti URL
- Aggiorna il piano Olostep se necessario
Siti bloccati o dinamici
Siti bloccati o dinamici
- Prova il parametro paese
- Regola attesa e parser
- Contatta il supporto per assistenza
Prezzi
Olostep addebita in base all’uso dell’API (indipendente da Apify):- Scrapes → per scraping
- Batches → per URL
- Crawls → per pagina
- Maps → per operazione
https://www.olostep.com/pricing.
Sicurezza
- La tua chiave API viene inviata come token Bearer a runtime.
- Non commettere chiavi nel controllo versione; Apify memorizza gli input nel Key-Value Store.
- Nello sviluppo locale, mantieni le chiavi in
storage/key_value_stores/default/INPUT.json(gitignored).
Risorse correlate
Scrapes API
Estrai Markdown, HTML, testo o JSON strutturato compatibile con LLM da qualsiasi URL.
Batches API
Processa fino a 10k URL contemporaneamente e recupera i risultati più tardi.
Crawls API
Scopri e fai scraping ricorsivamente del contenuto di un sito.
Maps API
Ottieni tutti gli URL su un sito web per preparare scraping batch.
Supporto
Sito Web Apify
Piattaforma Apify
Documentazione Apify
Documentazione piattaforma & SDK Apify
Documentazione
Documentazione completa API