Cosa puoi costruire
Scrape Sito Web
Estrai contenuti da qualsiasi URL singolo in Markdown, HTML, JSON o Testo
Scrape URL in Batch
Elabora grandi liste di URL in parallelo con output strutturati
Crea Crawl
Scopri e fai scraping delle pagine collegate per costruire dataset completi
Crea Mappa
Estrai tutti gli URL da un sito web (scoperta simile a una sitemap)
Risposte con AI
Fai domande e ottieni risposte strutturate in JSON con fonti
Inizio rapido
1) Installa Apify CLI
2) Ottieni la tua chiave API di Olostep
Dal Dashboard di Olostep → Chiavi API.3) Esegui l’Attore Olostep localmente
olostep-tools/integrations/apify/storage/key_value_stores/default/INPUT.json
Esempio di input:
4) Distribuisci su Apify (cloud)
Esegui in Apify Console (passo dopo passo)
- Apri il tuo Attore in Apify Console → Sorgente → Input.
- Nella scheda Manuale vedrai un campo visibile “Chiave API Olostep”. Incolla la tua chiave dal Dashboard di Olostep.
- Scegli un’operazione (predefinito “scrape”).
- Compila i campi pertinenti (per “scrape”, imposta “URL da Scrape”).
- Clicca Salva → Avvia.
- Quando l’esecuzione termina, apri la scheda Dataset per scaricare i risultati (JSON/CSV/Excel).
- Per “URL da Scrape”, puoi incollare con o senza schema. Se manca, l’attore predispone automaticamente
https://. - Se un sito è pesante in JavaScript e vedi un timeout, imposta “Attendi Prima di Scrape” a 2000–5000 ms e riprova.
Operazioni disponibili
Scrape Sito Web
Estrai contenuti da un singolo URL. Ottimo per l’automazione a livello di pagina.Deve essere “scrape”
La tua chiave API di Olostep (Bearer)
L’URL da scrape (deve includere http:// o https://)
Uno di: Markdown, HTML, JSON, Testo
Codice paese opzionale (es., “US”, “GB”, “CA”)
Tempo di attesa opzionale in ms per il rendering JavaScript (0–10000)
ID parser opzionale (es., “@olostep/amazon-product”)
- id, url, status, formats
- markdown_content / html_content / json_content / text_content
- URL ospitati (se disponibili), metadati della pagina
Scrape URL in Batch
Elabora molti URL contemporaneamente con formattazione e struttura coerenti.Deve essere “batch”
La tua chiave API di Olostep
Array JSON di oggetti con
Esempio:
url e custom_id opzionaleEsempio:
[{"url":"https://example.com","custom_id":"site1"}]Uno di: Markdown, HTML, JSON, Testo
Codice paese opzionale
Tempo di attesa opzionale in ms per siti JS
ID parser opzionale
- batch_id, status, total_urls, created_at, formats, country, parser, urls[]
Crea Crawl
Segui i link e fai scraping di più pagine da un URL di partenza.Deve essere “crawl”
La tua chiave API di Olostep
URL di partenza per il crawl
Pagine massime da crawlare
Segui i link sulla pagina
Uno di: Markdown, HTML, JSON, Testo
Codice paese opzionale
ID parser opzionale
- crawl_id, object, status, start_url, max_pages, follow_links, created, formats
Crea Mappa
Scopri tutti gli URL su un sito web e preparati per scraping in batch successivi.Deve essere “map”
La tua chiave API di Olostep
Il sito web da mappare
Filtro query opzionale
Limita il numero di URL
Includi glob(s), es. “/products/**”
Escludi glob(s), es. “/admin/**”
- map_id, object, website_url, total_urls, urls[], search_query, top_n
Esempi JSON da copiare e incollare (Console → Input → JSON)
Scrape
Batch
Crawl
Mappa
Risposte
Esempi di flussi di lavoro
Scopri e Fai Scraping di Prodotti
Scopri e Fai Scraping di Prodotti
- Crea Mappa → include “/products/**”
- Analizza URL → costruisci array batch
- Scrape URL in Batch → formati: JSON
- Invia a Google Sheets / Airtable
Monitoraggio Contenuti Giornaliero
Monitoraggio Contenuti Giornaliero
- Pianifica attore (giornalmente)
- Scrape Sito Web → formati: Markdown
- Riassumi con LLM
- Notifica su Slack
Base di Conoscenza dei Competitor
Base di Conoscenza dei Competitor
- Crea Crawl (blog/docs)
- Memorizza output in Notion
- Aggiorna settimanalmente con Pianificazione
Parser specializzati
Olostep supporta parser per strutturare dati per siti popolari.Prodotto Amazon
@olostep/amazon-product → titolo, prezzo, valutazione, recensioni, immagini, variantiRicerca Google
@olostep/google-search → risultati, titoli, frammenti, URLGoogle Maps
@olostep/google-maps → info azienda, recensioni, valutazioni, posizioneAltri Parser
Esplora estrattori di email, cercatori di handle social, estrattori di link di calendario e altro
Best practices
Preferisci batch per 3+ URL
Preferisci batch per 3+ URL
Più veloce, economico, facile da monitorare e rispettare i limiti di velocità.
Usa tempi di attesa appropriati
Usa tempi di attesa appropriati
Siti pesanti in JS: aumenta
wait_before_scraping (es., 2000–5000ms).Filtra prima di fare scraping
Filtra prima di fare scraping
Evita compiti non necessari — controlla prima i cambiamenti, mantieni lo stato di deduplicazione.
Memorizza grandi contenuti tramite URL ospitati
Memorizza grandi contenuti tramite URL ospitati
Usa output ospitati per aggirare i limiti di dimensione del payload nei flussi Apify.
Tratta le operazioni asincrone come a lungo termine
Tratta le operazioni asincrone come a lungo termine
Batch/Crawl/Map restituiscono ID; recuperali più tardi o concatenali con un ritardo.
Gestisci i timeout transitori in modo pulito
Gestisci i timeout transitori in modo pulito
Se vedi un 504 o un timeout transitorio, l’attore riprova automaticamente una volta con un breve tempo di attesa.
Puoi anche impostare “Attendi Prima di Scrape” a 2000–5000 ms per pagine pesanti in JS.
Puoi anche impostare “Attendi Prima di Scrape” a 2000–5000 ms per pagine pesanti in JS.
Risoluzione dei problemi
Autenticazione fallita
Autenticazione fallita
- Controlla la chiave API dal dashboard
- Rimuovi spazi finali
- Reinserisci nel modulo di input di Apify
Contenuto vuoto
Contenuto vuoto
- Aumenta il tempo di attesa
- Verifica che l’URL sia pubblico / non protetto da login
- Prova un formato di output diverso
Limite di velocità superato
Limite di velocità superato
- Distribuisci le esecuzioni tramite pianificazione
- Preferisci batch per molti URL
- Aggiorna il piano Olostep se necessario
Siti bloccati o dinamici
Siti bloccati o dinamici
- Prova il parametro paese
- Regola attesa e parser
- Contatta il supporto per assistenza
Prezzi
Olostep addebita in base all’uso dell’API (indipendente da Apify):- Scrapes → per scrape
- Batches → per URL
- Crawls → per pagina
- Maps → per operazione
https://olostep.com/pricing.
Sicurezza
- La tua chiave API viene inviata come token Bearer a runtime.
- Non commettere chiavi nel controllo di versione; Apify memorizza gli input nel Key‑Value Store.
- Nello sviluppo locale, conserva le chiavi in
storage/key_value_stores/default/INPUT.json(gitignorato).
Risorse correlate
API Scrapes
Estrai Markdown, HTML, testo o JSON strutturato adatto a LLM da qualsiasi URL.
API Batches
Elabora fino a 10k URL contemporaneamente e recupera i risultati in seguito.
API Crawls
Scopri e fai scraping ricorsivamente del contenuto di un sito.
API Maps
Ottieni tutti gli URL su un sito web per preparare scraping in batch.
Supporto
Sito Web Apify
Piattaforma Apify
Documentazione Apify
Documentazione piattaforma & SDK Apify
Documentazione
Documentazione completa API