Integrazione Olostep + Mastra

L’integrazione Olostep Mastra porta potenti capacità di estrazione dati web agli agenti di Mastra.ai. Olostep è un’API di ricerca, scraping e crawling web — un’API per cercare, estrarre e strutturare dati web. Crea agenti AI intelligenti che possono autonomamente cercare, fare scraping, analizzare e strutturare dati da qualsiasi sito web. Installa da npm →

Caratteristiche

L’integrazione fornisce 4 potenti API per l’estrazione automatizzata di dati web:

Scrape Website

Estrai contenuti da qualsiasi singolo URL in più formati (Markdown, HTML, JSON, testo)

Batch Scrape URLs

Elabora fino a 100.000 URL in parallelo. Perfetto per l’estrazione di dati su larga scala

Create Crawl

Scopri e fai scraping autonomamente di interi siti web seguendo i link

Create Map

Estrai tutti gli URL da un sito web per l’analisi della struttura del sito e la scoperta di contenuti

Installazione

npm install @olostep/mastra-tools

Configurazione

1. Installa il Pacchetto

npm install @olostep/mastra-tools @mastra/core

2. Importa e Registra l’Integrazione

Nel tuo file di configurazione Mastra:

import { Mastra } from '@mastra/core';
import { createOlostepIntegration } from '@olostep/mastra-tools';

// Crea l'integrazione Olostep
const olostep = createOlostepIntegration();

// Registra le API (questo le rende disponibili agli agenti)
olostep.registerApis();

// Aggiungi alla tua configurazione Mastra
export const mastra = new Mastra({
  config: {
    integrations: [olostep],
    // ... altra configurazione
  },
});

3. Configura la Chiave API

Imposta la tua chiave API Olostep come variabile d’ambiente:

export OLOSTEP_API_KEY=your-api-key-here

Oppure nel tuo file .env:

OLOSTEP_API_KEY=your-api-key-here

Ottieni la tua chiave API dalla Dashboard di Olostep.

API Disponibili

L’integrazione espone 4 API che i tuoi agenti Mastra possono utilizzare:

scrapeWebsite

Estrai contenuti da un singolo URL. Supporta più formati e rendering JavaScript. Casi d’Uso:

Monitora pagine specifiche per cambiamenti
Estrai informazioni sui prodotti da siti di e-commerce
Raccogli dati da articoli di notizie o post di blog
Recupera contenuti per aggregazione di contenuti

Parametri dello Schema:

apiKey

string

obbligatorio

La tua chiave API Olostep

url_to_scrape

string

obbligatorio

URL del sito web da fare scraping (deve includere http:// o https://)

formats

array

predefinito:"['markdown']"

Formati di output: [‘html’, ‘markdown’, ‘json’, ‘text’]

country

string

Codice del paese per contenuti specifici della località (es., “US”, “GB”, “CA”)

wait_before_scraping

number

Tempo di attesa in millisecondi per il rendering JavaScript (0-10000)

parser

string

ID parser opzionale per estrazione specializzata (es., “@olostep/amazon-product”)

Risposta:

id - ID dello scraping
url_to_scrape - URL fatto scraping
result.markdown_content - Contenuto in Markdown
result.html_content - Contenuto in HTML
result.json_content - Contenuto in JSON
result.text_content - Contenuto in testo
result.screenshot_hosted_url - URL dello screenshot (se disponibile)
result.markdown_hosted_url - URL del markdown ospitato
object - Tipo di oggetto (“scrape”)
created - Timestamp Unix

Esempio di Utilizzo:

// Nel tuo agente o workflow
const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'scrapeWebsite',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url_to_scrape: 'https://example.com',
      formats: ['markdown'],
      country: 'US',
    }
  }
});

batchScrape

Elabora più URL in parallelo (fino a 100.000 contemporaneamente). Perfetto per l’estrazione di dati su larga scala. Casi d’Uso:

Fai scraping di interi cataloghi di prodotti
Estrai dati da più risultati di ricerca
Elabora liste di URL da fogli di calcolo
Estrazione di contenuti in blocco

Parametri dello Schema:

apiKey

string

obbligatorio

La tua chiave API Olostep

batch_array

array

obbligatorio

Array di oggetti con campi url e custom_id opzionaleEsempio: [{"url":"https://example.com","custom_id":"site1"}]

formats

array

predefinito:"['markdown']"

Formati di output per tutti gli URL

country

string

Codice del paese per scraping specifico della località

wait_before_scraping

number

Tempo di attesa in millisecondi per il rendering JavaScript

parser

string

ID parser opzionale per estrazione specializzata

Risposta:

batch_id - ID del batch (usalo per recuperare i risultati in seguito)
status - Stato dell’elaborazione
object - Tipo di oggetto (“batch”)

Esempio di Utilizzo:

const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'batchScrape',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      batch_array: [
        { url: 'https://example.com', custom_id: 'site1' },
        { url: 'https://test.com', custom_id: 'site2' },
      ],
      formats: ['markdown'],
    }
  }
});

createCrawl

Scopri e fai scraping autonomamente di interi siti web seguendo i link. Perfetto per siti di documentazione, blog e repository di contenuti. Casi d’Uso:

Fai crawling e archivia interi siti di documentazione
Estrai tutti i post di blog da un sito web
Crea basi di conoscenza da contenuti web
Monitora i cambiamenti nella struttura del sito

Parametri dello Schema:

apiKey

string

obbligatorio

La tua chiave API Olostep

start_url

string

obbligatorio

URL di partenza per il crawl (deve includere http:// o https://)

max_pages

number

predefinito:"10"

Numero massimo di pagine da fare crawling

follow_links

boolean

predefinito:"true"

Se seguire i link trovati sulle pagine

formats

array

predefinito:"['markdown']"

Formato per il contenuto fatto scraping

country

string

Codice del paese opzionale per crawling specifico della località

parser

string

ID parser opzionale per estrazione di contenuti specializzati

Risposta:

id - ID del crawl (usalo per recuperare i risultati in seguito)
object - Tipo di oggetto (“crawl”)
status - Stato del crawl
created - Timestamp Unix

Esempio di Utilizzo:

const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'createCrawl',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      start_url: 'https://docs.example.com',
      max_pages: 50,
      follow_links: true,
      formats: ['markdown'],
    }
  }
});

createMap

Estrai tutti gli URL da un sito web per la scoperta di contenuti e l’analisi della struttura del sito. Casi d’Uso:

Crea mappe del sito e diagrammi della struttura del sito
Scopri tutte le pagine prima di fare batch scraping
Trova pagine rotte o mancanti
Audit e analisi SEO

Parametri dello Schema:

apiKey

string

obbligatorio

La tua chiave API Olostep

url

string

obbligatorio

URL del sito web da cui estrarre i link (deve includere http:// o https://)

search_query

string

Query di ricerca opzionale per filtrare gli URL (es., “blog”)

top_n

number

Limita il numero di URL restituiti

include_urls

array

Pattern glob per includere percorsi specifici (es., [“/blog/**”])

exclude_urls

array

Pattern glob per escludere percorsi specifici (es., [“/admin/**”])

Risposta:

id - ID della mappa
object - Tipo di oggetto (“map”)
url - URL del sito web
total_urls - Totale degli URL trovati
urls - Array di URL scoperti

Esempio di Utilizzo:

const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'createMap',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url: 'https://example.com',
      search_query: 'blog',
      top_n: 100,
      include_urls: ['/blog/**'],
    }
  }
});

Utilizzo con Agenti

Esempio di Agente Base

Crea un agente che può fare scraping di siti web:

import { Agent } from '@mastra/core';
import { createOlostepIntegration } from '@olostep/mastra-tools';

const olostep = createOlostepIntegration();
olostep.registerApis();

const agent = new Agent({
  name: 'web-researcher',
  instructions: `
    Sei un assistente di ricerca web. Quando gli utenti ti chiedono di ottenere informazioni da un sito web,
    usa l'API Olostep scrapeWebsite per estrarre il contenuto, quindi riassumilo per loro.
  `,
  model: 'openai/gpt-4',
});

// L'agente può ora utilizzare le API Olostep attraverso il sistema API di Mastra

Esempio di Workflow dell’Agente

Costruisci un workflow di ricerca che scopre e fa scraping di contenuti:

// 1. Mappa un sito web per scoprire gli URL
const mapResult = await mastra.callApi({
  integrationName: 'olostep',
  api: 'createMap',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url: 'https://example.com',
      include_urls: ['/blog/**'],
    }
  }
});

// 2. Fai batch scraping degli URL scoperti
const batchResult = await mastra.callApi({
  integrationName: 'olostep',
  api: 'batchScrape',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      batch_array: mapResult.urls.slice(0, 10).map(url => ({ url })),
      formats: ['markdown'],
    }
  }
});

// 3. Elabora i risultati con il tuo agente
const summary = await agent.generate({
  messages: [{
    role: 'user',
    content: `Riassumi questo contenuto: ${batchResult.result.markdown_content}`
  }]
});

Casi d’Uso Popolari

Agente di Ricerca

Crea un agente che ricerca autonomamente argomenti:

Ricerca Multi-Sorgente

Workflow:

L’utente chiede: “Ricerca tendenze AI”
L’agente usa createMap per scoprire pagine rilevanti
L’agente usa batchScrape per estrarre contenuti
L’agente analizza e riassume i risultati
Restituisce un report di ricerca strutturato

Monitoraggio della Concorrenza

Workflow:

Pianifica il monitoraggio giornaliero
Usa scrapeWebsite per controllare le pagine dei concorrenti
Confronta con i dati precedenti
Allerta sui cambiamenti significativi
Genera report settimanali

Aggregazione di Contenuti

Workflow:

Usa createCrawl per scoprire tutti i post del blog
Usa batchScrape per estrarre contenuti
Elabora con AI per estrarre argomenti chiave
Archivia nella base di conoscenza
Genera un calendario dei contenuti

Intelligenza E-commerce

Monitora prodotti e prezzi:

Workflow dell'Agente:
Fai scraping delle pagine dei prodotti (scrapeWebsite)
Estrai dati strutturati (con parser)
Traccia i cambiamenti di prezzo
Genera allerta
Aggiorna il database

Analisi SEO

Analizza la struttura e i contenuti del sito web:

Workflow dell'Agente:
Mappa la struttura del sito (createMap)
Fai crawling delle sezioni importanti (createCrawl)
Analizza la qualità dei contenuti
Identifica opportunità SEO
Genera raccomandazioni

Parser Specializzati

Olostep fornisce parser pre-costruiti per siti web popolari. Usali con il parametro parser:

Google Search

@olostep/google-searchEstrai: risultati di ricerca, titoli, snippet, URL

Google Maps

@olostep/google-mapsEstrai: informazioni aziendali, recensioni, valutazioni, posizione

Utilizzo dei Parser

Aggiungi l’ID del parser al parametro parser:

const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'scrapeWebsite',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url_to_scrape: 'https://www.amazon.com/dp/PRODUCT_ID',
      formats: ['json'],
      parser: '@olostep/amazon-product',
    }
  }
});

Il parser estrae automaticamente dati strutturati specifici per quel tipo di sito web.

Migliori Pratiche

Usa l'Elaborazione in Batch per Più URL

Quando fai scraping di più di 3-5 URL, usa batchScrape invece di più chiamate scrapeWebsite. L’elaborazione in batch è:

Molto più veloce (elaborazione parallela)
Più conveniente
Più facile da gestire
Migliore per i limiti di velocità

Imposta Tempi di Attesa Appropriati

Per siti pesanti in JavaScript, usa il parametro wait_before_scraping:

Siti semplici: 0-1000ms
Siti dinamici: 2000-3000ms
JavaScript pesante: 5000-8000ms

Testa con diversi valori per trovare il tempo di attesa ottimale.

Usa Parser Specializzati

Per siti web popolari (Amazon, LinkedIn, Google), usa parser pre-costruiti:

Ottieni dati strutturati automaticamente
Estrazione più affidabile
Nessun bisogno di parsing personalizzato
Mantenuto da Olostep

Gestisci Operazioni Asincrone

Le operazioni Batch, Crawl e Map sono asincrone:

Memorizza l’ID restituito (batch_id, crawl_id, map_id)
Poll per il completamento o usa webhook
Imposta workflow separati per il recupero

Gestione degli Errori

Avvolgi sempre le chiamate API in blocchi try-catch:

try {
  const result = await mastra.callApi({
    integrationName: 'olostep',
    api: 'scrapeWebsite',
    payload: { data: {...} }
  });
} catch (error) {
  // Gestisci errori di autenticazione, limiti di velocità o di rete
  console.error('Scraping fallito:', error.message);
}

Limitazione della Velocità

Fai attenzione ai limiti di velocità:

Spazia le richieste con ritardi
Usa l’elaborazione in batch quando possibile
Monitora l’uso nella dashboard di Olostep
Aggiorna il piano se necessario

Esempio Completo

Ecco un esempio completo di costruzione di un agente di ricerca:

import { Mastra } from '@mastra/core';
import { Agent } from '@mastra/core';
import { createOlostepIntegration } from '@olostep/mastra-tools';

// Crea e registra l'integrazione Olostep
const olostep = createOlostepIntegration();
olostep.registerApis();

// Inizializza Mastra
export const mastra = new Mastra({
  config: {
    integrations: [olostep],
    // ... altra configurazione
  },
});

// Crea agente di ricerca
const researchAgent = new Agent({
  name: 'research-assistant',
  instructions: `
    Sei un assistente di ricerca che può cercare, estrarre e strutturare dati web.
    Quando gli utenti ti chiedono di ricercare un argomento:
    1. Usa createMap di Olostep per scoprire pagine rilevanti
    2. Usa batchScrape per estrarre contenuti da più fonti
    3. Analizza e riassumi i risultati
    4. Presenta report di ricerca strutturati
  `,
  model: 'openai/gpt-4',
});

// Usa l'agente
async function researchTopic(topic: string) {
  // Step 1: Scopri pagine rilevanti
  const mapResult = await mastra.callApi({
    integrationName: 'olostep',
    api: 'createMap',
    payload: {
      data: {
        apiKey: process.env.OLOSTEP_API_KEY!,
        url: `https://example.com/search?q=${topic}`,
        top_n: 20,
      }
    }
  });

  // Step 2: Fai scraping delle pagine scoperte
  const batchResult = await mastra.callApi({
    integrationName: 'olostep',
    api: 'batchScrape',
    payload: {
      data: {
        apiKey: process.env.OLOSTEP_API_KEY!,
        batch_array: mapResult.urls.slice(0, 10).map(url => ({ url })),
        formats: ['markdown'],
      }
    }
  });

  // Step 3: Analizza con l'agente
  const summary = await researchAgent.generate({
    messages: [{
      role: 'user',
      content: `Basandoti su questi dati di ricerca, fornisci un riassunto completo di ${topic}`
    }]
  });

  return summary;
}

Risoluzione dei Problemi

Autenticazione Fallita

Errore: “Chiave API non valida”Soluzioni:

Controlla la chiave API dalla dashboard
Assicurati che la chiave API sia impostata nella variabile d’ambiente
Verifica che la chiave API sia attiva
Controlla spazi extra nella chiave API

API Non Trovata

Errore: “API non trovata” o “Integrazione non registrata”Soluzioni:

Assicurati che registerApis() sia chiamato dopo la creazione dell’integrazione
Verifica che l’integrazione sia aggiunta alla configurazione Mastra
Controlla che il nome dell’integrazione sia ‘olostep’
Riavvia il server Mastra dopo le modifiche

Scrape Restituisce Contenuto Vuoto

Errore: I campi di contenuto sono vuotiSoluzioni:

Aumenta il tempo wait_before_scraping
Controlla se il sito richiede il login
Prova un formato diverso (HTML vs Markdown)
Verifica che l’URL sia accessibile
Controlla se il sito blocca l’accesso automatizzato

Limite di Velocità Superato

Errore: “Limite di velocità superato”Soluzioni:

Spazia le richieste con ritardi
Usa l’elaborazione in batch invece di scraping individuali
Aggiorna il tuo piano Olostep
Controlla il limite di velocità nella dashboard

Errori di TypeScript

Errore: Modulo non trovato o errori di tipoSoluzioni:

Assicurati che @mastra/core sia installato
Controlla la compatibilità della versione di TypeScript
Verifica che tutte le dipendenze siano installate
Ricostruisci: npm run build

Prezzi

Olostep addebita in base all’uso dell’API, indipendentemente da Mastra:

Scrapes: Paghi per ogni scraping
Batches: Paghi per URL nel batch
Crawls: Paghi per pagina fatta crawling
Maps: Paghi per ogni operazione di mappa

Controlla i prezzi attuali su olostep.com/pricing.

Supporto

Hai bisogno di aiuto con l’integrazione Mastra?

Documentazione

Sfoglia la documentazione completa dell’API

Email di Supporto

Email: info@olostep.com

Documenti Mastra

Scopri il framework Mastra

Risorse Correlate

Scrapes API

Scopri l’endpoint Scrapes

Batches API

Scopri l’endpoint Batches

Crawls API

Scopri l’endpoint Crawls

Maps API

Scopri l’endpoint Maps

Integrazione Zapier

Automatizza con i workflow di Zapier

Integrazione LangChain

Crea agenti AI con LangChain

Sito Web Mastra

Piattaforma Mastra

Inizia Subito

Pronto a costruire agenti AI con capacità di web scraping?

Installa il Pacchetto

Installa @olostep/mastra-tools da npm

Crea agenti AI intelligenti che possono cercare, estrarre e strutturare dati web con Olostep e Mastra!

Inizia

Funzionalità

Integrazioni

Documentation Index

​Caratteristiche

Scrape Website

Batch Scrape URLs

Create Crawl

Create Map

​Installazione

​Configurazione

​1. Installa il Pacchetto

​2. Importa e Registra l’Integrazione

​3. Configura la Chiave API

​API Disponibili

​scrapeWebsite

​batchScrape

​createCrawl

​createMap

​Utilizzo con Agenti

​Esempio di Agente Base

​Esempio di Workflow dell’Agente

​Casi d’Uso Popolari

​Agente di Ricerca

​Intelligenza E-commerce

​Analisi SEO

​Parser Specializzati

Google Search

Google Maps

​Utilizzo dei Parser

​Migliori Pratiche

​Esempio Completo

​Risoluzione dei Problemi

​Prezzi

​Supporto

Documentazione

Email di Supporto

Documenti Mastra

​Risorse Correlate

Scrapes API

Batches API

Crawls API

Maps API

Integrazione Zapier

Integrazione LangChain

Sito Web Mastra

​Inizia Subito

Installa il Pacchetto

Caratteristiche

Installazione

Configurazione

1. Installa il Pacchetto

2. Importa e Registra l’Integrazione

3. Configura la Chiave API

API Disponibili

scrapeWebsite

batchScrape

createCrawl

createMap

Utilizzo con Agenti

Esempio di Agente Base

Esempio di Workflow dell’Agente

Casi d’Uso Popolari

Agente di Ricerca

Intelligenza E-commerce

Analisi SEO

Parser Specializzati

Utilizzo dei Parser

Migliori Pratiche

Esempio Completo

Risoluzione dei Problemi

Prezzi

Supporto

Risorse Correlate

Inizia Subito