Naar hoofdinhoud gaan

Documentation Index

Fetch the complete documentation index at: https://docs.olostep.com/llms.txt

Use this file to discover all available pages before exploring further.

De Olostep Mastra-integratie brengt krachtige webdata-extractiemogelijkheden naar Mastra.ai-agenten. Olostep is een Webzoek-, scraping- en crawling-API — een API om webdata te zoeken, te extraheren en te structureren. Bouw intelligente AI-agenten die autonoom data van elke website kunnen zoeken, scrapen, analyseren en structureren. Installeer vanaf npm →

Functies

De integratie biedt 4 krachtige API’s voor geautomatiseerde webdata-extractie:

Scrape Website

Extraheer inhoud van elke enkele URL in meerdere formaten (Markdown, HTML, JSON, tekst)

Batch Scrape URLs

Verwerk tot 100.000 URL’s parallel. Perfect voor grootschalige data-extractie

Create Crawl

Ontdek en scrape autonoom volledige websites door links te volgen

Create Map

Extraheer alle URL’s van een website voor site-structuuranalyse en inhoudsontdekking

Installatie

npm install @olostep/mastra-tools

Setup

1. Installeer het Pakket

npm install @olostep/mastra-tools @mastra/core

2. Importeer en Registreer Integratie

In je Mastra-configuratiebestand:
import { Mastra } from '@mastra/core';
import { createOlostepIntegration } from '@olostep/mastra-tools';

// Creëer de Olostep-integratie
const olostep = createOlostepIntegration();

// Registreer API's (dit maakt ze beschikbaar voor agenten)
olostep.registerApis();

// Voeg toe aan je Mastra-configuratie
export const mastra = new Mastra({
  config: {
    integrations: [olostep],
    // ... andere configuratie
  },
});

3. Configureer API-sleutel

Stel je Olostep API-sleutel in als een omgevingsvariabele:
export OLOSTEP_API_KEY=your-api-key-here
Of in je .env bestand:
OLOSTEP_API_KEY=your-api-key-here
Verkrijg je API-sleutel van het Olostep Dashboard.

Beschikbare API’s

De integratie stelt 4 API’s bloot die je Mastra-agenten kunnen gebruiken:

scrapeWebsite

Extraheer inhoud van een enkele URL. Ondersteunt meerdere formaten en JavaScript-rendering. Gebruiksscenario’s:
  • Monitor specifieke pagina’s op wijzigingen
  • Extraheer productinformatie van e-commercesites
  • Verzamel data van nieuwsartikelen of blogposts
  • Haal inhoud op voor contentaggregatie
Schema Parameters:
apiKey
string
vereist
Je Olostep API-sleutel
url_to_scrape
string
vereist
Website-URL om te scrapen (moet http:// of https:// bevatten)
formats
array
standaard:"['markdown']"
Uitvoerformaten: [‘html’, ‘markdown’, ‘json’, ‘text’]
country
string
Landcode voor locatie-specifieke inhoud (bijv. “US”, “GB”, “CA”)
wait_before_scraping
number
Wachttijd in milliseconden voor JavaScript-rendering (0-10000)
parser
string
Optionele parser-ID voor gespecialiseerde extractie (bijv. “@olostep/amazon-product”)
Antwoord:
  • id - Scrape ID
  • url_to_scrape - Gescrapete URL
  • result.markdown_content - Markdown-inhoud
  • result.html_content - HTML-inhoud
  • result.json_content - JSON-inhoud
  • result.text_content - Tekstinhoud
  • result.screenshot_hosted_url - Screenshot-URL (indien beschikbaar)
  • result.markdown_hosted_url - Gehoste markdown-URL
  • object - Objecttype (“scrape”)
  • created - Unix-timestamp
Voorbeeld Gebruik:
// In je agent of workflow
const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'scrapeWebsite',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url_to_scrape: 'https://example.com',
      formats: ['markdown'],
      country: 'US',
    }
  }
});

batchScrape

Verwerk meerdere URL’s parallel (tot 100.000 tegelijk). Perfect voor grootschalige data-extractie. Gebruiksscenario’s:
  • Scrape volledige productcatalogi
  • Extraheer data van meerdere zoekresultaten
  • Verwerk lijsten van URL’s uit spreadsheets
  • Bulk contentextractie
Schema Parameters:
apiKey
string
vereist
Je Olostep API-sleutel
batch_array
array
vereist
Array van objecten met url en optionele custom_id veldenVoorbeeld: [{"url":"https://example.com","custom_id":"site1"}]
formats
array
standaard:"['markdown']"
Uitvoerformaten voor alle URL’s
country
string
Landcode voor locatie-specifieke scraping
wait_before_scraping
number
Wachttijd in milliseconden voor JavaScript-rendering
parser
string
Optionele parser-ID voor gespecialiseerde extractie
Antwoord:
  • batch_id - Batch ID (gebruik dit om later resultaten op te halen)
  • status - Verwerkingsstatus
  • object - Objecttype (“batch”)
Voorbeeld Gebruik:
const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'batchScrape',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      batch_array: [
        { url: 'https://example.com', custom_id: 'site1' },
        { url: 'https://test.com', custom_id: 'site2' },
      ],
      formats: ['markdown'],
    }
  }
});

createCrawl

Ontdek en scrape autonoom volledige websites door links te volgen. Perfect voor documentatiesites, blogs en inhoudsrepositories. Gebruiksscenario’s:
  • Crawl en archiveer volledige documentatiesites
  • Extraheer alle blogposts van een website
  • Bouw kennisbanken van webinhoud
  • Monitor wijzigingen in de websitestructuur
Schema Parameters:
apiKey
string
vereist
Je Olostep API-sleutel
start_url
string
vereist
Start-URL voor de crawl (moet http:// of https:// bevatten)
max_pages
number
standaard:"10"
Maximum aantal pagina’s om te crawlen
Of links op pagina’s moeten worden gevolgd
formats
array
standaard:"['markdown']"
Formaat voor gescrapete inhoud
country
string
Optionele landcode voor locatie-specifieke crawling
parser
string
Optionele parser-ID voor gespecialiseerde inhoudsextractie
Antwoord:
  • id - Crawl ID (gebruik dit om later resultaten op te halen)
  • object - Objecttype (“crawl”)
  • status - Crawlstatus
  • created - Unix-timestamp
Voorbeeld Gebruik:
const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'createCrawl',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      start_url: 'https://docs.example.com',
      max_pages: 50,
      follow_links: true,
      formats: ['markdown'],
    }
  }
});

createMap

Extraheer alle URL’s van een website voor inhoudsontdekking en site-structuuranalyse. Gebruiksscenario’s:
  • Bouw sitemaps en site-structuurdiagrammen
  • Ontdek alle pagina’s voordat je batch scraping uitvoert
  • Vind gebroken of ontbrekende pagina’s
  • SEO-audits en analyse
Schema Parameters:
apiKey
string
vereist
Je Olostep API-sleutel
url
string
vereist
Website-URL om links uit te extraheren (moet http:// of https:// bevatten)
search_query
string
Optionele zoekopdracht om URL’s te filteren (bijv. “blog”)
top_n
number
Beperk het aantal geretourneerde URL’s
include_urls
array
Glob-patronen om specifieke paden op te nemen (bijv. [“/blog/**”])
exclude_urls
array
Glob-patronen om specifieke paden uit te sluiten (bijv. [“/admin/**”])
Antwoord:
  • id - Map ID
  • object - Objecttype (“map”)
  • url - Website-URL
  • total_urls - Totaal aantal gevonden URL’s
  • urls - Array van ontdekte URL’s
Voorbeeld Gebruik:
const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'createMap',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url: 'https://example.com',
      search_query: 'blog',
      top_n: 100,
      include_urls: ['/blog/**'],
    }
  }
});

Gebruik met Agenten

Basis Agent Voorbeeld

Creëer een agent die websites kan scrapen:
import { Agent } from '@mastra/core';
import { createOlostepIntegration } from '@olostep/mastra-tools';

const olostep = createOlostepIntegration();
olostep.registerApis();

const agent = new Agent({
  name: 'web-researcher',
  instructions: `
    Je bent een webonderzoeksassistent. Wanneer gebruikers je vragen om informatie van een website te halen,
    gebruik je de Olostep scrapeWebsite API om de inhoud te extraheren en deze vervolgens voor hen samen te vatten.
  `,
  model: 'openai/gpt-4',
});

// De agent kan nu Olostep API's gebruiken via Mastra's API-systeem

Agent Workflow Voorbeeld

Bouw een onderzoeksworkflow die inhoud ontdekt en scrapt:
// 1. Map een website om URL's te ontdekken
const mapResult = await mastra.callApi({
  integrationName: 'olostep',
  api: 'createMap',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url: 'https://example.com',
      include_urls: ['/blog/**'],
    }
  }
});

// 2. Batch scrape ontdekte URL's
const batchResult = await mastra.callApi({
  integrationName: 'olostep',
  api: 'batchScrape',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      batch_array: mapResult.urls.slice(0, 10).map(url => ({ url })),
      formats: ['markdown'],
    }
  }
});

// 3. Verwerk resultaten met je agent
const summary = await agent.generate({
  messages: [{
    role: 'user',
    content: `Vat deze inhoud samen: ${batchResult.result.markdown_content}`
  }]
});

Populaire Gebruiksscenario’s

Onderzoeksagent

Bouw een agent die autonoom onderwerpen onderzoekt:
Workflow:
  1. Gebruiker vraagt: “Onderzoek AI-trends”
  2. Agent gebruikt createMap om relevante pagina’s te ontdekken
  3. Agent gebruikt batchScrape om inhoud te extraheren
  4. Agent analyseert en vat bevindingen samen
  5. Geeft gestructureerd onderzoeksrapport terug
Workflow:
  1. Plan dagelijkse monitoring
  2. Gebruik scrapeWebsite om concurrentiepagina’s te controleren
  3. Vergelijk met eerdere data
  4. Waarschuw bij significante veranderingen
  5. Genereer wekelijkse rapporten
Workflow:
  1. Gebruik createCrawl om alle blogposts te ontdekken
  2. Gebruik batchScrape om inhoud te extraheren
  3. Verwerk met AI om belangrijke onderwerpen te extraheren
  4. Sla op in kennisbank
  5. Genereer contentkalender

E-commerce Intelligence

Monitor producten en prijzen:
Agent Workflow:
1. Scrape productpagina's (scrapeWebsite)
2. Extraheer gestructureerde data (met parser)
3. Volg prijsveranderingen
4. Genereer waarschuwingen
5. Update database

SEO Analyse

Analyseer websitestructuur en inhoud:
Agent Workflow:
1. Map websitestructuur (createMap)
2. Crawl belangrijke secties (createCrawl)
3. Analyseer inhoudskwaliteit
4. Identificeer SEO-kansen
5. Genereer aanbevelingen

Gespecialiseerde Parsers

Olostep biedt vooraf gebouwde parsers voor populaire websites. Gebruik ze met de parser parameter:

Google Search

@olostep/google-searchExtraheer: zoekresultaten, titels, fragmenten, URL’s

Google Maps

@olostep/google-mapsExtraheer: bedrijfsinformatie, beoordelingen, beoordelingen, locatie

Parsers Gebruiken

Voeg de parser-ID toe aan de parser parameter:
const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'scrapeWebsite',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url_to_scrape: 'https://www.amazon.com/dp/PRODUCT_ID',
      formats: ['json'],
      parser: '@olostep/amazon-product',
    }
  }
});
De parser extraheert automatisch gestructureerde data specifiek voor dat type website.

Best Practices

Wanneer je meer dan 3-5 URL’s scrapt, gebruik batchScrape in plaats van meerdere scrapeWebsite oproepen. Batchverwerking is:
  • Veel sneller (parallelle verwerking)
  • Kosteneffectiever
  • Makkelijker te beheren
  • Beter voor snelheidslimieten
Voor JavaScript-intensieve sites, gebruik de wait_before_scraping parameter:
  • Eenvoudige sites: 0-1000ms
  • Dynamische sites: 2000-3000ms
  • Zware JavaScript: 5000-8000ms
Test met verschillende waarden om de optimale wachttijd te vinden.
Voor populaire websites (Amazon, LinkedIn, Google), gebruik vooraf gebouwde parsers:
  • Krijg automatisch gestructureerde data
  • Betrouwbaardere extractie
  • Geen behoefte aan aangepaste parsing
  • Onderhouden door Olostep
Batch-, Crawl- en Map-operaties zijn asynchroon:
  • Bewaar de geretourneerde ID (batch_id, crawl_id, map_id)
  • Poll voor voltooiing of gebruik webhooks
  • Stel aparte workflows in voor ophalen
Omhul altijd API-oproepen in try-catch blokken:
try {
  const result = await mastra.callApi({
    integrationName: 'olostep',
    api: 'scrapeWebsite',
    payload: { data: {...} }
  });
} catch (error) {
  // Behandel authenticatie-, snelheidslimiet- of netwerkfouten
  console.error('Scraping mislukt:', error.message);
}
Wees bewust van snelheidslimieten:
  • Spreid verzoeken met vertragingen
  • Gebruik batchverwerking indien mogelijk
  • Monitor gebruik in Olostep dashboard
  • Upgrade plan indien nodig

Volledig Voorbeeld

Hier is een volledig voorbeeld van het bouwen van een onderzoeksagent:
import { Mastra } from '@mastra/core';
import { Agent } from '@mastra/core';
import { createOlostepIntegration } from '@olostep/mastra-tools';

// Creëer en registreer Olostep-integratie
const olostep = createOlostepIntegration();
olostep.registerApis();

// Initialiseer Mastra
export const mastra = new Mastra({
  config: {
    integrations: [olostep],
    // ... andere configuratie
  },
});

// Creëer onderzoeksagent
const researchAgent = new Agent({
  name: 'research-assistant',
  instructions: `
    Je bent een onderzoeksassistent die webdata kan zoeken, extraheren en structureren.
    Wanneer gebruikers je vragen om een onderwerp te onderzoeken:
    1. Gebruik Olostep's createMap om relevante pagina's te ontdekken
    2. Gebruik batchScrape om inhoud van meerdere bronnen te extraheren
    3. Analyseer en vat de bevindingen samen
    4. Presenteer gestructureerde onderzoeksrapporten
  `,
  model: 'openai/gpt-4',
});

// Gebruik de agent
async function researchTopic(topic: string) {
  // Stap 1: Ontdek relevante pagina's
  const mapResult = await mastra.callApi({
    integrationName: 'olostep',
    api: 'createMap',
    payload: {
      data: {
        apiKey: process.env.OLOSTEP_API_KEY!,
        url: `https://example.com/search?q=${topic}`,
        top_n: 20,
      }
    }
  });

  // Stap 2: Scrape ontdekte pagina's
  const batchResult = await mastra.callApi({
    integrationName: 'olostep',
    api: 'batchScrape',
    payload: {
      data: {
        apiKey: process.env.OLOSTEP_API_KEY!,
        batch_array: mapResult.urls.slice(0, 10).map(url => ({ url })),
        formats: ['markdown'],
      }
    }
  });

  // Stap 3: Analyseer met agent
  const summary = await researchAgent.generate({
    messages: [{
      role: 'user',
      content: `Op basis van deze onderzoeksdata, geef een uitgebreide samenvatting van ${topic}`
    }]
  });

  return summary;
}

Problemen Oplossen

Fout: “Ongeldige API-sleutel”Oplossingen:
  • Controleer API-sleutel van dashboard
  • Zorg ervoor dat API-sleutel is ingesteld in omgevingsvariabele
  • Verifieer dat API-sleutel actief is
  • Controleer op extra spaties in API-sleutel
Fout: “API niet gevonden” of “Integratie niet geregistreerd”Oplossingen:
  • Zorg ervoor dat registerApis() wordt aangeroepen na het maken van integratie
  • Verifieer dat integratie is toegevoegd aan Mastra-configuratie
  • Controleer of integratienaam ‘olostep’ is
  • Herstart Mastra-server na wijzigingen
Fout: Inhoudsvelden zijn leegOplossingen:
  • Verhoog wait_before_scraping tijd
  • Controleer of website login vereist
  • Probeer ander formaat (HTML vs Markdown)
  • Verifieer of URL toegankelijk is
  • Controleer of site geautomatiseerde toegang blokkeert
Fout: “Snelheidslimiet overschreden”Oplossingen:
  • Spreid verzoeken met vertragingen
  • Gebruik batchverwerking in plaats van individuele scrapes
  • Upgrade je Olostep-plan
  • Controleer snelheidslimiet in dashboard
Fout: Module niet gevonden of typefoutenOplossingen:
  • Zorg ervoor dat @mastra/core is geïnstalleerd
  • Controleer TypeScript-versiecompatibiliteit
  • Verifieer dat alle afhankelijkheden zijn geïnstalleerd
  • Herbouw: npm run build

Prijzen

Olostep rekent kosten op basis van API-gebruik, onafhankelijk van Mastra:
  • Scrapes: Betalen per scrape
  • Batches: Betalen per URL in batch
  • Crawls: Betalen per gecrawlde pagina
  • Maps: Betalen per map-operatie
Bekijk de huidige prijzen op olostep.com/pricing.

Ondersteuning

Hulp nodig met de Mastra-integratie?

Documentatie

Blader door volledige API-documentatie

Ondersteuning Email

Mastra Docs

Leer over het Mastra-framework

Gerelateerde Bronnen

Scrapes API

Leer over de Scrapes endpoint

Batches API

Leer over de Batches endpoint

Crawls API

Leer over de Crawls endpoint

Maps API

Leer over de Maps endpoint

Zapier Integratie

Automatiseer met Zapier-workflows

LangChain Integratie

Bouw AI-agenten met LangChain

Mastra Website

Mastra platform

Aan de Slag

Klaar om AI-agenten te bouwen met web scraping-mogelijkheden?

Installeer Pakket

Installeer @olostep/mastra-tools vanaf npm
Bouw intelligente AI-agenten die webdata kunnen zoeken, extraheren en structureren met Olostep en Mastra!