Functies
De integratie biedt 4 krachtige API’s voor geautomatiseerde webdata-extractie:Scrape Website
Extraheer inhoud van elke enkele URL in meerdere formaten (Markdown, HTML, JSON, tekst)
Batch Scrape URLs
Verwerk tot 100.000 URL’s parallel. Perfect voor grootschalige data-extractie
Create Crawl
Ontdek en scrape autonoom volledige websites door links te volgen
Create Map
Extraheer alle URL’s van een website voor site-structuuranalyse en inhoudsontdekking
Installatie
Setup
1. Installeer het Pakket
2. Importeer en Registreer Integratie
In je Mastra-configuratiebestand:3. Configureer API-sleutel
Stel je Olostep API-sleutel in als een omgevingsvariabele:.env bestand:
Beschikbare API’s
De integratie stelt 4 API’s bloot die je Mastra-agenten kunnen gebruiken:scrapeWebsite
Extraheer inhoud van een enkele URL. Ondersteunt meerdere formaten en JavaScript-rendering. Gebruiksscenario’s:- Monitor specifieke pagina’s op wijzigingen
- Extraheer productinformatie van e-commercesites
- Verzamel data van nieuwsartikelen of blogposts
- Haal inhoud op voor contentaggregatie
Je Olostep API-sleutel
Website-URL om te scrapen (moet http:// of https:// bevatten)
Uitvoerformaten: [‘html’, ‘markdown’, ‘json’, ‘text’]
Landcode voor locatie-specifieke inhoud (bijv. “US”, “GB”, “CA”)
Wachttijd in milliseconden voor JavaScript-rendering (0-10000)
Optionele parser-ID voor gespecialiseerde extractie (bijv. “@olostep/amazon-product”)
id- Scrape IDurl_to_scrape- Gescrapete URLresult.markdown_content- Markdown-inhoudresult.html_content- HTML-inhoudresult.json_content- JSON-inhoudresult.text_content- Tekstinhoudresult.screenshot_hosted_url- Screenshot-URL (indien beschikbaar)result.markdown_hosted_url- Gehoste markdown-URLobject- Objecttype (“scrape”)created- Unix-timestamp
batchScrape
Verwerk meerdere URL’s parallel (tot 100.000 tegelijk). Perfect voor grootschalige data-extractie. Gebruiksscenario’s:- Scrape volledige productcatalogi
- Extraheer data van meerdere zoekresultaten
- Verwerk lijsten van URL’s uit spreadsheets
- Bulk contentextractie
Je Olostep API-sleutel
Array van objecten met
url en optionele custom_id veldenVoorbeeld: [{"url":"https://example.com","custom_id":"site1"}]Uitvoerformaten voor alle URL’s
Landcode voor locatie-specifieke scraping
Wachttijd in milliseconden voor JavaScript-rendering
Optionele parser-ID voor gespecialiseerde extractie
batch_id- Batch ID (gebruik dit om later resultaten op te halen)status- Verwerkingsstatusobject- Objecttype (“batch”)
createCrawl
Ontdek en scrape autonoom volledige websites door links te volgen. Perfect voor documentatiesites, blogs en inhoudsrepositories. Gebruiksscenario’s:- Crawl en archiveer volledige documentatiesites
- Extraheer alle blogposts van een website
- Bouw kennisbanken van webinhoud
- Monitor wijzigingen in de websitestructuur
Je Olostep API-sleutel
Start-URL voor de crawl (moet http:// of https:// bevatten)
Maximum aantal pagina’s om te crawlen
Of links op pagina’s moeten worden gevolgd
Formaat voor gescrapete inhoud
Optionele landcode voor locatie-specifieke crawling
Optionele parser-ID voor gespecialiseerde inhoudsextractie
id- Crawl ID (gebruik dit om later resultaten op te halen)object- Objecttype (“crawl”)status- Crawlstatuscreated- Unix-timestamp
createMap
Extraheer alle URL’s van een website voor inhoudsontdekking en site-structuuranalyse. Gebruiksscenario’s:- Bouw sitemaps en site-structuurdiagrammen
- Ontdek alle pagina’s voordat je batch scraping uitvoert
- Vind gebroken of ontbrekende pagina’s
- SEO-audits en analyse
Je Olostep API-sleutel
Website-URL om links uit te extraheren (moet http:// of https:// bevatten)
Optionele zoekopdracht om URL’s te filteren (bijv. “blog”)
Beperk het aantal geretourneerde URL’s
Glob-patronen om specifieke paden op te nemen (bijv. [“/blog/**”])
Glob-patronen om specifieke paden uit te sluiten (bijv. [“/admin/**”])
id- Map IDobject- Objecttype (“map”)url- Website-URLtotal_urls- Totaal aantal gevonden URL’surls- Array van ontdekte URL’s
Gebruik met Agenten
Basis Agent Voorbeeld
Creëer een agent die websites kan scrapen:Agent Workflow Voorbeeld
Bouw een onderzoeksworkflow die inhoud ontdekt en scrapt:Populaire Gebruiksscenario’s
Onderzoeksagent
Bouw een agent die autonoom onderwerpen onderzoekt:Multi-Source Research
Multi-Source Research
Workflow:
- Gebruiker vraagt: “Onderzoek AI-trends”
- Agent gebruikt
createMapom relevante pagina’s te ontdekken - Agent gebruikt
batchScrapeom inhoud te extraheren - Agent analyseert en vat bevindingen samen
- Geeft gestructureerd onderzoeksrapport terug
Competitor Monitoring
Competitor Monitoring
Workflow:
- Plan dagelijkse monitoring
- Gebruik
scrapeWebsiteom concurrentiepagina’s te controleren - Vergelijk met eerdere data
- Waarschuw bij significante veranderingen
- Genereer wekelijkse rapporten
Content Aggregation
Content Aggregation
Workflow:
- Gebruik
createCrawlom alle blogposts te ontdekken - Gebruik
batchScrapeom inhoud te extraheren - Verwerk met AI om belangrijke onderwerpen te extraheren
- Sla op in kennisbank
- Genereer contentkalender
E-commerce Intelligence
Monitor producten en prijzen:SEO Analyse
Analyseer websitestructuur en inhoud:Gespecialiseerde Parsers
Olostep biedt vooraf gebouwde parsers voor populaire websites. Gebruik ze met deparser parameter:
Google Search
@olostep/google-searchExtraheer: zoekresultaten, titels, fragmenten, URL’sGoogle Maps
@olostep/google-mapsExtraheer: bedrijfsinformatie, beoordelingen, beoordelingen, locatieParsers Gebruiken
Voeg de parser-ID toe aan deparser parameter:
Best Practices
Gebruik Batchverwerking voor Meerdere URL's
Gebruik Batchverwerking voor Meerdere URL's
Wanneer je meer dan 3-5 URL’s scrapt, gebruik
batchScrape in plaats van meerdere scrapeWebsite oproepen. Batchverwerking is:- Veel sneller (parallelle verwerking)
- Kosteneffectiever
- Makkelijker te beheren
- Beter voor snelheidslimieten
Stel Geschikte Wachttijden In
Stel Geschikte Wachttijden In
Voor JavaScript-intensieve sites, gebruik de
wait_before_scraping parameter:- Eenvoudige sites: 0-1000ms
- Dynamische sites: 2000-3000ms
- Zware JavaScript: 5000-8000ms
Gebruik Gespecialiseerde Parsers
Gebruik Gespecialiseerde Parsers
Voor populaire websites (Amazon, LinkedIn, Google), gebruik vooraf gebouwde parsers:
- Krijg automatisch gestructureerde data
- Betrouwbaardere extractie
- Geen behoefte aan aangepaste parsing
- Onderhouden door Olostep
Behandel Asynchrone Operaties
Behandel Asynchrone Operaties
Batch-, Crawl- en Map-operaties zijn asynchroon:
- Bewaar de geretourneerde ID (batch_id, crawl_id, map_id)
- Poll voor voltooiing of gebruik webhooks
- Stel aparte workflows in voor ophalen
Foutafhandeling
Foutafhandeling
Omhul altijd API-oproepen in try-catch blokken:
Snelheidslimieten
Snelheidslimieten
Wees bewust van snelheidslimieten:
- Spreid verzoeken met vertragingen
- Gebruik batchverwerking indien mogelijk
- Monitor gebruik in Olostep dashboard
- Upgrade plan indien nodig
Volledig Voorbeeld
Hier is een volledig voorbeeld van het bouwen van een onderzoeksagent:Problemen Oplossen
Authenticatie Mislukt
Authenticatie Mislukt
Fout: “Ongeldige API-sleutel”Oplossingen:
- Controleer API-sleutel van dashboard
- Zorg ervoor dat API-sleutel is ingesteld in omgevingsvariabele
- Verifieer dat API-sleutel actief is
- Controleer op extra spaties in API-sleutel
API Niet Gevonden
API Niet Gevonden
Fout: “API niet gevonden” of “Integratie niet geregistreerd”Oplossingen:
- Zorg ervoor dat
registerApis()wordt aangeroepen na het maken van integratie - Verifieer dat integratie is toegevoegd aan Mastra-configuratie
- Controleer of integratienaam ‘olostep’ is
- Herstart Mastra-server na wijzigingen
Scrape Geeft Lege Inhoud Terug
Scrape Geeft Lege Inhoud Terug
Fout: Inhoudsvelden zijn leegOplossingen:
- Verhoog
wait_before_scrapingtijd - Controleer of website login vereist
- Probeer ander formaat (HTML vs Markdown)
- Verifieer of URL toegankelijk is
- Controleer of site geautomatiseerde toegang blokkeert
Snelheidslimiet Overschreden
Snelheidslimiet Overschreden
Fout: “Snelheidslimiet overschreden”Oplossingen:
- Spreid verzoeken met vertragingen
- Gebruik batchverwerking in plaats van individuele scrapes
- Upgrade je Olostep-plan
- Controleer snelheidslimiet in dashboard
TypeScript Fouten
TypeScript Fouten
Fout: Module niet gevonden of typefoutenOplossingen:
- Zorg ervoor dat
@mastra/coreis geïnstalleerd - Controleer TypeScript-versiecompatibiliteit
- Verifieer dat alle afhankelijkheden zijn geïnstalleerd
- Herbouw:
npm run build
Prijzen
Olostep rekent kosten op basis van API-gebruik, onafhankelijk van Mastra:- Scrapes: Betalen per scrape
- Batches: Betalen per URL in batch
- Crawls: Betalen per gecrawlde pagina
- Maps: Betalen per map-operatie
Ondersteuning
Hulp nodig met de Mastra-integratie?Documentatie
Blader door volledige API-documentatie
Ondersteuning Email
E-mail: info@olostep.com
Mastra Docs
Leer over het Mastra-framework
Gerelateerde Bronnen
Scrapes API
Leer over de Scrapes endpoint
Batches API
Leer over de Batches endpoint
Crawls API
Leer over de Crawls endpoint
Maps API
Leer over de Maps endpoint
Zapier Integratie
Automatiseer met Zapier-workflows
LangChain Integratie
Bouw AI-agenten met LangChain
Mastra Website
Mastra platform
Aan de Slag
Klaar om AI-agenten te bouwen met web scraping-mogelijkheden?Installeer Pakket
Installeer @olostep/mastra-tools vanaf npm