Functies
De integratie biedt 4 krachtige API’s voor geautomatiseerde webdata-extractie:Website Scrapen
Extraheer inhoud van elke enkele URL in meerdere formaten (Markdown, HTML, JSON, tekst)
Batch Scrapen van URL's
Verwerk tot 100.000 URL’s parallel. Perfect voor grootschalige data-extractie
Crawl Maken
Ontdek en scrape autonoom volledige websites door links te volgen
Kaart Maken
Extraheer alle URL’s van een website voor analyse van de sitestructuur en inhoudsontdekking
Installatie
Configuratie
1. Installeer het Pakket
2. Importeer en Registreer Integratie
In je Mastra-configuratiebestand:3. Configureer API-sleutel
Stel je Olostep API-sleutel in als een omgevingsvariabele:.env bestand:
Beschikbare API’s
De integratie stelt 4 API’s bloot die je Mastra-agenten kunnen gebruiken:scrapeWebsite
Extraheer inhoud van een enkele URL. Ondersteunt meerdere formaten en JavaScript-rendering. Gebruiksscenario’s:- Specifieke pagina’s monitoren op wijzigingen
- Productinformatie van e-commerce sites extraheren
- Data verzamelen van nieuwsartikelen of blogposts
- Inhoud ophalen voor contentaggregatie
Je Olostep API-sleutel
Website-URL om te scrapen (moet http:// of https:// bevatten)
Uitvoerformaten: [‘html’, ‘markdown’, ‘json’, ‘text’]
Landcode voor locatie-specifieke inhoud (bijv. “US”, “GB”, “CA”)
Wachttijd in milliseconden voor JavaScript-rendering (0-10000)
Optionele parser-ID voor gespecialiseerde extractie (bijv. “@olostep/amazon-product”)
id- Scrape IDurl_to_scrape- Gescrapete URLresult.markdown_content- Markdown inhoudresult.html_content- HTML inhoudresult.json_content- JSON inhoudresult.text_content- Tekst inhoudresult.screenshot_hosted_url- Screenshot URL (indien beschikbaar)result.markdown_hosted_url- Gehoste markdown URLobject- Objecttype (“scrape”)created- Unix-tijdstempel
batchScrape
Verwerk meerdere URL’s parallel (tot 100.000 tegelijk). Perfect voor grootschalige data-extractie. Gebruiksscenario’s:- Volledige productcatalogi scrapen
- Data extraheren van meerdere zoekresultaten
- Lijsten van URL’s uit spreadsheets verwerken
- Bulk contentextractie
Je Olostep API-sleutel
Array van objecten met
url en optionele custom_id veldenVoorbeeld: [{"url":"https://example.com","custom_id":"site1"}]Uitvoerformaten voor alle URL’s
Landcode voor locatie-specifieke scraping
Wachttijd in milliseconden voor JavaScript-rendering
Optionele parser-ID voor gespecialiseerde extractie
batch_id- Batch ID (gebruik dit om later resultaten op te halen)status- Verwerkingsstatusobject- Objecttype (“batch”)
createCrawl
Ontdek en scrape autonoom volledige websites door links te volgen. Perfect voor documentatiesites, blogs en inhoudsrepositories. Gebruiksscenario’s:- Volledige documentatiesites crawlen en archiveren
- Alle blogposts van een website extraheren
- Kennisbanken bouwen van webinhoud
- Wijzigingen in de sitestructuur monitoren
Je Olostep API-sleutel
Start-URL voor de crawl (moet http:// of https:// bevatten)
Maximum aantal pagina’s om te crawlen. Stel in op
1 om alleen de start-URL te scrapen.Formaat voor gescrapete inhoud
Optionele landcode voor locatie-specifieke crawling
Optionele parser-ID voor gespecialiseerde inhoudsextractie
id- Crawl ID (gebruik dit om later resultaten op te halen)object- Objecttype (“crawl”)status- Crawlstatuscreated- Unix-tijdstempel
createMap
Extraheer alle URL’s van een website voor inhoudsontdekking en sitestructuuranalyse. Gebruiksscenario’s:- Sitemaps en sitestructuurdiagrammen bouwen
- Alle pagina’s ontdekken voordat je batch scraping uitvoert
- Gebroken of ontbrekende pagina’s vinden
- SEO-audits en analyses
Je Olostep API-sleutel
Website-URL om links uit te extraheren (moet http:// of https:// bevatten)
Optionele zoekopdracht om URL’s te filteren (bijv. “blog”)
Beperk het aantal geretourneerde URL’s
Glob-patronen om specifieke paden op te nemen (bijv. [“/blog/**”])
Glob-patronen om specifieke paden uit te sluiten (bijv. [“/admin/**”])
id- Map IDobject- Objecttype (“map”)url- Website-URLtotal_urls- Totaal gevonden URL’surls- Array van ontdekte URL’s
Gebruik met Agenten
Basis Agent Voorbeeld
Maak een agent die websites kan scrapen:Agent Workflow Voorbeeld
Bouw een onderzoeksworkflow die inhoud ontdekt en scrapt:Populaire Gebruiksscenario’s
Onderzoeksagent
Bouw een agent die autonoom onderwerpen onderzoekt:Multi-Source Onderzoek
Multi-Source Onderzoek
Workflow:
- Gebruiker vraagt: “Onderzoek AI-trends”
- Agent gebruikt
createMapom relevante pagina’s te ontdekken - Agent gebruikt
batchScrapeom inhoud te extraheren - Agent analyseert en vat bevindingen samen
- Retourneert gestructureerd onderzoeksrapport
Concurrentie Monitoring
Concurrentie Monitoring
Workflow:
- Plan dagelijkse monitoring
- Gebruik
scrapeWebsiteom concurrentiepagina’s te controleren - Vergelijk met eerdere data
- Waarschuw bij significante wijzigingen
- Genereer wekelijkse rapporten
Inhoudsaggregatie
Inhoudsaggregatie
Workflow:
- Gebruik
createCrawlom alle blogposts te ontdekken - Gebruik
batchScrapeom inhoud te extraheren - Verwerk met AI om kernonderwerpen te extraheren
- Sla op in kennisbank
- Genereer inhoudskalender
E-commerce Intelligentie
Monitor producten en prijzen:SEO Analyse
Analyseer sitestructuur en inhoud:Gespecialiseerde Parsers
Olostep biedt vooraf gebouwde parsers voor populaire websites. Gebruik ze met deparser parameter:
Google Zoeken
@olostep/google-searchExtraheer: zoekresultaten, titels, fragmenten, URL’sGoogle Maps
@olostep/google-mapsExtraheer: bedrijfsinformatie, beoordelingen, beoordelingen, locatieGebruik van Parsers
Voeg de parser-ID toe aan deparser parameter:
Beste Praktijken
Gebruik Batchverwerking voor Meerdere URL's
Gebruik Batchverwerking voor Meerdere URL's
Wanneer je meer dan 3-5 URL’s scrapt, gebruik dan
batchScrape in plaats van meerdere scrapeWebsite oproepen. Batchverwerking is:- Veel sneller (parallelle verwerking)
- Kosteneffectiever
- Makkelijker te beheren
- Beter voor snelheidslimieten
Stel Geschikte Wachttijden In
Stel Geschikte Wachttijden In
Voor JavaScript-intensieve sites, gebruik de
wait_before_scraping parameter:- Eenvoudige sites: 0-1000ms
- Dynamische sites: 2000-3000ms
- Zware JavaScript: 5000-8000ms
Gebruik Gespecialiseerde Parsers
Gebruik Gespecialiseerde Parsers
Voor populaire websites (Amazon, LinkedIn, Google), gebruik vooraf gebouwde parsers:
- Krijg automatisch gestructureerde data
- Betrouwbaardere extractie
- Geen behoefte aan aangepaste parsing
- Onderhouden door Olostep
Behandel Asynchrone Operaties
Behandel Asynchrone Operaties
Batch-, Crawl- en Map-operaties zijn asynchroon:
- Bewaar de geretourneerde ID (batch_id, crawl_id, map_id)
- Poll voor voltooiing of gebruik webhooks
- Stel aparte workflows in voor ophalen
Foutafhandeling
Foutafhandeling
Omhul API-oproepen altijd in try-catch blokken:
Snelheidslimiet
Snelheidslimiet
Wees je bewust van snelheidslimieten:
- Spreid verzoeken met vertragingen
- Gebruik batchverwerking wanneer mogelijk
- Monitor gebruik in Olostep dashboard
- Upgrade plan indien nodig
Compleet Voorbeeld
Hier is een compleet voorbeeld van het bouwen van een onderzoeksagent:Probleemoplossing
Authenticatie Mislukt
Authenticatie Mislukt
Fout: “Ongeldige API-sleutel”Oplossingen:
- Controleer API-sleutel vanuit dashboard
- Zorg ervoor dat API-sleutel is ingesteld in omgevingsvariabele
- Verifieer dat API-sleutel actief is
- Controleer op extra spaties in API-sleutel
API Niet Gevonden
API Niet Gevonden
Fout: “API niet gevonden” of “Integratie niet geregistreerd”Oplossingen:
- Zorg ervoor dat
registerApis()wordt aangeroepen na het maken van integratie - Verifieer dat integratie is toegevoegd aan Mastra-config
- Controleer dat integratienaam ‘olostep’ is
- Herstart Mastra-server na wijzigingen
Scrape Geeft Lege Inhoud Terug
Scrape Geeft Lege Inhoud Terug
Fout: Inhoudsvelden zijn leegOplossingen:
- Verhoog
wait_before_scrapingtijd - Controleer of website inloggen vereist
- Probeer een ander formaat (HTML vs Markdown)
- Verifieer dat URL toegankelijk is
- Controleer of site geautomatiseerde toegang blokkeert
Snelheidslimiet Overschreden
Snelheidslimiet Overschreden
Fout: “Snelheidslimiet overschreden”Oplossingen:
- Spreid verzoeken met vertragingen
- Gebruik batchverwerking in plaats van individuele scrapes
- Upgrade je Olostep-plan
- Controleer snelheidslimiet in dashboard
TypeScript Fouten
TypeScript Fouten
Fout: Module niet gevonden of typefoutenOplossingen:
- Zorg ervoor dat
@mastra/coreis geïnstalleerd - Controleer TypeScript-versiecompatibiliteit
- Verifieer dat alle afhankelijkheden zijn geïnstalleerd
- Herbouw:
npm run build
Prijzen
Olostep rekent kosten op basis van API-gebruik, onafhankelijk van Mastra:- Scrapes: Betaal per scrape
- Batches: Betaal per URL in batch
- Crawls: Betaal per gecrawlde pagina
- Maps: Betaal per map-operatie
Ondersteuning
Hulp nodig met de Mastra-integratie?Documentatie
Blader door volledige API-documentatie
Ondersteuning E-mail
E-mail: info@olostep.com
Mastra Docs
Leer over het Mastra-framework
Gerelateerde Bronnen
Scrapes API
Leer over de Scrapes eindpunt
Batches API
Leer over de Batches eindpunt
Crawls API
Leer over de Crawls eindpunt
Maps API
Leer over de Maps eindpunt
Zapier Integratie
Automatiseer met Zapier-workflows
LangChain Integratie
Bouw AI-agenten met LangChain
Mastra Website
Mastra platform
Aan de Slag
Klaar om AI-agenten te bouwen met webscrapingmogelijkheden?Installeer Pakket
Installeer @olostep/mastra-tools van npm