Parsers zijn een manier om ongestructureerde data om te zetten in gestructureerde data die compatibel is met je backend. Door parsers te combineren met de Olostep API (crawls, scrapes, batches) kun je van elke website een API-aanroep maken om de JSON te retourneren die je nodig hebt. Parsers zijn ideaal wanneer je op grote schaal en op regelmatige basis data van dezelfde websites nodig hebt. Deze aanpak is aanzienlijk kostenefficiënter en sneller vergeleken met LLM extractie en retourneert alleen de vereiste JSON. We bieden vooraf gebouwde parsers voor populaire websites en gebruikssituaties. Je kunt ook je eigen parsers maken in een paar minuten met LLMs via het dashboard of ons team vragen om het voor je te doen.Documentation Index
Fetch the complete documentation index at: https://docs.olostep.com/llms.txt
Use this file to discover all available pages before exploring further.
Vooraf Gebouwde Parsers
We bieden verschillende vooraf gebouwde parsers voor populaire websites:- Google Zoeken:
@olostep/google-search - Amazon Product:
@olostep/amazon-it-product - E-mail Extractie:
@olostep/extract-emails - Kalenders Extractie:
@olostep/extract-calendars - Socials Extractie:
@olostep/extract-socials - TikTok data-extractie: neem contact met ons op om de parser-ID te krijgen
- Google Nieuws: neem contact met ons op om de parser-ID te krijgen
- Google Maps: neem contact met ons op om de parser-ID te krijgen
Voorbeeld Gebruik
Respons Formaat
Wanneer je een verzoek doet aan de Olostep API met het parserformaat, ontvang je een JSON-respons zoals het onderstaande voorbeeld:- Basisinformatie over het verzoek:
id,object,createdtimestamp,url_to_scrape - Resultaatobject met URL’s om toegang te krijgen tot verschillende formaten van de data
- json_content met gestructureerde JSON-resultaten inclusief:
searchParameters: Informatie over de zoekopdrachtknowledgeGraph: Gedetailleerde informatie over het zoekonderwerp (indien beschikbaar)organic: Lijst van zoekresultaten met titel, link, positie en snippetpeopleAlsoAsk: Gerelateerde vragen die gebruikers vaak zoekenrelatedSearches: Voorgestelde gerelateerde zoekopdrachten
json_content is het belangrijkste deel van de respons met de gestructureerde JSON-resultaten. Je kunt de JSON-inhoud direct uit de respons halen of de gehoste URL gebruiken die in de respons wordt gegeven.
Gestructureerde Respons: json_content
json_hosted_url veld in de respons:
- Gestructureerde JSON: Bekijk voorbeeld JSON
formats parameter en Olostep zal ze in de respons retourneren en gehoste URL’s voor elk formaat bieden.
Een Aangepaste Parser Nodig?
Als je een parser nodig hebt voor een specifieke website of de ID van een vooraf gebouwde parser:- Neem contact met ons op via info@olostep.com