Naar hoofdinhoud gaan
GET
/
v1
/
retrieve
Haal pagina-inhoud op
curl --request GET \
  --url https://api.olostep.com/v1/retrieve \
  --header 'Authorization: Bearer <token>'
{
  "html_content": "<string>",
  "markdown_content": "<string>",
  "json_content": "<string>",
  "html_hosted_url": "<string>",
  "markdown_hosted_url": "<string>",
  "json_hosted_url": "<string>",
  "size_exceeded": true
}

Autorisaties

Authorization
string
header
vereist

Bearer authenticatie header in de vorm Bearer , waarbij jouw auth token is.

Queryparameters

retrieve_id
string
vereist

De ID van de pagina-inhoud die je wilt ophalen. Beschikbaar in de respons van /v1/crawls/{crawl_id}/pages, /v1/scrapes/{scrape_id} of /v1/batches/{batch_id}/items endpoints

formats
enum<string>[]

Optionele array om alleen specifieke formaten in productie op te halen. Als deze niet wordt opgegeven, worden alle formaten geretourneerd.

Beschikbare opties:
html,
markdown,
json

Respons

Succesvolle respons met pagina-inhoud.

html_content
string

HTML-inhoud van de pagina, indien aangevraagd en beschikbaar.

markdown_content
string

Markdown-inhoud van de pagina, indien aangevraagd en beschikbaar.

json_content
string

JSON-inhoud van de pagina geretourneerd door parsers, indien aangevraagd en beschikbaar.

html_hosted_url
string

S3 bucket URL van html. Verloopt over 7 dagen.

markdown_hosted_url
string

S3 bucket URL van markdown. Verloopt over 7 dagen.

json_hosted_url
string

S3 bucket URL van json. Verloopt over 7 dagen.

size_exceeded
boolean

Als de grootte van inhoudsobjecten de limiet van 6MB overschrijdt. Als dit waar is, gebruik dan gehoste S3 urls om inhoud te krijgen.