Haal de inhoud op van verwerkte batches en crawls-URL’s.
Bearer authenticatie header in de vorm Bearer
De ID van de pagina-inhoud die je wilt ophalen. Beschikbaar in de respons van /v1/crawls/{crawl_id}/pages, /v1/scrapes/{scrape_id} of /v1/batches/{batch_id}/items endpoints
Optionele array om alleen specifieke formaten in productie op te halen. Als deze niet wordt opgegeven, worden alle formaten geretourneerd.
html, markdown, json Succesvolle respons met pagina-inhoud.
HTML-inhoud van de pagina, indien aangevraagd en beschikbaar.
Markdown-inhoud van de pagina, indien aangevraagd en beschikbaar.
JSON-inhoud van de pagina geretourneerd door parsers, indien aangevraagd en beschikbaar.
S3 bucket URL van html. Verloopt over 7 dagen.
S3 bucket URL van markdown. Verloopt over 7 dagen.
S3 bucket URL van json. Verloopt over 7 dagen.
Als de grootte van inhoudsobjecten de limiet van 6MB overschrijdt. Als dit waar is, gebruik dan gehoste S3 urls om inhoud te krijgen.