Recupera el contenido de lotes procesados y URLs rastreadas.
Encabezado de autenticación Bearer del formato Bearer
El ID del contenido de la página a recuperar. Disponible en la respuesta de los endpoints /v1/crawls/{crawl_id}/pages, /v1/scrapes/{scrape_id} o /v1/batches/{batch_id}/items
Array opcional para recuperar solo formatos específicos en producción. Si no se proporciona, se devolverán todos los formatos.
html, markdown, json Respuesta exitosa con el contenido de la página.
Contenido HTML de la página, si se solicita y está disponible.
Contenido Markdown de la página, si se solicita y está disponible.
Contenido JSON de la página devuelto por los analizadores, si se solicita y está disponible.
URL del bucket S3 de html. Expira en 7 días.
URL del bucket S3 de markdown. Expira en 7 días.
URL del bucket S3 de json. Expira en 7 días.
Si el tamaño de los objetos de contenido excede el límite de 6MB. Si es verdadero, usa las URLs de S3 alojadas para obtener el contenido.