Saltar al contenido principal
GET
/
v1
/
crawls
/
{crawl_id}
/
pages
Recuperar lista de páginas rastreadas opcionalmente con contenido
curl --request GET \
  --url https://api.olostep.com/v1/crawls/{crawl_id}/pages \
  --header 'Authorization: Bearer <token>'
{
  "crawl_id": "<string>",
  "object": "<string>",
  "status": "<string>",
  "search_query": "<string>",
  "pages_count": 123,
  "pages": [
    {
      "id": "<string>",
      "retrieve_id": "<string>",
      "url": "<string>",
      "is_external": true,
      "html_content": "<string>",
      "markdown_content": "<string>"
    }
  ],
  "metadata": {
    "external_urls": [
      "<string>"
    ],
    "failed_urls": [
      "<string>"
    ]
  },
  "cursor": 123
}

Autorizaciones

Authorization
string
header
requerido

Encabezado de autenticación Bearer del formato Bearer , donde es tu token de autenticación.

Parámetros de ruta

crawl_id
string
requerido

El ID del rastreo para recuperar la lista de URLs.

Parámetros de consulta

cursor
integer

Entero opcional que representa el índice para comenzar a obtener contenido. Útil para paginar hasta que se obtengan todas las URLs. Comienza con 0, luego proporciona el valor de response['cursor'] de la última solicitud.

limit
integer

Entero opcional para limitar el número de resultados devueltos. Se recomienda de 10 a 50 resultados a la vez. Paginado usando cursor. Se puede obtener un máximo de 10MB de contenido en una sola solicitud.

search_query
string

Una consulta de búsqueda opcional para ordenar los resultados por relevancia. Usa la search_query original por defecto si se proporciona.

formats
enum<string>[]

Obsoleto: Usa el endpoint /retrieve con retrieve_id. Array de formatos para obtener (e.g., ["html", "markdown"]).

Opciones disponibles:
html,
markdown

Respuesta

Respuesta exitosa con la lista de URLs.

crawl_id
string

ID de Rastreo

object
string

El tipo de objeto. "crawl" para este endpoint.

status
string

in_progress o completed

search_query
string
pages_count
number
pages
object[]
metadata
object
cursor
integer

Debe pasarse en la consulta en la próxima solicitud para obtener los siguientes elementos.