olostep.
Al instalar, un paso postinstalación descarga el binario correspondiente desde los lanzamientos de GitHub del paquete. Si eso falla, confirma que exista un lanzamiento para esta versión del paquete y tu plataforma, luego reinstala.
Instalación
Requisitos: Node.js 16+ (solo paranpm / npx; el CLI en sí es un binario nativo).
Clave API
ConfiguraOLOSTEP_API_KEY en tu entorno, o en un archivo .env en el directorio donde ejecutas olostep.
Crea claves: Olostep API Keys.
Salida
| Flag | Comportamiento |
|---|---|
--out <path> | Escribe JSON en un archivo (se crean directorios padres si es necesario). |
--out - | Escribe JSON solo en stdout (UTF-8, con sangría). Bueno para pipes y captura de subprocesos. |
--out, los archivos van bajo output/ (ver Rutas predeterminadas --out).
Comandos
Usaolostep <command> --help para cada opción. La mayoría de los comandos aceptan --timeout (HTTP, segundos).
map: descubrir URLs
| Opción | Descripción |
|---|---|
--out | Ruta de archivo o - |
--top-n | Máximo de URLs |
--search-query | Guía de descubrimiento |
--include-subdomain / --no-include-subdomain | Subdominios |
--include-url / --exclude-url | Patrones repetibles |
--cursor | Paginación |
--top-n, no --limit (eliminado).
answer: respuesta investigada
Consulta hasta que la respuesta esté lista.
| Opción | Descripción |
|---|---|
--out | Archivo o - |
--json-format | Sugerencia opcional de salida estructurada (cadena de objeto JSON) |
--poll-interval / --poll-timeout | Sondeo (segundos) |
--json-format, no --model (eliminado).
scrape: una URL
Formatos: html, markdown, text, json, raw_pdf, screenshot (separados por comas; por defecto markdown).
| Opción | Descripción |
|---|---|
--formats | Separados por comas |
--country | Código de país |
--wait-before-scraping | Ms para esperar antes de raspar |
--payload-json | Opciones avanzadas como cadena de objeto JSON |
--payload-file | Lo mismo, desde archivo (no junto con --payload-json) |
scrape-get: por ID de scrape
crawl: rastreo de sitio
Recuperar formatos: markdown, html, json.
Flags notables: --max-pages, --max-depth, --include-subdomain, --include-external, --include-url, --exclude-url, --search-query, --top-n, --webhook, --crawl-timeout, --follow-robots-txt / --ignore-robots-txt, --formats, --pages-limit, --pages-search-query, --poll-seconds, --poll-timeout, --dry-run (imprimir carga útil, sin solicitud).
batch-scrape: CSV
Columnas CSV: custom_id o id, y url.
| Opción | Descripción |
|---|---|
--formats | markdown, html, json |
--country | Opcional |
--parser-id | Parser de extracción estructurada |
--poll-seconds, --log-every, --items-limit | Sondeo / paginación |
--dry-run | Solo imprimir carga útil |
batch-update: metadatos por lotes
Requiere uno de --metadata-json o --metadata-file (objeto JSON).
Rutas predeterminadas --out
Cuando se omite --out:
| Comando | Predeterminado |
|---|---|
map | output/map.json |
answer | output/answer.json |
scrape | output/scrape.json |
scrape-get | output/scrape_get.json |
crawl | output/crawl_results.json |
batch-scrape | output/batch_results.json |
batch-update | output/batch_update.json |
Flags globales
| Flag | Descripción |
|---|---|
-V, --version | Versión |
-h, --help | Ayuda |