Qué puedes construir
Scrapear Sitio Web
Extrae contenido de cualquier URL individual en Markdown, HTML, JSON o Texto
Scrapear URLs en Lote
Procesa grandes listas de URLs en paralelo con salidas estructuradas
Crear Crawl
Descubre y scrapea páginas enlazadas para construir conjuntos de datos completos
Crear Mapa
Extrae todas las URLs de un sitio web (descubrimiento tipo sitemap)
Respuestas impulsadas por IA
Haz preguntas y obtén respuestas estructuradas en JSON con fuentes
Inicio rápido
1) Instalar Apify CLI
2) Obtén tu clave API de Olostep
Desde el Dashboard de Olostep → Claves API.3) Ejecuta el Actor de Olostep localmente
olostep-tools/integrations/apify/storage/key_value_stores/default/INPUT.json
Ejemplo de entrada:
4) Desplegar en Apify (nube)
Ejecutar en la Consola de Apify (paso a paso)
- Abre tu Actor en la Consola de Apify → Fuente → Entrada.
- En la pestaña Manual verás un campo visible “Clave API de Olostep”. Pega tu clave desde el Dashboard de Olostep.
- Elige una operación (por defecto es “scrape”).
- Rellena los campos relevantes (para “scrape”, establece “URL para Scrapear”).
- Haz clic en Guardar → Iniciar.
- Cuando la ejecución termine, abre la pestaña Conjunto de Datos para descargar los resultados (JSON/CSV/Excel).
- Para “URL para Scrapear”, puedes pegar con o sin esquema. Si falta, el actor automáticamente antepone
https://. - Si un sitio es pesado en JavaScript y ves un tiempo de espera, establece “Esperar Antes de Scrapear” a 2000–5000 ms y ejecuta de nuevo.
Operaciones disponibles
Scrapear Sitio Web
Extrae contenido de una sola URL. Ideal para automatización a nivel de página.Debe ser “scrape”
Tu clave API de Olostep (Bearer)
La URL para scrapear (debe incluir http:// o https://)
Uno de: Markdown, HTML, JSON, Texto
Código de país opcional (ej., “US”, “GB”, “CA”)
Tiempo de espera opcional en ms para renderizado de JavaScript (0–10000)
ID de parser opcional (ej., “@olostep/amazon-product”)
- id, url, estado, formatos
- markdown_content / html_content / json_content / text_content
- URLs alojadas (si están disponibles), metadatos de la página
Scrapear URLs en Lote
Procesa muchas URLs a la vez con formato y estructura consistentes.Debe ser “batch”
Tu clave API de Olostep
Arreglo JSON de objetos con
Ejemplo:
url y custom_id opcionalEjemplo:
[{"url":"https://example.com","custom_id":"site1"}]Uno de: Markdown, HTML, JSON, Texto
Código de país opcional
Tiempo de espera opcional en ms para sitios JS
ID de parser opcional
- batch_id, estado, total_urls, created_at, formatos, país, parser, urls[]
Crear Crawl
Sigue enlaces y scrapea múltiples páginas desde una URL de inicio.Debe ser “crawl”
Tu clave API de Olostep
URL de inicio para el crawl
Máximo de páginas para scrapear. Establece en
1 para scrapear solo la URL de inicio.Uno de: Markdown, HTML, JSON, Texto
Código de país opcional
ID de parser opcional
- crawl_id, objeto, estado, start_url, max_pages, creado, formatos
Crear Mapa
Descubre todas las URLs en un sitio web y prepáralas para scrapear en lote más tarde.Debe ser “map”
Tu clave API de Olostep
El sitio web a mapear
Filtro de consulta opcional
Limitar número de URLs
Incluir glob(s), ej. “/products/**”
Excluir glob(s), ej. “/admin/**”
- map_id, objeto, website_url, total_urls, urls[], search_query, top_n
Ejemplos de JSON para copiar y pegar (Consola → Entrada → JSON)
Scrapear
Lote
Crawl
Mapa
Respuestas
Ejemplos de flujos de trabajo
Descubrir y Scrapear Productos
Descubrir y Scrapear Productos
- Crear Mapa → incluir “/products/**”
- Analizar URLs → construir arreglo de lote
- Scrapear URLs en Lote → formatos: JSON
- Enviar a Google Sheets / Airtable
Monitoreo Diario de Contenidos
Monitoreo Diario de Contenidos
- Programar actor (diario)
- Scrapear Sitio Web → formatos: Markdown
- Resumir con LLM
- Notificar en Slack
Base de Conocimientos de Competidores
Base de Conocimientos de Competidores
- Crear Crawl (blog/docs)
- Almacenar salidas en Notion
- Actualizar semanalmente con Programación
Parsers especializados
Olostep soporta parsers para estructurar datos de sitios populares.Producto de Amazon
@olostep/amazon-product → título, precio, calificación, reseñas, imágenes, variantesBúsqueda de Google
@olostep/google-search → resultados, títulos, fragmentos, URLsGoogle Maps
@olostep/google-maps → información de negocios, reseñas, calificaciones, ubicaciónMás Parsers
Explora extractores de email, buscadores de redes sociales, extractores de enlaces de calendario, y más
Mejores prácticas
Preferir lote para 3+ URLs
Preferir lote para 3+ URLs
Más rápido, más barato, más fácil de monitorear y respetar límites de tasa.
Usar tiempos de espera apropiados
Usar tiempos de espera apropiados
Sitios pesados en JS: aumenta
wait_before_scraping (ej., 2000–5000ms).Filtrar antes de scrapear
Filtrar antes de scrapear
Evita tareas innecesarias — verifica cambios primero, mantén estado de deduplicación.
Almacenar contenido grande a través de URLs alojadas
Almacenar contenido grande a través de URLs alojadas
Usa salidas alojadas para evitar límites de tamaño de carga en flujos de Apify.
Tratar operaciones asíncronas como de larga duración
Tratar operaciones asíncronas como de larga duración
Batch/Crawl/Map devuelven IDs; recupéralos más tarde o encadénalos con un retraso.
Manejar tiempos de espera transitorios limpiamente
Manejar tiempos de espera transitorios limpiamente
Si ves un 504 o un tiempo de espera transitorio, el actor automáticamente reintenta una vez con un corto tiempo de espera.
También puedes establecer “Esperar Antes de Scrapear” a 2000–5000 ms para páginas pesadas en JS.
También puedes establecer “Esperar Antes de Scrapear” a 2000–5000 ms para páginas pesadas en JS.
Solución de problemas
Autenticación fallida
Autenticación fallida
- Verifica la clave API desde el dashboard
- Elimina espacios finales
- Re‑ingresa en el formulario de entrada de Apify
Contenido vacío
Contenido vacío
- Aumenta el tiempo de espera
- Verifica que la URL sea pública / no requiera inicio de sesión
- Prueba con un formato de salida diferente
Límite de tasa excedido
Límite de tasa excedido
- Espacia las ejecuciones mediante programación
- Prefiere lote para muchas URLs
- Actualiza el plan de Olostep si es necesario
Sitios bloqueados o dinámicos
Sitios bloqueados o dinámicos
- Prueba el parámetro de país
- Ajusta espera y parser
- Contacta soporte para orientación
Precios
Olostep cobra por uso de API (independiente de Apify):- Scrapes → por scrape
- Batches → por URL
- Crawls → por página
- Maps → por operación
https://www.olostep.com/pricing.
Seguridad
- Tu clave API se envía como token Bearer en tiempo de ejecución.
- No cometas claves en control de versiones; Apify almacena entradas en Key‑Value Store.
- En desarrollo local, mantén las claves en
storage/key_value_stores/default/INPUT.json(gitignored).
Recursos relacionados
API de Scrapes
Extrae Markdown, HTML, texto o JSON estructurado compatible con LLM de cualquier URL.
API de Batches
Procesa hasta 10k URLs concurrentemente y recupera resultados más tarde.
API de Crawls
Descubre y scrapea recursivamente el contenido de un sitio.
API de Maps
Obtén todas las URLs en un sitio web para preparar scrapes en lote.
Soporte
Sitio Web de Apify
Plataforma Apify
Documentación de Apify
Documentación de la plataforma y SDK de Apify
Documentación
Documentación completa de la API