Lo que puedes construir
Extraer Sitio Web
Extrae contenido de cualquier URL en Markdown, HTML, JSON o Texto
Extraer URLs en Lote
Procesa grandes listas de URLs en paralelo con salidas estructuradas
Crear Rastreo
Descubre y extrae páginas enlazadas para construir conjuntos de datos completos
Crear Mapa
Extrae todas las URLs de un sitio web (descubrimiento tipo sitemap)
Respuestas impulsadas por IA
Haz preguntas y obtén respuestas JSON estructuradas con fuentes
Inicio rápido
1) Instalar Apify CLI
2) Obtén tu clave API de Olostep
Desde el Dashboard de Olostep → Claves API.3) Ejecuta el Actor de Olostep localmente
olostep-tools/integrations/apify/storage/key_value_stores/default/INPUT.json
Ejemplo de entrada:
4) Desplegar en Apify (nube)
Ejecutar en la Consola de Apify (paso a paso)
- Abre tu Actor en la Consola de Apify → Fuente → Entrada.
- En la pestaña Manual verás un campo visible “Clave API de Olostep”. Pega tu clave desde el Dashboard de Olostep.
- Elige una operación (por defecto es “scrape”).
- Rellena los campos relevantes (para “scrape”, establece “URL para Extraer”).
- Haz clic en Guardar → Iniciar.
- Cuando la ejecución termine, abre la pestaña Conjunto de Datos para descargar resultados (JSON/CSV/Excel).
- Para “URL para Extraer”, puedes pegar con o sin esquema. Si falta, el actor automáticamente antepone
https://. - Si un sitio tiene mucho JavaScript y ves un tiempo de espera, establece “Esperar Antes de Extraer” a 2000–5000 ms y ejecuta de nuevo.
Operaciones disponibles
Extraer Sitio Web
Extrae contenido de una sola URL. Ideal para automatización a nivel de página.Debe ser “scrape”
Tu clave API de Olostep (Bearer)
La URL para extraer (debe incluir http:// o https://)
Uno de: Markdown, HTML, JSON, Texto
Código de país opcional (por ejemplo, “US”, “GB”, “CA”)
Tiempo de espera opcional en ms para renderizado de JavaScript (0–10000)
ID de parser opcional (por ejemplo, “@olostep/amazon-product”)
- id, url, estado, formatos
- markdown_content / html_content / json_content / text_content
- URLs alojadas (si están disponibles), metadatos de la página
Extraer URLs en Lote
Procesa muchas URLs a la vez con formato y estructura consistentes.Debe ser “batch”
Tu clave API de Olostep
Array JSON de objetos con
Ejemplo:
url y custom_id opcionalEjemplo:
[{"url":"https://example.com","custom_id":"site1"}]Uno de: Markdown, HTML, JSON, Texto
Código de país opcional
Tiempo de espera opcional en ms para sitios JS
ID de parser opcional
- batch_id, estado, total_urls, created_at, formatos, país, parser, urls[]
Crear Rastreo
Sigue enlaces y extrae múltiples páginas desde una URL de inicio.Debe ser “crawl”
Tu clave API de Olostep
URL de inicio para el rastreo
Máximo de páginas a rastrear
Seguir enlaces en la página
Uno de: Markdown, HTML, JSON, Texto
Código de país opcional
ID de parser opcional
- crawl_id, objeto, estado, start_url, max_pages, follow_links, creado, formatos
Crear Mapa
Descubre todas las URLs en un sitio web y prepáralas para extracción en lote posterior.Debe ser “map”
Tu clave API de Olostep
El sitio web para mapear
Filtro de consulta opcional
Limitar número de URLs
Incluir glob(s), por ejemplo, “/products/**”
Excluir glob(s), por ejemplo, “/admin/**”
- map_id, objeto, website_url, total_urls, urls[], search_query, top_n
Copiar y pegar ejemplos JSON (Consola → Entrada → JSON)
Extraer
Lote
Rastreo
Mapa
Respuestas
Ejemplos de flujos de trabajo
Descubrir y Extraer Productos
Descubrir y Extraer Productos
- Crear Mapa → incluir “/products/**”
- Analizar URLs → construir array de lote
- Extraer URLs en Lote → formatos: JSON
- Enviar a Google Sheets / Airtable
Monitoreo de Contenido Diario
Monitoreo de Contenido Diario
- Programar actor (diario)
- Extraer Sitio Web → formatos: Markdown
- Resumir con LLM
- Notificar en Slack
Base de Conocimiento de Competidores
Base de Conocimiento de Competidores
- Crear Rastreo (blog/docs)
- Almacenar salidas en Notion
- Refrescar semanalmente con Programación
Parsers especializados
Olostep soporta parsers para estructurar datos de sitios populares.Producto de Amazon
@olostep/amazon-product → título, precio, calificación, reseñas, imágenes, variantesBúsqueda de Google
@olostep/google-search → resultados, títulos, fragmentos, URLsGoogle Maps
@olostep/google-maps → información de negocios, reseñas, calificaciones, ubicaciónMás Parsers
Explora extractores de correo electrónico, buscadores de redes sociales, extractores de enlaces de calendario y más
Mejores prácticas
Preferir lote para 3+ URLs
Preferir lote para 3+ URLs
Más rápido, más barato, más fácil de monitorear y respetar límites de tasa.
Usar tiempos de espera apropiados
Usar tiempos de espera apropiados
Sitios pesados en JS: aumentar
wait_before_scraping (por ejemplo, 2000–5000ms).Filtrar antes de extraer
Filtrar antes de extraer
Evita tareas innecesarias — verifica cambios primero, mantén el estado de deduplicación.
Almacenar contenido grande vía URLs alojadas
Almacenar contenido grande vía URLs alojadas
Usa salidas alojadas para evitar límites de tamaño de carga en flujos de Apify.
Tratar operaciones asíncronas como de larga duración
Tratar operaciones asíncronas como de larga duración
Batch/Crawl/Map devuelven IDs; recupérelos más tarde o encadene con un retraso.
Manejar tiempos de espera transitorios limpiamente
Manejar tiempos de espera transitorios limpiamente
Si ves un 504 o un tiempo de espera transitorio, el actor automáticamente reintenta una vez con un corto tiempo de espera.
También puedes establecer “Esperar Antes de Extraer” a 2000–5000 ms para páginas pesadas en JS.
También puedes establecer “Esperar Antes de Extraer” a 2000–5000 ms para páginas pesadas en JS.
Solución de problemas
Fallo de autenticación
Fallo de autenticación
- Verifica la clave API desde el dashboard
- Elimina espacios finales
- Vuelve a ingresar en el formulario de entrada de Apify
Contenido vacío
Contenido vacío
- Aumenta el tiempo de espera
- Verifica que la URL sea pública / no requiera inicio de sesión
- Prueba un formato de salida diferente
Límite de tasa excedido
Límite de tasa excedido
- Espaciar ejecuciones mediante programación
- Preferir lote para muchas URLs
- Actualizar plan de Olostep si es necesario
Sitios bloqueados o dinámicos
Sitios bloqueados o dinámicos
- Probar parámetro de país
- Ajustar espera y parser
- Contactar soporte para orientación
Precios
Olostep cobra por uso de API (independiente de Apify):- Scrapes → por extracción
- Batches → por URL
- Crawls → por página
- Maps → por operación
https://olostep.com/pricing.
Seguridad
- Tu clave API se envía como token Bearer en tiempo de ejecución.
- No cometas claves en control de versiones; Apify almacena entradas en Key‑Value Store.
- En desarrollo local, mantén las claves en
storage/key_value_stores/default/INPUT.json(gitignored).
Recursos relacionados
API de Extracciones
Extrae Markdown, HTML, texto o JSON estructurado amigable con LLM de cualquier URL.
API de Lotes
Procesa hasta 10k URLs concurrentemente y recupera resultados más tarde.
API de Rastreo
Descubre y extrae recursivamente el contenido de un sitio.
API de Mapas
Obtén todas las URLs en un sitio web para preparar extracciones en lote.