Raspar y extraer
Respuestas AI
Lote y rastreo
Mapa y búsqueda
Antes de comenzar
Necesitas una clave API de Olostep. Consigue una desde el tablero de Olostep — el nivel gratuito cubre el uso personal.Elige una ruta de configuración
La ruta más rápida para cada cliente es el endpoint alojado enhttps://mcp.olostep.com/mcp. Sin instalaciones, sin Node, sin Docker — solo pega una URL y tu clave API.
Si necesitas que funcione completamente local (uso offline, proxy corporativo, aislado), cada cliente también admite una instalación local stdio a través de npx. Cada sección a continuación muestra ambos.
Authorization: Bearer YOUR_API_KEY. Local stdio usa OLOSTEP_API_KEY como una variable de entorno. No los mezcles — el modo de autenticación incorrecto es el error de incorporación número 1.Configuración del cliente
- Cursor
- Claude Code
- Claude Desktop
- VS Code
- Windsurf
- Docker
- Metorial
Reemplaza YOUR_API_KEY en la configuración resultante con tu clave real.Configuración manual:Crea o edita .cursor/mcp.json en la raíz de tu proyecto (o ~/.cursor/mcp.json para global):Instalación local stdio (opcional)
Instalación local stdio (opcional)
olostep listado con 10 herramientas incluyendo scrape_website. Si ves “Conectado, 0 herramientas”, tu clave API es incorrecta.Elegir la herramienta adecuada
El servidor MCP expone 10 herramientas. Usa este árbol de decisiones para elegir la correcta — el agente usa el mismo razonamiento:| Quieres… | Usa | Notas |
|---|---|---|
| El contenido de una página específica | scrape_website o get_webpage_content | Establece wait_before_scraping=2000–5000 para SPAs |
| Una respuesta web en lenguaje natural con fuentes | answers | Devuelve síntesis AI + citas |
| Resultados de búsqueda para una consulta | search_web | Basado en parser, no AI, estructurado |
| Una lista de URLs en un sitio | create_map | Solo descubrimiento de URLs — NO raspa |
| URLs filtradas por consulta | get_website_urls | Clasificadas por relevancia a tu search_query |
| Muchas URLs conocidas a la vez | batch_scrape_urls + get_batch_results | Asíncrono — inicia, luego consulta |
| Un sitio completo o sección | create_crawl + get_crawl_results | Asíncrono — sigue enlaces desde una URL de inicio |
Detalles de las herramientas
scrape_website
scrape_website
markdown, html, json, text. Opcional country para solicitudes geo-dirigidas, wait_before_scraping (0–10000 ms) para sitios pesados en JS, y parser (por ejemplo, @olostep/amazon-product) para extracción estructurada.get_webpage_content
get_webpage_content
scrape_website. Úsalo cuando solo quieras markdown limpio y no necesites opciones de formato.search_web
search_web
country para resultados localizados. Devuelve JSON, no prosa AI.answers
answers
task con fuentes y citas. Pasa un argumento json para obtener la respuesta en una forma específica — ya sea un esquema JSON o una breve descripción en lenguaje natural.batch_scrape_urls
batch_scrape_urls
batch_id — luego llama a get_batch_results para obtener el contenido. Establece wait_for_completion_seconds (hasta 900) si deseas una sola llamada bloqueante en lugar de consultar. Recomendado: 60 para lotes de menos de 50 URLs, 300–600 para 50–1k, 0 (consulta por separado) para lotes más grandes.get_batch_results
get_batch_results
batch_id. Devuelve processing hasta que esté completo, luego completed con el array de elementos.create_crawl
create_crawl
start_url. Usa include_url_patterns / exclude_url_patterns (sintaxis glob como /blog/**) para definir el alcance. Devuelve un crawl_id — luego llama a get_crawl_results.get_crawl_results
get_crawl_results
crawl_id. Soporta paginación a través de cursor y items_limit (máximo 100 por llamada). Devuelve in_progress hasta que esté completo.create_map
create_map
include_url_patterns / exclude_url_patterns y search_query.get_website_urls
get_website_urls
create_map, pero las URLs se clasifican por relevancia a una search_query requerida. Úsalo cuando quieras los N enlaces más relevantes en un sitio.Solución de problemas
El servidor aparece pero muestra 0 herramientas
El servidor aparece pero muestra 0 herramientas
Authorization: Bearer sk_... — sin comillas alrededor del valor, sin espacios adicionales.`npx: command not found` o `command not found: olostep-mcp`
`npx: command not found` o `command not found: olostep-mcp`
Conexión rechazada o errores de DNS en `mcp.olostep.com`
Conexión rechazada o errores de DNS en `mcp.olostep.com`
npx -y olostep-mcp) — realiza solicitudes salientes a api.olostep.com en su lugar, lo cual generalmente está permitido.Configuración editada pero la lista de herramientas está desactualizada
Configuración editada pero la lista de herramientas está desactualizada
Fallos específicos de Windows con `npx`
Fallos específicos de Windows con `npx`
npx falla al iniciar el servidor en Windows, usa la forma envuelta en CMD:`401 Missing Authorization: Bearer <OLOSTEP_API_KEY>`
`401 Missing Authorization: Bearer <OLOSTEP_API_KEY>`
Recetas
Prompts para copiar y pegar que funcionan bien con las herramientas:- Raspar una lista de URLs de productos: “Tengo un CSV de 200 URLs de productos de Amazon. Ráspalos por lotes con
parser=@olostep/amazon-producty devuelve como JSON.” - Rastrear un sitio de documentación: “Rastrea https://stripe.com/docs con
max_pages=50yinclude_url_patterns=['/docs/**']. Resume cada sección como markdown.” - Encontrar competidores: “Usa
answerspara encontrar los 5 principales competidores de Notion para sitios de documentación técnica. Devuelve nombre, página de inicio y una línea de posicionamiento.” - Mapear y luego raspar: “Ejecuta
create_mapen https://example.com filtrado a/blog/**, luegobatch_scrape_urlsen los 20 mejores resultados.”