Saltar al contenido principal
El servidor Olostep MCP ofrece a cualquier cliente AI compatible con MCP (Claude, Cursor, Windsurf, VS Code, Claude Code, etc.) 10 herramientas listas para usar en la web en vivo: scraping, búsqueda, respuestas AI con citas, trabajos por lotes, rastreo de sitios y descubrimiento de URLs.

Raspar y extraer

Extrae markdown, HTML, JSON o texto de cualquier URL con renderizado JS opcional

Respuestas AI

Respuestas fundamentadas en la web con fuentes y salida estructurada

Lote y rastreo

Hasta 10k URLs en paralelo, o descubre un sitio completo de manera autónoma

Mapa y búsqueda

Encuentra cada URL en un sitio, o ejecuta una búsqueda web basada en parser

Antes de comenzar

Necesitas una clave API de Olostep. Consigue una desde el tablero de Olostep — el nivel gratuito cubre el uso personal.

Elige una ruta de configuración

La ruta más rápida para cada cliente es el endpoint alojado en https://mcp.olostep.com/mcp. Sin instalaciones, sin Node, sin Docker — solo pega una URL y tu clave API. Si necesitas que funcione completamente local (uso offline, proxy corporativo, aislado), cada cliente también admite una instalación local stdio a través de npx. Cada sección a continuación muestra ambos.
Endpoint alojado usa Authorization: Bearer YOUR_API_KEY. Local stdio usa OLOSTEP_API_KEY como una variable de entorno. No los mezcles — el modo de autenticación incorrecto es el error de incorporación número 1.

Configuración del cliente

Instalación con un clic (recomendada):Agregar servidor Olostep MCP a CursorReemplaza YOUR_API_KEY en la configuración resultante con tu clave real.Configuración manual:Crea o edita .cursor/mcp.json en la raíz de tu proyecto (o ~/.cursor/mcp.json para global):
{
  "mcpServers": {
    "olostep": {
      "url": "https://mcp.olostep.com/mcp",
      "headers": {
        "Authorization": "Bearer YOUR_API_KEY"
      }
    }
  }
}
{
  "mcpServers": {
    "olostep": {
      "command": "npx",
      "args": ["-y", "olostep-mcp"],
      "env": {
        "OLOSTEP_API_KEY": "YOUR_API_KEY"
      }
    }
  }
}
Requiere Node.js 18+ en tu máquina.
Verificar: Abre Cursor → Configuración → MCP. Deberías ver olostep listado con 10 herramientas incluyendo scrape_website. Si ves “Conectado, 0 herramientas”, tu clave API es incorrecta.

Elegir la herramienta adecuada

El servidor MCP expone 10 herramientas. Usa este árbol de decisiones para elegir la correcta — el agente usa el mismo razonamiento:
Quieres…UsaNotas
El contenido de una página específicascrape_website o get_webpage_contentEstablece wait_before_scraping=2000–5000 para SPAs
Una respuesta web en lenguaje natural con fuentesanswersDevuelve síntesis AI + citas
Resultados de búsqueda para una consultasearch_webBasado en parser, no AI, estructurado
Una lista de URLs en un sitiocreate_mapSolo descubrimiento de URLs — NO raspa
URLs filtradas por consultaget_website_urlsClasificadas por relevancia a tu search_query
Muchas URLs conocidas a la vezbatch_scrape_urls + get_batch_resultsAsíncrono — inicia, luego consulta
Un sitio completo o seccióncreate_crawl + get_crawl_resultsAsíncrono — sigue enlaces desde una URL de inicio
¿Raspar un sitio completo? Usa create_crawl, no batch_scrape_urls. Crawl descubre Y raspa. Batch es para una lista conocida de URLs que ya tienes.

Detalles de las herramientas

Extrae contenido de una sola URL. Soporta markdown, html, json, text. Opcional country para solicitudes geo-dirigidas, wait_before_scraping (0–10000 ms) para sitios pesados en JS, y parser (por ejemplo, @olostep/amazon-product) para extracción estructurada.
Versión ligera solo markdown de scrape_website. Úsalo cuando solo quieras markdown limpio y no necesites opciones de formato.
Resultados de búsqueda web estructurados (basados en parser) para una consulta. Opcional country para resultados localizados. Devuelve JSON, no prosa AI.
Respuesta impulsada por AI a una task con fuentes y citas. Pasa un argumento json para obtener la respuesta en una forma específica — ya sea un esquema JSON o una breve descripción en lenguaje natural.
Raspa asíncronamente de 2–10k URLs que ya tienes. Devuelve un batch_id — luego llama a get_batch_results para obtener el contenido. Establece wait_for_completion_seconds (hasta 900) si deseas una sola llamada bloqueante en lugar de consultar. Recomendado: 60 para lotes de menos de 50 URLs, 300–600 para 50–1k, 0 (consulta por separado) para lotes más grandes.
Obtiene el estado y el contenido raspado para un batch_id. Devuelve processing hasta que esté completo, luego completed con el array de elementos.
Rastreo asíncrono que sigue enlaces desde un start_url. Usa include_url_patterns / exclude_url_patterns (sintaxis glob como /blog/**) para definir el alcance. Devuelve un crawl_id — luego llama a get_crawl_results.
Obtiene el estado y las páginas para un crawl_id. Soporta paginación a través de cursor y items_limit (máximo 100 por llamada). Devuelve in_progress hasta que esté completo.
Obtén una lista de URLs en un sitio. Solo descubrimiento de URLs — no raspa. Úsalo cuando quieras mostrar URLs candidatas (por ejemplo, dejar que el usuario elija un subconjunto). Soporta include_url_patterns / exclude_url_patterns y search_query.
Como create_map, pero las URLs se clasifican por relevancia a una search_query requerida. Úsalo cuando quieras los N enlaces más relevantes en un sitio.

Solución de problemas

Tu clave API es inválida o está limitada por tasa. Abre el tablero de claves API y verifica la clave. Si usas el endpoint alojado, el encabezado debe ser exactamente Authorization: Bearer sk_... — sin comillas alrededor del valor, sin espacios adicionales.
Node.js no está instalado (o no está en tu PATH). Instala Node 18+ desde nodejs.org, luego reinicia tu terminal y tu cliente MCP. En Windows, cambia a un CMD/PowerShell que tenga Node en el PATH.
Probablemente estés detrás de un proxy corporativo o firewall que bloquea el host. Cambia a la instalación local stdio (npx -y olostep-mcp) — realiza solicitudes salientes a api.olostep.com en su lugar, lo cual generalmente está permitido.
El cliente almacenó en caché la configuración antigua. Cierra completamente y reinicia — no solo cierres la ventana. Claude Desktop en particular sigue ejecutándose en la barra de menú / bandeja del sistema.
Si npx falla al iniciar el servidor en Windows, usa la forma envuelta en CMD:
{
  "command": "cmd",
  "args": ["/c", "npx", "-y", "olostep-mcp"],
  "env": { "OLOSTEP_API_KEY": "YOUR_API_KEY" }
}
Accediste al endpoint alojado sin un encabezado de autenticación (o con el formato incorrecto). Agrega el encabezado a la configuración de tu cliente exactamente como se muestra en la pestaña de configuración.

Recetas

Prompts para copiar y pegar que funcionan bien con las herramientas:
  • Raspar una lista de URLs de productos: “Tengo un CSV de 200 URLs de productos de Amazon. Ráspalos por lotes con parser=@olostep/amazon-product y devuelve como JSON.”
  • Rastrear un sitio de documentación: “Rastrea https://stripe.com/docs con max_pages=50 y include_url_patterns=['/docs/**']. Resume cada sección como markdown.”
  • Encontrar competidores: “Usa answers para encontrar los 5 principales competidores de Notion para sitios de documentación técnica. Devuelve nombre, página de inicio y una línea de posicionamiento.”
  • Mapear y luego raspar: “Ejecuta create_map en https://example.com filtrado a /blog/**, luego batch_scrape_urls en los 20 mejores resultados.”

Fuente y versiones