Saltar al contenido principal
Tu agente OpenClaw puede leer documentación, pero no puede leer la web. El plugin Olostep Web Agent soluciona eso: busca, extrae, rastrea y extrae datos estructurados de cualquier sitio web, directamente dentro del flujo de trabajo de tu agente. Una instalación te da 13 habilidades para tareas de alto nivel (depurar un error de hilos en vivo de StackOverflow, escribir código de integración desde documentos actuales, investigar herramientas con comparaciones estructuradas) y un servidor MCP de 9 herramientas para acceso programático directo. SPAs pesados en JS, CAPTCHAs, Cloudflare, proxies residenciales — manejados automáticamente.

Instalación

clawhub install olostep
Eso es todo. Si prefieres conectar el servidor MCP manualmente, añade esto a tu configuración de OpenClaw:
{
  "mcpServers": {
    "olostep": {
      "command": "npx",
      "args": ["-y", "olostep-mcp"],
      "env": {
        "OLOSTEP_API_KEY": "your-api-key-here"
      }
    }
  }
}
Obtén una clave API gratuita en olostep.com/auth — 500 solicitudes/mes, sin tarjeta de crédito.

Habilidades

Habilidades de Datos Básicas

Estas seis habilidades son los bloques de construcción. Cada una hace una cosa bien, y tu agente puede componerlas para flujos de trabajo complejos.

scrape

Cualquier URL a markdown limpio, HTML, JSON o texto. Renderizado completo del navegador, elusión de anti-bots, geo-segmentación, acciones del navegador (clic, desplazamiento, escritura) y analizadores preconstruidos para tipos de sitios comunes.

search

Tres modos: respuestas sintetizadas por IA con citas, datos crudos de SERP de Google (resultados orgánicos, PAA, gráfico de conocimiento) y descubrimiento de URL limitado a dominios.

crawl

Comienza desde una URL, sigue los enlaces, extrae cada página descubierta. Establece páginas máximas, incluye/excluye patrones de URL y controla la profundidad del rastreo.

batch

Extrae hasta 10,000 URLs en paralelo con renderizado completo. Etiqueta cada URL con custom_id para mapear los resultados a tus fuentes.

map

Descubre cada URL en un sitio web sin extraer ninguna de ellas. Filtra por patrones glob, clasifica por relevancia de consulta de búsqueda, limita con top_n.

answers

Haz una pregunta en lenguaje natural, obtén una respuesta sintetizada por IA basada en fuentes web en vivo. Pasa un parámetro json para obtener una salida estructurada que coincida con cualquier esquema que definas.

Habilidades de Flujo de Trabajo

Estas siete habilidades encadenan múltiples operaciones básicas juntas. Ellas manejan el pensamiento — tu agente solo elige la habilidad correcta para el trabajo.

research

“Compara los 3 mejores ORM para Node.js” — el agente busca en múltiples fuentes, extrae páginas de precios y características, y devuelve una comparación estructurada con citas y una recomendación.

debug-error

Pega un rastro de pila o mensaje de error. El agente busca en problemas de GitHub y StackOverflow ese error exacto, extrae los hilos relevantes y devuelve una solución basada en lo que hicieron los desarrolladores que enfrentaron el mismo problema.

docs-to-code

Apunta a una URL de documentos. El agente extrae la referencia API actual y escribe código de integración funcional de lo que realmente está publicado — no de datos de entrenamiento obsoletos que pueden referenciar métodos obsoletos.

migrate-code

Dale tu versión actual y la versión objetivo. El agente extrae la guía de migración, extrae cada cambio importante con patrones antes/después y reescribe tu código para que coincida.

extract-schema

Convierte cualquier página web no estructurada — listados de productos, ofertas de trabajo, artículos — en JSON tipado que coincida con una interfaz TypeScript, esquema JSON o modelo de base de datos que proporciones.

integrate

Detecta automáticamente tu stack (lenguaje, marco, kit de herramientas de IA) y escribe una integración completa del SDK de Olostep: comandos de instalación, configuración del cliente, conexión de herramientas y un paso de verificación.

setup

Configura la clave API de Olostep y verifica la conexión. Incluye solución de problemas para problemas comunes de configuración.

Herramientas MCP

El servidor MCP incluido (olostep-mcp) le da a tu agente 9 herramientas que puede llamar directamente. Úsalas cuando necesites un control detallado más allá de lo que proporcionan las habilidades de flujo de trabajo.
HerramientaQué hace
scrape_websiteExtrae una sola URL a markdown, HTML, JSON o texto
get_webpage_contentObtiene una página web como markdown limpio, listo para LLM
search_webBusca en la web en vivo, obtiene respuestas sintetizadas por IA
google_searchDatos estructurados de SERP de Google — resultados orgánicos, PAA, gráfico de conocimiento
answersHaz una pregunta, obtén una respuesta citada con salida JSON estructurada opcional
batch_scrape_urlsExtrae hasta 10,000 URLs en paralelo con renderizado completo
create_crawlRastrea un sitio web siguiendo enlaces desde una URL inicial
create_mapDescubre todas las URLs en un sitio web, filtrable por patrón y consulta
get_website_urlsEncuentra y recupera URLs relevantes de un dominio específico

Cómo se ve esto en la práctica

”¿Por qué está fallando?” — Depuración desde la web en vivo

Pegas ECONNRESET al llamar al endpoint del webhook de Stripe en tu agente. Busca en problemas de GitHub y StackOverflow ese error exacto, extrae los tres hilos más relevantes y devuelve una solución concreta — no “verifica la configuración de tu red”, sino la configuración de tiempo de espera real que lo resolvió para otros desarrolladores que enfrentaron el mismo obstáculo.

”Escribe la integración” — Código desde documentos actuales, no datos de entrenamiento obsoletos

Necesitas integrar una API de pago. La habilidad docs-to-code extrae la referencia API actual — la publicada hoy, no la versión en la que tu modelo fue entrenado hace seis meses — y escribe código funcional usando los parámetros y endpoints que realmente existen.

”¿Cuál debería usar?” — Comparaciones estructuradas de herramientas

¿Evaluando ORMs? ¿Comparando proveedores de autenticación? La habilidad research busca en múltiples fuentes, extrae páginas de precios reales y matrices de características, y devuelve una tabla de comparación estructurada con citas. Obtienes una recomendación respaldada por lo que realmente está en el sitio web de cada producto, no por la popularidad en los datos de entrenamiento.

Construye un pipeline RAG desde cualquier sitio de documentación

map   → descubre cada URL en el sitio de documentación
batch → extrae todas las páginas en paralelo como markdown limpio
      → alimenta en tu almacén vectorial
Dos habilidades, un pipeline. Funciona en sitios de documentación con cientos o miles de páginas.

Extrae datos estructurados a escala

map   → encuentra todas las URLs de productos, listados o trabajos
batch → extrae cada página con un analizador preconstruido → JSON tipado
      → canaliza a tu base de datos, API o archivos de semilla

Migra a una nueva versión de framework

Estás actualizando Next.js 13 a 15. La habilidad migrate-code extrae la guía de migración oficial, extrae cada cambio importante con patrones de código antes/después y reescribe tus archivos para que coincidan — basado en la documentación real, no en la mejor suposición del modelo.

Analizadores Preconstruidos

Pasa el parámetro parser a cualquier llamada de extracción y obtén JSON tipado en lugar de contenido crudo. No se necesita definición de esquema — estos manejan la extracción por ti.
AnalizadorDevuelve
@olostep/google-searchResultados orgánicos, gráfico de conocimiento, People Also Ask
@olostep/amazon-it-productPrecio, calificación, características, disponibilidad
@olostep/extract-emailsCada dirección de correo electrónico encontrada en la página
@olostep/extract-calendarsEventos de calendario estructurados
@olostep/extract-socialsEnlaces a perfiles de redes sociales

Enlaces

Instalar en ClawHub

Listado de plugins, historial de versiones y instalación con un solo comando

Obtener Clave API

500 solicitudes gratuitas/mes, sin tarjeta de crédito

Documentación del Servidor MCP

Configuración completa del servidor MCP para Cursor, Claude Desktop y otros clientes

Referencia API

Documentación completa de endpoints con ejemplos