Tu agente OpenClaw puede leer documentación, pero no puede leer la web. El plugin Olostep Web Agent soluciona eso: busca, extrae, rastrea y extrae datos estructurados de cualquier sitio web, directamente dentro del flujo de trabajo de tu agente. Una instalación te da 13 habilidades para tareas de alto nivel (depurar un error desde hilos en vivo de StackOverflow, escribir código de integración desde documentos actuales, investigar herramientas con comparaciones estructuradas) y un servidor MCP de 9 herramientas para acceso programático directo. SPAs pesadas en JS, CAPTCHAs, Cloudflare, proxies residenciales: manejados automáticamente.Documentation Index
Fetch the complete documentation index at: https://docs.olostep.com/llms.txt
Use this file to discover all available pages before exploring further.
Instalación
Habilidades
Habilidades de Datos Básicas
Estas seis habilidades son los bloques de construcción. Cada una hace una cosa bien, y tu agente puede combinarlas para flujos de trabajo complejos.scrape
Cualquier URL a markdown limpio, HTML, JSON o texto. Renderizado completo del navegador, elusión de anti-bots, geo-segmentación, acciones del navegador (clic, desplazamiento, escritura) y analizadores preconstruidos para tipos de sitios comunes.
search
Tres modos: respuestas sintetizadas por IA con citas, datos crudos de SERP de Google (resultados orgánicos, PAA, gráfico de conocimiento) y descubrimiento de URL delimitado por dominio.
crawl
Comienza desde una URL, sigue enlaces, extrae cada página descubierta. Establece páginas máximas, incluye/excluye patrones de URL y controla la profundidad del rastreo.
batch
Extrae hasta 10,000 URLs en paralelo con renderizado completo. Etiqueta cada URL con
custom_id para mapear resultados de vuelta a tus fuentes.map
Descubre cada URL en un sitio web sin extraer ninguna de ellas. Filtra por patrones glob, clasifica por relevancia de consulta de búsqueda, limita con
top_n.answers
Haz una pregunta en lenguaje sencillo, obtén una respuesta sintetizada por IA basada en fuentes web en vivo. Pasa un parámetro
json para obtener salida estructurada que coincida con cualquier esquema que definas.Habilidades de Flujo de Trabajo
Estas siete habilidades encadenan múltiples operaciones básicas juntas. Manejan el pensamiento: tu agente solo elige la habilidad correcta para el trabajo.research
“Compara los 3 mejores ORMs para Node.js” — el agente busca en múltiples fuentes, extrae páginas de precios y características, y devuelve una comparación estructurada con citas y una recomendación.
debug-error
Pega un rastro de pila o mensaje de error. El agente busca en problemas de GitHub y StackOverflow ese error exacto, extrae los hilos relevantes y devuelve una solución basada en lo que hicieron los desarrolladores que enfrentaron el mismo problema.
docs-to-code
Apunta a una URL de documentación. El agente extrae la referencia API actual y escribe código de integración funcional a partir de lo que realmente está publicado, no de datos de entrenamiento obsoletos que pueden referenciar métodos obsoletos.
migrate-code
Dale tu versión actual y la versión objetivo. El agente extrae la guía de migración, extrae cada cambio importante con patrones antes/después y reescribe tu código para que coincida.
extract-schema
Convierte cualquier página web no estructurada — listados de productos, ofertas de trabajo, artículos — en JSON tipado que coincida con una interfaz TypeScript, esquema JSON o modelo de base de datos que proporciones.
integrate
Detecta automáticamente tu stack (lenguaje, framework, kit de herramientas de IA) y escribe una integración completa del SDK de Olostep: comandos de instalación, configuración del cliente, conexión de herramientas y un paso de verificación.
setup
Configura la clave API de Olostep y verifica la conexión. Incluye solución de problemas para problemas comunes de configuración.
Herramientas MCP
El servidor MCP incluido (olostep-mcp) le da a tu agente 9 herramientas que puede llamar directamente. Úsalas cuando necesites control detallado más allá de lo que proporcionan las habilidades de flujo de trabajo.
| Herramienta | Qué hace |
|---|---|
scrape_website | Extrae una sola URL a markdown, HTML, JSON o texto |
get_webpage_content | Obtiene una página web como markdown limpio, listo para LLM |
search_web | Busca en la web en vivo, obtiene respuestas sintetizadas por IA |
google_search | Datos estructurados de SERP de Google — resultados orgánicos, PAA, gráfico de conocimiento |
answers | Haz una pregunta, obtén una respuesta citada con salida JSON estructurada opcional |
batch_scrape_urls | Extrae hasta 10,000 URLs en paralelo con renderizado completo |
create_crawl | Rastrea un sitio web siguiendo enlaces desde una URL inicial |
create_map | Descubre todas las URLs en un sitio web, filtrables por patrón y consulta |
get_website_urls | Encuentra y recupera URLs relevantes de un dominio específico |
Cómo se ve esto en la práctica
”¿Por qué está fallando?” — Depurar desde la web en vivo
PegasECONNRESET al llamar al endpoint del webhook de Stripe en tu agente. Busca en problemas de GitHub y StackOverflow ese error exacto, extrae los tres hilos más relevantes y devuelve una solución concreta, no “verifica tu configuración de red”, sino la configuración de tiempo de espera real que lo resolvió para otros desarrolladores que enfrentaron el mismo problema.
”Escribe la integración” — Código desde documentos actuales, no datos de entrenamiento obsoletos
Necesitas integrar una API de pago. La habilidaddocs-to-code extrae la referencia API actual, la publicada hoy, no la versión en la que tu modelo fue entrenado hace seis meses, y escribe código funcional usando los parámetros y endpoints que realmente existen.
”¿Cuál debería usar?” — Comparaciones estructuradas de herramientas
¿Evaluando ORMs? ¿Comparando proveedores de autenticación? La habilidadresearch busca en múltiples fuentes, extrae páginas de precios reales y matrices de características, y devuelve una tabla de comparación estructurada con citas. Obtienes una recomendación respaldada por lo que realmente está en el sitio web de cada producto, no por la popularidad de los datos de entrenamiento.
Construye un pipeline RAG desde cualquier sitio de documentación
Extrae datos estructurados a escala
Migra a una nueva versión de framework
Estás actualizando Next.js de la versión 13 a la 15. La habilidadmigrate-code extrae la guía de migración oficial, extrae cada cambio importante con patrones de código antes/después y reescribe tus archivos para que coincidan, basado en la documentación real, no en la mejor suposición del modelo.
Analizadores Preconstruidos
Pasa el parámetroparser a cualquier llamada de extracción y obtén JSON tipado en lugar de contenido crudo. No se necesita definición de esquema: estos manejan la extracción por ti.
| Analizador | Devuelve |
|---|---|
@olostep/google-search | Resultados orgánicos, gráfico de conocimiento, People Also Ask |
@olostep/amazon-it-product | Precio, calificación, características, disponibilidad |
@olostep/extract-emails | Cada dirección de correo electrónico encontrada en la página |
@olostep/extract-calendars | Eventos de calendario estructurados |
@olostep/extract-socials | Enlaces a perfiles de redes sociales |
Enlaces
Instalar en ClawHub
Listado de plugins, historial de versiones y instalación con un solo comando
Obtener Clave API
500 solicitudes gratuitas/mes, sin tarjeta de crédito
Documentación del Servidor MCP
Configuración completa del servidor MCP para Cursor, Claude Desktop y otros clientes
Referencia de API
Documentación completa de endpoints con ejemplos