Saltar al contenido principal
El nodo verificado Olostep Web Scraper te ofrece seis operaciones dentro del constructor visual de n8n: extraer una URL, buscar en la web, obtener respuestas de IA, extraer por lotes miles de URLs, rastrear un sitio o mapear todos sus enlaces. Ver en n8n →

Antes de comenzar

  • Una cuenta de Olostep con una clave API: obtén una gratis, no se requiere tarjeta de crédito. Tus primeros 500 créditos están incluidos.
  • n8n en funcionamiento: ya sea n8n Cloud o una instancia autoalojada. Los nodos de la comunidad deben estar habilitados (lo están por defecto en la mayoría de las configuraciones).
  • No se requiere codificación: todo en esta guía se realiza a través del editor visual de n8n.

Configuración

1

Busca el nodo de Olostep

Abre cualquier flujo de trabajo, haz clic en + y busca Olostep. Selecciona Olostep Web Scraper de los resultados.Buscar Olostep en el selector de nodos de n8n
2

Instala el nodo

Haz clic en el resultado para abrir el panel de detalles del nodo, luego haz clic en Instalar nodo. n8n instalará n8n-nodes-olostep y te pedirá que reinicies. Hazlo antes de continuar.Detalles del nodo Olostep Web Scraper con botón Instalar nodo
Si Nodos de la Comunidad está deshabilitado para tu espacio de trabajo, un administrador debe habilitarlo primero. Consulta la guía de nodos de la comunidad de n8n.
3

Añade tu clave API

Abre el nodo de Olostep en tu flujo de trabajo, haz clic en Configurar Credencial (en la pestaña de Parámetros), añade tu clave API y haz clic en Guardar.Formulario de credenciales de Olostep en n8n con campo de Clave APIObtén tu clave desde el panel de Olostep →
4

Conéctalo y ejecuta

Conecta el nodo de Olostep a un disparador y a cualquier paso posterior, luego ejecuta tu flujo de trabajo.Lienzo de flujo de trabajo de n8n con Disparador de Programación conectado al nodo Olostep

Acciones

Extraer Sitio Web

Extrae contenido de cualquier URL como Markdown, HTML, JSON o texto plano. Maneja páginas renderizadas en JS con tiempos de espera opcionales y orientación por país.

Buscar

Realiza una búsqueda web y obtén resultados estructurados (títulos, URLs y fragmentos) como JSON.

Respuestas (IA)

Haz una pregunta en lenguaje natural y obtén una respuesta con fuentes citadas. Útil antes de los nodos LLM cuando necesitas respuestas fundamentadas.

Extraer URLs por Lotes

Envía hasta 10,000 URLs en un solo trabajo, procesadas en paralelo. Devuelve un batch_id; recupera resultados de forma asincrónica.

Crear Rastreo

Comienza desde una URL, sigue enlaces y extrae todas las subpáginas. Bueno para sitios de documentación, blogs o ingestión de sitios completos. Devuelve un crawl_id.

Crear Mapa

Obtén cada URL en un sitio sin extraer contenido. Úsalo para descubrimiento antes de un trabajo por lotes. Devuelve un map_id.
Batch, Crawl y Map son asincrónicos. Almacena el ID devuelto y usa un nodo de Espera o un segundo flujo de trabajo para recuperar resultados una vez que el procesamiento se complete.

Ejemplo de flujo de trabajo: Enriquecimiento de leads desde Google Sheets

Qué hace: Cuando pegas una URL de empresa en una hoja de Google, este flujo de trabajo automáticamente extrae el sitio web de la empresa, extrae información clave con un nodo de IA y escribe los resultados de vuelta en la misma fila, convirtiendo una hoja de cálculo en blanco en una base de datos de leads completa. Nodos utilizados: Disparador de Google Sheets → Olostep Extraer Sitio Web → OpenAI → Código → Actualización de Google Sheets Flujo de trabajo de enriquecimiento de leads en n8n: Disparador de Google Sheets conectado a nodos de Olostep, OpenAI, Código y actualización de Google Sheets

Paso 1: Configura tu Hoja de Google

Crea una hoja con estas columnas: URL de la Empresa, Industria, Descripción, Tamaño de la Empresa, Enriquecido. El flujo de trabajo lee desde URL de la Empresa y completa el resto.

Paso 2: Añade un disparador de Google Sheets

En n8n, añade un nodo de disparador de Google Sheets. Configura el evento en Fila Añadida, apúntalo a tu hoja y configúralo para observar la columna URL de la Empresa. Ahora, cada vez que pegues una nueva URL en la hoja, este flujo de trabajo se activará.

Paso 3: Añade Olostep Extraer Sitio Web

Conecta un nodo de Olostep Web Scraper después del disparador. Configura:
  • Acción: Extraer Sitio Web
  • URL: {{ $json["Company URL"] }} (extrae la URL de la nueva fila)
  • Formato de Salida: Markdown
Markdown funciona mejor aquí porque elimina la navegación, anuncios y plantillas. El nodo de IA en el siguiente paso obtiene prosa limpia sobre la empresa en lugar de ruido HTML bruto.

Paso 4: Añade un nodo de OpenAI

Conecta un nodo de OpenAI. Configura el modelo a gpt-4o-mini (rápido y económico para tareas de extracción) y usa este prompt:
Eres un investigador de ventas. Basado en el contenido del sitio web de la empresa a continuación, extrae:
1. Industria (una frase, por ejemplo, "B2B SaaS", "E-commerce", "Salud")
2. Descripción de la empresa en una oración (máximo 20 palabras)
3. Tamaño estimado de la empresa (Startup / SMB / Mid-market / Enterprise)

Devuelve solo un objeto JSON con claves: industry, description, company_size.

Contenido del sitio web:
{{ $json.markdownContent }}
El campo markdownContent es lo que Olostep devuelve de la extracción, como texto plano limpio.

Paso 5: Analiza la respuesta de IA y escribe de vuelta

Añade un nodo de Código para analizar el JSON de OpenAI:
const parsed = JSON.parse($input.first().json.message.content);
return [{ json: parsed }];
Luego conecta un nodo de Google Sheets configurado para Actualizar Fila. Mapea las columnas:
  • Industria{{ $json.industry }}
  • Descripción{{ $json.description }}
  • Tamaño de la Empresa{{ $json.company_size }}
  • Enriquecido

Lo que obtienes

Pega una URL como https://notion.so en tu hoja, y en ~10 segundos la fila se completa:
URL de la EmpresaIndustriaDescripciónTamaño de la EmpresaEnriquecido
https://notion.soSaaS de ProductividadEspacio de trabajo todo en uno para notas, documentos y bases de datosMid-market
Desde aquí puedes extender este flujo de trabajo: añade una notificación de Slack cuando el enriquecimiento se complete, filtra por industria antes de escribir de vuelta, o reemplaza Google Sheets con HubSpot para actualizar contactos directamente.

Plantillas

Flujos de trabajo de n8n listos para importar construidos con Olostep:

Rastrear docs → base de conocimiento de IA

Rastrear sitios de documentación con Olostep y estructurar la salida en una base de conocimiento lista para IA.

Leads de Google Maps → enriquecimiento de tomadores de decisiones

Extrae leads de negocios de Google Maps y enriquécelos con detalles de tomadores de decisiones.

Minar quejas de usuarios → informe de insights

Analiza quejas con Olostep + Gemini y genera informes de insights estructurados en Google Docs.

Extracción de productos de Amazon → Google Sheets

Extrae URLs y metadatos de productos de Amazon con Olostep, luego sincroniza los resultados con Sheets.
Explora todos los flujos de trabajo de Olostep en n8n.io →

Parsers

Añade un ID de parser al campo Parser en cualquier acción de Scrape o Batch para obtener datos estructurados en lugar de contenido bruto:
ParserExtrae
@olostep/amazon-productTítulo, precio, calificación, reseñas, imágenes, variantes
@olostep/google-searchTítulos de resultados, URLs, fragmentos
@olostep/google-mapsNombre del negocio, dirección, calificación, reseñas
@olostep/extract-emailsDirecciones de correo electrónico de cualquier página
@olostep/extract-socialsEnlaces de perfiles sociales (X, GitHub, LinkedIn, etc.)
@olostep/extract-calendarsEnlaces de Google Calendar y ICS
Consulta la lista completa en la tienda de parsers de Olostep →

Solución de problemas

Copia la clave directamente desde olostep.com/dashboard sin espacios finales. Elimina y recrea la credencial en n8n si el error persiste.
Aumenta Esperar Antes de Extraer (prueba 2000–5000ms para páginas pesadas en JS). Confirma que la URL es accesible públicamente sin un inicio de sesión. Si un dominio específico falla constantemente, contacta a info@olostep.com.
El campo URLs para Extraer espera un array JSON:
[
  { "url": "https://example.com/page-1", "custom_id": "p1" },
  { "url": "https://example.com/page-2", "custom_id": "p2" }
]
Usa un nodo de Código aguas arriba para construir este array desde tus datos si es necesario.
Añade un nodo de Espera entre los pasos de extracción, o cambia a Extraer URLs por Lotes en lugar de hacer scrapes individuales en bucle. Verifica el uso actual en el panel.
En n8n Cloud, los nodos de la comunidad deben ser habilitados por un propietario del espacio de trabajo. En autoalojado, asegúrate de que N8N_COMMUNITY_PACKAGES_ENABLED=true esté configurado en tu entorno. Consulta la guía de instalación de n8n.

Relacionado

API de Scrapes

Referencia completa para el endpoint de scrape

API de Batches

Cómo funcionan los trabajos por lotes y cómo recuperar resultados

API de Crawls

Configuración de rastreo y recuperación de resultados

API de Maps

Descubrimiento de URLs y opciones de filtrado

Comienza

¿Listo para automatizar tus flujos de trabajo de búsqueda web, scraping y rastreo?

Sitio web de n8n

Plataforma n8n

Instalar el Nodo

Instala n8n-nodes-olostep y comienza a construir flujos de trabajo automatizados
¡Conecta Olostep con n8n y automatiza hoy mismo la extracción de datos web!