Saltar al contenido principal
La integración de Olostep con n8n lleva potentes capacidades de búsqueda web, scraping y crawling a los flujos de trabajo de n8n. Construye flujos de trabajo automatizados que buscan, extraen y estructuran datos web de cualquier sitio web sin necesidad de escribir código. Comienza con Olostep en n8n →

Características

La integración proporciona 6 operaciones potentes para la extracción automatizada de datos web:

Raspar Sitio Web

Extrae contenido de cualquier URL única en múltiples formatos (Markdown, HTML, JSON, texto)

Buscar

Busca en la Web y obtén resultados estructurados

Respuestas (IA)

Busca en la Web con IA y obtén respuestas estructuradas con fuentes y citas

Raspar URLs en Lote

Raspa hasta 10k URLs al mismo tiempo. Perfecto para la extracción de datos a gran escala

Crear Rastreo

Obtén el contenido de las subpáginas de una URL. Descubre y raspa sitios web enteros de manera autónoma

Crear Mapa

Obtén todas las URLs de un sitio web para análisis de estructura del sitio y descubrimiento de contenido

Instalación

1. Instala el Nodo

Instala el paquete de nodo de Olostep a través de npm:
npm install n8n-nodes-olostep
Luego reinicia n8n para cargar el nuevo nodo. Alternativamente, sigue la guía de instalación de nodos comunitarios de n8n para obtener instrucciones detalladas.

2. Conecta Tu Cuenta

La primera vez que uses el nodo de Olostep en un flujo de trabajo, necesitarás configurar credenciales:
  1. Añade el nodo “Olostep Scrape” a tu flujo de trabajo
  2. Haz clic en el nodo para abrir su configuración
  3. Haz clic en “Crear Nueva Credencial” o selecciona credenciales existentes
  4. Ingresa tu clave API de Olostep
  5. Haz clic en “Guardar” para almacenar la credencial
Obtén tu clave API desde el Panel de Control de Olostep.

Acciones Disponibles

Raspar Sitio Web

Extrae contenido de una URL única. Soporta múltiples formatos y renderizado de JavaScript. Casos de Uso:
  • Monitorear cambios en páginas específicas
  • Extraer información de productos de sitios de comercio electrónico
  • Recolectar datos de artículos de noticias o publicaciones de blogs
  • Obtener contenido para agregación de contenido
Configuración:
URL para Raspar
string
requerido
URL del sitio web a raspar (debe incluir http:// o https://)
Formato de Salida
dropdown
predeterminado:"Markdown"
Elige formato: Markdown, HTML, JSON o Texto Plano
Código de País
string
Código de país para contenido específico de ubicación (por ejemplo, “US”, “GB”, “CA”)
Esperar Antes de Raspar
integer
Tiempo de espera en milisegundos para renderizado de JavaScript (0-10000)
Parser
string
ID de parser opcional para extracción especializada (por ejemplo, “@olostep/amazon-product”)
Campos de Salida:
  • ID de Raspeo
  • URL Raspada
  • Contenido Markdown
  • Contenido HTML
  • Contenido JSON
  • Contenido de Texto
  • Estado
  • Marca de Tiempo
  • URL de Captura de Pantalla (si está disponible)
  • Metadatos de la Página
Ejemplos de Flujos de Trabajo:
Disparador: Programación (Todos los días a las 9 AM)Acción: Olostep - Raspar Sitio Web
  • URL: Página de producto de la competencia
  • Formato: JSON
  • Parser: @olostep/amazon-product
Acción: Google Sheets - Añadir Fila
  • Añadir datos de precios a la hoja de seguimiento
Acción: Email - Enviar Email (Si el precio baja)
  • Alertar al equipo sobre cambios de precio
Disparador: RSS Feed - Nuevo ElementoAcción: Olostep - Raspar Sitio Web
  • URL: {{$json.link}}
  • Formato: Markdown
Acción: Notion - Crear Página
  • Guardar contenido del artículo en la base de datos de Notion
Disparador: Google Sheets - Nueva FilaAcción: Olostep - Raspar Sitio Web
  • URL: Sitio web de la empresa desde la hoja
  • Formato: Markdown
Acción: OpenAI - Completar Texto
  • Extraer información de la empresa usando IA
Acción: Google Sheets - Actualizar Fila
  • Añadir datos enriquecidos de vuelta a la hoja

Buscar

Busca en la Web una consulta dada y obtén resultados estructurados (resultados de búsqueda basados en parser, no IA). Casos de Uso:
  • Flujos de trabajo de investigación automatizada
  • Descubrimiento y enriquecimiento de leads
  • Análisis competitivo
  • Investigación de contenido
Configuración:
Consulta
string
requerido
Consulta de búsqueda
Salida: Devuelve resultados de búsqueda estructurados como JSON con títulos, URLs, fragmentos y metadatos. Ejemplos de Flujos de Trabajo:
Disparador: Programación (Diariamente a las 8 AM)Acción: Olostep - Buscar
  • Consulta: “últimos desarrollos en IA”
Acción: Código - Procesar Resultados
  • Extraer y formatear información clave
Acción: Notion - Crear Páginas
  • Almacenar hallazgos de investigación
Disparador: Manual (Botón)Acción: Olostep - Buscar
  • Consulta: ”{{$json.searchTerm}}”
Acción: Airtable - Crear Registros
  • Almacenar leads con información de contacto

Raspar URLs en Lote

Raspa hasta 10k URLs al mismo tiempo. Perfecto para la extracción de datos a gran escala. Casos de Uso:
  • Raspar catálogos de productos completos
  • Extraer datos de múltiples resultados de búsqueda
  • Procesar listas de URLs desde hojas de cálculo
  • Extracción de contenido en masa
Configuración:
URLs para Raspar
text
requerido
Array JSON de objetos con campos url y custom_id.Ejemplo: [{"url":"https://example.com","custom_id":"site1"}]
Formato de Salida
dropdown
predeterminado:"Markdown"
Elige formato para todas las URLs: Markdown, HTML, JSON o Texto Plano
Código de País
string
Código de país para scraping específico de ubicación
Esperar Antes de Raspar
integer
Tiempo de espera en milisegundos para renderizado de JavaScript
Parser
string
ID de parser opcional para extracción especializada
Campos de Salida:
  • ID de Lote (úsalo para recuperar resultados más tarde)
  • Estado
  • Total de URLs
  • Creado En
  • Formato Solicitado
  • Código de País
  • Parser Usado
Ejemplos de Flujos de Trabajo:
Disparador: Webhook - Recibir Solicitud POSTAcción: Código - Formatear URLs
  • Convertir CSV/lista a formato de array JSON
Acción: Olostep - Raspar URLs en Lote
  • URLs: {{$json.urlArray}}
  • Formato: JSON
  • Parser: @olostep/amazon-product
Acción: Webhook - POST
  • Enviar ID de lote a tu sistema para recuperación
Disparador: Programación - Todos los días a las 6 AMAcción: Google Sheets - Leer Filas
  • Obtener URLs para monitorear
Acción: Código - Formatear URLs
  • Convertir a formato de array de lote
Acción: Olostep - Raspar URLs en Lote
  • Procesar todas las URLs a la vez
Acción: Slack - Enviar Mensaje
  • Notificar al equipo que el scraping está completo

Crear Rastreo

Obtén el contenido de las subpáginas de una URL. Descubre y raspa sitios web enteros de manera autónoma siguiendo enlaces. Perfecto para sitios de documentación, blogs y repositorios de contenido. Casos de Uso:
  • Rastrear y archivar sitios de documentación completos
  • Extraer todas las publicaciones de blog de un sitio web
  • Construir bases de conocimiento a partir de contenido web
  • Monitorear cambios en la estructura del sitio web
Configuración:
URL de Inicio
string
requerido
URL de inicio para el rastreo (debe incluir http:// o https://)
Máximo de Páginas
integer
predeterminado:"10"
Número máximo de páginas a rastrear
Seguir Enlaces
boolean
predeterminado:"true"
Si se deben seguir los enlaces encontrados en las páginas
Formato de Salida
dropdown
predeterminado:"Markdown"
Formato para el contenido raspado
Código de País
string
Código de país opcional para rastreo específico de ubicación
Parser
string
ID de parser opcional para extracción de contenido especializada
Campos de Salida:
  • ID de Rastreo (úsalo para recuperar resultados más tarde)
  • Tipo de Objeto
  • Estado
  • URL de Inicio
  • Máximo de Páginas
  • Seguir Enlaces
  • Marca de Tiempo Creada
  • Formatos
Ejemplos de Flujos de Trabajo:
Disparador: Programación - Mensualmente el 1º a las 12 AMAcción: Olostep - Crear RastreoAcción: Webhook - POST
  • Enviar ID de rastreo a tu sistema de archivo
Acción: Slack - Enviar Mensaje
  • Notificar al equipo que el rastreo está en progreso
Disparador: Programación - Semanalmente los lunes a las 9 AMAcción: Olostep - Crear Rastreo
  • URL de Inicio: URL del blog de la competencia
  • Máx. Páginas: 100
  • Formato: Markdown
Acción: Esperar - Por 10 minutos
  • Esperar a que el rastreo se complete
Acción: Airtable - Crear Registros
  • Almacenar datos de rastreo para análisis

Crear Mapa

Obtén todas las URLs de un sitio web. Extrae todas las URLs de un sitio web para descubrimiento de contenido y análisis de estructura del sitio. Casos de Uso:
  • Construir mapas de sitio y diagramas de estructura del sitio
  • Descubrir todas las páginas antes de raspar en lote
  • Encontrar páginas rotas o faltantes
  • Auditorías y análisis SEO
Configuración:
URL del Sitio Web
string
requerido
URL del sitio web para extraer enlaces (debe incluir http:// o https://)
Consulta de Búsqueda
string
Consulta de búsqueda opcional para filtrar URLs (por ejemplo, “blog”)
Top N URLs
integer
Limitar el número de URLs devueltas
Incluir Patrones de URL
string
Patrones glob para incluir rutas específicas (por ejemplo, “/blog/**”)
Excluir Patrones de URL
string
Patrones glob para excluir rutas específicas (por ejemplo, “/admin/**”)
Campos de Salida:
  • ID de Mapa
  • Tipo de Objeto
  • URL del Sitio Web
  • Total de URLs Encontradas
  • URLs (array JSON)
  • Consulta de Búsqueda
  • Límite de Top N
Ejemplos de Flujos de Trabajo:
Disparador: Manual (Botón)Acción: Olostep - Crear MapaAcción: Código - Extraer URLs
  • Analizar URLs del resultado del mapa
Acción: Olostep - Raspar URLs en Lote
  • URLs: {{$json.urls}}
  • Formato: JSON
Acción: Google Sheets - Añadir Filas
  • Añadir todos los datos de productos a la hoja de cálculo
Disparador: Programación - MensualmenteAcción: Olostep - Crear Mapa
  • URL: Tu sitio web
  • Top N: 1000
Acción: Airtable - Crear Registros
  • Almacenar todas las URLs para seguimiento
Acción: Slack - Enviar Mensaje
  • Informar el total de páginas encontradas

Ejemplos Populares de Flujos de Trabajo

Monitoreo de Precios en E-commerce

Monitorea precios de la competencia y recibe alertas instantáneas:
Disparador: Programación (Cada hora)

Acción: Olostep - Raspar Sitio Web
  - URL: Página de producto de la competencia
  - Formato: JSON
  - Parser: @olostep/amazon-product

Acción: IF - Verificar si el precio cambió

Acción: Slack - Enviar Mensaje
  - Alerta: "El precio cambió a $\{\{price\}\}"

Agregación de Contenido

Agrega contenido de múltiples fuentes:
Disparador: Google Sheets - Nueva Fila

Acción: Olostep - Raspar Sitio Web
  - URL: \{\{$json.url\}\}
  - Formato: Markdown

Acción: OpenAI - Resumir
  - Resumir el contenido

Acción: Airtable - Crear Registro
  - Almacenar artículo con resumen

Pipeline de Enriquecimiento de Leads

Enriquece datos de leads con información web:
Disparador: HubSpot - Nuevo Contacto

Acción: Olostep - Raspar Sitio Web
  - URL: \{\{$json.companyWebsite\}\}
  - Formato: Markdown

Acción: OpenAI - Extraer Datos
  - Extraer: tamaño de la empresa, industria, productos

Acción: HubSpot - Actualizar Contacto
  - Añadir datos enriquecidos al contacto

Automatización de Investigación

Automatiza la investigación desde múltiples fuentes:
Disparador: Airtable - Nuevo Registro

Acción: Olostep - Crear Mapa
  - URL: Sitio web objetivo de investigación
  - Incluir: /research/**

Acción: Código - Analizar URLs

Acción: Olostep - Raspar URLs en Lote
  - URLs: \{\{$json.discoveredUrls\}\}
  - Formato: Markdown

Acción: Notion - Crear Páginas
  - Crear base de datos de investigación

Monitoreo de Redes Sociales

Rastrea menciones y contenido:
Disparador: Programación (Cada 6 horas)

Acción: Olostep - Raspar Sitio Web
  - URL: Página de búsqueda de sitio de noticias
  - Formato: HTML

Acción: Código - Extraer Menciones
  - Encontrar menciones de marca

Acción: Google Sheets - Añadir Fila
  - Registrar menciones con marca de tiempo

Flujos de Trabajo de Múltiples Pasos

Pipeline Completo de Scraping de Productos

Construye un pipeline completo de datos de productos:
1

Descubrir URLs de Productos

Usa Crear Mapa para encontrar todas las páginas de productos en el sitio web objetivo
  • Incluir patrones: /products/**
  • Excluir patrones: /cart/**, /checkout/**
2

Procesar Productos en Lote

Usa Raspar URLs en Lote para extraer todos los datos de productos
  • Formato: JSON
  • Parser: Parser específico de producto si está disponible
3

Almacenar en Base de Datos

Envía el ID de lote a tu sistema o espera y recupera resultados
  • Usa Airtable, Google Sheets o tu base de datos
4

Monitorear Cambios

Programa raspeos diarios para rastrear cambios de precio/disponibilidad
  • Compara con datos existentes
  • Alerta sobre cambios significativos

Estrategia de Contenido SEO

Analiza competidores y planifica contenido:
1

Mapear Sitios de la Competencia

Usa Crear Mapa en sitios web de la competencia
  • Extraer todas las publicaciones de blog y páginas de contenido
2

Raspar Contenido

Usa Raspar URLs en Lote para obtener contenido completo
  • Formato: Markdown para análisis fácil
3

Análisis con IA

Usa OpenAI para analizar temas y palabras clave
  • Identificar brechas de contenido
  • Encontrar temas de tendencia
4

Crear Calendario de Contenido

Añadir ideas a Notion o Airtable
  • Planificar tu estrategia de contenido

Parsers Especializados

Olostep proporciona parsers preconstruidos para sitios web populares. Úsalos con el campo Parser:

Producto de Amazon

@olostep/amazon-productExtrae: título, precio, calificación, reseñas, imágenes, variantes

Búsqueda de Google

@olostep/google-searchExtrae: resultados de búsqueda, títulos, fragmentos, URLs

Google Maps

@olostep/google-mapsExtrae: información de negocios, reseñas, calificaciones, ubicación

Extraer Emails

@olostep/extract-emailsExtrae: emails de páginas, listas de contactos y pies de página

Extraer Redes Sociales

@olostep/extract-socialsExtrae: enlaces de perfiles sociales (X/Twitter, GitHub, etc.)

Extraer Calendarios

@olostep/extract-calendarsExtrae: enlaces de calendario (Google Calendar, ICS) de páginas

Uso de Parsers

Simplemente añade el ID del parser al campo Parser. Dos ejemplos:
Acción: Olostep - Raspar Sitio Web
  - URL: https://www.amazon.com/dp/PRODUCT_ID
  - Formato: JSON
  - Parser: @olostep/amazon-product
Acción: Olostep - Raspar Sitio Web
  - URL: https://example.com/contact
  - Formato: JSON
  - Parser: @olostep/extract-emails
El parser extrae automáticamente datos estructurados específicos para la tarea.

Integración con Aplicaciones Populares

Google Sheets

Perfecto para la recolección y seguimiento de datos:
1. Olostep raspa el sitio web
2. Filtrar o transformar datos
3. Google Sheets - Añadir Fila
Casos de Uso:
  • Hojas de seguimiento de precios
  • Bases de datos de enriquecimiento de leads
  • Inventario de contenido
  • Hojas de análisis de la competencia

Airtable

Construye bases de datos potentes con datos raspados:
1. Olostep raspa o rastrea
2. Código - Formatear datos
3. Airtable - Crear Registros
Casos de Uso:
  • Catálogos de productos
  • Bases de datos de investigación
  • Calendarios de contenido
  • Bases de datos de enlaces

Slack

Recibe notificaciones instantáneas:
1. Olostep monitorea la página
2. IF - Verificar cambios
3. Slack - Enviar Mensaje
Casos de Uso:
  • Alertas de caída de precios
  • Notificaciones de actualización de contenido
  • Monitoreo de errores
  • Resúmenes diarios

HubSpot / Salesforce

Enriquece datos de CRM automáticamente:
1. Nuevo contacto añadido
2. Olostep raspa el sitio web de la empresa
3. OpenAI extrae información clave
4. CRM - Actualizar contacto
Casos de Uso:
  • Enriquecimiento de leads
  • Investigación de empresas
  • Inteligencia competitiva
  • Mapeo de cuentas

Notion

Construye bases de conocimiento:
1. Olostep rastrea documentación
2. Código - Analizar contenido
3. Notion - Crear Páginas
Casos de Uso:
  • Espejos de documentación
  • Repositorios de investigación
  • Bibliotecas de contenido
  • Wikis de equipo

Mejores Prácticas

Al raspar más de 3-5 URLs, usa Raspar URLs en Lote en lugar de múltiples acciones de Raspar Sitio Web. El procesamiento en lote es:
  • Mucho más rápido (procesamiento en paralelo)
  • Más rentable
  • Más fácil de gestionar
  • Mejor para límites de tasa
Para sitios con mucho JavaScript, usa el parámetro “Esperar Antes de Raspar”:
  • Sitios simples: 0-1000ms
  • Sitios dinámicos: 2000-3000ms
  • JavaScript pesado: 5000-8000ms
Prueba con diferentes valores para encontrar el tiempo de espera óptimo.
Usa parsers preconstruidos (por ejemplo, Amazon, Google, y parsers específicos de tarea de la Tienda Olostep como emails, redes sociales, calendarios):
  • Obtén datos estructurados automáticamente
  • Extracción más confiable
  • No necesitas parsing personalizado
  • Mantenidos por Olostep
Usa el nodo IF de n8n para evitar raspeos innecesarios:
  • Verifica si la URL ha cambiado
  • Verifica que los datos no se hayan raspado recientemente
  • Aplica lógica de negocio antes de raspar
Esto ahorra créditos de API y tiempo de ejecución.
Las operaciones de Lote, Rastreo y Mapa son asíncronas:
  • Almacena el ID devuelto (batch_id, crawl_id, map_id)
  • Usa un nodo de Espera si recuperas inmediatamente
  • Considera callbacks de webhook para finalización
  • Configura flujos de trabajo separados para recuperación
Elige el almacenamiento adecuado según tus necesidades:
  • Google Sheets: Seguimiento simple, colaboración en equipo
  • Airtable: Datos relacionales, formato enriquecido
  • Base de Datos: A gran escala, consultas complejas
  • Notion: Base de conocimiento, documentación
Configura monitoreo para tus flujos de trabajo de scraping:
  • Usa flujos de trabajo de Error en n8n
  • Envía alertas a Slack/Email en caso de fallos
  • Rastrea el uso de API en el panel de control de Olostep
  • Registra métricas importantes

Casos de Uso Comunes por Industria

E-commerce

  • Monitoreo de Precios: Rastrea precios de la competencia en tiempo real
  • Investigación de Productos: Descubre productos de tendencia y brechas de mercado
  • Seguimiento de Inventario: Monitorea la disponibilidad de stock
  • Análisis de Reseñas: Agrega y analiza reseñas de clientes

Marketing & SEO

  • Descubrimiento de Contenido: Encuentra oportunidades de contenido
  • Análisis de la Competencia: Rastrea estrategias de la competencia
  • Investigación de Backlinks: Descubre oportunidades de enlaces
  • Investigación de Palabras Clave: Extrae datos de palabras clave de resultados de búsqueda

Ventas & Generación de Leads

  • Enriquecimiento de Leads: Mejora datos de CRM con información web
  • Investigación de Empresas: Recolecta inteligencia de empresas
  • Descubrimiento de Contactos: Encuentra tomadores de decisiones
  • Inteligencia Competitiva: Rastrea movimientos de la competencia

Investigación & Análisis

  • Recolección de Datos: Recolecta datos de múltiples fuentes
  • Investigación de Mercado: Rastrea tendencias de la industria
  • Investigación Académica: Recolecta datos de investigación
  • Inteligencia de Precios: Analiza estrategias de precios

Medios & Publicaciones

  • Agregación de Contenido: Cura contenido de múltiples sitios
  • Monitoreo de Noticias: Rastrea noticias y menciones
  • Redes Sociales: Monitorea plataformas sociales
  • Detección de Tendencias: Identifica temas de tendencia

Solución de Problemas

Error: “Clave API inválida”Soluciones:
  • Verifica la clave API desde el panel de control
  • Asegúrate de que no haya espacios extra en la clave API
  • Recrea la credencial en n8n
  • Verifica que la clave API esté activa
Error: Los campos de contenido están vacíosSoluciones:
  • Aumenta el tiempo de “Esperar Antes de Raspar”
  • Verifica si el sitio web requiere inicio de sesión
  • Prueba con un formato diferente (HTML vs Markdown)
  • Verifica que la URL sea accesible
  • Verifica si el sitio bloquea el acceso automatizado
Error: “Formato JSON inválido para array de lote”Soluciones:
  • Usa el formato: [{"url":"https://example.com","custom_id":"id1"}]
  • Asegúrate de la sintaxis JSON adecuada
  • Usa el nodo de Código para formatear URLs correctamente
  • Prueba el JSON con un validador en línea
Error: “Límite de tasa excedido”Soluciones:
  • Espacia las ejecuciones de flujo de trabajo con nodos de Espera
  • Usa procesamiento en lote en lugar de raspeos individuales
  • Actualiza tu plan de Olostep
  • Verifica el límite de tasa en el panel de control
Error: URLs específicas fallan al rasparSoluciones:
  • Verifica el formato de la URL (incluye http:// o https://)
  • Verifica si la URL requiere autenticación
  • Prueba la URL en el navegador primero
  • Prueba con el parámetro de país
  • Contacta soporte para dominios bloqueados

Ventajas de n8n

Autoalojado

n8n es autoalojado, dándote control total sobre tus flujos de trabajo y datos. Sin bloqueo de proveedor, sin datos saliendo de tu infraestructura.

Sin Límites de Tareas

A diferencia de las plataformas de automatización basadas en la nube, n8n no impone límites de tareas. Ejecuta tantos flujos de trabajo como necesites sin costos adicionales.

Código Abierto

n8n es de código abierto, permitiéndote personalizar y extenderlo para adaptarse a tus necesidades específicas.

Rentable

n8n autoalojado es gratuito, con alojamiento en la nube opcional disponible. Solo paga por el uso de la API de Olostep.

Precios

Olostep cobra basado en el uso de la API, independiente de n8n:
  • Raspeos: Paga por raspeo
  • Lotes: Paga por URL en lote
  • Rastreos: Paga por página rastreada
  • Mapas: Paga por operación de mapa
Consulta los precios actuales en olostep.com/pricing. n8n: n8n autoalojado es gratuito. Alojamiento en la nube disponible con planes pagos opcionales.

Soporte

¿Necesitas ayuda con la integración de n8n?

Recursos Relacionados

Comienza

¿Listo para automatizar tus flujos de trabajo de búsqueda web, scraping y crawling?

Instala el Nodo

Instala n8n-nodes-olostep y comienza a construir flujos de trabajo automatizados
¡Conecta Olostep con n8n y automatiza hoy mismo tu extracción de datos web!