Passer au contenu principal
Le nœud Olostep Web Scraper vérifié vous offre six opérations dans le constructeur visuel de n8n : scraper une URL, rechercher sur le web, obtenir des réponses IA, scraper par lots des milliers d’URLs, crawler un site ou cartographier tous ses liens. Voir sur n8n →

Avant de commencer

  • Un compte Olostep avec une clé API : obtenez-en une gratuitement, pas de carte de crédit requise. Vos 500 premiers crédits sont inclus.
  • n8n en cours d’exécution : soit n8n Cloud soit une instance auto-hébergée. Les nœuds communautaires doivent être activés (ils le sont par défaut sur la plupart des configurations).
  • Aucune programmation requise : tout dans ce guide se fait via l’éditeur visuel de n8n.

Configuration

1

Recherchez le nœud Olostep

Ouvrez n’importe quel workflow, cliquez sur +, et recherchez Olostep. Sélectionnez Olostep Web Scraper dans les résultats.Recherchez Olostep dans le sélecteur de nœuds n8n
2

Installez le nœud

Cliquez sur le résultat pour ouvrir le panneau de détails du nœud, puis cliquez sur Installer le nœud. n8n installera n8n-nodes-olostep et vous demandera de redémarrer. Faites-le avant de continuer.Détails du nœud Olostep Web Scraper avec le bouton Installer le nœud
Si Nœuds Communautaires est désactivé pour votre espace de travail, un administrateur doit l’activer d’abord. Consultez le guide des nœuds communautaires n8n.
3

Ajoutez votre clé API

Ouvrez le nœud Olostep dans votre workflow, cliquez sur Configurer l’identifiant (dans l’onglet Paramètres), ajoutez votre clé API, et cliquez sur Enregistrer.Formulaire d'identifiants Olostep dans n8n avec le champ Clé APIObtenez votre clé depuis le tableau de bord Olostep →
4

Connectez-le et exécutez

Connectez le nœud Olostep à un déclencheur et à toutes les étapes en aval, puis exécutez votre workflow.Canvas de workflow n8n avec le déclencheur de planification connecté au nœud Olostep

Actions

Scraper un site web

Extraire le contenu de n’importe quelle URL en tant que Markdown, HTML, JSON ou texte brut. Gère les pages rendues en JS avec des temps d’attente optionnels et un ciblage par pays.

Rechercher

Effectuer une recherche web et obtenir des résultats structurés (titres, URLs et extraits) en JSON.

Réponses (IA)

Poser une question en langage naturel et obtenir une réponse avec des sources citées. Utile avant les nœuds LLM lorsque vous avez besoin de réponses fondées.

Scraper des URLs par lots

Soumettre jusqu’à 10 000 URLs en un seul travail, traitées en parallèle. Retourne un batch_id; récupérez les résultats de manière asynchrone.

Créer un crawl

Partir d’une URL, suivre les liens et scraper toutes les sous-pages. Idéal pour les sites de documentation, les blogs ou l’ingestion complète de sites. Retourne un crawl_id.

Créer une carte

Obtenez chaque URL sur un site sans scraper le contenu. Utilisez-le pour la découverte avant un travail par lots. Retourne un map_id.
Batch, Crawl, et Map sont asynchrones. Stockez l’ID retourné et utilisez un nœud d’attente ou un second workflow pour récupérer les résultats une fois le traitement terminé.

Exemple de workflow : enrichissement de prospects depuis Google Sheets

Ce qu’il fait : Lorsque vous collez une URL d’entreprise dans une feuille Google, ce workflow scrape automatiquement le site web de l’entreprise, extrait les informations clés avec un nœud IA, et écrit les résultats dans la même ligne, transformant une feuille de calcul vide en une base de données de prospects remplie. Nœuds utilisés : Déclencheur Google Sheets → Olostep Scrape Website → OpenAI → Code → Mise à jour Google Sheets Workflow d'enrichissement de prospects dans n8n : déclencheur Google Sheets connecté aux nœuds Olostep, OpenAI, Code et mise à jour Google Sheets

Étape 1 : Configurez votre feuille Google

Créez une feuille avec ces colonnes : Company URL, Industry, Description, Company Size, Enriched. Le workflow lit depuis Company URL et remplit le reste.

Étape 2 : Ajoutez un déclencheur Google Sheets

Dans n8n, ajoutez un nœud de déclencheur Google Sheets. Réglez l’événement sur Row Added, pointez-le vers votre feuille, et configurez-le pour surveiller la colonne Company URL. Maintenant, chaque fois que vous collez une nouvelle URL dans la feuille, ce workflow se déclenche.

Étape 3 : Ajoutez Olostep Scrape Website

Connectez un nœud Olostep Web Scraper après le déclencheur. Configurez :
  • Action : Scraper un site web
  • URL : {{ $json["Company URL"] }} (récupère l’URL de la nouvelle ligne)
  • Format de sortie : Markdown
Markdown fonctionne mieux ici car il élimine la navigation, les publicités et les modèles. Le nœud IA à l’étape suivante obtient un texte propre sur l’entreprise au lieu de bruit HTML brut.

Étape 4 : Ajoutez un nœud OpenAI

Connectez un nœud OpenAI. Réglez le modèle sur gpt-4o-mini (rapide et économique pour les tâches d’extraction) et utilisez cette invite :
Vous êtes un chercheur commercial. Basé sur le contenu du site web de l'entreprise ci-dessous, extrayez :
1. Industrie (une phrase, par ex. "B2B SaaS", "E-commerce", "Santé")
2. Description de l'entreprise en une phrase (max 20 mots)
3. Taille estimée de l'entreprise (Startup / PME / Mid-market / Entreprise)

Retournez uniquement un objet JSON avec les clés : industry, description, company_size.

Contenu du site web :
{{ $json.markdownContent }}
Le champ markdownContent est ce que Olostep retourne du scrape, sous forme de texte brut propre.

Étape 5 : Analysez la réponse IA et écrivez-la

Ajoutez un nœud Code pour analyser le JSON d’OpenAI :
const parsed = JSON.parse($input.first().json.message.content);
return [{ json: parsed }];
Puis connectez un nœud Google Sheets réglé sur Update Row. Mappez les colonnes :
  • Industry{{ $json.industry }}
  • Description{{ $json.description }}
  • Company Size{{ $json.company_size }}
  • EnrichedYes

Ce que vous obtenez

Collez une URL comme https://notion.so dans votre feuille, et en ~10 secondes la ligne se remplit :
Company URLIndustryDescriptionCompany SizeEnriched
https://notion.soProductivity SaaSEspace de travail tout-en-un pour notes, docs et bases de donnéesMid-marketYes
À partir de là, vous pouvez étendre ce workflow : ajoutez une notification Slack lorsque l’enrichissement est terminé, filtrez par industrie avant d’écrire, ou remplacez Google Sheets par HubSpot pour mettre à jour directement les contacts.

Modèles

Workflows n8n prêts à importer construits avec Olostep :

Crawl docs → base de connaissances IA

Crawler des sites de documentation avec Olostep et structurer la sortie en une base de connaissances prête pour l’IA.

Leads Google Maps → enrichissement décideur

Scraper des leads commerciaux depuis Google Maps et les enrichir avec des détails sur les décideurs.

Exploiter les plaintes utilisateurs → rapport d'analyse

Analyser les plaintes avec Olostep + Gemini et générer des rapports d’analyse structurés dans Google Docs.

Extraction de produits Amazon → Google Sheets

Extraire les URLs et métadonnées de produits Amazon avec Olostep, puis synchroniser les résultats avec Sheets.
Parcourez tous les workflows Olostep sur n8n.io →

Parseurs

Ajoutez un ID de parseur au champ Parser sur toute action Scrape ou Batch pour obtenir des données structurées au lieu de contenu brut :
ParserExtraits
@olostep/amazon-productTitre, prix, note, avis, images, variantes
@olostep/google-searchTitres des résultats, URLs, extraits
@olostep/google-mapsNom de l’entreprise, adresse, note, avis
@olostep/extract-emailsAdresses email de n’importe quelle page
@olostep/extract-socialsLiens de profils sociaux (X, GitHub, LinkedIn, etc.)
@olostep/extract-calendarsLiens Google Calendar et ICS
Voir la liste complète dans le store de parseurs Olostep →

Dépannage

Copiez la clé directement depuis olostep.com/dashboard sans espaces de fin. Supprimez et recréez l’identifiant dans n8n si l’erreur persiste.
Augmentez Attendre avant de scraper (essayez 2000–5000ms pour les pages lourdes en JS). Confirmez que l’URL est accessible publiquement sans connexion. Si un domaine spécifique échoue constamment, contactez info@olostep.com.
Le champ URLs à scraper attend un tableau JSON :
[
  { "url": "https://example.com/page-1", "custom_id": "p1" },
  { "url": "https://example.com/page-2", "custom_id": "p2" }
]
Utilisez un nœud Code en amont pour construire ce tableau à partir de vos données si nécessaire.
Ajoutez un nœud Attendre entre les étapes de scraping, ou passez à Scraper des URLs par lots au lieu de boucler des scrapes uniques. Vérifiez l’utilisation actuelle dans le tableau de bord.
Sur n8n Cloud, les nœuds communautaires doivent être activés par un propriétaire d’espace de travail. Sur auto-hébergé, assurez-vous que N8N_COMMUNITY_PACKAGES_ENABLED=true est défini dans votre environnement. Voir le guide d’installation de n8n.

Connexes

API de Scrapes

Référence complète pour le point de terminaison de scrape

API de Batches

Comment fonctionnent les tâches par lots et comment récupérer les résultats

API de Crawls

Configuration de crawl et récupération des résultats

API de Maps

Découverte d’URL et options de filtrage

Commencez

Prêt à automatiser vos workflows de recherche web, de scraping et de crawling ?

Site Web n8n

Plateforme n8n

Installez le nœud

Installez n8n-nodes-olostep et commencez à créer des workflows automatisés
Connectez Olostep avec n8n et automatisez dès aujourd’hui votre extraction de données web !