Scraper & extraire
Réponses AI
Lot & crawl
Carte & recherche
Avant de commencer
Tu as besoin d’une clé API Olostep. Obtiens-en une depuis le tableau de bord Olostep — le niveau gratuit couvre l’utilisation personnelle.Choisir une méthode d’installation
Le chemin le plus rapide pour chaque client est le point d’accès hébergé àhttps://mcp.olostep.com/mcp. Pas d’installation, pas de Node, pas de Docker — il suffit de coller une URL et ta clé API.
Si tu as besoin de le faire fonctionner entièrement en local (utilisation hors ligne, proxy d’entreprise, réseau isolé), chaque client prend également en charge une installation local stdio via npx. Chaque section ci-dessous montre les deux.
Authorization: Bearer YOUR_API_KEY. Local stdio utilise OLOSTEP_API_KEY comme variable d’environnement. Ne les mélange pas — le mauvais mode d’authentification est l’erreur d’intégration numéro 1.Configuration du client
- Cursor
- Claude Code
- Claude Desktop
- VS Code
- Windsurf
- Docker
- Metorial
Remplace YOUR_API_KEY dans la configuration résultante par ta vraie clé.Configuration manuelle :Crée ou modifie .cursor/mcp.json à la racine de ton projet (ou ~/.cursor/mcp.json pour une configuration globale) :Installation local stdio (optionnelle)
Installation local stdio (optionnelle)
olostep listé avec 10 outils incluant scrape_website. Si tu vois “Connecté, 0 outils”, ta clé API est incorrecte.Choisir le bon outil
Le serveur MCP expose 10 outils. Utilise cet arbre de décision pour choisir le bon — l’agent utilise le même raisonnement :| Tu veux… | Utilise | Remarques |
|---|---|---|
| Le contenu d’une page spécifique | scrape_website ou get_webpage_content | Défini wait_before_scraping=2000–5000 pour les SPA |
| Une réponse web en langage naturel avec sources | answers | Retourne une synthèse AI + citations |
| Résultats de recherche pour une requête | search_web | Basé sur un parseur, non AI, structuré |
| Une liste d’URLs sur un site | create_map | Découverte d’URL uniquement — ne scrape PAS |
| URLs filtrées par requête | get_website_urls | Classées par pertinence pour ta search_query |
| Plusieurs URLs connues à la fois | batch_scrape_urls + get_batch_results | Asynchrone — démarre, puis interroge |
| Un site entier ou une section | create_crawl + get_crawl_results | Asynchrone — suit les liens à partir d’une URL de départ |
Détails des outils
scrape_website
scrape_website
markdown, html, json, text. country optionnel pour les requêtes géo-ciblées, wait_before_scraping (0–10000 ms) pour les sites lourds en JS, et parser (par exemple @olostep/amazon-product) pour une extraction structurée.get_webpage_content
get_webpage_content
scrape_website. À utiliser lorsque tu veux juste du markdown propre et que tu n’as pas besoin d’options de format.search_web
search_web
country optionnel pour des résultats localisés. Retourne du JSON, pas de la prose AI.answers
answers
task avec sources et citations. Passe un argument json pour obtenir la réponse dans une forme spécifique — soit un schéma JSON, soit une courte description en langage naturel.batch_scrape_urls
batch_scrape_urls
batch_id — puis appelle get_batch_results pour récupérer le contenu. Défini wait_for_completion_seconds (jusqu’à 900) si tu veux un seul appel bloquant au lieu de l’interrogation. Recommandé : 60 pour les lots de moins de 50 URLs, 300–600 pour 50–1k, 0 (interroger séparément) pour les lots plus grands.get_batch_results
get_batch_results
batch_id. Retourne processing jusqu’à ce que ce soit terminé, puis completed avec le tableau d’éléments.create_crawl
create_crawl
start_url. Utilise include_url_patterns / exclude_url_patterns (syntaxe glob comme /blog/**) pour délimiter. Retourne un crawl_id — puis appelle get_crawl_results.get_crawl_results
get_crawl_results
crawl_id. Prend en charge la pagination via cursor et items_limit (max 100 par appel). Retourne in_progress jusqu’à ce que ce soit terminé.create_map
create_map
include_url_patterns / exclude_url_patterns et search_query.get_website_urls
get_website_urls
create_map, mais les URLs sont classées par pertinence pour une search_query requise. À utiliser lorsque tu veux les N meilleurs liens correspondants sur un site.Dépannage
Le serveur apparaît mais affiche 0 outils
Le serveur apparaît mais affiche 0 outils
Authorization: Bearer sk_... — pas de guillemets autour de la valeur, pas d’espaces supplémentaires.`npx: command not found` ou `command not found: olostep-mcp`
`npx: command not found` ou `command not found: olostep-mcp`
Connexion refusée ou erreurs DNS sur `mcp.olostep.com`
Connexion refusée ou erreurs DNS sur `mcp.olostep.com`
npx -y olostep-mcp) — elle effectue des requêtes sortantes vers api.olostep.com à la place, ce qui est généralement autorisé.Configuration modifiée mais la liste des outils est obsolète
Configuration modifiée mais la liste des outils est obsolète
Échecs spécifiques à Windows avec `npx`
Échecs spécifiques à Windows avec `npx`
npx échoue à lancer le serveur sur Windows, utilise la forme encapsulée par CMD :`401 Missing Authorization: Bearer <OLOSTEP_API_KEY>`
`401 Missing Authorization: Bearer <OLOSTEP_API_KEY>`
Recettes
Copie-colle des invites qui fonctionnent bien avec les outils :- Scraper une liste d’URLs de produits : “J’ai un CSV de 200 URLs de produits Amazon. Scrape-les par lot avec
parser=@olostep/amazon-productet retourne-les en JSON.” - Crawl un site de docs : “Crawl https://stripe.com/docs avec
max_pages=50etinclude_url_patterns=['/docs/**']. Résume chaque section en markdown.” - Trouver des concurrents : “Utilise
answerspour trouver les 5 principaux concurrents de Notion pour les sites de documentation technique. Retourne le nom, la page d’accueil et le positionnement en une ligne.” - Cartographier puis scraper : “Exécute
create_mapsur https://example.com filtré sur/blog/**, puisbatch_scrape_urlssur les 20 meilleurs résultats.”