メインコンテンツへスキップ
認証済みのOlostep Web Scraperノードは、n8nのビジュアルビルダー内で6つの操作を提供します:URLをスクレイプ、ウェブを検索、AI回答を取得、数千のURLをバッチスクレイプ、サイトをクロール、またはすべてのリンクをマップ。 n8nで見る →

始める前に

  • APIキー付きのOlostepアカウント: 無料で取得、クレジットカードは不要です。最初の500クレジットが含まれています。
  • n8nの実行: n8n Cloudまたはセルフホストされたインスタンス。コミュニティノードが有効である必要があります(ほとんどのセットアップではデフォルトで有効です)。
  • コード不要: このガイドのすべてはn8nのビジュアルエディタを通じて行われます。

セットアップ

1

Olostepノードを検索

任意のワークフローを開き、+をクリックしてOlostepを検索します。結果からOlostep Web Scraperを選択します。n8nノードピッカーでOlostepを検索
2

ノードをインストール

結果をクリックしてノード詳細パネルを開き、次にノードをインストールをクリックします。n8nはn8n-nodes-olostepをインストールし、再起動を促します。続行する前にそれを行ってください。インストールノードボタン付きのOlostep Web Scraperノード詳細
ワークスペースでコミュニティノードが無効になっている場合、管理者が最初にそれを有効にする必要があります。n8nコミュニティノードガイドを参照してください。
3

APIキーを追加

ワークフロー内のOlostepノードを開き、クレデンシャルを設定(パラメータタブ内)をクリックし、APIキーを追加して保存をクリックします。APIキー欄付きのn8n内のOlostepクレデンシャルフォームOlostepダッシュボードからキーを取得 →
4

接続して実行

Olostepノードをトリガーおよび任意の下流ステップに接続し、ワークフローを実行します。スケジュールトリガーがOlostepノードに接続されたn8nワークフローキャンバス

アクション

ウェブサイトをスクレイプ

任意のURLからMarkdown、HTML、JSON、またはプレーンテキストとしてコンテンツを取得します。オプションの待機時間と国ターゲティングでJSレンダリングされたページを処理します。

検索

ウェブ検索を実行し、構造化された結果(タイトル、URL、スニペット)をJSONとして取得します。

回答(AI)

自然言語の質問をして、引用元付きの回答を取得します。LLMノードの前に、根拠のある応答が必要な場合に便利です。

URLをバッチスクレイプ

1つのジョブで最大10,000のURLを提出し、並行して処理します。batch_idを返し、結果を非同期で取得します。

クロールを作成

URLから始めてリンクをたどり、すべてのサブページをスクレイプします。ドキュメントサイト、ブログ、またはサイト全体の取り込みに適しています。crawl_idを返します。

マップを作成

コンテンツをスクレイプせずにサイト上のすべてのURLを取得します。バッチジョブの前に発見に使用します。map_idを返します。
バッチ、クロール、マップは非同期です。 返されたIDを保存し、処理が完了したら結果を取得するためにWaitノードまたは2つ目のワークフローを使用します。

例のワークフロー:Google Sheetsからのリード強化

何をするか: Google Sheetに会社のURLを貼り付けると、このワークフローが自動的に会社のウェブサイトをスクレイプし、AIノードで主要情報を抽出し、結果を同じ行に書き戻し、空白のスプレッドシートを充実したリードデータベースに変えます。 使用ノード: Google Sheetsトリガー → Olostep Scrape Website → OpenAI → Code → Google Sheets更新 Google SheetsトリガーがOlostep、OpenAI、Code、Google Sheets更新ノードに接続されたn8nのリード強化ワークフロー

ステップ1:Google Sheetを設定

次の列を持つシートを作成します:Company URLIndustryDescriptionCompany SizeEnriched。ワークフローはCompany URLから読み取り、残りを埋めます。

ステップ2:Google Sheetsトリガーを追加

n8nで、Google Sheetsトリガーノードを追加します。イベントをRow Addedに設定し、シートを指定し、Company URL列を監視するように設定します。これで、新しいURLをシートに貼り付けるたびに、このワークフローが発火します。

ステップ3:Olostep Scrape Websiteを追加

トリガーの後にOlostep Web Scraperノードを接続します。設定:
  • アクション: ウェブサイトをスクレイプ
  • URL: {{ $json["Company URL"] }}(新しい行からURLを取得)
  • 出力形式: Markdown
Markdownはナビゲーション、広告、定型文を取り除くため、ここでは最適です。次のステップのAIノードは、会社についてのクリーンな文章を取得し、生のHTMLノイズを避けます。

ステップ4:OpenAIノードを追加

OpenAIノードを接続します。モデルをgpt-4o-miniに設定し(抽出タスクに速くて安価)、次のプロンプトを使用します:
あなたは営業リサーチャーです。以下の会社ウェブサイトのコンテンツに基づいて、次を抽出してください:
1. 業界(1フレーズ、例:"B2B SaaS"、"E-commerce"、"Healthcare")
2. 1文の会社説明(最大20語)
3. 推定会社規模(Startup / SMB / Mid-market / Enterprise)

キー:industry、description、company_sizeを持つJSONオブジェクトのみを返してください。

ウェブサイトコンテンツ:
{{ $json.markdownContent }}
markdownContentフィールドは、Olostepがスクレイプから返すクリーンなプレーンテキストです。

ステップ5:AIの応答を解析して書き戻す

Codeノードを追加して、OpenAIからのJSONを解析します:
const parsed = JSON.parse($input.first().json.message.content);
return [{ json: parsed }];
次に、Google Sheetsノードを接続して行を更新に設定します。列をマップ:
  • Industry{{ $json.industry }}
  • Description{{ $json.description }}
  • Company Size{{ $json.company_size }}
  • EnrichedYes

得られるもの

https://notion.soのようなURLをシートに貼り付けると、約10秒以内に行が埋まります:
Company URLIndustryDescriptionCompany SizeEnriched
https://notion.soProductivity SaaSAll-in-one workspace for notes, docs, and databasesMid-marketYes
ここからこのワークフローを拡張できます:強化が完了したときにSlack通知を追加したり、書き戻す前に業界でフィルタリングしたり、Google SheetsをHubSpotに置き換えて連絡先を直接更新したりできます。

テンプレート

Olostepで構築されたインポート可能なn8nワークフロー:

ドキュメントをクロール → AIナレッジベース

Olostepでドキュメントサイトをクロールし、AI対応のナレッジベースに構造化します。

Google Mapsリード → 意思決定者の強化

Google Mapsからビジネスリードをスクレイプし、意思決定者の詳細で強化します。

ユーザーの苦情をマイニング → インサイトレポート

Olostep + Geminiで苦情を分析し、Google Docsで構造化されたインサイトレポートを生成します。

Amazon製品の抽出 → Google Sheets

OlostepでAmazon製品のURLとメタデータを抽出し、結果をSheetsに同期します。
n8n.ioでのすべてのOlostepワークフローを閲覧 →

パーサー

ParserフィールドにパーサーIDを追加して、スクレイプまたはバッチアクションで構造化データを取得します:
Parser抽出内容
@olostep/amazon-productタイトル、価格、評価、レビュー、画像、バリエーション
@olostep/google-search結果のタイトル、URL、スニペット
@olostep/google-mapsビジネス名、住所、評価、レビュー
@olostep/extract-emails任意のページからのメールアドレス
@olostep/extract-socialsソーシャルプロファイルリンク(X、GitHub、LinkedInなど)
@olostep/extract-calendarsGoogle CalendarとICSリンク
Olostepパーサーストアで完全なリストを見る →

トラブルシューティング

olostep.com/dashboardからキーを直接コピーし、末尾にスペースがないことを確認します。エラーが続く場合は、n8nでクレデンシャルを削除して再作成してください。
スクレイプ前の待機を増やします(JSが多いページには2000–5000msを試してください)。URLがログインなしで公開アクセス可能であることを確認します。特定のドメインが一貫して失敗する場合は、info@olostep.comに連絡してください。
スクレイプするURLフィールドはJSON配列を期待しています:
[
  { "url": "https://example.com/page-1", "custom_id": "p1" },
  { "url": "https://example.com/page-2", "custom_id": "p2" }
]
必要に応じて、上流でCodeノードを使用してこの配列をデータから構築します。
スクレイプステップ間にWaitノードを追加するか、単一スクレイプをループする代わりにBatch Scrape URLsに切り替えます。ダッシュボードで現在の使用状況を確認してください。
n8n Cloudでは、コミュニティノードはワークスペースオーナーによって有効にされる必要があります。セルフホストでは、N8N_COMMUNITY_PACKAGES_ENABLED=trueが環境に設定されていることを確認します。n8nのインストールガイドを参照してください。

関連

Scrapes API

スクレイプエンドポイントの完全なリファレンス

Batches API

バッチジョブの仕組みと結果の取得方法

Crawls API

クロールの設定と結果の取得

Maps API

URLの発見とフィルタリングオプション

始めましょう

ウェブ検索、スクレイピング、クロールワークフローを自動化する準備はできましたか?

n8nウェブサイト

n8nプラットフォーム

ノードをインストール

n8n-nodes-olostepをインストールして、自動化ワークフローの構築を開始
Olostepをn8nと接続して、今日からウェブデータ抽出を自動化しましょう!