メインコンテンツへスキップ
認証済みのOlostep Web Scraperノードは、n8nのビジュアルビルダー内で6つの操作を提供します:URLをスクレイプ、ウェブを検索、AIの回答を取得、数千のURLをバッチスクレイプ、サイトをクロール、またはすべてのリンクをマップ。 n8nで見る →

始める前に

  • APIキー付きのOlostepアカウント: 無料で取得、クレジットカードは不要です。最初の500クレジットが含まれています。
  • n8nが稼働中: n8n Cloudまたはセルフホストのインスタンス。コミュニティノードが有効である必要があります(ほとんどのセットアップでデフォルトで有効です)。
  • コーディング不要: このガイドのすべてはn8nのビジュアルエディタを通じて行われます。

セットアップ

1

Olostepノードを検索

任意のワークフローを開き、+をクリックしてOlostepを検索します。結果からOlostep Web Scraperを選択します。n8nノードピッカーでOlostepを検索
2

ノードをインストール

結果をクリックしてノード詳細パネルを開き、ノードをインストールをクリックします。n8nはn8n-nodes-olostepをインストールし、再起動を促します。続行する前にそれを行ってください。Olostep Web Scraperノード詳細とノードをインストールボタン
ワークスペースでコミュニティノードが無効になっている場合、管理者が最初に有効にする必要があります。n8nコミュニティノードガイドを参照してください。
3

APIキーを追加

ワークフロー内のOlostepノードを開き、資格情報を設定(パラメータタブ内)をクリックし、APIキーを追加して保存をクリックします。n8nのOlostep資格情報フォームとAPIキー欄Olostepダッシュボードからキーを取得 →
4

接続して実行

Olostepノードをトリガーと下流のステップに接続し、ワークフローを実行します。スケジュールトリガーがOlostepノードに接続されたn8nワークフローキャンバス

アクション

ウェブサイトをスクレイプ

任意のURLからコンテンツをMarkdown、HTML、JSON、またはプレーンテキストとして取得します。JSレンダリングされたページをオプションの待機時間と国ターゲティングで処理します。

検索

ウェブ検索を実行し、構造化された結果(タイトル、URL、スニペット)をJSONとして取得します。

回答(AI)

自然言語の質問をして、引用元付きの回答を取得します。LLMノードの前に、根拠のある回答が必要な場合に便利です。

URLをバッチスクレイプ

一度に最大10,000のURLを送信し、並行して処理します。batch_idを返し、結果を非同期で取得します。

クロールを作成

URLから始めてリンクをたどり、すべてのサブページをスクレイプします。ドキュメントサイト、ブログ、またはサイト全体の取り込みに適しています。crawl_idを返します。

マップを作成

コンテンツをスクレイプせずにサイト上のすべてのURLを取得します。バッチジョブの前に発見に使用します。map_idを返します。
バッチ、クロール、マップは非同期です。 返されたIDを保存し、処理が完了したら結果を取得するためにWaitノードまたは2番目のワークフローを使用します。

例のワークフロー: Google Sheetsからのリード強化

機能: Googleシートに会社のURLを貼り付けると、このワークフローは自動的に会社のウェブサイトをスクレイプし、AIノードで主要情報を抽出し、結果を同じ行に書き戻し、空白のスプレッドシートを充実したリードデータベースに変えます。 使用ノード: Google Sheetsトリガー → Olostep Scrape Website → OpenAI → Code → Google Sheets更新 n8nでのリード強化ワークフロー: Google SheetsトリガーがOlostep、OpenAI、Code、Google Sheets更新ノードに接続

ステップ1: Google Sheetを設定

次の列を持つシートを作成します: Company URL, Industry, Description, Company Size, Enriched。ワークフローはCompany URLから読み取り、残りを埋めます。

ステップ2: Google Sheetsトリガーを追加

n8nで、Google Sheetsトリガーノードを追加します。イベントをRow Addedに設定し、シートを指し、Company URL列を監視するように設定します。これで、新しいURLをシートに貼り付けるたびに、このワークフローが発火します。

ステップ3: Olostep Scrape Websiteを追加

トリガーの後にOlostep Web Scraperノードを接続します。設定:
  • アクション: ウェブサイトをスクレイプ
  • URL: {{ $json["Company URL"] }}(新しい行からURLを取得)
  • 出力形式: Markdown
Markdownはナビゲーション、広告、定型文を除去するため、ここでは最適です。次のステップのAIノードは、会社についてのきれいな文章を取得します。

ステップ4: OpenAIノードを追加

OpenAIノードを接続します。モデルをgpt-4o-miniに設定し(抽出タスクに高速で安価)、次のプロンプトを使用します:
あなたは営業研究者です。以下の会社のウェブサイトコンテンツに基づいて、以下を抽出してください:
1. 業界(1フレーズ、例:"B2B SaaS", "E-commerce", "Healthcare")
2. 1文の会社説明(最大20語)
3. 推定会社規模(Startup / SMB / Mid-market / Enterprise)

キー:industry, description, company_sizeを持つJSONオブジェクトのみを返してください。

ウェブサイトコンテンツ:
{{ $json.markdownContent }}
markdownContentフィールドは、Olostepがスクレイプから返すクリーンなプレーンテキストです。

ステップ5: AIの応答を解析して書き戻す

Codeノードを追加して、OpenAIからのJSONを解析します:
const parsed = JSON.parse($input.first().json.message.content);
return [{ json: parsed }];
次に、Google Sheetsノードを接続して行を更新に設定します。列をマッピング:
  • Industry{{ $json.industry }}
  • Description{{ $json.description }}
  • Company Size{{ $json.company_size }}
  • EnrichedYes

得られるもの

https://notion.soのようなURLをシートに貼り付けると、約10秒以内に行が埋まります:
Company URLIndustryDescriptionCompany SizeEnriched
https://notion.soProductivity SaaSAll-in-one workspace for notes, docs, and databasesMid-marketYes
ここからこのワークフローを拡張できます:強化が完了したらSlack通知を追加したり、書き戻す前に業界でフィルタリングしたり、Google SheetsをHubSpotに置き換えて直接連絡先を更新したりします。

テンプレート

Olostepで構築されたn8nワークフローをすぐにインポート:

ドキュメントをクロール → AI知識ベース

Olostepでドキュメントサイトをクロールし、AI対応の知識ベースに構造化します。

Google Mapsリード → 意思決定者の強化

Google Mapsからビジネスリードをスクレイプし、意思決定者の詳細で強化します。

ユーザーの苦情をマイニング → インサイトレポート

Olostep + Geminiで苦情を分析し、Google Docsで構造化されたインサイトレポートを生成します。

Amazon製品の抽出 → Google Sheets

OlostepでAmazon製品のURLとメタデータを抽出し、結果をSheetsに同期します。
n8n.ioでのすべてのOlostepワークフローを閲覧 →

パーサー

任意のスクレイプまたはバッチアクションでParserフィールドにパーサーIDを追加して、未加工のコンテンツの代わりに構造化データを取得:
パーサー抽出内容
@olostep/amazon-productタイトル、価格、評価、レビュー、画像、バリエーション
@olostep/google-search結果のタイトル、URL、スニペット
@olostep/google-mapsビジネス名、住所、評価、レビュー
@olostep/extract-emails任意のページからのメールアドレス
@olostep/extract-socialsソーシャルプロファイルリンク(X、GitHub、LinkedInなど)
@olostep/extract-calendarsGoogleカレンダーとICSリンク
Olostepパーサーストアで完全なリストを見る →

トラブルシューティング

olostep.com/dashboardからキーを直接コピーし、末尾にスペースがないことを確認してください。エラーが続く場合は、n8nで資格情報を削除して再作成してください。
スクレイプ前の待機を増やします(JSが多いページには2000〜5000msを試してください)。URLがログインなしで公開アクセス可能であることを確認してください。特定のドメインが一貫して失敗する場合は、info@olostep.comに連絡してください。
スクレイプするURLフィールドはJSON配列を期待しています:
[
  { "url": "https://example.com/page-1", "custom_id": "p1" },
  { "url": "https://example.com/page-2", "custom_id": "p2" }
]
必要に応じて、データからこの配列を作成するために上流にCodeノードを使用します。
スクレイプステップ間にWaitノードを追加するか、単一スクレイプをループする代わりにBatch Scrape URLsに切り替えます。ダッシュボードで現在の使用状況を確認してください。
n8n Cloudでは、コミュニティノードはワークスペースオーナーが有効にする必要があります。セルフホストでは、N8N_COMMUNITY_PACKAGES_ENABLED=trueが環境に設定されていることを確認してください。n8nのインストールガイドを参照してください。

関連

Scrapes API

スクレイプエンドポイントの完全なリファレンス

Batches API

バッチジョブの動作と結果の取得方法

Crawls API

クロールの設定と結果の取得

Maps API

URLの発見とフィルタリングオプション

始めよう

ウェブ検索、スクレイピング、クロールワークフローを自動化する準備はできましたか?

n8nウェブサイト

n8nプラットフォーム

ノードをインストール

n8n-nodes-olostepをインストールして自動化ワークフローを構築し始めましょう
Olostepをn8nと接続して、今日からウェブデータ抽出を自動化しましょう!