Olostep + Mastra 統合

Olostep Mastra統合は、Mastra.aiエージェントに強力なウェブデータ抽出機能をもたらします。Olostepはウェブ検索、スクレイピング、クロールAPIであり、ウェブデータを検索、抽出、構造化するためのAPIです。あらゆるウェブサイトからデータを自律的に検索、スクレイピング、分析、構造化できるインテリジェントなAIエージェントを構築しましょう。 npmからインストール →

特徴

この統合は、自動化されたウェブデータ抽出のための4つの強力なAPIを提供します：

ウェブサイトをスクレイプ

任意の単一URLから複数のフォーマット（Markdown、HTML、JSON、テキスト）でコンテンツを抽出

URLをバッチスクレイプ

最大100,000のURLを並行して処理。大規模なデータ抽出に最適

クロールを作成

リンクをたどってウェブサイト全体を自律的に発見し、スクレイプ

マップを作成

サイト構造分析とコンテンツ発見のためにウェブサイトからすべてのURLを抽出

インストール

npm install @olostep/mastra-tools

yarn add @olostep/mastra-tools

pnpm add @olostep/mastra-tools

セットアップ

1. パッケージをインストール

npm install @olostep/mastra-tools @mastra/core

2. 統合をインポートして登録

あなたのMastra設定ファイルで：

import { Mastra } from '@mastra/core';
import { createOlostepIntegration } from '@olostep/mastra-tools';

// Olostep統合を作成
const olostep = createOlostepIntegration();

// APIを登録（これによりエージェントが利用可能になります）
olostep.registerApis();

// Mastra設定に追加
export const mastra = new Mastra({
  config: {
    integrations: [olostep],
    // ... 他の設定
  },
});

3. APIキーを設定

Olostep APIキーを環境変数として設定：

export OLOSTEP_API_KEY=your-api-key-here

または .env ファイルに：

OLOSTEP_API_KEY=your-api-key-here

APIキーは Olostep Dashboard から取得してください。

利用可能なAPI

この統合は、あなたのMastraエージェントが使用できる4つのAPIを公開します：

scrapeWebsite

単一のURLからコンテンツを抽出します。複数のフォーマットとJavaScriptレンダリングをサポート。 使用例:

特定のページの変更を監視
Eコマースサイトから商品情報を抽出
ニュース記事やブログ投稿からデータを収集
コンテンツ集約のためにコンテンツを引き出す

スキーマパラメータ:

string

必須

あなたのOlostep APIキー

string

必須

スクレイプするウェブサイトのURL（http://またはhttps://を含む必要があります）

array

デフォルト:"['markdown']"

出力フォーマット: [‘html’, ‘markdown’, ‘json’, ‘text’]

string

ロケーション特有のコンテンツのための国コード（例：“US”, “GB”, “CA”）

number

JavaScriptレンダリングのための待機時間（ミリ秒単位、0-10000）

string

特殊な抽出のためのオプションのパーサーID（例：“@olostep/amazon-product”）

レスポンス:

id - スクレイプID
url_to_scrape - スクレイプされたURL
result.markdown_content - Markdownコンテンツ
result.html_content - HTMLコンテンツ
result.json_content - JSONコンテンツ
result.text_content - テキストコンテンツ
result.screenshot_hosted_url - スクリーンショットURL（利用可能な場合）
result.markdown_hosted_url - ホストされたMarkdown URL
object - オブジェクトタイプ (“scrape”)
created - Unixタイムスタンプ

使用例:

// エージェントまたはワークフロー内で
const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'scrapeWebsite',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url_to_scrape: 'https://example.com',
      formats: ['markdown'],
      country: 'US',
    }
  }
});

batchScrape

複数のURLを並行して処理（最大100,000件まで）。大規模なデータ抽出に最適。 使用例:

商品カタログ全体をスクレイプ
複数の検索結果からデータを抽出
スプレッドシートからのURLリストを処理
大量のコンテンツ抽出

スキーマパラメータ:

string

必須

あなたのOlostep APIキー

array

必須

urlとオプションのcustom_idフィールドを持つオブジェクトの配列例: [{"url":"https://example.com","custom_id":"site1"}]

array

デフォルト:"['markdown']"

すべてのURLの出力フォーマット

string

ロケーション特有のスクレイピングのための国コード

number

JavaScriptレンダリングのための待機時間

string

特殊な抽出のためのオプションのパーサーID

レスポンス:

batch_id - バッチID（後で結果を取得するために使用）
status - 処理ステータス
object - オブジェクトタイプ (“batch”)

使用例:

const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'batchScrape',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      batch_array: [
        { url: 'https://example.com', custom_id: 'site1' },
        { url: 'https://test.com', custom_id: 'site2' },
      ],
      formats: ['markdown'],
    }
  }
});

createCrawl

リンクをたどってウェブサイト全体を自律的に発見し、スクレイプします。ドキュメントサイト、ブログ、コンテンツリポジトリに最適。 使用例:

ドキュメントサイト全体をクロールしてアーカイブ
ウェブサイトからすべてのブログ投稿を抽出
ウェブコンテンツからナレッジベースを構築
ウェブサイト構造の変更を監視

スキーマパラメータ:

string

必須

あなたのOlostep APIキー

string

必須

クロールの開始URL（http://またはhttps://を含む必要があります）

number

デフォルト:"10"

クロールする最大ページ数。1に設定すると開始URLのみをスクレイプします。

array

デフォルト:"['markdown']"

スクレイプされたコンテンツのフォーマット

string

ロケーション特有のクロールのためのオプションの国コード

string

特殊なコンテンツ抽出のためのオプションのパーサーID

レスポンス:

id - クロールID（後で結果を取得するために使用）
object - オブジェクトタイプ (“crawl”)
status - クロールステータス
created - Unixタイムスタンプ

使用例:

const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'createCrawl',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      start_url: 'https://docs.example.com',
      max_pages: 50,
      formats: ['markdown'],
    }
  }
});

createMap

コンテンツ発見とサイト構造分析のためにウェブサイトからすべてのURLを抽出します。 使用例:

サイトマップとサイト構造図を構築
バッチスクレイプの前にすべてのページを発見
壊れたページや不足しているページを見つける
SEO監査と分析

スキーマパラメータ:

string

必須

あなたのOlostep APIキー

string

必須

リンクを抽出するウェブサイトのURL（http://またはhttps://を含む必要があります）

string

URLをフィルタリングするためのオプションの検索クエリ（例：“blog”）

number

返されるURLの数を制限

array

特定のパスを含めるためのグロブパターン（例：[“/blog/**”]）

array

特定のパスを除外するためのグロブパターン（例：[“/admin/**”]）

レスポンス:

id - マップID
object - オブジェクトタイプ (“map”)
url - ウェブサイトのURL
total_urls - 見つかったURLの総数
urls - 発見されたURLの配列

使用例:

const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'createMap',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url: 'https://example.com',
      search_query: 'blog',
      top_n: 100,
      include_urls: ['/blog/**'],
    }
  }
});

エージェントでの使用

基本的なエージェントの例

ウェブサイトをスクレイプできるエージェントを作成：

import { Agent } from '@mastra/core';
import { createOlostepIntegration } from '@olostep/mastra-tools';

const olostep = createOlostepIntegration();
olostep.registerApis();

const agent = new Agent({
  name: 'web-researcher',
  instructions: `
    あなたはウェブリサーチアシスタントです。ユーザーがウェブサイトから情報を取得するように頼んだ場合、
    OlostepのscrapeWebsite APIを使用してコンテンツを抽出し、それを要約して提供します。
  `,
  model: 'openai/gpt-4',
});

// エージェントはMastraのAPIシステムを通じてOlostep APIを使用できます

エージェントワークフローの例

コンテンツを発見しスクレイプするリサーチワークフローを構築：

// 1. ウェブサイトをマップしてURLを発見
const mapResult = await mastra.callApi({
  integrationName: 'olostep',
  api: 'createMap',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url: 'https://example.com',
      include_urls: ['/blog/**'],
    }
  }
});

// 2. 発見されたURLをバッチスクレイプ
const batchResult = await mastra.callApi({
  integrationName: 'olostep',
  api: 'batchScrape',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      batch_array: mapResult.urls.slice(0, 10).map(url => ({ url })),
      formats: ['markdown'],
    }
  }
});

// 3. エージェントで結果を処理
const summary = await agent.generate({
  messages: [{
    role: 'user',
    content: `このコンテンツを要約してください: ${batchResult.result.markdown_content}`
  }]
});

専門的なパーサー

Olostepは人気のあるウェブサイト向けの事前構築されたパーサーを提供しています。parserパラメータで使用：

Google検索

@olostep/google-search抽出: 検索結果、タイトル、スニペット、URL

Googleマップ

@olostep/google-maps抽出: ビジネス情報、レビュー、評価、位置

パーサーの使用

parserパラメータにパーサーIDを追加：

const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'scrapeWebsite',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url_to_scrape: 'https://www.amazon.com/dp/PRODUCT_ID',
      formats: ['json'],
      parser: '@olostep/amazon-product',
    }
  }
});

パーサーはそのウェブサイトタイプに特化した構造化データを自動的に抽出します。

ベストプラクティス

複数のURLに対してバッチ処理を使用

3〜5以上のURLをスクレイプする場合は、複数のscrapeWebsite呼び出しの代わりにbatchScrapeを使用してください。バッチ処理は：

はるかに高速（並列処理）
よりコスト効率が高い
管理が容易
レート制限に優しい

適切な待機時間を設定

JavaScriptが多用されているサイトには、wait_before_scrapingパラメータを使用：

シンプルなサイト：0-1000ms
動的なサイト：2000-3000ms
JavaScriptが多い：5000-8000ms

最適な待機時間を見つけるために異なる値でテストしてください。

専門的なパーサーを使用

人気のあるウェブサイト（Amazon、LinkedIn、Google）には事前構築されたパーサーを使用：

構造化データを自動的に取得
より信頼性の高い抽出
カスタムパーシングの必要なし
Olostepによって維持管理

非同期操作を処理

バッチ、クロール、マップ操作は非同期：

返されたID（batch_id、crawl_id、map_id）を保存
完了をポーリングまたはWebhookを使用
結果取得のための別のワークフローを設定

エラーハンドリング

常にAPI呼び出しをtry-catchブロックでラップ：

try {
  const result = await mastra.callApi({
    integrationName: 'olostep',
    api: 'scrapeWebsite',
    payload: { data: {...} }
  });
} catch (error) {
  // 認証、レート制限、またはネットワークエラーを処理
  console.error('スクレイピング失敗:', error.message);
}

レート制限

レート制限に注意：

リクエストを遅延させて間隔を空ける
可能な限りバッチ処理を使用
Olostepダッシュボードで使用状況を監視
必要に応じてプランをアップグレード

完全な例

リサーチエージェントを構築する完全な例を示します：

import { Mastra } from '@mastra/core';
import { Agent } from '@mastra/core';
import { createOlostepIntegration } from '@olostep/mastra-tools';

// Olostep統合を作成して登録
const olostep = createOlostepIntegration();
olostep.registerApis();

// Mastraを初期化
export const mastra = new Mastra({
  config: {
    integrations: [olostep],
    // ... 他の設定
  },
});

// リサーチエージェントを作成
const researchAgent = new Agent({
  name: 'research-assistant',
  instructions: `
    あなたはウェブデータを検索、抽出、構造化できるリサーチアシスタントです。
    ユーザーがトピックをリサーチするように頼んだ場合：
    1. OlostepのcreateMapを使用して関連ページを発見
    2. batchScrapeを使用して複数のソースからコンテンツを抽出
    3. 結果を分析し要約
    4. 構造化されたリサーチレポートを提示
  `,
  model: 'openai/gpt-4',
});

// エージェントを使用
async function researchTopic(topic: string) {
  // ステップ1: 関連ページを発見
  const mapResult = await mastra.callApi({
    integrationName: 'olostep',
    api: 'createMap',
    payload: {
      data: {
        apiKey: process.env.OLOSTEP_API_KEY!,
        url: `https://example.com/search?q=${topic}`,
        top_n: 20,
      }
    }
  });

  // ステップ2: 発見されたページをスクレイプ
  const batchResult = await mastra.callApi({
    integrationName: 'olostep',
    api: 'batchScrape',
    payload: {
      data: {
        apiKey: process.env.OLOSTEP_API_KEY!,
        batch_array: mapResult.urls.slice(0, 10).map(url => ({ url })),
        formats: ['markdown'],
      }
    }
  });

  // ステップ3: エージェントで分析
  const summary = await researchAgent.generate({
    messages: [{
      role: 'user',
      content: `このリサーチデータに基づいて、${topic}の包括的な要約を提供してください`
    }]
  });

  return summary;
}

トラブルシューティング

認証失敗

エラー: “無効なAPIキー”解決策:

ダッシュボードからAPIキーを確認
APIキーが環境変数に設定されていることを確認
APIキーがアクティブであることを確認
APIキーに余分なスペースがないか確認

APIが見つからない

エラー: “APIが見つからない” または “統合が登録されていない”解決策:

統合を作成した後にregisterApis()が呼び出されていることを確認
統合がMastra設定に追加されていることを確認
統合名が’olostep’であることを確認
変更後にMastraサーバーを再起動

スクレイプが空のコンテンツを返す

エラー: コンテンツフィールドが空解決策:

wait_before_scraping時間を増やす
ウェブサイトがログインを必要としているか確認
異なるフォーマットを試す（HTML vs Markdown）
URLがアクセス可能であることを確認
サイトが自動アクセスをブロックしているか確認

レート制限超過

エラー: “レート制限超過”解決策:

リクエストを遅延させて間隔を空ける
個別のスクレイプの代わりにバッチ処理を使用
Olostepプランをアップグレード
ダッシュボードでレート制限を確認

TypeScriptエラー

エラー: モジュールが見つからないまたはタイプエラー解決策:

@mastra/coreがインストールされていることを確認
TypeScriptバージョンの互換性を確認
すべての依存関係がインストールされていることを確認
再ビルド: npm run build

価格

OlostepはAPI使用量に基づいて課金され、Mastraとは独立しています：

スクレイプ: スクレイプごとに課金
バッチ: バッチ内のURLごとに課金
クロール: クロールされたページごとに課金
マップ: マップ操作ごとに課金

現在の価格はolostep.com/pricingで確認してください。

サポート

Mastra統合に関するヘルプが必要ですか？

ドキュメント

完全なAPIドキュメントを閲覧

サポートメール

メール: info@olostep.com

Mastraドキュメント

Mastraフレームワークについて学ぶ

スクレイプAPI

スクレイプエンドポイントについて学ぶ

バッチAPI

バッチエンドポイントについて学ぶ

クロールAPI

クロールエンドポイントについて学ぶ

マップAPI

マップエンドポイントについて学ぶ

Zapier統合

Zapierワークフローで自動化

LangChain統合

LangChainでAIエージェントを構築

Mastraウェブサイト

Mastraプラットフォーム

はじめに

ウェブスクレイピング機能を持つAIエージェントを構築する準備はできましたか？

パッケージをインストール

npmから@olostep/mastra-toolsをインストール

OlostepとMastraを使用して、ウェブデータを検索、抽出、構造化できるインテリジェントなAIエージェントを構築しましょう！

​特徴

ウェブサイトをスクレイプ

URLをバッチスクレイプ

クロールを作成

マップを作成

​インストール

​セットアップ

​1. パッケージをインストール

​2. 統合をインポートして登録

​3. APIキーを設定

​利用可能なAPI

​scrapeWebsite

​batchScrape

​createCrawl

​createMap

​エージェントでの使用

​基本的なエージェントの例

​エージェントワークフローの例

​人気のある使用例

​リサーチエージェント

​Eコマースインテリジェンス

​SEO分析

​専門的なパーサー

Google検索

Googleマップ

​パーサーの使用

​ベストプラクティス

​完全な例

​トラブルシューティング

​価格

​サポート

ドキュメント

サポートメール

Mastraドキュメント

​関連リソース

スクレイプAPI

バッチAPI

クロールAPI

マップAPI

Zapier統合

LangChain統合

Mastraウェブサイト

​はじめに

パッケージをインストール

特徴

インストール

セットアップ

1. パッケージをインストール

2. 統合をインポートして登録

3. APIキーを設定

利用可能なAPI

scrapeWebsite

batchScrape

createCrawl

createMap

エージェントでの使用

基本的なエージェントの例

エージェントワークフローの例

人気のある使用例

リサーチエージェント

Eコマースインテリジェンス

SEO分析

専門的なパーサー

パーサーの使用

ベストプラクティス

完全な例

トラブルシューティング

価格

サポート

関連リソース

はじめに