/v1/mapsエンドポイントを使用すると、ウェブサイト上のすべてのURLを取得できます。これは、コンテンツの発見、サイト構造の分析(例:SEO)、次にスクレイプしたいURLを決定するのに役立ちます。
- ウェブサイト上のすべてのURLを取得(サイトマップや発見されたリンクを含む)
- 特殊なパターンを使用してパスを含める/除外する(例:
/blog/**) cursorを使用して大きなレスポンスをページネーション(1レスポンスあたり最大10MB)top_nでボリュームを制限
インストール
使用法
ウェブサイトのurlを指定してPOSTリクエストを送信します。オプションでinclude_urls、exclude_urls(グロブパターン)、およびtop_nを渡すことができます。
cursorパラメータを返します。詳細については、APIリファレンスを参照してください。
このエンドポイントは特に次のような場合に役立ちます:
- ウェブサイト上のすべてのコンテンツページを発見する
- サイト構造と階層を分析する
- バッチ処理のためにURLを準備する
- スクレイプする特定のURLを決定する
include_urlsとexclude_urlsのパラメータを使用できます。
例
例えば、www.brex.comから/product/以降のパスを持つすべてのURLを抽出したい場合、例えばhttps://www.brex.com/product/api/no-codeですが、www.brex.com/productも含めたいとします。
次のコードを使用できます: