/v1/maps 端点,您可以获取网站上的所有URL。这对于内容发现、网站结构分析(例如SEO)或决定下一个要抓取的URL非常有用。
- 获取网站上的所有URL(包括站点地图和发现的链接)
- 使用特殊模式包含/排除路径(例如
/blog/**) - 使用
cursor分页大响应(每个响应最多10MB) - 使用
top_n限制数量
安装
使用方法
发送一个包含网站url 的POST请求。可以选择传递 include_urls、exclude_urls(glob模式)和 top_n。
cursor 参数,可用于分页和获取后续URL。有关详细信息,请参阅 API参考。
此端点特别有用,当您需要:
- 发现网站上的所有内容页面
- 分析网站结构和层次
- 准备批量处理的URL
- 决定要抓取的特定URL
include_urls 和 exclude_urls。
示例
假设您想从 www.brex.com 提取所有路径在/product/ 之后的URL,例如 https://www.brex.com/product/api/no-code,但也包括 www.brex.com/product。
您可以使用以下代码: