获取页面内容
检索
检索内容
检索已处理批次和抓取URL的内容。
GET
获取页面内容
授权
Bearer认证头格式为Bearer ,其中是你的认证令牌。
查询参数
要获取的页面内容的 ID。可在 /v1/crawls/{crawl_id}/pages、/v1/scrapes/{scrape_id} 或 /v1/batches/{batch_id}/items 端点的响应中找到
可选数组,用于在生产中仅获取特定格式。如果未提供,将返回所有格式。
可用选项:
html, markdown, json 响应
成功响应页面内容。
页面 HTML 内容(如果请求并可用)。
页面 Markdown 内容(如果请求并可用)。
从解析器返回的页面 JSON 内容(如果请求并可用)。
HTML 的 S3 存储桶 URL。7 天后过期。
Markdown 的 S3 存储桶 URL。7 天后过期。
JSON 的 S3 存储桶 URL。7 天后过期。
如果内容对象的大小超过 6MB 限制。如果为 true,请使用托管的 S3 urls 获取内容。