ページコンテンツを取得
取得
コンテンツの取得
処理済みバッチとクロールURLのコンテンツを取得します。
GET
ページコンテンツを取得
承認
Bearer 形式のBearer認証ヘッダー。はあなたの認証トークンです。
クエリパラメータ
取得するページコンテンツのID。/v1/crawls/{crawl_id}/pages、/v1/scrapes/{scrape_id}、または/v1/batches/{batch_id}/itemsエンドポイントのレスポンスで利用可能
本番環境で特定のフォーマットのみを取得するためのオプションの配列。指定しない場合、すべてのフォーマットが返されます。
利用可能なオプション:
html, markdown, json レスポンス
ページコンテンツを含む成功したレスポンス。
リクエストされ、利用可能な場合のページのHTMLコンテンツ。
リクエストされ、利用可能な場合のページのMarkdownコンテンツ。
リクエストされ、利用可能な場合のパーサーから返されたページのJSONコンテンツ。
HTMLのS3バケットURL。7日間有効。
MarkdownのS3バケットURL。7日間有効。
JSONのS3バケットURL。7日間有効。
コンテンツオブジェクトのサイズが6MBの制限を超える場合。trueの場合、ホストされたS3のURLを使ってコンテンツを取得してください。