跳转到主要内容
GET
/
v1
/
retrieve
Seiteninhalt abrufen
curl --request GET \
  --url https://api.olostep.com/v1/retrieve \
  --header 'Authorization: Bearer <token>'
{
  "html_content": "<string>",
  "markdown_content": "<string>",
  "json_content": "<string>",
  "html_hosted_url": "<string>",
  "markdown_hosted_url": "<string>",
  "json_hosted_url": "<string>",
  "size_exceeded": true
}

授权

Authorization
string
header
必填

Bearer authentication header of the form Bearer <token>, where <token> is your auth token.

查询参数

retrieve_id
string
必填

Die ID des abzurufenden Seiteninhalts. Verfügbar in der Antwort der Endpunkte /v1/crawls/{crawl_id}/pages, /v1/scrapes/{scrape_id} oder /v1/batches/{batch_id}/items

formats
enum<string>[]

Optionale Liste, um nur bestimmte Formate in der Produktion abzurufen. Wenn nicht angegeben, werden alle Formate zurückgegeben.

可用选项:
html,
markdown,
json

响应

Erfolgreiche Antwort mit Seiteninhalt.

html_content
string

HTML-Inhalt der Seite, falls angefordert und verfügbar.

markdown_content
string

Markdown-Inhalt der Seite, falls angefordert und verfügbar.

json_content
string

JSON-Inhalt der Seite, der von Parsern zurückgegeben wird, falls angefordert und verfügbar.

html_hosted_url
string

S3-Bucket-URL von html. Läuft in 7 Tagen ab.

markdown_hosted_url
string

S3-Bucket-URL von markdown. Läuft in 7 Tagen ab.

json_hosted_url
string

S3-Bucket-URL von json. Läuft in 7 Tagen ab.

size_exceeded
boolean

Wenn die Größe der Inhaltsobjekte das 6MB-Limit überschreitet. Wenn wahr, verwenden Sie gehostete S3-URLs, um den Inhalt zu erhalten.