Inhalte von verarbeiteten Batches und Crawls-URLs abrufen.
Documentation Index
Fetch the complete documentation index at: https://docs.olostep.com/llms.txt
Use this file to discover all available pages before exploring further.
/v1/retrieve kannst du die Inhalte von zuvor verarbeiteten Batches und Crawls abrufen. Dies ist nützlich, um auf die gesammelten Daten zuzugreifen und sie in deinen Anwendungen zu verwenden.
GET-Anfrage an den Endpunkt /v1/retrieve mit den erforderlichen Parametern.
success).batchId und crawlId übermittelst, um solche Fehler zu vermeiden.Bearer-Authentifizierungsheader in der Form Bearer , wobei dein Authentifizierungstoken ist.
Die ID des Seiteninhalts, der abgerufen werden soll. Verfügbar in der Antwort der Endpunkte /v1/crawls/{crawl_id}/pages, /v1/scrapes/{scrape_id} oder /v1/batches/{batch_id}/items
Optionale Liste, um nur bestimmte Formate in der Produktion abzurufen. Wenn nicht angegeben, werden alle Formate zurückgegeben.
html, markdown, json Erfolgreiche Antwort mit Seiteninhalt.
HTML-Inhalt der Seite, falls angefordert und verfügbar.
Markdown-Inhalt der Seite, falls angefordert und verfügbar.
JSON-Inhalt der Seite, der von Parsern zurückgegeben wird, falls angefordert und verfügbar.
S3-Bucket-URL von html. Läuft in 7 Tagen ab.
S3-Bucket-URL von markdown. Läuft in 7 Tagen ab.
S3-Bucket-URL von json. Läuft in 7 Tagen ab.
Wenn die Größe der Inhaltsobjekte das 6MB-Limit überschreitet. Wenn wahr, verwende gehostete S3-URLs, um den Inhalt zu erhalten.