Übersicht
Der scrape-Endpunkt von Olostep ermöglicht es, Inhalte von jeder Website zu extrahieren. Inhalte im Markdown-Format sind nützlich, wenn du sie einem LLM zuführen möchtest, ohne den gesamten HTML-Code. In diesem Leitfaden werden wir sehen, wie man Markdown von einer Website wiehttps://www.nea.com/team extrahiert.
Voraussetzungen
Bevor du beginnst, stelle sicher, dass du Folgendes hast:- Einen gültigen Olostep API-Schlüssel. Du kannst einen erhalten, indem du dich bei Olostep anmeldest.
- Python auf deinem System installiert
- Die Bibliotheken
requestsundjson(diese sind standardmäßig mit Python installiert, aber du kannst sie bei Bedarf mitpip install requestsinstallieren)
Text von einer Website extrahieren
Das folgende Python-Skript zeigt, wie man Text- und Markdown-Inhalte von einer Website mithilfe der Olostep-API extrahiert.Beispielantwort
Eine erfolgreiche Antwort sieht ungefähr so aus:Erklärung
url_to_scrape: gibt die URL der Website an, von der Inhalte extrahiert werden sollen.formats: definiert die Ausgabeformate (in diesem Fall Text).Authorization: enthält deinen API-Schlüssel zur Authentifizierung der Anfrage.- Die Antwort wird als JSON formatiert und zur besseren Lesbarkeit ausgegeben.