Übersicht
Der scrape-Endpunkt von Olostep ermöglicht es, Inhalte von jeder Website zu extrahieren. Inhalte im Markdown-Format sind nützlich, wenn Sie sie einem LLM zuführen möchten, ohne den gesamten HTML-Code. In diesem Leitfaden werden wir sehen, wie man Markdown von einer Website wiehttps://www.nea.com/team extrahiert.
Voraussetzungen
Bevor Sie beginnen, stellen Sie sicher, dass Sie Folgendes haben:- Einen gültigen Olostep API-Schlüssel. Sie können einen erhalten, indem Sie sich bei Olostep anmelden.
- Python auf Ihrem System installiert
- Die Bibliotheken
requestsundjson(diese sind in Python vorinstalliert, aber Sie können sie bei Bedarf mitpip install requestsinstallieren)
Text von einer Website extrahieren
Das folgende Python-Skript zeigt, wie man Text und Markdown-Inhalte von einer Website mit der API von Olostep extrahiert.Beispielantwort
Eine erfolgreiche Antwort sieht ungefähr so aus:Erklärung
url_to_scrape: gibt die URL der Website an, von der Inhalte extrahiert werden sollen.formats: definiert die Ausgabeformate (in diesem Fall Text).Authorization: enthält Ihren API-Schlüssel zur Authentifizierung der Anfrage.- Die Antwort wird als JSON formatiert und zur besseren Lesbarkeit ausgegeben.