Panoramica
L’endpoint scrape di Olostep consente di estrarre contenuti da qualsiasi sito web. Il contenuto in markdown è utile se si desidera fornirlo a un LLM senza tutto l’HTML. In questa guida vedremo come estrarre markdown da un sito web comehttps://www.nea.com/team.
Prerequisiti
Prima di iniziare, assicurati di avere quanto segue:- Una chiave API valida di Olostep. Puoi ottenerne una registrandoti su Olostep.
- Python installato sul tuo sistema
- Le librerie
requestsejson(queste sono preinstallate con Python, ma puoi installarle usandopip install requestsse necessario)
Estrazione del Testo da un Sito Web
Il seguente script Python dimostra come estrarre testo e contenuti markdown da un sito web utilizzando l’API di Olostep.Risposta di Esempio
Una risposta di successo sarà simile a questa:Spiegazione
url_to_scrape: specifica l’URL del sito web da cui estrarre il contenuto.formats: definisce i formati di output (in questo caso testo).Authorization: contiene la tua chiave API per autenticare la richiesta.- La risposta è formattata come JSON e stampata per leggibilità.