Par défaut, Olostep prend en charge le retour de contenu dans divers formats, y compris :
HTML
Texte
PDF brut
Markdown
Pour certains cas d’utilisation, tu pourrais ne pas avoir besoin de tout le contenu, mais seulement de données spécifiées, structurées et propres au format JSON.Pour y parvenir, tu peux utiliser :
Parsers : Idéal pour le scraping de sites web à grand volume, cohérent et récurrent
Extraction LLM : Idéal pour les besoins d’extraction flexibles ou les sites web avec des structures changeantes.
Les deux méthodes fournissent des données JSON propres et structurées qui peuvent être immédiatement utilisées dans tes applications sans traitement supplémentaire.