Par défaut, Olostep prend en charge le retour de contenu dans divers formats, y compris :
HTML
Texte
PDF brut
Markdown
Pour certains cas d’utilisation, tu pourrais n’avoir besoin que de données spécifiées, structurées et propres au format JSON, plutôt que de tout le contenu.Pour y parvenir, tu peux utiliser :
Parsers : Idéal pour le scraping de sites web à volume élevé, cohérent et récurrent
Extraction LLM : Idéal pour les besoins d’extraction flexibles ou les sites web avec des structures changeantes.
Les deux méthodes fournissent des données JSON propres et structurées qui peuvent être immédiatement utilisées dans tes applications sans traitement supplémentaire.