Par défaut, Olostep prend en charge le retour de contenu dans divers formats, y compris :
HTML
Texte
PDF brut
Markdown
Pour certains cas d’utilisation, vous n’aurez peut-être pas besoin de l’intégralité du contenu, mais seulement de données spécifiées, structurées et propres au format JSON.Pour y parvenir, vous pouvez utiliser :
Parsers : Idéal pour le scraping de sites web à fort volume, cohérent et récurrent
Extraction LLM : Idéal pour des besoins d’extraction flexibles ou des sites web avec des structures changeantes.
Pour obtenir l’accès à la fonctionnalité d’Extraction LLM, veuillez nous contacter à info@olostep.comLes deux méthodes fournissent des données JSON propres et structurées qui peuvent être immédiatement utilisées dans vos applications sans traitement supplémentaire.