Passer au contenu principal
Par défaut, Olostep prend en charge le retour de contenu dans divers formats, y compris :
  • HTML
  • Texte
  • PDF brut
  • Markdown
Pour certains cas d’utilisation, tu pourrais n’avoir besoin que de données spécifiées, structurées et propres au format JSON, plutôt que de tout le contenu. Pour y parvenir, tu peux utiliser :
  • Parsers : Idéal pour le scraping de sites web à volume élevé, cohérent et récurrent
  • Extraction LLM : Idéal pour les besoins d’extraction flexibles ou les sites web avec des structures changeantes.
Les deux méthodes fournissent des données JSON propres et structurées qui peuvent être immédiatement utilisées dans tes applications sans traitement supplémentaire.