跳转到主要内容
默认情况下,Olostep 支持以多种格式返回内容,包括:
  • HTML
  • 文本
  • 原始 PDF
  • Markdown
对于某些用例,你可能不需要整个内容,而只需要以 JSON 格式指定的、结构化的、干净的数据。 要实现这一点,你可以使用:
  • 解析器:适用于高容量、一致性、定期的网站抓取
  • LLM 提取:适用于灵活的提取需求或结构变化的网站。
这两种方法都提供干净、结构化的 JSON 数据,可以直接在你的应用程序中使用,无需额外处理。