跳转到主要内容
经过验证的 Olostep Web Scraper 节点为你提供了 n8n 可视化构建器中的六个操作:抓取 URL、搜索网页、获取 AI 答案、批量抓取数千个 URL、爬取网站或映射其所有链接。 在 n8n 上查看 →

开始之前

  • 拥有带有 API 密钥的 Olostep 账户: 免费获取,无需信用卡。包含前 500 个积分。
  • n8n 正在运行: 可以是 n8n Cloud 或自托管实例。必须启用社区节点(在大多数设置中默认启用)。
  • 无需编写代码: 本指南中的所有操作都通过 n8n 的可视化编辑器完成。

设置

1

搜索 Olostep 节点

打开任意工作流,点击 +,搜索 Olostep。从结果中选择 Olostep Web Scraper在 n8n 节点选择器中搜索 Olostep
2

安装节点

点击结果以打开节点详细信息面板,然后点击 安装节点。n8n 将安装 n8n-nodes-olostep 并提示你重启。在继续之前执行此操作。Olostep Web Scraper 节点详细信息和安装节点按钮
如果你的工作区禁用了 社区节点,管理员需要先启用它。请参阅 n8n 社区节点指南
3

添加你的 API 密钥

在工作流中打开 Olostep 节点,点击 设置凭证(在参数选项卡中),添加你的 API 密钥,然后点击 保存n8n 中的 Olostep 凭证表单和 API 密钥字段Olostep 仪表板获取你的密钥 →
4

连接并运行

将 Olostep 节点连接到触发器和任何下游步骤,然后执行你的工作流。n8n 工作流画布,计划触发器连接到 Olostep 节点

操作

抓取网站

从任何 URL 提取内容为 Markdown、HTML、JSON 或纯文本。支持 JS 渲染页面,具有可选的等待时间和国家定位。

搜索

进行网页搜索并以 JSON 格式获取结构化结果(标题、URL 和摘要)。

答案(AI)

提出自然语言问题并获取带有引用来源的答案。在需要有根据的回答时,在 LLM 节点之前很有用。

批量抓取 URL

在一个作业中提交最多 10,000 个 URL,并行处理。返回一个 batch_id;异步检索结果。

创建爬取

从一个 URL 开始,跟随链接并抓取所有子页面。适用于文档网站、博客或整个网站的摄取。返回一个 crawl_id

创建地图

获取网站上的每个 URL,而不抓取内容。在批处理作业之前用于发现。返回一个 map_id
批处理、爬取和地图是异步的。 存储返回的 ID,并使用等待节点或第二个工作流在处理完成后检索结果。

示例工作流:从 Google Sheets 丰富潜在客户信息

它的作用: 当你将公司 URL 粘贴到 Google 表格时,此工作流会自动抓取该公司的网站,使用 AI 节点提取关键信息,并将结果写回到同一行,将空白电子表格变成已填充的潜在客户数据库。 使用的节点: Google Sheets 触发器 → Olostep 抓取网站 → OpenAI → 代码 → Google Sheets 更新 n8n 中的潜在客户信息丰富工作流:Google Sheets 触发器连接到 Olostep、OpenAI、代码和 Google Sheets 更新节点

第 1 步:设置你的 Google 表格

创建一个包含以下列的表格:Company URLIndustryDescriptionCompany SizeEnriched。工作流从 Company URL 读取并填写其余部分。

第 2 步:添加 Google Sheets 触发器

在 n8n 中,添加一个 Google Sheets 触发节点。将事件设置为 Row Added,指向你的表格,并设置为监视 Company URL 列。现在,每次你将新 URL 粘贴到表格中时,此工作流都会触发。

第 3 步:添加 Olostep 抓取网站

在触发器后连接一个 Olostep Web Scraper 节点。设置:
  • 操作: 抓取网站
  • URL: {{ $json["Company URL"] }}(从新行中提取 URL)
  • 输出格式: Markdown
Markdown 在这里效果最佳,因为它去除了导航、广告和样板。下一步中的 AI 节点获取的是关于公司的干净文本,而不是原始的 HTML 噪音。

第 4 步:添加 OpenAI 节点

连接一个 OpenAI 节点。将模型设置为 gpt-4o-mini(快速且适合提取任务)并使用以下提示:
你是一名销售研究员。根据以下公司网站内容,提取:
1. 行业(一个短语,例如 "B2B SaaS","电子商务","医疗保健")
2. 一句话公司描述(最多 20 个字)
3. 估计公司规模(初创公司 / 中小企业 / 中型市场 / 企业)

仅返回一个包含键:industry, description, company_size 的 JSON 对象。

网站内容:
{{ $json.markdownContent }}
markdownContent 字段是 Olostep 从抓取中返回的干净纯文本。

第 5 步:解析 AI 响应并写回

添加一个 代码 节点以解析 OpenAI 的 JSON:
const parsed = JSON.parse($input.first().json.message.content);
return [{ json: parsed }];
然后连接一个 Google Sheets 节点,设置为 更新行。映射列:
  • Industry{{ $json.industry }}
  • Description{{ $json.description }}
  • Company Size{{ $json.company_size }}
  • EnrichedYes

你得到的结果

将一个 URL 如 https://notion.so 粘贴到你的表格中,大约 10 秒内该行会填充:
Company URLIndustryDescriptionCompany SizeEnriched
https://notion.soProductivity SaaSAll-in-one workspace for notes, docs, and databasesMid-marketYes
从这里你可以扩展此工作流:在丰富完成时添加 Slack 通知,在写回之前按行业过滤,或用 HubSpot 替换 Google Sheets 以直接更新联系人。

模板

使用 Olostep 构建的可导入 n8n 工作流:

爬取文档 → AI 知识库

使用 Olostep 爬取文档网站,并将输出结构化为 AI 准备好的知识库。

Google Maps 潜在客户 → 决策者丰富

从 Google Maps 抓取商业潜在客户,并用决策者详细信息丰富它们。

挖掘用户投诉 → 洞察报告

使用 Olostep + Gemini 分析投诉,并在 Google Docs 中生成结构化的洞察报告。

亚马逊产品提取 → Google Sheets

使用 Olostep 提取亚马逊产品 URL 和元数据,然后将结果同步到 Sheets。
在 n8n.io 上浏览所有 Olostep 工作流 →

解析器

在任何抓取或批处理操作的 解析器 字段中添加解析器 ID,以获取结构化数据而不是原始内容:
解析器提取内容
@olostep/amazon-product标题、价格、评分、评论、图片、变体
@olostep/google-search结果标题、URL、摘要
@olostep/google-maps商业名称、地址、评分、评论
@olostep/extract-emails从任何页面提取电子邮件地址
@olostep/extract-socials社交资料链接(X、GitHub、LinkedIn 等)
@olostep/extract-calendarsGoogle Calendar 和 ICS 链接
Olostep 解析器商店中查看完整列表 →

故障排除

直接从 olostep.com/dashboard 复制密钥,不要有尾随空格。如果错误仍然存在,请在 n8n 中删除并重新创建凭证。
增加 抓取前等待时间(对于 JS 密集页面,尝试 2000–5000ms)。确认 URL 可以公开访问,无需登录。如果特定域名持续失败,请联系 info@olostep.com
要抓取的 URL 字段需要一个 JSON 数组:
[
  { "url": "https://example.com/page-1", "custom_id": "p1" },
  { "url": "https://example.com/page-2", "custom_id": "p2" }
]
如果需要,使用上游的代码节点从你的数据构建此数组。
在抓取步骤之间添加一个 等待 节点,或切换到 批量抓取 URL 而不是循环单个抓取。在 仪表板 中查看当前使用情况。
在 n8n Cloud 上,社区节点必须由工作区所有者启用。在自托管中,确保环境中设置了 N8N_COMMUNITY_PACKAGES_ENABLED=true。请参阅 n8n 的安装指南

相关内容

抓取 API

抓取端点的完整参考

批处理 API

批处理作业的工作原理及如何检索结果

爬取 API

爬取配置和结果检索

地图 API

URL 发现和过滤选项

开始使用

准备好自动化你的网页搜索、抓取和爬取工作流了吗?

n8n 网站

n8n 平台

安装节点

安装 n8n-nodes-olostep 并开始构建自动化工作流
立即将 Olostep 与 n8n 连接,自动化你的网页数据提取!