手动触发自动化 - N8N 工作流导航

适用人群

此工作流适合以下人群：
- 开发者：希望自动化从网页提取数据的过程。
- 数据分析师：需要将网页内容转换为可分析的格式，特别是 Markdown。
- 内容创作者：希望从多个来源快速收集和整理信息。
- 企业用户：需要定期从特定 URL 收集数据以供内部使用或报告。
- API 用户：想要利用 Firecrawl.dev API 进行网页抓取的用户。

解决的问题

此工作流解决了以下问题：
- 自动化数据抓取：通过 Firecrawl.dev API 自动从网页提取内容和链接，减少手动工作。
- 处理 API 限制：自动管理 API 调用频率，确保不超过每分钟 10 次请求 的限制。
- 批量处理：支持 40 个项目 的批量处理，提升效率。
- 格式转换：将 HTML 内容转换为 Markdown 格式，方便后续分析和使用。

工作流程

工作流的详细过程：
1. 手动触发：用户点击 ‘测试工作流’ 按钮以启动工作流。
2. 获取 URL：从用户自定义的数据源中获取需要抓取的网页 URL。
3. 拆分 URL：将获取的 URL 拆分为单独的项目，便于后续处理。
4. 限流处理：每次处理 40 个项目，然后再将其拆分为每批 10 个项目。
5. 抓取网页内容：使用 HTTP 请求节点向 Firecrawl.dev API 发送请求，抓取网页的 Markdown 内容和链接。
6. 数据处理：将抓取到的数据整理并格式化，准备输出到用户指定的数据源。
7. 输出数据：将处理后的数据发送到连接的数据库或其他数据源。

自定义指南

用户可以通过以下方式自定义和调整此工作流：
- 修改输入源：用户可以将 URL 数据源更改为不同的数据库，确保数据列名为 Page。
- 调整批量大小：根据需要修改每批处理的 URL 数量，例如将 10 个项目的批量大小更改为 5 个。
- 更新 API 密钥：在 HTTP 请求节点中更新 Firecrawl 的 API 密钥，以确保能够成功访问 API。
- 自定义输出格式：根据具体需求调整输出数据的格式，例如将数据输出到 Airtable 或其他服务。