手动触发自动化

用于ManualTrigger Automate,手动触发的自动化工作流程,集成17个节点,能够高效处理网页内容,转换为Markdown格式,并提取链接。支持批量处理,每次最多处理40个项目,遵循API速率限制,确保稳定性和可靠性。通过连接自定义数据源,简化数据抓取和管理,提升工作效率。

2025/7/8
17 个节点
复杂
手动复杂等待便签无操作按批分割分割输出高级API集成
分类:
Complex WorkflowManual Triggered
集成服务:
WaitSticky NoteNoOpSplitInBatchesSplitOut

适用人群

此工作流适合以下人群:
- 开发者:希望自动化从网页提取数据的过程。
- 数据分析师:需要将网页内容转换为可分析的格式,特别是 Markdown
- 内容创作者:希望从多个来源快速收集和整理信息。
- 企业用户:需要定期从特定 URL 收集数据以供内部使用或报告。
- API 用户:想要利用 Firecrawl.dev API 进行网页抓取的用户。

解决的问题

此工作流解决了以下问题:
- 自动化数据抓取:通过 Firecrawl.dev API 自动从网页提取内容和链接,减少手动工作。
- 处理 API 限制:自动管理 API 调用频率,确保不超过每分钟 10 次请求 的限制。
- 批量处理:支持 40 个项目 的批量处理,提升效率。
- 格式转换:将 HTML 内容转换为 Markdown 格式,方便后续分析和使用。

工作流程

工作流的详细过程:
1. 手动触发:用户点击 ‘测试工作流’ 按钮以启动工作流。
2. 获取 URL:从用户自定义的数据源中获取需要抓取的网页 URL。
3. 拆分 URL:将获取的 URL 拆分为单独的项目,便于后续处理。
4. 限流处理:每次处理 40 个项目,然后再将其拆分为每批 10 个项目
5. 抓取网页内容:使用 HTTP 请求节点向 Firecrawl.dev API 发送请求,抓取网页的 Markdown 内容和链接。
6. 数据处理:将抓取到的数据整理并格式化,准备输出到用户指定的数据源。
7. 输出数据:将处理后的数据发送到连接的数据库或其他数据源。

自定义指南

用户可以通过以下方式自定义和调整此工作流:
- 修改输入源:用户可以将 URL 数据源更改为不同的数据库,确保数据列名为 Page
- 调整批量大小:根据需要修改每批处理的 URL 数量,例如将 10 个项目的批量大小更改为 5 个
- 更新 API 密钥:在 HTTP 请求节点中更新 Firecrawl 的 API 密钥,以确保能够成功访问 API。
- 自定义输出格式:根据具体需求调整输出数据的格式,例如将数据输出到 Airtable 或其他服务。