使用Dumpling AI从URL抓取书籍,清理HTML,保存到表格,作为CSV发送邮件

用于Dumpling AI,自动从指定网址抓取书籍数据,提取书名和价格,按价格排序,生成CSV文件并通过电子邮件发送。此工作流程简化了数据收集和整理的过程,节省时间,提高效率。

2025/7/8
11 个节点
中等
tlcnkmb96fufz2ea手动中等converttofilegmailsticky notegooglesheetstriggersplitout高级文件存储api集成
分类:
Communication & MessagingManual TriggeredData Processing & AnalysisMedium Workflow
集成服务:
ConvertToFileGmailSticky NoteGoogleSheetsTriggerSplitOut

适用人群

目标受众


- 书籍爱好者:希望快速获取在线书店的书籍信息并进行比较。
- 市场分析师:需要定期收集书籍价格数据以进行市场研究。
- 开发者:希望通过自动化流程简化数据收集和报告生成。
- 学生:需要整理书籍信息用于研究或项目。

解决的问题

解决的问题


- 手动收集书籍信息的繁琐:通过自动化流程从网站中提取书籍数据,消除手动操作的需要。
- 数据格式不统一:将提取的数据转换为 CSV格式,便于后续分析和处理。
- 信息更新不及时:通过定期监控 Google Sheets 中的新书籍 URL,确保信息的实时更新。

工作流程

工作流程步骤


1. 触发器:监控 Google Sheets 中的新行添加,当有新 URL 时自动启动流程。
2. 抓取网站内容:使用 Dumpling AI 发送 HTTP POST 请求,获取目标 URL 的完整 HTML 内容。
3. 提取书籍信息:从抓取的 HTML 中提取所有书籍条目,使用 CSS 选择器定位书籍列表。
4. 分割书籍数组:将提取的书籍信息数组分割成单独的书籍,便于后续处理。
5. 提取个别书籍数据:从每本书中提取书名和价格,确保数据的完整性。
6. 按价格排序:根据书籍价格进行降序排序,方便用户查看价格最高的书籍。
7. 转换为 CSV 文件:将排序后的书籍数据转换为 CSV 格式,以便下载和使用。
8. 通过电子邮件发送 CSV 文件:将生成的 CSV 文件作为附件发送到指定的电子邮件地址。

自定义指南

自定义指南


- 更改 URL 源:在 Google Sheets 中更新书籍 URL,以抓取不同的网站。
- 调整提取的 CSS 选择器:根据目标网站的 HTML 结构,修改提取书籍信息的 CSS 选择器。
- 修改电子邮件内容:在发送电子邮件的节点中更新消息内容和收件人,以适应不同的需求。
- 定制排序规则:可以根据其他字段(如书名、作者等)进行排序,以满足特定需求。