使用 Bright Data Scrape 和 Google Gemini 自动化 Etsy 数据挖掘

用于Etsy,通过Bright Data抓取和Google Gemini模型,自动化提取产品信息,支持分页处理和Webhook通知,提升数据获取效率,简化信息提取流程。

2025/7/8
19 个节点
复杂
kujft2fojmovqamjddpkw7hg5dzhqu2w手动复杂便签langchainsplitinbatchesreadwritefilesplitout高级api集成文件存储代码自定义
分类:
Complex WorkflowManual Triggered
集成服务:
Sticky NoteLangChainSplitInBatchesReadWriteFileSplitOut

适用人群

  • 电商卖家:希望自动化提取 Etsy 上的产品信息以优化销售策略。
    - 数据分析师:需要快速获取并分析 Etsy 的产品数据以进行市场研究。
    - 开发者:希望通过 API 集成 Etsy 数据到他们的应用或服务中。
    - 创业者:寻找灵感和产品趋势以指导新产品的开发。
  • 解决的问题

    这个工作流解决了手动提取 Etsy 产品信息的繁琐过程。通过自动化抓取数据,用户可以节省时间并提高数据准确性,特别是在处理大量产品时,确保获取最新的市场信息。

    工作流程

  • 手动触发工作流:用户点击‘测试工作流’按钮启动整个流程。
    2. 设置 Etsy 搜索查询:指定要搜索的产品类型,例如‘wall art for mum’。
    3. 执行 Etsy 网络请求:使用 Bright Data API 发送请求以获取搜索结果。
    4. 提取分页结果:分析返回的数据,提取出产品的信息和分页链接。
    5. 循环处理每一页:对每一页的结果执行相同的请求,确保获取所有相关产品。
    6. 提取产品信息:从每个产品的详细信息中提取出所需的字段,如名称、价格和链接。
    7. 发送 Webhook 通知:将提取的数据发送到指定的 Webhook URL。
    8. 保存数据到磁盘:将抓取的内容写入文件,以便后续分析和使用。
  • 自定义指南

    用户可以根据自己的需求自定义此工作流:
    - 搜索查询:修改‘Set Esty Search Query’节点中的 URL,以改变搜索的产品类型。
    - Webhook URL:在‘Initiate a Webhook Notification for the extracted data’节点中更新 URL,以便将数据发送到不同的接收端。
    - 数据处理逻辑:根据需要调整数据提取和处理的节点,添加或修改提取的字段。
    - 文件保存路径:在‘Write the scraped content to disk’节点中修改文件路径,以适应用户的文件系统结构。