手动触发自动化

用于ManualTrigger Automate,手动触发的自动化工作流程,通过整合LangChain、Google Drive等工具,将银行对账单转换为Markdown格式,提取存款信息,支持处理PDF和扫描文档,提升数据处理效率,确保信息准确性。

2025/7/8
20 个节点
复杂
手动复杂langchain便签谷歌云端硬盘压缩编辑图像聚合高级api集成
分类:
Complex WorkflowManual TriggeredCreative Design Automation
集成服务:
LangChainSticky NoteGoogle DriveCompressionEditImageAggregate

适用人群

目标受众


- 财务分析师:需要从银行对账单中提取数据以进行财务分析。
- 会计人员:需要将纸质银行对账单数字化并提取关键信息。
- 开发者:希望利用自动化工具集成银行数据处理。
- 企业管理者:需要快速、准确地获取银行交易数据以进行决策支持。

解决的问题

解决的问题


- 数据提取效率低:传统手动提取数据耗时且容易出错。
- 纸质文件处理困难:扫描的PDF文件无法直接提取文本,导致数据无法使用。
- 信息整合难度大:需要将多个页面的信息整合为可用的格式,便于后续分析。

工作流程

工作流步骤


1. 手动触发工作流:用户通过点击‘测试工作流’按钮启动流程。
2. 获取银行对账单:从 Google Drive 下载指定的银行对账单PDF文件。
3. 将PDF拆分为图像:使用在线服务将PDF的每一页转换为单独的图像。
4. 调整图像大小:将图像缩小为75x75像素,以便于后续处理。
5. 将图像转录为Markdown:利用LangChain的视觉模型将图像中的文本转录为Markdown格式,保留文本结构。
6. 合并所有页面的文本:将所有页面的转录文本合并为一个完整的文档。
7. 提取关键信息:从合并的文本中提取所有存款相关的行,生成结构化数据,以便进一步分析。

自定义指南

自定义指南


- 更改PDF来源:可以将‘获取银行对账单’节点的Google Drive文件ID替换为其他文件的ID。
- 替换图像处理服务:如果需要数据隐私,可以自建PDF转图像服务,替换掉当前的在线服务。
- 修改提取条件:在‘提取所有存款表格行’节点中,自定义提取的条件和格式,以适应特定的对账单样式。
- 调整图像处理参数:在‘调整图像大小’节点中,可以根据需要修改图像的宽度和高度。