Telegram RAG pdf - N8N 工作流导航

适用人群

此工作流适合以下人群：
- 开发者：希望通过 Telegram 实现自动化工作流的人。
- 数据科学家：需要处理和分析文档数据的专业人士。
- 企业用户：希望通过聊天机器人与客户互动并提供信息的人。
- 教育工作者：需要向学生提供资料和答案的教师。

解决的问题

此工作流解决了以下问题：
- 文档处理：自动接收 Telegram 中的 PDF 文档并将其提取和处理。
- 数据存储：将文档数据存储到 Pinecone 向量数据库中，以便后续查询。
- 即时响应：能够根据用户的提问快速检索信息并提供答案，提高用户体验。

工作流程

工作流流程详细说明：
1. 触发器：通过 Telegram 触发器接收用户消息。
2. 条件检查：检查接收到的消息是否包含文档。
3. 获取文件：如果是文档，则通过 Telegram API 获取文件。
4. 文件处理：将获取的文件转换为 application/pdf 格式。
5. 数据加载：使用默认数据加载器将 PDF 文档加载到工作流中。
6. 文本分割：使用递归字符文本分割器将文档分割为可管理的块。
7. 生成嵌入：使用 OpenAI 生成文档的嵌入。
8. 存储向量：将生成的嵌入存储到 Pinecone 向量数据库中。
9. 检索数据：根据用户提问从向量数据库中检索相关信息。
10. 生成回答：使用 Groq 聊天模型生成回答，基于检索到的信息。
11. 发送响应：将生成的回答通过 Telegram 发送回用户。
12. 处理结果：在文档成功存储后，告知用户存储的页面总数。

自定义指南

用户可以根据以下指南自定义和调整此工作流：
- 更改触发条件：根据需要调整 Telegram 触发器的设置，以接收不同类型的消息。
- 修改文件处理逻辑：可以改变文件类型处理或添加其他文件格式。
- 调整数据存储：可以更改 Pinecone 的配置，选择不同的索引或存储模式。
- 定制响应内容：根据业务需求修改 Telegram 响应节点中的文本内容。
- 添加新功能：根据需求添加更多节点，例如集成其他 API 或数据源。