LangChain 自动化 - N8N 工作流导航

适用人群

此工作流适合以下人群：
- 研究人员：需要快速获取和分析 Paul Graham 的文章以进行研究。
- 学生：想要获取高质量的写作灵感和学习材料。
- 开发者：希望集成自然语言处理和向量存储的应用。
- 内容创作者：需要从经典文章中提取信息以生成新内容。

解决的问题

该工作流解决了以下问题：
- 信息获取：自动从 Paul Graham 的网站抓取最新的文章。
- 数据处理：提取文章内容并将其存储在向量数据库中，便于后续检索和分析。
- 互动性：允许用户通过聊天界面与存储的文章进行交互，获取信息和答案。

工作流程

工作流的详细步骤如下：
1. 触发工作流：用户手动点击"执行工作流"按钮。
2. 抓取文章列表：通过 HTTP 请求从 Paul Graham 的网站获取文章列表。
3. 提取文章名称：解析 HTML 内容，提取所有文章的链接。
4. 分割文章：将提取的文章名称分割成单独的项目。
5. 限制数量：限制只处理前 3 篇文章。
6. 获取文章内容：针对每篇文章发送请求，获取完整的文本内容。
7. 提取文本：解析 HTML 内容，提取文章的纯文本。
8. 存储到向量数据库：将提取的文本插入到 Milvus 向量数据库中，清空现有集合。
9. 生成嵌入：使用 OpenAI 生成文章文本的嵌入。
10. 文本分割：将长文本分割成适合处理的块。
11. 设置检索链：配置 Q&A 链以从 Milvus 数据库中检索信息并回答用户的问题。

自定义指南

用户可以通过以下方式自定义和调整此工作流：
- 更改文章来源：修改 Fetch Essay List 节点中的 URL，以抓取不同网站的文章。
- 调整文章数量：在 Limit to first 3 节点中更改 maxItems 参数，以处理更多或更少的文章。
- 修改存储设置：在 Milvus Vector Store 节点中更改集合名称，以适应用户的数据库结构。
- 自定义聊天模型：在 OpenAI Chat Model 节点中选择不同的模型或调整参数，以满足特定需求。