Google 页面实体提取模板 - N8N 工作流导航

适用人群

该工作流适合以下人群：
- 开发者：希望通过自动化提取网页中的实体信息，以便进行数据分析或其他应用。
- 市场营销人员：需要从竞争对手或市场相关网站获取信息，以制定更有效的营销策略。
- 研究人员：希望快速获取网页内容中的实体数据，以支持研究工作。
- 内容创作者：需要从不同来源提取信息，以丰富自己的内容创作。

解决的问题

此工作流解决了从网页中提取命名实体（如人名、组织名、地点等）的需求。通过使用 Google 的自然语言 API，用户可以轻松获取结构化的实体数据，帮助他们更好地理解和分析网页内容。

工作流程

工作流的详细步骤如下：
1. Webhook 触发：用户发送一个包含要分析的网页 URL 的 POST 请求到 webhook 端点。
2. 获取 URL 页面内容：工作流接收到请求后，提取 URL 并发送请求以获取网页内容。
3. 准备数据：将获取的网页内容进行清理和准备，以便发送给 Google 的自然语言 API。
4. 调用 Google 实体识别 API：将准备好的数据发送到 Google 的 API，进行实体识别。
5. 响应用户：将识别出的实体数据以 JSON 格式返回给用户，包含实体名称、类型、重要性分数等信息。

自定义指南

用户可以通过以下方式自定义和调整此工作流：
- 替换 YOUR-GOOGLE-API-KEY 为实际的 Google Cloud API 密钥，确保自然语言 API 已启用。
- 根据需要调整 网页内容的提取逻辑，例如处理不同格式的网页内容。
- 修改 返回的数据格式，以适应用户的特定需求，例如添加或删除某些实体信息。
- 通过调整 sticky note 的内容和样式，提供更详细的说明或用户指导。