Agente de IA Basado en Visión - con Google Sheets, ScrapingBee y Gemini

Audiencia Objetivo

Este flujo de trabajo está diseñado para:
- Desarrolladores y técnicos que buscan automatizar la extracción de datos de páginas web.
- Empresas de comercio electrónico que necesitan recopilar información sobre productos de múltiples sitios web de manera eficiente.
- Investigadores de mercado que requieren datos precisos y estructurados de la competencia.
- Profesionales de marketing que desean analizar precios y promociones de productos en línea.

Problema Resuelto

Este flujo de trabajo resuelve el problema de la extracción manual de datos de páginas web, que puede ser lento y propenso a errores. Al utilizar un agente de IA basado en visión, se automatiza la recopilación de información clave como títulos de productos, precios, marcas y promociones, lo que ahorra tiempo y mejora la precisión de los datos recopilados.

Pasos del Flujo

Activación del flujo de trabajo: El flujo se inicia manualmente al hacer clic en 'Probar flujo de trabajo'.
2. Obtención de URLs: Se recupera una lista de URLs desde Google Sheets que se van a raspar.
3. Configuración de campos: Se preparan los campos necesarios para la solicitud a ScrapingBee.
4. Captura de pantalla: Se utiliza ScrapingBee para obtener una captura de pantalla completa de la página web especificada.
5. Extracción de datos: El agente de IA analiza la captura de pantalla para extraer información relevante. Si no puede, se llama a una herramienta de raspado HTML como respaldo.
6. Formato de salida estructurado: Los datos extraídos se organizan en un formato JSON estructurado.
7. División de resultados: Los resultados se dividen en filas individuales para su fácil manejo.
8. Almacenamiento en Google Sheets: Finalmente, los datos extraídos se insertan en la hoja de resultados en Google Sheets.

Guía de Personalización

Para personalizar este flujo de trabajo:
- Modificar el esquema de salida: Ajuste el Structured Output Parser para adaptarse a los campos que necesita extraer de las páginas web específicas.
- Agregar más campos: En el nodo Set fields, agregue campos adicionales que desee enviar a ScrapingBee o al agente de IA.
- Ajustar los prompts de IA: Personalice los mensajes del agente de IA para mejorar la precisión de la extracción según el tipo de productos o información que necesita.
- Cambiar la configuración de ScrapingBee: Ajuste los parámetros de la solicitud a ScrapingBee, como el tamaño de la captura de pantalla o los encabezados HTTP, según sus necesidades específicas.