Pruebas de Múltiples LLM Locales con LM Studio

Audiencia Objetivo

Este flujo de trabajo está diseñado para:
- Desarrolladores que desean evaluar y comparar múltiples modelos de lenguaje locales.
- Investigadores que necesitan analizar la legibilidad y la calidad de las respuestas generadas por modelos de lenguaje.
- Educadores que buscan herramientas para evaluar la comprensión lectora en diferentes niveles.
- Analistas de datos que quieren recopilar y analizar métricas de rendimiento de modelos de lenguaje en Google Sheets.

Problema Resuelto

Este flujo de trabajo aborda la necesidad de automatizar el proceso de evaluación de modelos de lenguaje, permitiendo a los usuarios:
- Recopilar respuestas de múltiples modelos de manera eficiente.
- Analizar métricas como la legibilidad, el conteo de palabras y la longitud de las oraciones.
- Guardar automáticamente los resultados en Google Sheets para facilitar el seguimiento y análisis posterior.

Pasos del Flujo

Recibir un mensaje de chat: El flujo se activa manualmente al recibir un mensaje.
2. Obtener modelos: Se consulta a un servidor para obtener la lista de modelos de lenguaje disponibles.
3. Configurar la hora de inicio: Se captura la hora en que se inicia la evaluación.
4. Agregar un prompt del sistema: Se establece un mensaje que guía a los modelos para que generen respuestas claras y concisas.
5. Ejecutar el modelo: Se envían solicitudes a los modelos seleccionados para que generen respuestas basadas en el prompt.
6. Analizar las respuestas: Se evalúan las respuestas generadas en términos de legibilidad, conteo de palabras y longitud de las oraciones.
7. Guardar resultados: Se almacenan los resultados analizados en una hoja de Google Sheets para su revisión y análisis posterior.
8. Calcular la diferencia de tiempo: Se calcula el tiempo total que tomó procesar la solicitud y generar la respuesta.

Guía de Personalización

Los usuarios pueden personalizar este flujo de trabajo de las siguientes maneras:
- Actualizar la URL base: Cambiar la URL en el nodo 'Obtener Modelos' para que apunte a su servidor de LM Studio.
- Modificar los prompts: Ajustar el prompt del sistema en el nodo 'Agregar Prompt del Sistema' para guiar a los modelos según sus necesidades específicas.
- Personalizar métricas: Adaptar el código en el nodo 'Analizar Métricas de Respuesta LLM' para incluir otras métricas o análisis que sean relevantes para su caso de uso.
- Modificar la hoja de Google: Cambiar los encabezados y el formato en la hoja de Google Sheets para que se ajusten a sus preferencias de presentación y análisis.