Fin Vision es una capacidad integrada de Fin AI Agent que le permite analizar y entender imágenes enviadas por clientes - capturas de pantalla, fotos, documentos y más - directamente dentro de las conversaciones vía chat o correo electrónico.
No es necesario habilitar ni configurar nada, y no hay costo adicional.
Fin Vision ayuda a:
Diagnosticar problemas más rápido
Eliminar la necesidad de explicaciones largas por parte del cliente
Extraer y entender contenido visual como mensajes de error, recibos, defectos de producto y más
Cómo funciona Fin Vision
Fin Vision utiliza modelos de lenguaje multimodales grandes (LLMs) para entender imágenes. Cuando un cliente envía una imagen, Fin la procesa usando un LLM habilitado para visión para generar una descripción textual estructurada. Esta transcripción incluye:
Texto extraído (OCR)
Elementos de la interfaz y etiquetas asociadas
Números de referencia, detalles del producto y puntos clave
Información contextual derivada de la imagen
Esta descripción se añade luego al historial del chat, lo que permite a Fin incorporar el contexto visual en sus respuestas.
Con este entendimiento, Fin puede:
Buscar en tu knowledge base de manera más efectiva
Resolver tareas que dependen de información visual
Proporcionar respuestas relevantes y accionables, tal como lo haría con la entrada escrita de un cliente
Nota:
Fin no entrena ni analiza imágenes dentro de tu contenido de soporte (por ejemplo, imágenes incrustadas en artículos). Solo procesa imágenes enviadas activamente por clientes durante las conversaciones.
Fin no genera imágenes, pero puede incluir imágenes existentes de tu contenido de soporte en las respuestas (Fin Image Answers).
Actualmente Fin no puede leer texto ALT en imágenes.
Formas de usar Fin Vision
Industria | Ejemplos de casos de uso |
FinTech |
|
SaaS |
|
ecommerce |
|
Gaming/Gambling |
|
Maximizando Fin Vision
Para sacar el máximo provecho de Fin Vision, combínalo con otras funciones de Fin:
Usar con Fin Guidance
Usa Fin Guidance para instruir a Fin a pedir proactivamente imágenes cuando sea necesario. También puedes guiar a Fin sobre qué buscar en una captura de pantalla y los siguientes pasos según el resultado.
Ejemplos de guía:
Si un cliente comparte una captura de pantalla, identifica el tipo de dispositivo y sugiere los siguientes pasos en consecuencia.
Si un usuario reporta un error u otro problema con nuestro sitio web, pide una captura de pantalla que muestre el error y un enlace a la página en la que están antes de brindar más ayuda.
Pide al cliente que proporcione prueba de pago (recibo), ya sea como captura de pantalla o foto.
Preguntas frecuentes
¿Qué formatos de imagen soporta Fin Vision?
¿Qué formatos de imagen soporta Fin Vision?
Fin Vision soporta archivos JPG, PNG, GIF y HEIC compartidos por clientes.
¿Cómo maneja Fin la privacidad y la información sensible en las imágenes?
¿Cómo maneja Fin la privacidad y la información sensible en las imágenes?
Fin está diseñado pensando en la privacidad. Los modelos de visión tienen instrucciones explícitas para no extraer información personal o sensible de las imágenes, como números de tarjeta de crédito, CVV o datos de identificación. Además, las imágenes se almacenan temporalmente y se eliminan automáticamente después de un corto período.
¿Fin almacena imágenes?
¿Fin almacena imágenes?
Las imágenes se almacenan temporalmente en un entorno seguro en la nube y se eliminan automáticamente después de un corto período.
¿Los clientes necesitan enviar imágenes de una manera específica?
¿Los clientes necesitan enviar imágenes de una manera específica?
No, los clientes pueden subir o pegar imágenes en el chat o correo electrónico. Fin se encarga del resto.
¿Pueden los clientes enviar múltiples imágenes?
¿Pueden los clientes enviar múltiples imágenes?
Sí, Fin analizará cada imagen individualmente y usará el contexto para informar las respuestas.
¿Fin genera o envía imágenes?
¿Fin genera o envía imágenes?
Fin no genera imágenes, pero puede incluir imágenes existentes de tu contenido de soporte en las respuestas (Fin Image Answers).
¿Fin Vision soporta múltiples idiomas?
¿Fin Vision soporta múltiples idiomas?
Sí, Fin puede extraer texto de imágenes en muchos idiomas, aunque la precisión depende de la claridad y complejidad.
¿Puedo desactivar Fin Vision?
¿Puedo desactivar Fin Vision?
No, Fin Vision está integrada y no puede desactivarse. Funciona automáticamente como parte de la comprensión de conversaciones de Fin.
¿Puede Fin leer imágenes HEIC?
¿Puede Fin leer imágenes HEIC?
Sí, Fin Vision puede leer y procesar archivos High Efficiency Image Container (HEIC), el formato de foto predeterminado en iPhones. Fin lee imágenes HEIC y responde con contexto relevante, igual que con cualquier otro formato de imagen soportado.

