Ir al contenido principal

¿Cómo entiende Fin Vision las imágenes?

Fin Vision analiza instantáneamente imágenes para diagnosticar problemas, ofrecer soluciones o capturar detalles clave que avanzan la conversación.

Fin Vision es una capacidad integrada de Fin AI Agent que le permite analizar y entender imágenes enviadas por clientes - capturas de pantalla, fotos, documentos y más - directamente dentro de las conversaciones vía chat o correo electrónico.

No es necesario habilitar ni configurar nada, y no hay costo adicional.

Fin Vision ayuda a:

  • Diagnosticar problemas más rápido

  • Eliminar la necesidad de explicaciones largas por parte del cliente

  • Extraer y entender contenido visual como mensajes de error, recibos, defectos de producto y más


Cómo funciona Fin Vision

Fin Vision utiliza modelos de lenguaje multimodales grandes (LLMs) para entender imágenes. Cuando un cliente envía una imagen, Fin la procesa usando un LLM habilitado para visión para generar una descripción textual estructurada. Esta transcripción incluye:

  • Texto extraído (OCR)

  • Elementos de la interfaz y etiquetas asociadas

  • Números de referencia, detalles del producto y puntos clave

  • Información contextual derivada de la imagen

Esta descripción se añade luego al historial del chat, lo que permite a Fin incorporar el contexto visual en sus respuestas.

Con este entendimiento, Fin puede:

  • Buscar en tu knowledge base de manera más efectiva

  • Resolver tareas que dependen de información visual

  • Proporcionar respuestas relevantes y accionables, tal como lo haría con la entrada escrita de un cliente

Nota:

  • Fin no entrena ni analiza imágenes dentro de tu contenido de soporte (por ejemplo, imágenes incrustadas en artículos). Solo procesa imágenes enviadas activamente por clientes durante las conversaciones.

  • Fin no genera imágenes, pero puede incluir imágenes existentes de tu contenido de soporte en las respuestas (Fin Image Answers).

  • Actualmente Fin no puede leer texto ALT en imágenes.


Formas de usar Fin Vision

Industria

Ejemplos de casos de uso

FinTech

  • Solución de errores: Capturas de pantalla de transferencias fallidas o problemas de inicio de sesión ayudan a Fin a brindar soporte específico.

  • Revisión de alertas de fraude: Fin ayuda a identificar capturas de pantalla de phishing o actividad sospechosa.

SaaS

  • Solución de bugs en la interfaz: Los clientes comparten capturas de pantalla de errores o comportamientos inesperados de la interfaz; Fin extrae mensajes de error y proporciona soluciones.

  • Ayuda en la incorporación: Fin puede asistir a los clientes en flujos de interfaz poco claros basándose en capturas de pantalla compartidas.

  • Verificación de licencias: Fin lee claves de licencia o números de cuenta de facturas subidas.

ecommerce

  • Validación de devoluciones/reembolsos: Los clientes suben imágenes de productos dañados o incorrectos; Fin evalúa la elegibilidad basada en instrucciones de tareas.

  • Problemas de envío: Los clientes comparten fotos del embalaje o contenido; Fin determina artículos faltantes o daños en el embalaje.

  • Procesamiento de facturas: Fin extrae números de pedido y fechas de recibos o albaranes.

Gaming/Gambling

  • Reporte de Bug: Los jugadores envían capturas de pantalla de fallos o cierres inesperados; Fin interpreta los visuales y registra los problemas.

  • Problemas de retiro: Los clientes suben capturas de pantalla de transacciones fallidas; Fin extrae marcas de tiempo, montos e IDs de transacción.

  • Verificación de apuestas: Fin lee y confirma detalles de boletos de apuesta de imágenes subidas.


Maximizando Fin Vision

Para sacar el máximo provecho de Fin Vision, combínalo con otras funciones de Fin:

Usar con Fin Guidance

Usa Fin Guidance para instruir a Fin a pedir proactivamente imágenes cuando sea necesario. También puedes guiar a Fin sobre qué buscar en una captura de pantalla y los siguientes pasos según el resultado.

Ejemplos de guía:

  • Si un cliente comparte una captura de pantalla, identifica el tipo de dispositivo y sugiere los siguientes pasos en consecuencia.

  • Si un usuario reporta un error u otro problema con nuestro sitio web, pide una captura de pantalla que muestre el error y un enlace a la página en la que están antes de brindar más ayuda.

  • Pide al cliente que proporcione prueba de pago (recibo), ya sea como captura de pantalla o foto.


Preguntas frecuentes

¿Qué formatos de imagen soporta Fin Vision?

Fin Vision soporta archivos JPG, PNG, GIF y HEIC compartidos por clientes.

¿Cómo maneja Fin la privacidad y la información sensible en las imágenes?

Fin está diseñado pensando en la privacidad. Los modelos de visión tienen instrucciones explícitas para no extraer información personal o sensible de las imágenes, como números de tarjeta de crédito, CVV o datos de identificación. Además, las imágenes se almacenan temporalmente y se eliminan automáticamente después de un corto período.

¿Fin almacena imágenes?

Las imágenes se almacenan temporalmente en un entorno seguro en la nube y se eliminan automáticamente después de un corto período.

¿Los clientes necesitan enviar imágenes de una manera específica?

No, los clientes pueden subir o pegar imágenes en el chat o correo electrónico. Fin se encarga del resto.

¿Pueden los clientes enviar múltiples imágenes?

Sí, Fin analizará cada imagen individualmente y usará el contexto para informar las respuestas.

¿Fin genera o envía imágenes?

Fin no genera imágenes, pero puede incluir imágenes existentes de tu contenido de soporte en las respuestas (Fin Image Answers).

¿Fin Vision soporta múltiples idiomas?

Sí, Fin puede extraer texto de imágenes en muchos idiomas, aunque la precisión depende de la claridad y complejidad.

¿Puedo desactivar Fin Vision?

No, Fin Vision está integrada y no puede desactivarse. Funciona automáticamente como parte de la comprensión de conversaciones de Fin.

¿Puede Fin leer imágenes HEIC?

Sí, Fin Vision puede leer y procesar archivos High Efficiency Image Container (HEIC), el formato de foto predeterminado en iPhones. Fin lee imágenes HEIC y responde con contexto relevante, igual que con cualquier otro formato de imagen soportado.

¿Ha quedado contestada tu pregunta?