Fin Vision é uma capacidade integrada do Fin AI Agent que permite analisar e entender imagens enviadas por clientes - capturas de tela, fotos, documentos e mais - diretamente nas conversas via chat ou e-mail.
Não é necessário ativar ou configurar nada, e não há custo adicional.
Fin Vision ajuda a:
Diagnosticar problemas mais rapidamente
Eliminar a necessidade de explicações longas dos clientes
Extrair e entender conteúdo visual como mensagens de erro, recibos, defeitos de produtos e mais
Como o Fin Vision funciona
Fin Vision usa modelos de linguagem multimodais (LLMs) para entender imagens. Quando um cliente envia uma imagem, o Fin a processa usando um LLM com visão para gerar uma descrição textual estruturada. Essa transcrição inclui:
Texto extraído (OCR)
Elementos da interface e rótulos associados
Números de referência, detalhes do produto e destaques principais
Insights contextuais derivados da imagem
Essa descrição é então adicionada ao histórico do chat, o que permite que o Fin incorpore o contexto visual em suas respostas.
Com esse entendimento, o Fin pode:
Pesquisar sua knowledge base de forma mais eficaz
Resolver Tarefas que dependem de informações visuais
Fornecer respostas relevantes e acionáveis - assim como faria com a entrada escrita do cliente
Nota:
O Fin não treina ou analisa imagens dentro do seu conteúdo de suporte (por exemplo, imagens incorporadas em artigos). Ele processa apenas imagens enviadas ativamente pelos clientes durante as conversas.
O Fin não gera imagens, mas pode incluir imagens existentes do seu conteúdo de suporte nas respostas (Fin Image Answers).
Atualmente, o Fin não consegue ler texto ALT em imagens.
Formas de usar o Fin Vision
Indústria | Exemplos de casos de uso |
FinTech |
|
SaaS |
|
ecommerce |
|
Gaming/Gambling |
|
Maximizando o Fin Vision
Para aproveitar ao máximo o Fin Vision, combine-o com outros recursos do Fin:
Use com Fin Guidance
Use Fin Guidance para instruir o Fin a solicitar proativamente imagens quando necessário. Você também pode orientar o Fin sobre o que procurar em uma captura de tela e os próximos passos com base no resultado.
Exemplos de orientação:
Se um cliente compartilhar uma captura de tela, identifique o tipo de dispositivo e sugira os próximos passos de acordo.
Se um usuário relatar um erro ou outro problema em nosso site, peça uma captura de tela mostrando o erro e um link para a página em que está antes de fornecer mais assistência.
Peça ao cliente que forneça comprovante de pagamento (recibo), seja como captura de tela ou foto.
Perguntas frequentes
Quais formatos de imagem o Fin Vision suporta?
Quais formatos de imagem o Fin Vision suporta?
Fin Vision suporta arquivos JPG, PNG, GIF e HEIC compartilhados pelos clientes.
Como o Fin lida com privacidade e informações sensíveis em imagens?
Como o Fin lida com privacidade e informações sensíveis em imagens?
O Fin foi projetado com privacidade em mente. Os modelos de visão são explicitamente orientados a não extrair nenhuma informação pessoal ou sensível das imagens, como números de cartão de crédito, CVVs ou dados de identificação. Além disso, as imagens são armazenadas temporariamente e excluídas automaticamente após um curto período.
O Fin armazena imagens?
O Fin armazena imagens?
As imagens são armazenadas temporariamente em um ambiente seguro na nuvem e excluídas automaticamente após um curto período.
Os clientes precisam enviar imagens de uma forma específica?
Os clientes precisam enviar imagens de uma forma específica?
Não, os clientes podem enviar ou colar imagens no chat ou e-mail. O Fin cuida do resto.
Os clientes podem enviar várias imagens?
Os clientes podem enviar várias imagens?
Sim, o Fin analisará cada imagem individualmente e usará o contexto para informar as respostas.
O Fin gera ou envia imagens?
O Fin gera ou envia imagens?
O Fin não gera imagens, mas pode incluir imagens existentes do seu conteúdo de suporte nas respostas (Fin Image Answers).
O Fin Vision suporta múltiplos idiomas?
O Fin Vision suporta múltiplos idiomas?
Sim, o Fin pode extrair texto de imagens em muitos idiomas, embora a precisão dependa da clareza e complexidade.
Posso desativar o Fin Vision?
Posso desativar o Fin Vision?
Não, o Fin Vision é integrado e não pode ser desativado. Ele opera automaticamente como parte do entendimento do Fin nas conversas.
O Fin pode ler imagens HEIC?
O Fin pode ler imagens HEIC?
Sim, o Fin Vision pode ler e processar arquivos High Efficiency Image Container (HEIC) — o formato padrão de fotos do iPhone. O Fin lê imagens HEIC e responde com contexto relevante, assim como qualquer outro formato de imagem suportado.

