Passar para o conteúdo principal

Como o Fin Vision entende imagens?

Fin Vision analisa instantaneamente imagens para diagnosticar problemas, fornecer soluções ou capturar detalhes importantes que avançam a conversa.

Fin Vision é uma capacidade integrada do Fin AI Agent que permite analisar e entender imagens enviadas por clientes - capturas de tela, fotos, documentos e mais - diretamente nas conversas via chat ou e-mail.

Não é necessário ativar ou configurar nada, e não há custo adicional.

Fin Vision ajuda a:

  • Diagnosticar problemas mais rapidamente

  • Eliminar a necessidade de explicações longas dos clientes

  • Extrair e entender conteúdo visual como mensagens de erro, recibos, defeitos de produtos e mais


Como o Fin Vision funciona

Fin Vision usa modelos de linguagem multimodais (LLMs) para entender imagens. Quando um cliente envia uma imagem, o Fin a processa usando um LLM com visão para gerar uma descrição textual estruturada. Essa transcrição inclui:

  • Texto extraído (OCR)

  • Elementos da interface e rótulos associados

  • Números de referência, detalhes do produto e destaques principais

  • Insights contextuais derivados da imagem

Essa descrição é então adicionada ao histórico do chat, o que permite que o Fin incorpore o contexto visual em suas respostas.

Com esse entendimento, o Fin pode:

  • Pesquisar sua knowledge base de forma mais eficaz

  • Resolver Tarefas que dependem de informações visuais

  • Fornecer respostas relevantes e acionáveis - assim como faria com a entrada escrita do cliente

Nota:

  • O Fin não treina ou analisa imagens dentro do seu conteúdo de suporte (por exemplo, imagens incorporadas em artigos). Ele processa apenas imagens enviadas ativamente pelos clientes durante as conversas.

  • O Fin não gera imagens, mas pode incluir imagens existentes do seu conteúdo de suporte nas respostas (Fin Image Answers).

  • Atualmente, o Fin não consegue ler texto ALT em imagens.


Formas de usar o Fin Vision

Indústria

Exemplos de casos de uso

FinTech

  • Resolução de erros: Capturas de tela de transferências falhadas ou problemas de login ajudam o Fin a fornecer suporte direcionado.

  • Revisão de alertas de fraude: O Fin ajuda a identificar capturas de tela de phishing ou atividades suspeitas.

SaaS

  • Resolução de bugs na interface: Clientes compartilham capturas de tela de erros ou comportamentos inesperados na interface; o Fin extrai mensagens de erro e fornece correções.

  • Ajuda na integração: O Fin pode auxiliar clientes em fluxos de interface confusos com base em capturas de tela compartilhadas.

  • Verificação de licença: O Fin lê chaves de licença ou números de conta a partir de faturas enviadas.

ecommerce

  • Validação de devolução/reembolso: Clientes enviam imagens de produtos danificados ou incorretos; o Fin avalia a elegibilidade com base nas instruções da Tarefa.

  • Problemas de envio: Clientes compartilham fotos da embalagem ou do conteúdo; o Fin determina itens faltantes ou danos na embalagem.

  • Processamento de faturas: O Fin extrai números de pedido e datas de recibos ou notas fiscais.

Gaming/Gambling

  • Relato de Bug: Jogadores enviam capturas de tela de falhas ou travamentos; o Fin interpreta os visuais e registra os problemas.

  • Problemas de saque: Clientes enviam capturas de tela de transações falhadas; o Fin extrai carimbos de data/hora, valores e IDs de transação.

  • Verificação de bilhete de aposta: O Fin lê e confirma detalhes do bilhete de aposta a partir de imagens enviadas.


Maximizando o Fin Vision

Para aproveitar ao máximo o Fin Vision, combine-o com outros recursos do Fin:

Use com Fin Guidance

Use Fin Guidance para instruir o Fin a solicitar proativamente imagens quando necessário. Você também pode orientar o Fin sobre o que procurar em uma captura de tela e os próximos passos com base no resultado.

Exemplos de orientação:

  • Se um cliente compartilhar uma captura de tela, identifique o tipo de dispositivo e sugira os próximos passos de acordo.

  • Se um usuário relatar um erro ou outro problema em nosso site, peça uma captura de tela mostrando o erro e um link para a página em que está antes de fornecer mais assistência.

  • Peça ao cliente que forneça comprovante de pagamento (recibo), seja como captura de tela ou foto.


Perguntas frequentes

Quais formatos de imagem o Fin Vision suporta?

Fin Vision suporta arquivos JPG, PNG, GIF e HEIC compartilhados pelos clientes.

Como o Fin lida com privacidade e informações sensíveis em imagens?

O Fin foi projetado com privacidade em mente. Os modelos de visão são explicitamente orientados a não extrair nenhuma informação pessoal ou sensível das imagens, como números de cartão de crédito, CVVs ou dados de identificação. Além disso, as imagens são armazenadas temporariamente e excluídas automaticamente após um curto período.

O Fin armazena imagens?

As imagens são armazenadas temporariamente em um ambiente seguro na nuvem e excluídas automaticamente após um curto período.

Os clientes precisam enviar imagens de uma forma específica?

Não, os clientes podem enviar ou colar imagens no chat ou e-mail. O Fin cuida do resto.

Os clientes podem enviar várias imagens?

Sim, o Fin analisará cada imagem individualmente e usará o contexto para informar as respostas.

O Fin gera ou envia imagens?

O Fin não gera imagens, mas pode incluir imagens existentes do seu conteúdo de suporte nas respostas (Fin Image Answers).

O Fin Vision suporta múltiplos idiomas?

Sim, o Fin pode extrair texto de imagens em muitos idiomas, embora a precisão dependa da clareza e complexidade.

Posso desativar o Fin Vision?

Não, o Fin Vision é integrado e não pode ser desativado. Ele opera automaticamente como parte do entendimento do Fin nas conversas.

O Fin pode ler imagens HEIC?

Sim, o Fin Vision pode ler e processar arquivos High Efficiency Image Container (HEIC) — o formato padrão de fotos do iPhone. O Fin lê imagens HEIC e responde com contexto relevante, assim como qualquer outro formato de imagem suportado.

Respondeu à sua pergunta?