Se você quiser treinar Fin com o conteúdo do site, pode fazer isso sincronizando a URL pública desse site.
Começar
Vá para Train > Content e então selecione Website sync abaixo da seção "Add content".
Agora insira a URL pública do seu website (top-level domain) e clique em Next.
Isso buscará todas as páginas da URL do site que você fornecerá e lerá todas as páginas do sub domain.
Dicas:
Forneça o link da página inicial do seu external help center para melhores resultados.
Use top-level domains (por exemplo, https://myhelpcenter.com em vez de https://myhelpcenter.com/articles).
Revisar páginas para sincronizar
Depois de inserir sua URL, verificaremos se ela é válida e acessível. Então você precisará revisar as páginas para sincronizar. Todas as subpáginas vinculadas em cada seção selecionada serão sincronizadas. Selecione apenas conteúdo relevante e atualizado.
Configurações avançadas [opcional]
Se quiser configurar sua sincronização de website mais detalhadamente (como incluir ou excluir certas URLs), clique em Advanced settings.
URLs adicionais
As estruturas dos websites podem variar. Para garantir que sincronizemos seu conteúdo mais relevante, recomendamos que adicione URLs adicionais para essas subpáginas específicas.
Por exemplo, se você inserir https://myhelpcenter.com/help como URL principal acima, talvez queira também adicionar a URL específica como https://myhelpcenter.com/help/index.html
URLs para excluir
Para excluir certas páginas das quais você não quer sincronizar conteúdo, você pode adicionar uma lista de URL globs.
O que é um url glob?
Um glob é uma sequência de caracteres literais e/ou curingas usados para corresponder a caminhos de arquivos ou URLs. Globbing é o ato de localizar arquivos em um sistema de arquivos usando um ou mais globs. Usar URL globs também ajuda a obter uma variedade de URLs que são quase iguais, com apenas uma pequena parte mudando entre as requisições.
Por exemplo, este URL glob https://{store,docs}.example.com/** permite que o crawler acesse todas as URLs que começam com https://store.example.com/ ou https://docs.example.com/ e https://example.com/**/*\?*foo=*
Elementos da página para incluir
Para evitar extrair conteúdo de seções específicas, você pode selecionar Custom e adicionar uma lista dos seletores CSS que deseja incluir ou excluir.
Use isso para excluir partes da página que não são úteis para Fin — como barras de navegação ou banners.
O valor deve ser um seletor CSS válido, aceito pela função document.querySelectorAll() (por exemplo, sidebar, #newsletter-banner).
Por padrão, já excluímos elementos comuns como cabeçalhos, rodapés, modais, scripts e imagens embutidas.
Seletor CSS clicável
Isso permite que elementos DOM identificados pelo seletor CSS sejam clicados durante o processo de sincronização web.
Use isso para capturar conteúdo oculto dentro de seções expansíveis, abas ou menus suspensos.
Insira seletores CSS válidos como
[aria- expanded="false"],#expand_section,.tab.Para corresponder a elementos com múltiplas classes, use encadeamento CSS (sem espaços). Por exemplo,
.button.blue.smalldireciona elementos que possuem todas as três classes.Para corresponder a múltiplos elementos diferentes, separe os seletores com vírgulas. Por exemplo:
.tab,accordiondireciona elementos de abas e acordeão.
Aguardar para carregar seletor CSS
Para direcionar conteúdo que pode demorar a aparecer na página, você pode adicionar um seletor CSS que fará o scraper web esperar antes de extrair o conteúdo.
Use isso quando o conteúdo carregar lentamente ou após interação do usuário (por exemplo, via JavaScript).
O valor deve ser um seletor CSS válido, aceito pela função document.querySelectorAll().
A página só será processada quando o elemento selecionado aparecer — isso substitui o comportamento padrão de tempo.
Insira um seletor CSS válido, como
#load_content_idou.article_paragraph.
XML Sitemap
Para acessar páginas que podem não ser alcançáveis pelas URLs iniciais, você pode ativar o XML Sitemap para uma sincronização web mais robusta em sites que suportam sitemap.
Se esta opção estiver ativada, o scraper web procurará Sitemaps nos domains da source URL fornecida e enfileirará URLs correspondentes de forma semelhante aos links encontrados nas páginas rastreadas. Você também pode referenciar um arquivo sitemap.xml diretamente adicionando-o como outra Start URL, por exemplo, https://www.example.com/sitemap.xml.
Região do proxy
Ao configurar uma sincronização de website, uma região de proxy é automaticamente sugerida com base no top-level domain (TLD) do seu site — por exemplo, um domain .de usará o proxy alemão, e .fr o proxy francês. Se nenhum TLD correspondente for encontrado, um proxy dos EUA será usado como padrão.
Você pode alterar o proxy em Advanced settings a qualquer momento — ao criar uma nova sincronização ou ao editar uma existente. Ao editar uma sincronização existente, você pode escolher salvar apenas a nova configuração de proxy ou salvar e sincronizar seu conteúdo imediatamente.
Os seguintes proxies estão disponíveis:
Rotativos: Estados Unidos, Austrália, Alemanha, França, Reino Unido, República Tcheca, Hungria
Estáticos:
Estados Unidos - 119.13.211.225, 161.123.167.215, 94.176.49.232, 185.223.56.90, 154.17.143.135
Europa - 178.171.116.231, 206.232.77.243, 206.232.90.11, 209.20.175.180, 45.94.247.149
Austrália - 154.220.151.84, 173.254.193.121, 160.224.101.213, 160.224.100.176, 212.70.22.41
Públicos-alvo
A etapa Target permite definir um público padrão para todas as páginas sincronizadas e criar regras baseadas em URL para atribuir automaticamente públicos específicos com base em padrões de URL — sem necessidade de marcação manual.
Primeiro decida se o conteúdo desta fonte está habilitado para Fin AI Agent e/ou Copilot.
Então você pode definir um público Fin padrão para aplicar a todas as páginas sincronizadas desta fonte (se nenhum padrão for definido, o conteúdo será padrão para Everyone), ou criar regras para atribuir públicos específicos com base em padrões de URL.
Por exemplo: Se a URL contiver /uk, atribua o público do Reino Unido. As regras são avaliadas durante a sincronização, então Fin e Copilot sempre fornecem o conteúdo certo para o público certo.
Cada regra suporta três comparadores de URL:
Começa com — corresponde a URLs que começam com um prefixo dado.
Termina com — corresponde a URLs que terminam com um sufixo dado.
Contém — corresponde a URLs que contêm uma substring dada.
Nota:
Uma pré-visualização ao vivo mostra quantas páginas correspondem a cada regra, ajudando a validar as regras antes de salvar. Isso requer um sitemap disponível para sua fonte de sincronização web. Sem um sitemap, as regras ainda se aplicam, mas você não pode pré-visualizar as correspondências.
As regras são nomeadas automaticamente na criação, mas podem ser renomeadas. É aplicado um máximo de 10 regras por fonte de sincronização web.
As regras de público são apenas aditivas: elas adicionam públicos ao conteúdo, mas nunca removem atribuições existentes. Remover uma regra não desfaz suas atribuições passadas de público.
Revisar configurações de sincronização
Finalmente, revise suas configurações de sincronização e clique em Sync website para começar a sincronizar o conteúdo do seu site com o Intercom.
Gerenciar fontes do site
Quando a sincronização for concluída, você receberá uma notificação por e-mail e o site aparecerá como uma fonte sincronizada em Train > Content na seção "Content sources".
Se você clicar em uma fonte do site, poderá pré-visualizar e gerenciar as páginas individuais que foram sincronizadas a partir da URL pública.
Nota: As fontes do site são somente leitura e não podem ser editadas dentro do seu workspace Fin, elas devem ser editadas na fonte.
Configurar configurações
Quando você visualizar uma página do site, encontrará um painel "Detalhes" à direita que contém:
Dados: Veja o tipo de conteúdo, idioma, data de criação e última atualização (quando foi sincronizado pela última vez com a fonte).
Fin: Ative/desative para Fin Agent e Fin Copilot. Quando ativado, o conteúdo fica disponível para clientes e colegas, respectivamente
Agendamento: Ative ou desative o conteúdo para Fin e Copilot em datas definidas.
Público: Garanta que os clientes recebam apenas respostas e vejam conteúdo do Fin Agent que seja relevante para eles.
Link: A URL pública para esta fonte do site.
Relatórios: Acompanha com que frequência este conteúdo é usado para resolver conversas pelo Fin Agent.
Tag: Adicione uma tag para agrupar páginas da web e manter o conteúdo organizado.
Disponibilize para Fin ou Copilot
Para disponibilizar uma fonte do site para Fin Agent ou Fin Copilot, vá para Train > Content e clique na fonte do site na seção "Content sources", depois abra a página relevante que você sincronizou.
No painel "Detalhes" , role para baixo até “Fin” e ative:
Fin Agent - Esta configuração tornará a página da web disponível para o Fin AI usar ao responder aos clientes (respeitará quaisquer regras de público).
Fin Copilot - Esta configuração tornará a página da web disponível para o Fin Copilot usar ao responder aos colegas.
Agendar disponibilidade do site
Você pode agendar quando as páginas do site sincronizadas serão ativadas ou desativadas para Fin e Copilot, em uma data, hora e fuso horário futuros. Defina apenas uma data de início ou defina uma data de início e fim para criar uma janela de disponibilidade limitada no tempo. O agendamento se aplica a páginas individuais ou em massa.
Agendar uma única página
Abra a página. No painel Detalhes à direita, encontre a seção Agendamento dentro do menu suspenso Fin.
Clique em Agendar disponibilidade.
No modal: selecione o produto de IA (Fin para Service ou Fin Copilot), defina a disponibilidade (Ativar ou Desativar) e escolha uma data, hora e fuso horário.
Opcionalmente, ative Definir data de término para adicionar uma data e hora de término — a ação será revertida automaticamente nesse momento.
Clique em Agendar para confirmar.
Agendamento em massa de páginas
Selecione várias páginas na lista de conteúdo.
Vá para o menu suspenso Mais ações e selecione Agendar disponibilidade.
O mesmo modal de agendamento se aplica a todos os itens selecionados.
Como o agendamento funciona
Apenas data de início: A ação de ativar/desativar ocorre no horário agendado e permanece em efeito até que você a altere manualmente.
Data de início + fim: O conteúdo é ativado (ou desativado) no horário de início e depois reverte automaticamente no horário de término.
Alterações manuais não cancelam um agendamento pendente: Se você alternar manualmente a disponibilidade após definir um agendamento, a transição agendada ainda ocorrerá no horário previsto e substituirá sua alteração manual.
Um agendamento pendente por item por agente: Definir um novo agendamento substitui o anterior — sem duplicatas.
Conteúdo excluído: Se uma página for excluída antes do disparo do agendamento, o agendamento simplesmente não será aplicado e nenhum erro será exibido.
Torná-lo disponível para um público específico
Você pode atribuir públicos ao conteúdo sincronizado automaticamente usando regras baseadas em URL durante a criação da sincronização web, ou manualmente por página. Primeiro, você precisará criar e definir o público que deseja segmentar.
Então vá para Train > Content e clique na fonte do site na seção "Content sources", depois abra a página relevante que você sincronizou.
No painel "Details" , role para baixo até “Fin” e use o menu suspenso de público para selecionar um dos seus públicos pré-definidos.
Nota:
O público padrão para URLs públicas é “Everyone”.
O Fin Agent também respeitará qualquer público que você aplicar a uma URL pública e usará este artigo para responder às perguntas dos clientes somente se corresponder às regras do público.
Adicionar ou editar regras de público em sincronizações existentes
Você não precisa recriar uma sincronização para adicionar segmentação de público. Vá para Train > Content, selecione a fonte, clique no menu de configurações no canto superior direito e selecione Open settings. Navegue até a etapa Target para adicionar ou editar regras baseadas em URL.
Nota: Quando regras de público são adicionadas a uma sincronização web existente, elas se aplicam retroativamente a todo o conteúdo já ingerido dessa fonte — não apenas ao conteúdo novo daqui para frente.
Re-sincronizar ou remover um site como fonte
Se você quiser re-sincronizar ou remover uma URL pública como fonte, vá para Train > Content, e clique na fonte do site na seção "Content sources", depois abra o menu Settings no canto superior direito.
Aqui, você pode selecionar se deseja Re-sync ou Remove this source.
Dica: Atualizações feitas no seu site fonte não aparecerão imediatamente no Intercom. As re-sincronizações do site acontecem automaticamente toda semana, mas você pode acionar uma re-sincronização manual a qualquer momento para mostrar o conteúdo mais recente mais rápido.
Ver histórico de sincronização do site
Você pode ver uma lista das sincronizações passadas do site para saber quando foram executadas pela última vez, quais páginas foram encontradas e quaisquer páginas com falha. Vá para Train > Content, e clique na fonte do site na seção "Content sources", depois selecione View sync history.
Cada linha na tabela representa uma execução passada ou ativa, e você pode filtrar as execuções por status (iniciada, sucesso, falha).
Inclui as seguintes informações:
Data da sincronização
Status
Páginas sincronizadas
Páginas excluídas
Páginas com falha
Duração
Sincronização iniciada por
Se uma sincronização falhou, você pode passar o mouse sobre o status para ver uma explicação detalhada do motivo.
Solução de problemas da sincronização do site
Problemas comuns
Ao importar conteúdo do site para habilitar o Fin, você precisa inserir a public URL. Isso buscará todas as páginas aninhadas sob essa URL e as sincronizará para o Fin AI Agent usar.
Se o importador não retornou o número de páginas que você esperava, há algumas razões...
A URL fornecida não é o domínio de nível superior
A sincronização do site funciona indo até a URL que você fornece e depois buscando todas as páginas aninhadas sob essa URL. Essas páginas devem ter o mesmo padrão de URL que a URL que você fornece.
Por exemplo, se o domínio de nível superior é https://myhelpcenter.com/home, então todas as páginas que você deseja importar devem incluir o prefixo /home na URL, por exemplo, https://myhelpcenter.com/home/article. Se não incluírem, remova o prefixo e use o tronco de URL mais básico, por exemplo, https://myhelpcenter.com, e tente importar novamente.
A URL é privada
Se o conteúdo que você deseja usar estiver atrás de um login, o Fin não poderá acessá-lo ou importá-lo.
Limites de página
Você pode sincronizar até 100 domínios de nível superior diferentes e o Fin sincronizará no máximo 30.000 páginas de cada fonte. A sincronização pode falhar às vezes se houver uma quantidade muito grande de conteúdo em uma única página (você será notificado se uma sincronização falhar).
Sites restritos a IPs regionais específicos
A sincronização do site do Fin (usada para adicionar URLs públicas para Fin AI Agent e Copilot) não usa uma string de agente de usuário dedicada e personalizada neste momento.
Se seu site tem proteção anti-crawling rigorosa, você pode usar um static proxy para permitir uma lista fixa de endereços IP e garantir que seu conteúdo seja ingerido. Selecione um static proxy em Advanced settings ao criar ou editar sua sincronização do site.
Por endereço IP: Se seu site requer lista de permissões, selecione um static proxy em Advanced settings — isso lhe dá um conjunto fixo de IPs para adicionar à sua lista de permissões.
Essas solicitações são usadas apenas para sincronização do site. Elas não afetam o tráfego do Messenger ou o rastreamento do usuário final.
Erros de sincronização do site
Quando você sincroniza conteúdo do site, pode ver diferentes status que indicam o que aconteceu durante o processo. Para ver o status da sincronização do site, vá para Train > Content e selecione a fonte do site, depois use o menu Status para filtrar por:
Sincronizando
Ao vivo
Falhou
Excluído
Aqui está o que cada um significa e o que você pode fazer a seguir:
Sincronizando
A sincronização da página ainda está em andamento. Uma sincronização inicial pode levar de alguns minutos a mais de uma hora, dependendo da quantidade de conteúdo que você tem.
Ao vivo
A página foi sincronizada com sucesso e pode ser ativada para Fin e Copilot.
Nota: Uma sincronização bem-sucedida nem sempre significa que conseguimos extrair todo o conteúdo da página. Se você quiser confirmar a cobertura completa, recomendamos visualizar Fin com as respostas que espera encontrar nessa página.
Excluído
Essas páginas não são sincronizadas intencionalmente porque você as excluiu nas Configurações avançadas de sincronização. Elas não podem ser tentadas novamente ou incluídas, a menos que especificado de outra forma.
Falhou
Esses erros significam que a sincronização não foi concluída e podem exigir alterações do seu lado antes de tentar novamente:
1. Erro desconhecido
Mensagem: “Esta página não pôde ser acessada. Pode estar lenta ou bloqueada. Tente sincronizar novamente ou entre em contato com o suporte se falhar.”
O que significa: Algo nos impediu de acessar a página, mas a causa não está clara.
2. Sessão bloqueada / Limite de taxa
Mensagem: “O site está nos impedindo de acessar seu conteúdo. Verifique se está sendo bloqueado por uma configuração anti-crawler ou firewall. Verifique a configuração do seu site e tente sincronizar novamente. Se o problema persistir, entre em contato com o suporte.”
O que significa: Seu site está bloqueando ou limitando ativamente nosso crawler.
3. Erros de rede, tempo limite ou similares
Mensagem: “Esta página não pôde ser acessada. Pode estar lenta para carregar ou bloqueada por configurações anti-crawler ou firewall. Verifique a configuração do seu site e tente sincronizar novamente. Se o problema persistir, entre em contato com o suporte.
O que significa: A página não carregou a tempo ou não pôde ser alcançada devido a problemas de rede ou bloqueios.
4. Duplicado
Mensagem: “Esta página tem o mesmo conteúdo que outra que já está sincronizada. Apenas uma versão será incluída.”
O que significa: Detectamos conteúdo idêntico em outro lugar, então apenas uma cópia é mantida.
5. Filtragem por palavra-chave
Mensagem: “Páginas com palavras-chave como category, collection ou tag na URL são excluídas por padrão, pois geralmente não contêm conteúdo único. Se esta página deve ser incluída, entre em contato com o suporte.”
O que significa: Essas URLs geralmente representam listas, não páginas de conteúdo independentes.
6. Código de status 400
Mensagem: “O conteúdo da página não pode ser encontrado. Verifique se a URL é válida e se a página carrega sem problemas.
O que significa: A URL pode estar quebrada ou retornando um erro no seu site.
7. URL bloqueada
Mensagem: “Este domain do website está bloqueado para sincronização. Se precisar disso, entre em contato com o suporte.”
O que significa: O domain está intencionalmente excluído da sincronização.
Você pode tentar sincronizar novamente uma página que falhou passando o mouse sobre a página, selecionando o menu de três pontos e depois selecionando Resync.























