Se você quiser treinar Fin com o conteúdo do site, pode fazer isso sincronizando a URL pública desse site.

Começar

Vá para Train > Content e então selecione Website sync abaixo da seção "Add content".

Agora insira a URL pública do seu site (top-level domain) e clique em Next.

Isso buscará todas as páginas da URL do site que você fornecerá e lerá todas as páginas do sub domain.

Dicas:

Forneça o link da página inicial do seu help center externo para melhores resultados.
Use top-level domains (por exemplo, https://myhelpcenter.com em vez de https://myhelpcenter.com/articles).

Revisar páginas para sincronizar

Depois de inserir sua URL, verificaremos se ela é válida e acessível. Então você precisará revisar as páginas para sincronizar. Todas as subpáginas vinculadas em cada seção selecionada serão sincronizadas. Selecione apenas conteúdo relevante e atualizado.

Configurações avançadas `[opcional]`

Se quiser configurar sua sincronização de site mais detalhadamente (como incluir ou excluir certas URLs), clique em Configurações avançadas.

URLs adicionais

As estruturas dos sites podem variar. Para garantir que sincronizemos seu conteúdo mais relevante, recomendamos adicionar URLs adicionais para essas subpáginas específicas.

Por exemplo, se você inserir https://myhelpcenter.com/help como URL principal acima, talvez queira também adicionar a URL específica como https://myhelpcenter.com/help/index.html

URLs para excluir

Para excluir certas páginas das quais você não quer sincronizar conteúdo, você pode adicionar uma lista de globs de URL.

O que é um glob de URL?

Um glob é uma sequência de caracteres literais e/ou curingas usados para corresponder a caminhos de arquivos ou URLs. Globbing é o ato de localizar arquivos em um sistema de arquivos usando um ou mais globs. Usar globs de URL também ajuda a obter uma variedade de URLs que são quase iguais, com apenas uma pequena parte mudando entre as requisições.

Por exemplo, este glob de URL https://{store,docs}.example.com/** permite que o rastreador acesse todas as URLs que começam com https://store.example.com/ ou https://docs.example.com/ e https://example.com/**/*\?*foo=*

Elementos da página para incluir

Para evitar extrair conteúdo de seções específicas, você pode selecionar Custom e adicionar uma lista dos seletores CSS que deseja incluir ou excluir.

Use isso para excluir partes da página que não são úteis para Fin — como barras de navegação ou banners.
O valor deve ser um seletor CSS válido, aceito pela função document.querySelectorAll() (por exemplo, sidebar, #newsletter-banner).
Por padrão, já excluímos elementos comuns como cabeçalhos, rodapés, modais, scripts e imagens embutidas.

Seletor CSS clicável

Isso permite que elementos DOM identificados pelo seletor CSS sejam clicados durante o processo de sincronização web.

Use isso para capturar conteúdo oculto dentro de seções expansíveis, abas ou menus suspensos.
Digite seletores CSS válidos como [aria- expanded="false"], #expand_section, .tab.
Para corresponder a elementos com múltiplas classes, use encadeamento CSS (sem espaços). Por exemplo, .button.blue.small direciona elementos que possuem todas as três classes.
Para corresponder a múltiplos elementos diferentes, separe os seletores com vírgulas. Por exemplo: .tab, accordion direciona elementos de abas e acordeão.

Aguardar para carregar seletor CSS

Para direcionar conteúdo que pode demorar a aparecer na página, você pode adicionar um seletor CSS que fará o scraper web esperar antes de extrair o conteúdo.

Use isso quando o conteúdo carregar lentamente ou após interação do usuário (por exemplo, via JavaScript).
O valor deve ser um seletor CSS válido, aceito pela função document.querySelectorAll().
A página só será processada quando o elemento selecionado aparecer — isso substitui o comportamento padrão de tempo.
Digite um seletor CSS válido, como #load_content_id ou .article_paragraph.

XML Sitemap

Para acessar páginas que podem não ser alcançáveis pelas URLs iniciais, você pode ativar o XML Sitemap para uma sincronização web mais robusta em sites que suportam sitemap.

Se esta opção estiver ativada, o scraper web procurará Sitemaps nos domains da source URL fornecida e enfileirará URLs correspondentes de forma semelhante aos links encontrados nas páginas rastreadas. Você também pode referenciar um arquivo sitemap.xml diretamente adicionando-o como outra Start URL, por exemplo, https://www.example.com/sitemap.xml.

Ignorar URLs canônicas

Quando ativado, o scraper web ignora tags de link canônico (rel="canonical") e trata cada URL como uma página distinta. Esta opção está desativada por padrão.

Isso é útil quando um site aponta muitas páginas para uma URL canônica e o conteúdo está sendo perdido como resultado.

Região do proxy

Ao configurar uma sincronização de site, uma região de proxy é automaticamente sugerida com base no top-level domain (TLD) do seu site — por exemplo, um domain .de usará o proxy alemão, e .fr o proxy francês. Se nenhum TLD correspondente for encontrado, um proxy dos EUA será usado como padrão.

Você pode alterar o proxy em Configurações avançadas a qualquer momento — ao criar uma nova sincronização ou ao editar uma existente. Ao editar uma sincronização existente, você pode escolher salvar apenas a nova configuração de proxy ou salvar e sincronizar seu conteúdo imediatamente.

Os seguintes proxies estão disponíveis:

Rotativo: United States, Australia, Germany, France, United Kingdom, Czechia, Hungary
Estático:
- Estados Unidos - 119.13.211.225, 161.123.167.215, 94.176.49.232, 185.223.56.90, 154.17.143.135
- Europa - 178.171.116.231, 206.232.77.243, 206.232.90.11, 209.20.175.180, 45.94.247.149
- Austrália - 154.220.151.84, 173.254.193.121, 160.224.101.213, 160.224.100.176, 212.70.22.41

Públicos-alvo

A etapa Target permite definir um público padrão para todas as páginas sincronizadas e criar regras baseadas em URL para atribuir automaticamente públicos específicos com base em padrões de URL — sem necessidade de marcação manual.

Primeiro decida se o conteúdo desta fonte está habilitado para Fin AI Agent e/ou Copilot.

Então você pode definir um público Fin padrão para aplicar a todas as páginas sincronizadas desta fonte (se nenhum padrão for definido, o conteúdo será padrão para Everyone), ou criar regras para atribuir públicos específicos com base em padrões de URL.

Por exemplo: Se a URL contiver /uk, atribua o público do Reino Unido. As regras são avaliadas durante a sincronização, então Fin e Copilot sempre fornecem o conteúdo certo para o público certo.

Cada regra suporta três comparadores de URL:

Começa com — corresponde a URLs que começam com um prefixo dado.
Termina com — corresponde a URLs que terminam com um sufixo dado.
Contém — corresponde a URLs que contêm uma substring dada.

Nota:

Uma pré-visualização ao vivo mostra quantas páginas correspondem a cada regra, ajudando a validar as regras antes de salvar. Isso requer um sitemap disponível para sua fonte de sincronização web. Sem um sitemap, as regras ainda se aplicam, mas você não pode pré-visualizar as correspondências.
As regras são nomeadas automaticamente na criação, mas podem ser renomeadas. É aplicado um máximo de 10 regras por fonte de sincronização web.
As regras de público são apenas aditivas: elas adicionam públicos ao conteúdo, mas nunca removem atribuições existentes. Remover uma regra não desfaz suas atribuições passadas de público.

Revisar configurações de sincronização

Por fim, revise suas configurações de sincronização e clique em Sync website para começar a sincronizar o conteúdo do seu site com o Intercom.

Gerenciar fontes do site

Quando a sincronização for concluída, você receberá uma notificação por e-mail e o site aparecerá como uma fonte sincronizada em Train > Content na seção "Content sources".

Se você clicar em uma fonte do site, poderá pré-visualizar e gerenciar as páginas individuais que foram sincronizadas a partir da URL pública.

Nota: As fontes do site são somente leitura e não podem ser editadas dentro do seu workspace Fin, elas devem ser editadas na fonte.

Configurar configurações

Quando você visualizar uma página do site, encontrará um painel "Detalhes" à direita que contém:

Dados: Veja o tipo de conteúdo, idioma, data de criação e última atualização (quando foi sincronizado pela última vez com a fonte).
Fin: Ative/desative para Fin Agent e Fin Copilot. Quando ativado, o conteúdo fica disponível para clientes e colegas, respectivamente
- Agendamento: Ative ou desative o conteúdo para Fin e Copilot em datas definidas.
- Público: Garanta que os clientes recebam apenas respostas e vejam conteúdo do Fin Agent que seja relevante para eles.
Link: A URL pública para esta fonte do site.
Relatórios: Acompanha com que frequência este conteúdo é usado para resolver conversas pelo Fin Agent.
Tag: Adicione uma tag para agrupar páginas da web e manter o conteúdo organizado.

Disponibilize para Fin ou Copilot

Para disponibilizar uma fonte do site para Fin Agent ou Fin Copilot, vá para Train > Content e clique na fonte do site na seção "Content sources", depois abra a página relevante que você sincronizou.

No painel "Detalhes" , role para baixo até “Fin” e ative:

Fin Agent - Esta configuração tornará a página da web disponível para o Fin AI usar ao responder aos clientes (respeitará quaisquer regras de público).
Fin Copilot - Esta configuração tornará a página da web disponível para o Fin Copilot usar ao responder aos colegas.

Agendar disponibilidade do site

Você pode agendar quando as páginas do site sincronizadas serão ativadas ou desativadas para Fin e Copilot, em uma data, hora e fuso horário futuros. Defina apenas uma data de início ou defina uma data de início e fim para criar uma janela de disponibilidade limitada. O agendamento se aplica a páginas individuais ou em massa.

Agendar uma única página

Abra a página. No painel Detalhes à direita, encontre a seção Agendamento dentro do menu suspenso Fin.
Clique em Agendar disponibilidade.
No modal: selecione o produto de IA (Fin para Service ou Fin Copilot), defina a disponibilidade (Ativar ou Desativar) e escolha uma data, hora e fuso horário.
Opcionalmente, ative Definir data de término para adicionar uma data e hora de término — a ação será revertida automaticamente nesse momento.
Clique em Agendar para confirmar.

Agendamento em massa de páginas

Selecione várias páginas na lista de conteúdo.
Vá para o menu suspenso Mais ações e selecione Agendar disponibilidade.
O mesmo modal de agendamento se aplica a todos os itens selecionados.

Como o agendamento funciona

Somente data de início: A ação de ativar/desativar ocorre no horário programado e permanece em efeito até que você a altere manualmente.
Data de início + fim: O conteúdo é ativado (ou desativado) no horário de início e depois reverte automaticamente no horário de término.
Alterações manuais não cancelam uma programação pendente: Se você alternar a disponibilidade manualmente após definir uma programação, a transição programada ainda ocorrerá no horário previsto e substituirá sua alteração manual.
Uma programação pendente por item por agente: Definir uma nova programação substitui a anterior — sem duplicatas.
Conteúdo excluído: Se uma página for excluída antes da execução da programação, a programação simplesmente não será aplicada e nenhum erro será exibido.

Torne-o disponível para um público específico

Você pode atribuir públicos ao conteúdo sincronizado automaticamente usando regras baseadas em URL durante a criação da sincronização web, ou manualmente por página. Primeiro, você precisará criar e definir o público que deseja segmentar.

Então vá para Train > Content e clique na fonte do site na seção "Content sources", depois abra a página relevante que você sincronizou.

No painel "Details" , role para baixo até “Fin” e use o menu suspenso de público para selecionar um dos seus públicos pré-definidos.

Nota:

O público padrão para URLs públicas é “Everyone”.
O Fin Agent também respeitará qualquer público que você aplicar a uma URL pública e usará este artigo para responder às perguntas dos clientes somente se corresponder às regras do público.

Adicionar ou editar regras de público em sincronizações existentes

Você não precisa recriar uma sincronização para adicionar segmentação de público. Vá para Train > Content, selecione a fonte, clique no menu de configurações no canto superior direito e selecione Abrir configurações. Navegue até a etapa Target para adicionar ou editar regras baseadas em URL.

Nota: Quando regras de público são adicionadas a uma sincronização web existente, elas se aplicam retroativamente a todo o conteúdo já ingerido dessa fonte — não apenas ao conteúdo novo daqui para frente.

Re-sincronizar ou remover um site como fonte

Se você quiser re-sincronizar ou remover uma URL pública como fonte, vá para Train > Content, e clique na fonte do site na seção "Content sources", depois abra o menu Settings no canto superior direito.

Aqui, você pode selecionar se deseja Re-sincronizar ou Remover esta fonte.

Dica: Atualizações feitas no seu site fonte não aparecerão imediatamente no Intercom. As re-sincronizações do site acontecem automaticamente toda semana, mas você pode acionar uma re-sincronização manual a qualquer momento para mostrar o conteúdo mais recente mais cedo.

Ver histórico de sincronização do site

Você pode ver uma lista das sincronizações passadas do site para saber quando foram executadas pela última vez, quais páginas foram encontradas e quaisquer páginas com falha. Vá para Train > Content, e clique na fonte do site na seção "Content sources", depois selecione Ver histórico de sincronização.

Cada linha na tabela representa uma execução passada ou ativa, e você pode filtrar as execuções por status (iniciada, sucesso, falha).

Inclui as seguintes informações:

Data da sincronização
Status
Páginas sincronizadas
Páginas excluídas
Páginas com falha
Duração
Sincronização iniciada por

Se uma sincronização falhou, você pode passar o mouse sobre o status para ver uma explicação detalhada do motivo.

Solução de problemas da sincronização do site

Problemas comuns

Ao importar conteúdo do site para habilitar o Fin, você precisa inserir a URL pública. Isso buscará todas as páginas aninhadas sob essa URL e as sincronizará para uso do Fin AI Agent.

Se o importador não retornou o número de páginas esperado, há algumas razões...

A URL fornecida não é o domínio de nível superior

A sincronização do site funciona indo até a URL que você fornece e depois buscando todas as páginas aninhadas sob essa URL. Essas páginas devem ter o mesmo padrão de URL que a URL fornecida.

Por exemplo, se o domínio de nível superior for https://myhelpcenter.com/home, então todas as páginas que você deseja importar devem incluir o prefixo /home na URL, por exemplo, https://myhelpcenter.com/home/article. Se não incluírem, remova o prefixo e use o URL mais básico, por exemplo, https://myhelpcenter.com, e tente importar novamente.

A URL é privada

Se o conteúdo que você deseja usar estiver atrás de um login, o Fin não poderá acessá-lo ou importá-lo.

Limites de página

Você pode sincronizar até 100 domínios de nível superior diferentes e o Fin sincronizará no máximo 30.000 páginas de cada fonte. A sincronização pode falhar se houver uma quantidade muito grande de conteúdo em uma única página (você será notificado se uma sincronização falhar).

Sites restritos a IPs regionais específicos

A sincronização do site do Fin (usada para adicionar URLs públicas para Fin AI Agent e Copilot) não usa uma string de agente de usuário dedicada e personalizada no momento.

Se seu site tem proteção anti-crawling rigorosa, você pode usar um proxy estático para permitir uma lista fixa de endereços IP e garantir que seu conteúdo seja ingerido. Selecione um proxy estático em Configurações avançadas ao criar ou editar sua sincronização do site.

Por endereço IP: Se seu site requer lista de permissões, selecione um proxy estático em Configurações avançadas — isso fornece um conjunto fixo de IPs para adicionar à sua lista de permissões.
Essas solicitações são usadas apenas para sincronização do site. Elas não afetam o tráfego do Messenger ou o rastreamento do usuário final.

Páginas de sites não ingleses ou internacionais não estão sincronizando

Se seu sitemap inclui URLs com caracteres não ASCII (como letras acentuadas ou scripts como chinês ou árabe), algumas dessas páginas podem não sincronizar como esperado. A descoberta do sitemap agora suporta essas URLs, mas ainda podem ocorrer problemas em outras partes do processo de sincronização. Tente re-sincronizar manualmente para resolver. Se as páginas ainda estiverem faltando, contate o suporte.

Erros de sincronização do site

Quando você sincroniza o conteúdo do site, pode ver diferentes status que indicam o que aconteceu durante o processo. Para ver o status da sincronização do seu site, vá para Train > Content e selecione a fonte do site, depois use o menu suspenso Status para filtrar por:

Sincronizando
Ativo
Falhou
Excluído

Aqui está o que cada um significa e o que você pode fazer a seguir:

Sincronizando

A sincronização da página ainda está em andamento. Uma sincronização inicial pode levar de alguns minutos a mais de uma hora, dependendo da quantidade de conteúdo que você tem.

Ativo

A página foi sincronizada com sucesso e pode ser ativada para Fin e Copilot.

Nota: Uma sincronização bem-sucedida nem sempre significa que conseguimos capturar todo o conteúdo da página. Se quiser confirmar a cobertura completa, recomendamos visualizar o Fin com as respostas que espera encontrar nessa página.

Excluído

Essas páginas não são sincronizadas intencionalmente porque você as excluiu nas Configurações avançadas de sincronização. Elas não podem ser tentadas novamente ou incluídas, a menos que especificado de outra forma.

Falhou

Esses erros significam que a sincronização não foi concluída e podem exigir alterações do seu lado antes de tentar novamente:

1. Erro desconhecido

Mensagem: “Esta página não pôde ser acessada. Pode estar lenta ou bloqueada. Tente sincronizar novamente ou entre em contato com o suporte se falhar.”
O que significa: Algo nos impediu de acessar a página, mas a causa não está clara.

2. Sessão bloqueada / Limite de taxa

Mensagem: “O site está nos impedindo de acessar seu conteúdo. Verifique se está sendo bloqueado por uma configuração anti-crawler ou firewall. Verifique a configuração do seu site e tente sincronizar novamente. Se o problema persistir, entre em contato com o suporte.”
O que significa: Seu site está bloqueando ou limitando ativamente nosso crawler.

3. Erros de rede, tempo limite ou similares

Mensagem: “Esta página não pôde ser acessada. Pode estar lenta para carregar ou bloqueada por configurações anti-crawler ou firewall. Verifique a configuração do seu site e tente sincronizar novamente. Se o problema persistir, entre em contato com o suporte.
O que significa: A página não carregou a tempo ou não pôde ser alcançada devido a problemas de rede ou bloqueios.

4. Duplicado

Mensagem: “Esta página tem o mesmo conteúdo que outra que já está sincronizada. Apenas uma versão será incluída.”
O que significa: Detectamos conteúdo idêntico em outro lugar, então apenas uma cópia é mantida.

5. Filtragem por palavra-chave

Mensagem: “Páginas com palavras-chave como category, collection ou tag na URL são excluídas por padrão, pois geralmente não contêm conteúdo único. Se esta página deve ser incluída, entre em contato com o suporte.”
O que significa: Essas URLs geralmente representam listas, não páginas de conteúdo independentes.

6. Código de status 400

Mensagem: “O conteúdo da página não pode ser encontrado. Verifique se a URL é válida e se a página carrega sem problemas.
O que significa: A URL pode estar quebrada ou retornando um erro no seu site.

7. URL bloqueada

Mensagem: “Este domain do website está bloqueado para sincronização. Se precisar disso, entre em contato com o suporte.”
O que significa: O domain está intencionalmente excluído da sincronização.

Você pode tentar sincronizar novamente uma página que falhou passando o mouse sobre a página, selecionando o menu de três pontos e depois selecionando Resync.

Sincronize e gerencie sites