Si deseas entrenar a Fin con el contenido del sitio web, puedes hacerlo sincronizando la URL pública de ese sitio.
Comenzar
Ve a Train > Content y luego selecciona Website sync debajo de la sección "Add content".
Ahora ingresa la URL pública de tu sitio web (top-level domain) y haz clic en Siguiente.
Esto obtendrá todas las páginas de la URL del sitio web que proporciones y leerá todas las páginas del sub domain.
Consejos:
Proporciona el enlace a la página principal de tu external help center para mejores resultados.
Usa top-level domains (por ejemplo, https://myhelpcenter.com en lugar de https://myhelpcenter.com/articles).
Revisar páginas para sincronizar
Una vez que ingreses tu URL, verificaremos que sea válida y accesible. Luego deberás revisar las páginas para sincronizar. Todas las subpáginas vinculadas en cada sección seleccionada se sincronizarán. Selecciona solo contenido relevante y actualizado.
Configuración avanzada [opcional]
Si deseas configurar tu sincronización de sitio web más a fondo (como incluir o excluir ciertas URLs), haz clic en Configuración avanzada.
URLs adicionales
Las estructuras de los sitios web pueden variar. Para asegurarnos de sincronizar tu contenido más relevante, recomendamos agregar URLs adicionales para esas subpáginas específicas.
Por ejemplo, si ingresas https://myhelpcenter.com/help como la URL principal arriba, también podrías querer agregar la URL específica como https://myhelpcenter.com/help/index.html
URLs para excluir
Para excluir ciertas páginas de las que no deseas sincronizar contenido, puedes agregar una lista de URL globs.
¿Qué es un url glob?
Un glob es una cadena de caracteres literales y/o comodines usados para coincidir con rutas de archivos o URLs. Globbing es el acto de localizar archivos en un sistema de archivos usando uno o más globs. Usar URL globs también ayuda a obtener un rango de URLs que son mayormente iguales, con solo una pequeña parte cambiando entre las solicitudes.
Por ejemplo, este URL glob https://{store,docs}.example.com/** permite que el rastreador acceda a todas las URLs que comienzan con https://store.example.com/ o https://docs.example.com/ y https://example.com/**/*\?*foo=*
Elementos de página para incluir
Para evitar extraer contenido de secciones específicas, puedes seleccionar Personalizado y agregar una lista de los selectores CSS que deseas incluir o excluir.
Usa esto para excluir partes de la página que no son útiles para Fin, como barras de navegación o banners.
El valor debe ser un selector CSS válido aceptado por la función document.querySelectorAll() (por ejemplo, sidebar, #newsletter-banner).
Por defecto, ya excluimos elementos comunes como encabezados, pies de página, modales, scripts e imágenes en línea.
Selector CSS clickeable
Esto permite que los elementos DOM identificados por el selector CSS sean clickeados durante el proceso de sincronización web.
Usa esto para capturar contenido oculto dentro de secciones expandibles, pestañas o menús desplegables.
Ingresa selectores CSS válidos como
[aria- expanded="false"],#expand_section,.tab.Para coincidir con elementos con múltiples clases, usa encadenamiento CSS (sin espacios). Por ejemplo,
.button.blue.smallapunta a elementos que tienen las tres clases.Para coincidir con múltiples elementos diferentes, separa los selectores con comas. Por ejemplo:
.tab,accordionapunta a elementos de pestañas y acordeones.
Esperar para cargar selector CSS
Para apuntar a contenido que puede tardar en aparecer en la página, puedes agregar un selector CSS que hará que el scraper web espere antes de extraer contenido.
Usa esto cuando el contenido carga lentamente o después de la interacción del usuario (por ejemplo, vía JavaScript).
El valor debe ser un selector CSS válido aceptado por la función document.querySelectorAll().
La página solo se procesará una vez que aparezca el elemento seleccionado; esto anula el comportamiento de tiempo predeterminado.
Ingresa un selector CSS válido, como
#load_content_ido.article_paragraph.
Mapa del sitio XML
Para acceder a páginas que podrían no ser accesibles desde las URLs iniciales, puedes habilitar el Mapa del sitio XML para una sincronización web más robusta en sitios que soportan sitemap.
Si esta opción está habilitada, el scraper web buscará Sitemaps en los domains de la source URL proporcionada y encolará URLs coincidentes de manera similar a los enlaces encontrados en las páginas rastreadas. También puedes referenciar un archivo sitemap.xml directamente agregándolo como otra Start URL, por ejemplo, https://www.example.com/sitemap.xml.
Región del proxy
Al configurar una sincronización de sitio web, se sugiere automáticamente una región de proxy basada en el top-level domain de tu sitio — por ejemplo, un domain .de usará por defecto el proxy alemán, y .fr el proxy francés. Si no se encuentra una coincidencia de TLD, se usa un proxy de EE. UU. como respaldo.
Puedes cambiar el proxy en cualquier momento en Configuración avanzada, ya sea al crear una nueva sincronización o al editar una existente. Al editar una sincronización existente, puedes elegir guardar solo la nueva configuración de proxy o guardar y sincronizar tu contenido inmediatamente.
Los siguientes proxies están disponibles:
Rotativos: Estados Unidos, Australia, Alemania, Francia, Reino Unido, Chequia, Hungría
Estáticos:
Estados Unidos - 119.13.211.225, 161.123.167.215, 94.176.49.232, 185.223.56.90, 154.17.143.135
Europa - 178.171.116.231, 206.232.77.243, 206.232.90.11, 209.20.175.180, 45.94.247.149
Australia - 154.220.151.84, 173.254.193.121, 160.224.101.213, 160.224.100.176, 212.70.22.41
Audiencias objetivo
El paso Target te permite establecer una audiencia predeterminada para todas las páginas sincronizadas y crear reglas basadas en URL para asignar automáticamente audiencias específicas según patrones de URL — sin necesidad de etiquetado manual.
Primero decide si el contenido de esta fuente está habilitado para Fin AI Agent y/o Copilot.
Luego puedes establecer una audiencia Fin predeterminada para aplicar a todas las páginas sincronizadas desde esta fuente (si no se establece un valor predeterminado, el contenido se asigna por defecto a Everyone), o crear reglas para asignar audiencias específicas basadas en patrones de URL.
Por ejemplo: Si la URL contiene /uk, asigna la audiencia del Reino Unido. Las reglas se evalúan durante la sincronización, por lo que Fin y Copilot siempre ofrecen el contenido correcto a la audiencia adecuada.
Cada regla admite tres comparadores de URL:
Empieza con — coincide con URLs que comienzan con un prefijo dado.
Termina con — coincide con URLs que terminan con un sufijo dado.
Contiene — coincide con URLs que contienen una subcadena dada.
Nota:
Una vista previa en vivo muestra cuántas páginas coinciden con cada regla, ayudándote a validar las reglas antes de guardarlas. Esto requiere que haya un sitemap disponible para tu fuente de sincronización web. Sin un sitemap, las reglas siguen aplicándose pero no puedes previsualizar las coincidencias.
Las reglas se nombran automáticamente al crearse pero pueden ser renombradas. Se aplica un máximo de 10 reglas por fuente de sincronización web.
Las reglas de audiencia son solo aditivas: añaden audiencias al contenido pero nunca eliminan asignaciones existentes. Eliminar una regla no deshace sus asignaciones de audiencia pasadas.
Revisar configuración de sincronización
Finalmente, revisa tu configuración de sincronización y luego haz clic en Sync website para comenzar a sincronizar el contenido de tu sitio web con Intercom.
Gestionar fuentes del sitio web
Una vez que la sincronización esté completa, recibirás una notificación por correo electrónico y el sitio web aparecerá como una fuente sincronizada en Train > Content bajo la sección "Content sources".
Si haces clic en una fuente de sitio web, puedes previsualizar y gestionar las páginas individuales que se sincronizaron desde la URL pública.
Nota: Las fuentes del sitio web son solo de lectura y no pueden editarse dentro de tu espacio de trabajo Fin, deben editarse en la fuente.
Configurar ajustes
Cuando ves una página web, encontrarás un panel de "Detalles" a la derecha que contiene:
Datos: Ver el tipo de contenido, idioma, fecha de creación y última actualización (cuándo se sincronizó por última vez con la fuente).
Fin: Habilitar/deshabilitar para Fin Agent y Fin Copilot. Cuando está habilitado, el contenido se vuelve disponible para clientes y compañeros de equipo, respectivamente.
Programación: Activar o desactivar contenido para Fin y Copilot en fechas establecidas.
Audiencia: Asegúrate de que los clientes solo reciban respuestas y vean contenido de Fin Agent que sea relevante para ellos.
Enlace: La URL pública para esta fuente del sitio web.
Informes: Rastrea con qué frecuencia este contenido está involucrado y se usa para resolver conversaciones por Fin Agent.
Etiqueta: Añade una etiqueta para agrupar páginas web y mantener el contenido organizado.
Hazlo disponible para Fin o Copilot
Para hacer que una fuente de sitio web esté disponible para Fin Agent o Fin Copilot, ve a Train > Content y haz clic en la fuente del sitio web bajo la sección "Content sources", luego abre la página web relevante que has sincronizado.
Desde el panel "Detalles" baja hasta “Fin” y activa:
Fin Agent - Esta configuración hará que la página web esté disponible para que Fin AI la use al responder a los clientes (respetará cualquier regla de audiencia).
Fin Copilot - Esta configuración hará que la página web esté disponible para que Fin Copilot la use al responder a los compañeros de equipo.
Programar disponibilidad del sitio web
Puedes programar cuándo las páginas sincronizadas del sitio web se activan o desactivan para Fin y Copilot, en una fecha, hora y zona horaria futura. Establece solo una fecha de inicio, o establece tanto una fecha de inicio como una de fin para crear una ventana de disponibilidad limitada en el tiempo. La programación se aplica a páginas individuales o en bloque.
Programar una sola página
Abre la página. En el panel de Detalles a la derecha, encuentra la sección Programación dentro del desplegable Fin.
Haz clic en Programar disponibilidad.
En el modal: selecciona el producto de IA (Fin para Service o Fin Copilot), establece la disponibilidad (Activar o Desactivar) y elige una fecha, hora y zona horaria.
Opcionalmente activa Establecer fecha de fin para añadir una fecha y hora de fin — la acción se revierte automáticamente en ese momento.
Haz clic en Programar para confirmar.
Programar páginas en bloque
Selecciona varias páginas de la lista de contenido.
Ve al desplegable Más acciones y selecciona Programar disponibilidad.
El mismo modal de programación se aplica a todos los elementos seleccionados.
Cómo funciona la programación
Sólo fecha de inicio: La acción de activar/desactivar se ejecuta en el momento programado y permanece en efecto hasta que la cambies manualmente.
Fecha de inicio + fin: El contenido se activa (o desactiva) a la hora de inicio, luego revierte automáticamente a la hora de fin.
Los cambios manuales no cancelan una programación pendiente: Si cambias manualmente la disponibilidad después de establecer una programación, la transición programada aún se ejecutará a la hora prevista y anulará tu cambio manual.
Un horario pendiente por elemento por agente: Establecer un nuevo horario reemplaza al anterior — no hay duplicados.
Contenido eliminado: Si una página se elimina antes de que se active su horario, el horario simplemente no se aplicará y no se mostrará ningún error.
Hacerlo disponible para una audiencia específica
Puedes asignar audiencias al contenido sincronizado automáticamente usando reglas basadas en URL durante la creación de la sincronización web, o manualmente página por página. Primero, necesitarás crear y definir la audiencia que deseas dirigir.
Luego ve a Train > Content y haz clic en la fuente del sitio web bajo la sección "Content sources", luego abre la página web relevante que has sincronizado.
Desde el panel "Details" , desplázate hacia abajo hasta “Fin” y usa el menú desplegable de audiencia para seleccionar una de tus audiencias predefinidas.
Nota:
La audiencia predeterminada para URLs públicas es “Everyone”.
Fin Agent también respetará cualquier audiencia que apliques a una URL pública y solo usará este artículo para responder preguntas de clientes si coinciden con las reglas de audiencia.
Agregar o editar reglas de audiencia en sincronizaciones existentes
No necesitas recrear una sincronización para agregar segmentación de audiencia. Ve a Train > Content, selecciona la fuente, haz clic en el menú desplegable de configuración en la esquina superior derecha y selecciona Abrir configuración. Navega al paso Target para agregar o editar reglas basadas en URL.
Nota: Cuando se agregan reglas de audiencia a una sincronización web existente, se aplican retroactivamente a todo el contenido ya ingerido de esa fuente — no solo al contenido nuevo en adelante.
Volver a sincronizar o eliminar un sitio web como fuente
Si deseas volver a sincronizar o eliminar una URL pública como fuente, ve a Train > Content, y haz clic en la fuente del sitio web bajo la sección "Content sources", luego abre el menú desplegable Settings en la esquina superior derecha.
Aquí, puedes seleccionar si Volver a sincronizar o Eliminar esta fuente.
Consejo: Las actualizaciones realizadas en tu sitio web fuente no aparecerán inmediatamente en Intercom. Las re-sincronizaciones del sitio web ocurren automáticamente cada semana, pero puedes activar una re-sincronización manual en cualquier momento para mostrar el contenido más reciente antes.
Ver historial de sincronización del sitio web
Puedes ver una lista de sincronizaciones pasadas del sitio web para ver cuándo se ejecutaron por última vez, qué páginas se encontraron y cualquier página fallida. Ve a Train > Content, y haz clic en la fuente del sitio web bajo la sección "Content sources", luego selecciona Ver historial de sincronización.
Cada fila en la tabla representa una ejecución pasada o activa, y puedes filtrar las ejecuciones por estado (iniciada, éxito, fallida).
Incluye la siguiente información:
Fecha de sincronización
Estado
Páginas sincronizadas
Páginas excluidas
Páginas fallidas
Duración
Sincronización iniciada por
Si una sincronización ha fallado, puedes pasar el cursor sobre el estado para ver una explicación detallada del motivo.
Solución de problemas de sincronización del sitio web
Problemas comunes
Al importar contenido del sitio web para habilitar Fin, necesitas ingresar la public URL. Esto buscará todas las páginas anidadas bajo esa URL y las sincronizará para que Fin AI Agent las use.
Si el importador no devolvió el número de páginas que esperabas, hay algunas razones...
La URL proporcionada no es el dominio de nivel superior
La sincronización del sitio web funciona yendo a la URL que proporcionas y luego buscando todas las páginas anidadas bajo esa URL. Estas páginas deben tener el mismo patrón de URL que la URL que proporcionas.
Por ejemplo, si el dominio de nivel superior es https://myhelpcenter.com/home, entonces todas las páginas que deseas importar deben incluir el prefijo /home en la URL, por ejemplo https://myhelpcenter.com/home/article. Si no lo hacen, elimina el prefijo y usa el tallo URL más básico, por ejemplo https://myhelpcenter.com, luego intenta la importación nuevamente.
La URL es privada
Si el contenido que deseas usar está detrás de un inicio de sesión, Fin no podrá acceder ni importarlo.
Límites de páginas
Puedes sincronizar hasta 100 diferentes dominios de nivel superior y Fin sincronizará un máximo de 30,000 páginas de cada fuente. La sincronización puede fallar a veces si hay una cantidad muy grande de contenido en una sola página (se te notificará si una sincronización falla).
Sitios web restringidos a IPs regionales específicas
La sincronización del sitio web de Fin (usada para agregar URLs públicas para Fin AI Agent y Copilot) no usa una cadena de agente de usuario dedicada y personalizada en este momento.
Si tu sitio tiene una protección estricta contra rastreo, puedes usar un proxy estático para permitir una lista blanca de un conjunto fijo de direcciones IP y asegurar que tu contenido sea ingerido. Selecciona un proxy estático en Configuración avanzada al crear o editar tu sincronización del sitio web.
Por dirección IP: Si tu sitio requiere lista blanca, selecciona un proxy estático en Configuración avanzada — esto te da un conjunto fijo de IPs para agregar a tu lista blanca.
Estas solicitudes se usan solo para la sincronización del sitio web. No afectan el tráfico de tu Messenger ni el seguimiento del usuario final.
Errores de sincronización del sitio web
Cuando sincronizas contenido del sitio web, puedes ver diferentes estados que indican lo que sucedió durante el proceso. Para ver el estado de sincronización de tu sitio web ve a Train > Content y selecciona la fuente del sitio web, luego usa el menú desplegable Status para filtrar por:
Sincronizando
En vivo
Fallido
Excluido
Esto es lo que significa cada uno y lo que puedes hacer a continuación:
Sincronizando
La sincronización de la página aún está en progreso. Una sincronización inicial puede tardar desde unos minutos hasta más de una hora, dependiendo de la cantidad de contenido que tengas.
En vivo
La página se sincronizó correctamente y puede ser habilitada para Fin y Copilot.
Nota: Una sincronización exitosa no siempre significa que pudimos extraer todo el contenido de la página. Si quieres confirmar la cobertura completa, recomendamos previsualizar Fin con las respuestas que esperas encontrar en esa página.
Excluido
Estas páginas no se sincronizan intencionalmente porque las excluiste en la Configuración avanzada de sincronización. No pueden reintentarse ni incluirse a menos que se especifique lo contrario.
Fallido
Estos errores significan que la sincronización no se completó y pueden requerir cambios de tu parte antes de reintentar:
1. Error desconocido
Mensaje: “No se pudo acceder a esta página. Puede estar lenta o bloqueada. Intenta sincronizar de nuevo o contacta al help center si falla.”
Qué significa: Algo nos impidió acceder a la página, pero la causa no está clara.
2. Sesión bloqueada / Límite de tasa
Mensaje: “El sitio web nos está impidiendo acceder a su contenido. Verifica si está siendo bloqueado por una configuración anti-crawler o firewall. Revisa la configuración de tu sitio e intenta sincronizar de nuevo. Si el problema persiste, contacta al help center.”
Qué significa: Tu sitio está bloqueando o limitando activamente nuestro crawler.
3. Errores de red, tiempo de espera o similares
Mensaje: “No se pudo acceder a esta página. Puede estar lenta para cargar o bloqueada por configuraciones anti-crawler o firewall. Revisa la configuración de tu sitio e intenta sincronizar de nuevo. Si el problema persiste, contacta al help center.
Qué significa: La página no cargó a tiempo o no se pudo alcanzar debido a problemas de red o bloqueo.
4. Duplicado
Mensaje: “Esta página tiene el mismo contenido que otra que ya está sincronizada. Solo se incluirá una versión.”
Qué significa: Detectamos contenido idéntico en otro lugar, por lo que solo se mantiene una copia.
5. Filtrado por palabra clave
Mensaje: “Las páginas con palabras clave como category, collection o tag en la URL están excluidas por defecto, ya que usualmente no contienen contenido único. Si esta página debe incluirse, contacta al help center.”
Qué significa: Estas URLs suelen representar listas, no páginas de contenido independientes.
6. Código de estado 400
Mensaje: “No se puede encontrar el contenido de la página. Verifica que la URL sea válida y que la página cargue sin problemas.
Qué significa: La URL puede estar rota o devolver un error en tu sitio web.
7. URL bloqueada
Mensaje: “Este domain está bloqueado para sincronización. Si lo necesitas, contacta al help center.”
Qué significa: El domain está excluido intencionalmente de la sincronización.
Puedes reintentar una sincronización fallida de página pasando el cursor sobre la página, seleccionando el menú de tres puntos y luego seleccionando Resync.























