Blog

Guía definitiva para la deduplicación en HubSpot

Desde la prevención de duplicados hasta la automatización, esta guía cubre todo lo que necesitas para gestionar duplicados en HubSpot y mejorar la calidad de tus datos.

May 20, 2020
#
min lectura
Guía definitiva para la deduplicación en HubSpot

La deduplicación en HubSpot ha evolucionado bastante en los últimos años. Antes de 2018, los usuarios de HubSpot tenían muy pocas herramientas disponibles, hasta que lanzamos la integración Dedupely <> HubSpot. Poco después, HubSpot presentó su propia herramienta de deduplicación basada en IA. Hoy en día existen varias opciones, pero los errores y limitaciones aún persisten.

Esta es una guía completa para la gestión de duplicados en HubSpot. Me aseguré de cubrir cada área con el mayor detalle posible. El objetivo final es eliminar contactos, empresas, y más duplicados de tus listas en HubSpot para que tu equipo pueda tener interacciones listas para ventas.

Duplicados de HubSpot 101

Cómo llegan los contactos duplicados a HubSpot

Con base en lo que hemos visto, lo que investigamos y lo que nos han contado clientes, estas son las formas más comunes en que entran registros duplicados:

  • Crear registros a mano sin revisar si ya existían antes
  • Importar mal los datos o subir los mismos registros varias veces sin usar campos clave para asociarlos, como el correo electrónico
  • Integraciones de terceros que no revisan si el contacto ya está en la base antes de crear uno nuevo
  • Formularios de tipo "web to lead" que solo agregan y no validan contra datos existentes
  • Implementaciones internas del API que no respetan la lógica de asociación

Al final del día, HubSpot es tan propenso a duplicados como cualquier otro sistema basado en bases de datos o spreadsheets.

¿Por qué los duplicados en HubSpot son un problema (y a quién le debería importar)?

Todo el equipo debería tener claro que los datos duplicados no solo hacen más lento el trabajo, también pueden costarle dinero y reputación a la empresa.

Te conviene cuidar la calidad de los datos si trabajas en:

  • Ventas
  • Marketing o gestión comercial
  • Dirección de Marketing o Ventas (VPs, CMOs, etc.)

Los duplicados afectan de varias formas:

  • Las personas de ventas tienen que filtrar más registros, y pueden contactar dos veces al mismo prospecto por error
  • Los reportes se distorsionan: los datos se duplican y los números ya no reflejan bien la realidad
  • Hay quienes pierden hasta el 50% de su tiempo en tareas repetitivas relacionadas con calidad de datos (MIT Sloan)
  • Corregir un error cuesta 10 veces más que prevenirlo. Dejar duplicados te puede costar hasta 100 USD por caso (SiriusDecisions)
  • Y claro, se va la confianza. Tanto en los datos como en tus campañas, tu marca o las relaciones con clientes

¿Es urgente desduplicar HubSpot hoy?

Sí. Cada día que pasa sin hacerlo es más trabajo acumulado. Y más riesgo. Ya lo dijimos arriba: prevenir sale 10 veces más barato que corregir. Además, entre más lo dejes pasar, más se acumula el problema. Claro, hay casos donde duplicar un dato puede tener sentido (como cuando hay pedidos recurrentes o clientes que regresan). Pero eso es distinto a tener caos en la base. Piensa en la descomposición de datos como si fuera polvo en la casa: entre más lo dejes, más te cuesta limpiarlo.

Un estudio de salud de datos de prospectos muestra que el 15% de los leads en una empresa están duplicados. Otro indica que las empresas pueden recuperar hasta el 70% de ingresos solo con tener datos limpios.

¿Esperarte a que falten tres días para tu próxima campaña? No lo recomendamos. Mejor deduplica desde ahora.

¿Qué hace HubSpot hoy para evitar duplicados?

HubSpot ya tiene algunas funciones para evitar duplicados desde el inicio. Aquí te explicamos cómo funcionan:

Evitar duplicados con correos y dominio de empresa

HubSpot no permite agregar dos contactos con el mismo correo. Eso reduce muchos duplicados a futuro, pero también significa que hay que tener cuidado con correos genéricos como info@, que más de una persona puede usar.

Para empresas, HubSpot usa el dominio del sitio web como clave única. O sea, no puedes tener dos empresas con example.com.

Cómo importar sin duplicar (sí, se puede)

Cuando importas datos a HubSpot, puedes evitar duplicados si usas bien las claves para asociar registros: correo para contactos o dominio para empresas.

Lo hemos explicado antes, pero va lo básico:

  • Usa los campos correctos en tus archivos CSV
  • Puedes usar los IDs de HubSpot para actualizar registros ya existentes sin crear otros nuevos
  • HubSpot te permite asociar registros automáticamente si los datos coinciden

También puedes usar los IDs existentes de HubSpot para volver a importar registros y actualizar los que ya tienes en tu CRM. De acuerdo con HubSpot:

“Puedes usar el ID del objeto para indicar qué registros ya existen en tu CRM. Si importas un objeto que ya existe en HubSpot, los datos coincidentes se actualizarán con la información nueva que importes.”

La herramienta de deduplicación de HubSpot (solo para usuarios Pro)

Sí, HubSpot tiene una función para deduplicar contactos. Y HubSpot afirma que usa IA para asociar contactos similares y ayudarte a detectar duplicados más fácilmente.

El sistema hace chequeos periódicos (no sabemos si diario o semanal) y te muestra duplicados en pares (uno a uno), en una lista paginada.

Pero:

  • Solo está disponible para cuentas Pro o superiores. Si usas la versión gratuita, no la tendrás.
  • La comunidad de HubSpot ha señalado varios límites:
    • Solo asocia de dos en dos
    • No hay opción de combinar en lote
    • Y no hay distinción clara entre coincidencias parciales y exactas, lo que puede resultar en errores o combinaciones incorrectas

Paso uno: Encontrar y combinar duplicados existentes en HubSpot

Lo primero que hay que hacer es limpiar la mayoría de los duplicados que tienes hoy en tu cuenta de HubSpot. Ya que esté listo, pasamos a la parte de automatizar y prevenir duplicados nuevos.

Nota: Vamos a usar Dedupely como ejemplo. Puedes empezar tu prueba gratuita para ver cómo funciona con tu cuenta.

Cómo manejar el riesgo al combinar

¿Dos personas con el mismo nombre y apellido son duplicados en la vida real? No. Pero a menos que tu empresa tenga 100 millones de clientes, no es algo que debas preocuparte mucho.

Entonces, podemos empezar evitando errores obvios al asociar duplicados que en realidad son coincidencias normales. A veces los registros comparten teléfono u otros datos comunes.

En resumen: entre más campos uses para asociar duplicados, menos riesgo de combinar algo incorrecto. Pero también, entre más campos pidas que coincidan, menos duplicados vas a encontrar. Es una decisión que tú tomas.

Qué tanto riesgo asumes depende totalmente de ti, pero lo ideal es ir con cautela. ¿Por qué? Porque una vez que combinas mal, es muy difícil deshacerlo. Con la cantidad de datos que se mueven en una combinación, no hay una forma fácil ni confiable de revertirlo, por eso en Dedupely no ofrecemos “deshacer”.

Addressing merge risk

Are two people with the same first and last name in real life duplicates of each other? No! However, unless your company has 100 million customers, you probably don't have to worry about people with the same name.

So we can start by preventing ourselves from making common sense mistakes with duplicate matches that are natural. Records sometimes have the same phone numbers, or other matching attributes.

In short, the more fields we use to match duplicates with the lower the chance of incorrect merging. However, the more fields we use, the fewer duplicates we're going to have. So there's a risk trade-off that, at some point, you'll have to make.

The amount of risk you take depends entirely on you and I urge you to proceed as risk-adverse as possible. Why? Because once done, it's nearly impossible to fully and quickly recover from large amounts of incorrectly merged contacts. With the amount of data that moves around in a merge, it's very hard from a technical standpoint to undo merges (we still haven't found a reliable way to do it, and therefor we don't).

Buenas prácticas para evitar errores al combinar

Sí, los errores existen. Pero también se pueden prevenir por completo. Aquí van algunas prácticas que usamos todos los días:

  1. Siempre haz backups de tu base. Haz un respaldo antes de combinar en masa.
  2. Siempre revisa y audita tu configuración de asociación. Es fácil equivocarse si te aceleras. Dedupely intenta validar cada entrada, pero tú conoces tus datos mejor.
  3. Ten claro cómo y cuándo cambian tus datos. Ajusta tus reglas de combinación si algo cambia en cómo se almacena o captura la información.
  4. Pon atención a los detalles. Números como “000-0000” en campos de teléfono se ven vacíos, pero la computadora los interpreta como valor.
  5. No automatices combinaciones sin haberlas probado. Nunca corras un auto-merge si no estás seguro del resultado.
  6. Toma en cuenta la atribución. Si dos leads se combinan, ¿quién se queda con la propiedad del lead?

Cómo encontrar duplicados en HubSpot

Empieza seleccionando los campos que quieres asociar. Puedes irte por los básicos (nombre y apellido) y luego ir afinando con más campos.

Cuando termine el escaneo, toca revisar los duplicados. Desplázate por la lista para buscar errores de asociación.

Ver asociaciones incorrectas te ayuda a entender qué tan buena es tu configuración. Si ves inconsistencias, ajusta las reglas antes de combinar en masa.

Combina duplicados uno por uno

Empezar uno por uno te da una mejor idea de qué campos están causando problemas.

La combinación personalizada te permite decidir qué valores se mantienen y qué contacto se considera el principal.

Usa reglas de combinación para ahorrar tiempo

Las reglas de combinación te permiten definir de forma automática qué valores ganan, según su contenido o atributos.

Esto te ahorra muchísimo tiempo en combinaciones personalizadas, especialmente cuando estás en modo masivo o automático.

Define el registro maestro

Puedes establecer qué registro se mantiene después de combinar usando las reglas de combinación. Solo define el ID que quieres conservar.

Revisa tus combinaciones en HubSpot

El historial de combinaciones te muestra un resumen de lo que se combinó. También puedes refrescar la vista en HubSpot para confirmar que los datos se actualizaron.

Si todo se ve bien, vas por buen camino hacia una cuenta sin duplicados.

“¡Ayuda! Todavía veo duplicados en HubSpot”

Es completamente normal. Es casi imposible detectar todos los duplicados en el primer intento. Aquí es donde ajustamos las reglas de asociación.

Dedupely aplica por defecto una asociación por similitud para campos de texto. Pero puedes personalizar el tipo de coincidencia para encontrar duplicados más precisos:

  • Asociación exacta: Coincidencia exacta (mayúsculas/minúsculas incluidas)
  • Asociación similar: Ignora puntuación u otros símbolos
  • Primera palabra/última palabra similar: Compara sólo el inicio o final (ideal para nombres o empresas con nombre compuesto)
  • Asociación difusa: Muy flexible, pero también menos precisa. No se recomienda como única regla.

También puedes revisar prefijos o sufijos comunes, o ignorar términos genéricos para mejorar la precisión.

¿Cuánto tiempo toma deduplicar HubSpot por primera vez?

Este proceso puede tardar desde unas horas hasta unas semanas. Depende de qué tan desordenada esté tu base y cuánto volumen tengas.

Paso dos: Prevenir que entren duplicados en HubSpot

Como ya vimos antes, prevenir duplicados es mucho más barato que corregirlos. Y claro, corregirlos sigue siendo mejor que dejarlos ahí.

HubSpot tiene varias funciones para evitar que entren duplicados. Pero nada es perfecto, y el error humano sigue existiendo.

Revisa de dónde vienen tus duplicados

Saber de dónde vienen te va a ayudar a encontrar formas de prevenirlos antes de que lleguen.

Si tu equipo de desarrollo usa las APIs de HubSpot o crea soluciones personalizadas, vale la pena revisar si algún flujo puede estar generando duplicados. Y si sí, ver cómo corregirlo.

También revisa cualquier app de terceros que esté creando nuevos registros. Formularios web, integraciones tipo “web-to-lead” o sincronizaciones automáticas entre plataformas pueden asociar datos sin verificar si ya existen.

Enseña a tu equipo a cuidar los datos

Cada persona de tu equipo que toca datos en HubSpot debería saber lo básico sobre cómo mantenerlos limpios. Cosas como:

  • Cómo debe estar formateada la información
  • Cómo ingresar un registro sin duplicarlo
  • Qué herramientas usar para deduplicar o detectar registros duplicados
  • Cómo evitar errores en la asignación de leads o contactos

Si tu equipo sabe cómo proteger los datos desde el inicio, ya estás previniendo una buena parte del caos antes de que suceda.

Paso tres: Automatiza

Una vez que ya pasaste la parte pesada del paso uno y el ajuste fino del paso dos, es momento de automatizar.

Prevenir sigue siendo la mejor forma de resolver la mayoría de los problemas de duplicados (y probablemente otros también). Pero los duplicados son inevitables, y la automatización rinde frutos a lo largo del tiempo: días, semanas, meses y años mientras tu equipo usa HubSpot. Y sí, te lo van a agradecer.

Usa la combinación automática para capturar duplicados diarios

La combinación automática te ayuda a no tener que lidiar manualmente con duplicados evidentes.

Eso sí: vas a tener que seguir revisando manualmente cada semana. Dedupely te avisará cuando tus reglas de asociación (que no están automatizadas) detecten duplicados. Ahí tú decides si combinarlos o no. Si ves que cada semana son los mismos tipos de duplicados —fáciles de identificar—, puedes automatizar esas reglas de asociación.

Con el apoyo de tu equipo y algunas medidas preventivas, vas a poder mantener el control total de tus datos.

Presupuesto para tu limpieza de duplicados en HubSpot

Cómo se calculan los precios de deduplicación

Con base en lo que hemos visto en el mercado, el número de registros suele ser el factor más determinante en el precio.

  • Bases pequeñas (menos de 30,000–50,000 registros) suelen comenzar desde los $500 USD por año
  • Bases grandes (150,000+ registros) pueden costar entre $2,000 y $20,000 USD como pago único o anual

El costo también varía según:

  • El nivel de personalización que tenga tu cuenta de HubSpot
  • Si se trata de un servicio guiado (consultoría) o de autogestión
  • El tiempo estimado para terminar la deduplicación

Cada proveedor de limpieza de datos maneja su propio esquema de precios. Lo mejor es contactar directamente para ver tu caso y cotizar uno a uno.

Tiempos realistas para una deduplicación inicial en HubSpot

JAsí como el precio depende del número de registros, el tiempo también. Y no es menor.

Bases pequeñas pueden tomar una hora o un poco más. Bases grandes pueden tardar días o incluso semanas. A mayor volumen, mayor es el cuidado que se debe tener con los datos, los errores, y los distintos tipos de duplicados que hay que atrapar.

Para evitar prisas de último minuto, lo ideal es deduplicar tu base de HubSpot con semanas de anticipación. No días. No horas antes del deadline. Aquí hay varios factores que considerar:

  • Qué tan rápido trabaje la empresa o persona que contratarás
  • Si tu base requiere personalización o pruebas adicionales para evitar errores o pérdida de datos
  • Qué tantas particularidades y errores necesita corregir tu base actual
  • Tiempo adicional para sincronizar y mover datos si es necesario

Los imprevistos suelen ser los peores: un correo que no salió, un lanzamiento que se atrasó. Mejor con tiempo. Hazlo con calma.

¿Quién debe involucrarse en la deduplicación?

Cualquiera que tenga algo que decir sobre cómo entra o se modifica la información:

  • El responsable de datos o integraciones
  • Gerentes de ventas
  • Cualquier persona que necesite entender qué se cambia, por qué y cómo

¿Cómo calculo el ROI de deduplicar en HubSpot?

Hay muchos estudios que confirman que los datos duplicados pueden costarle caro a una empresa. Pero si necesitas convencer a otros del gasto, aquí va una forma práctica de estimarlo.

Piensa en cuántas horas pierden tus reps arreglando datos duplicados.
Mídelo así:

  1. Cronometra cuánto tarda un/a rep en encontrar y combinar un grupo de duplicados manualmente
  2. Pregunta cuántas veces al día/semana hacen eso
  3. Multiplica todo y tendrás una idea de cuántas horas se pierden

Fórmula de ejemplo:

((Núm. de duplicados combinados por día) * (minutos por combinación / 60)) * salario por hora

Ejemplo:

Tu equipo combina 20 duplicados al día, tardan 4 minutos por cada uno:

(20 * 4 = 80 minutos) → 80 minutos / 60 = 1.33 horas  
1.33 horas * $30 USD/hora = $39 USD diarios

Si tienes 3 reps haciendo esto todos los días:
$39 * 3 reps * 30 días = entre $1,170 y $3,510 USD al mes en tiempo perdido solo para arreglar datos.

Y eso sin contar las oportunidades perdidas o el desgaste interno.

¿No te parece mucho? Tal vez no tienes un problema serio de duplicados.
¿Sí te parece mucho? Entonces ya tienes con qué convencer al resto del equipo.

Nota: No somos matemáticos. Es solo una estimación para darte una idea de cuánto podrías estar perdiendo por no deduplicar bien.

¿Solución interna o del Marketplace de HubSpot?

Todos hemos caído en la trampa de querer hacer las cosas por nuestra cuenta… hasta que después de horas perdidas, mejor decidimos pagarle a alguien más.

También hay casos donde una solución interna sí tiene sentido.

Entonces, ¿cuáles son las opciones reales para manejar duplicados de forma efectiva?

Solución con API creada por tu equipo de desarrollo

Tienes developers. ¿Por qué no ponerlos a construir una solución a la medida que cubra todo lo que necesitas? Bueno… espera tantito.

A muchos developers les encanta crear sus propias herramientas. Créeme, yo también estuve ahí—casi diseño desde cero toda nuestra plataforma—hasta que me cayó el veinte del verdadero costo de hacerlo en casa.

Tus developers están para construir el producto o servicio que vendes. Además, no son baratos. Y crear una herramienta de deduplicación casera implica:

  1. Tiempo de desarrollo inicial
  2. Tiempo para resolver bugs, rediseñar specs y ajustar detalles
  3. Mantenimiento y actualizaciones constantes
  4. Costos de hosting y operación

Todo eso se va sumando. Y al final puede salir más caro, más lento, y más limitado. Ni hablar del tiempo de espera para que funcione bien.

Gestión nativa de duplicados en HubSpot

HubSpot se diferencia de otras plataformas por tener gestión de duplicados integrada.

Pero como ya mencionamos antes, también tiene sus limitantes:

  • Pocas formas de asociar campos: dependes de lo que decida su IA
  • No puedes combinar automáticamente ni hacer combinaciones masivas
  • Solo permite agrupar de a dos registros por coincidencia
  • Y en general, el proceso se siente algo limitado y lento

Aunque es mejor que lo que ofrecen otros CRMs, la herramienta nativa no resuelve del todo el problema—sobre todo si quieres ahorrar tiempo.

“Eso le toca al equipo de ventas, ¿no?”

¿En qué momento “limpiar datos y resolver duplicados” se volvió parte de la chamba de un/a representante de ventas? ¿Alguno de ellos cree que eso es parte de su rol?

Capacitar al equipo para que cuide la calidad de los datos es básico. Claro que todos deberían tener buenos hábitos de entrada de datos en HubSpot. Es cuestión de orden, respeto y colaboración.

Peeero… si no les das herramientas reales para capturar, manejar y limpiar esos datos, solo estás haciendo su trabajo más difícil. Y eso, inevitablemente, complica las ventas.

¿Por qué las soluciones del Marketplace de HubSpot son una obviedad?

Y no, HubSpot no gana comisión por las integraciones, contrario a lo que muchos creen.

Hay varias apps de deduplicación en el Marketplace. Algunas no son muy buenas… pero otras hacen su trabajo espectacular. Estas herramientas las construyen empresas que realmente invierten en resolver bien el problema, ahorrándote horas (y dolores de cabeza).

Te vas a ahorrar:

  • Atajos que se sienten como parches temporales
  • Proyectos pesados que distraen a tu equipo
  • Y funciones nativas que no terminan de cumplir

¿Qué buscar en un proveedor de deduplicación?

He revisado a fondo los pros y contras de muchas de las apps que están disponibles. Algunas son gratis, otras no tienen precios públicos. Pero la mayoría hacen bien su trabajo.

Si decides contratar una consultoría, asegúrate de que entiendan tu caso a fondo. No des por hecho que saben lo que haces con el campo X o Y. Explícales todo. Haz todas las preguntas. La mayoría estarán dispuestos a ayudarte, pero tienes que ser claro desde el principio.

Si optas por una solución de autogestión, vas a tener control total del proceso. Eso sí, prepárate para leer documentación y ver algunos videos.

La herramienta que elijas debería tener estas funciones:

  • Opciones de asociación flexibles, con filtros exactos, similares, fonéticos, y posibilidad de ignorar términos comunes
  • Posibilidad de combinar en bloque, personalizar cada combinación y automatizar solo cuando estés seguro
  • Reglas de combinación que te permitan decidir qué campos se mantienen, cuáles se reemplazan y qué registro gana
  • Notificaciones cuando entren nuevos duplicados a tu base
  • Un equipo de soporte que realmente responde rápido y te ayuda

Esto es exactamente lo que buscamos lograr en Dedupely.
Y si la parte de autogestión no es lo tuyo, nosotros te apoyamos sin costo extra.

Échale un vistazo al conector HubSpot <> Dedupely por acá.

Contáctanos

Estamos listos para ayudarte a configurar Dedupely.

Escríbenos un correo

Probablemente ya sepamos la respuesta a tu pregunta 🙂

¡Correo electrónico copiado en tu portapapeles!

Agenda un Zoom

Ya sea que apenas estés empezando o ya estés metido hasta el fondo, contáctanos.

Descubre publicaciones de blog relacionadas

Mantente actualizado con nuestros últimos artículos e información.

No se han encontrado artículos.

Comienza gratis

Sin compromisos ni tarjeta de crédito.

Todos nuestros planes incluyen todas nuestras funciones + deduplicación ilimitada, servicio al cliente ilimitado, integraciones ilimitadas y sin tarifas por usuario.

"Lo que más nos ha impresionado es cómo el equipo de Customer Success de Dedupely siempre va más allá."
Isaac J

Isaac J

Usuario de Salesforce

"Nuestros clientes quieren lograr grandes resultados rápidamente. En HubSpot todos saben lo que Dedupely puede hacer."
Scott B

Scott B

VP of Platform en HubSpot

"Dedupely es la solución para contactos duplicados. Altamente recomendado para quienes usan la integración con Pipedrive."
John K

John K

David J Anderson School of Management

"Funcionó de forma simple y efectiva, y se ajustó a mi presupuesto [...] Feliz de recomendar una buena app e integración."
Allan R

Allan R

Target3D

"En cuestión de 30 minutos [...] Dedupely se encargó automáticamente de todo lo que necesitaba para combinar registros."
Wasmer D

Wasmer D

Usuario de HubSpot

"Dedupely nos ayudó a deduplicar cientos de registros rápidamente, con un nivel de transparencia que te da confianza..."
Grattan H

Grattan H

Usuario de Pipedrive

"Esta herramienta hizo que un proyecto de una semana tomara solo unas horas."
Burchard J

Burchard J

Usuario de HubSpot

"La aplicación funciona excelente [...] el soporte respondió rápido y me ayudó a encaminar todo."
Shawnee K

Shawnee K

Usuario de Salesforce

"Funcionó como esperábamos y Néstor del equipo de soporte fue de gran ayuda... Muy recomendable."
DiBlasio S

DiBlasio S

Usuario de HubSpot

"Quedé muy satisfecho con Dedupely. Es altamente configurable y funciona excelente tanto de forma manual como automática."
Laura R

Laura R

Usuario de Salesforce

"Dedupely fue clave para mejorar la calidad de mi base de datos en el CRM. Me ahorró horas de trabajo manual".
Marco S

Marco S

Efecte

"Conectar HubSpot y correr mi primer deduplicado no pudo haber sido más fácil."
Emily K

Emily K

Mercy Housing

"Nos quitó de encima el enorme dolor de cabeza que era combinar más de 27,000 contactos duplicados."
Sean B

Sean B

Legal CPD

"Teníamos 300 mil registros en el CRM. A pesar del volumen, Dedupely funcionó perfecto."
Simon W

Simon W

Tillhub

"Funciona muy bien, el soporte es de 10."
Andy G

Andy G

Usuario de Pipedrive

"La app funcionó perfecto y me ayudó mucho con cientos de duplicados en Pipedrive."
Samo J

Samo J

TapHome

"¡Sí lo recomiendo! Fácil de usar, reportes adecuados y un equipo de Customer Success espectacular."
Alina T

Alina T

FieldBee