Guide pratiche

Anagrafica Clienti con Duplicati: Come Eliminarli e Pulire il Database

Stesso cliente in 5 versioni diverse (Rossi, Rossi srl, Rossi Srl, ROSSI). Fatturazione errata, statistiche sbagliate, marketing sprecato. Vediamo come pulire.

Team Ingenia 09 May 2026
Anagrafica Clienti con Duplicati: Come Eliminarli e Pulire il Database

Apri l'anagrafica del gestionale e cerchi "Rossi". Trovi: Rossi srl, Rossi Srl, Rossi S.r.l., ROSSI Srl, Mario Rossi srl. Sono 5 versioni diverse dello stesso cliente. Fatturi al primo, mando email al secondo, le statistiche calcolano 5 clienti diversi. Caos. Vediamo come identificare ed eliminare duplicati.

Come nascono i duplicati

  • Inserimento manuale da operatori diversi.
  • Importazioni da file Excel non riconciliati.
  • Migrazione da gestionale precedente.
  • Acquisizioni con merge anagrafiche.
  • Errori di battitura (Rossii, Rossi corretto).

In aziende con anagrafica oltre i 5 anni: 5-15% di duplicati tipici.

I costi dei duplicati

ProblemaCosto
Fatturazione errata (cliente sbagliato)200-1000 €/episodio
Marketing duplicato (stessa email 5 volte)Reputazione
Statistiche errate (5 clienti vs 1)Decisioni sbagliate
Tempo amministrativo riconciliazione2-5h/mese
DSO calcolato maleCash flow imprevedibile

Le strategie di matching

1. Matching esatto su P.IVA

P.IVA è univoca per legge. Stesso P.IVA = stesso cliente. 100% affidabile se P.IVA è valido.

Limite: clienti privati senza P.IVA, P.IVA scritte male.

2. Matching esatto su Codice Fiscale

Per privati: stesso CF = stessa persona.

3. Fuzzy matching su nome

Per casi senza P.IVA/CF univoci, algoritmi di similarità:

  • Levenshtein distance: numero modifiche per trasformare A in B.
  • Jaro-Winkler: ottimizzato per nomi.
  • Soundex: matching fonetico.

"Rossi srl" e "Rossi Srl" → similarità >95%, probabile duplicato.

4. Matching su indirizzo + città

Stesso indirizzo + città + nome simile = quasi certamente duplicato.

Workflow di pulizia

Step 1: identifica duplicati

Esegui query/algoritmo di matching:

  • Lista coppie sospette.
  • Score di similarità.
  • Esamina visualmente.

Step 2: scegli "master"

Per ogni gruppo di duplicati, scegli record "master" (canonico):

  • Più completo (più campi).
  • Più recente (data ultima modifica).
  • Con dati validati.

Step 3: merge dati

Trasferisci dati dai duplicati al master:

  • Storico ordini.
  • Note.
  • Contatti.
  • Allegati.

Step 4: marca/elimina duplicati

Due strategie:

  • Soft delete: flag "duplicato" (recuperabile).
  • Hard delete: eliminazione fisica (irreversibile).

Soft delete consigliato per audit.

Step 5: prevenzione

  • Validation P.IVA in fase inserimento.
  • Alert "cliente già esistente?" con suggerimenti.
  • Permessi: solo certi ruoli inseriscono nuovi.

L'anagrafica unificata di Gestya

Il modulo Anagrafiche di Gestya:

  • Validazione P.IVA automatica.
  • Validazione CF con algoritmo.
  • Alert duplicati al momento dell'inserimento.
  • Merge tool per riconciliazione.
  • Storico unificato: ordini, fatture, note del cliente master.
  • Multi-tenant per gruppi.

Statistiche tipiche post-pulizia

Caso azienda media con 5.000 clienti:

  • ~500-750 duplicati identificati (10-15%).
  • ~400 facilmente riconciliabili (P.IVA match).
  • ~200 richiedono review manuale.
  • ~50-100 ambigui (decisione caso per caso).

Tempo pulizia: 2-5 giorni di lavoro per anagrafica medio-grande.

I moduli Gestya correlati

Scopri Gestya e anagrafica pulita.

Pronto a trasformare il tuo business?

Raccontaci il tuo progetto. Ti risponderemo entro 24 ore.