Apri l'anagrafica del gestionale e cerchi "Rossi". Trovi: Rossi srl, Rossi Srl, Rossi S.r.l., ROSSI Srl, Mario Rossi srl. Sono 5 versioni diverse dello stesso cliente. Fatturi al primo, mando email al secondo, le statistiche calcolano 5 clienti diversi. Caos. Vediamo come identificare ed eliminare duplicati.
Come nascono i duplicati
- Inserimento manuale da operatori diversi.
- Importazioni da file Excel non riconciliati.
- Migrazione da gestionale precedente.
- Acquisizioni con merge anagrafiche.
- Errori di battitura (Rossii, Rossi corretto).
In aziende con anagrafica oltre i 5 anni: 5-15% di duplicati tipici.
I costi dei duplicati
| Problema | Costo |
|---|---|
| Fatturazione errata (cliente sbagliato) | 200-1000 €/episodio |
| Marketing duplicato (stessa email 5 volte) | Reputazione |
| Statistiche errate (5 clienti vs 1) | Decisioni sbagliate |
| Tempo amministrativo riconciliazione | 2-5h/mese |
| DSO calcolato male | Cash flow imprevedibile |
Le strategie di matching
1. Matching esatto su P.IVA
P.IVA è univoca per legge. Stesso P.IVA = stesso cliente. 100% affidabile se P.IVA è valido.
Limite: clienti privati senza P.IVA, P.IVA scritte male.
2. Matching esatto su Codice Fiscale
Per privati: stesso CF = stessa persona.
3. Fuzzy matching su nome
Per casi senza P.IVA/CF univoci, algoritmi di similarità:
- Levenshtein distance: numero modifiche per trasformare A in B.
- Jaro-Winkler: ottimizzato per nomi.
- Soundex: matching fonetico.
"Rossi srl" e "Rossi Srl" → similarità >95%, probabile duplicato.
4. Matching su indirizzo + città
Stesso indirizzo + città + nome simile = quasi certamente duplicato.
Workflow di pulizia
Step 1: identifica duplicati
Esegui query/algoritmo di matching:
- Lista coppie sospette.
- Score di similarità.
- Esamina visualmente.
Step 2: scegli "master"
Per ogni gruppo di duplicati, scegli record "master" (canonico):
- Più completo (più campi).
- Più recente (data ultima modifica).
- Con dati validati.
Step 3: merge dati
Trasferisci dati dai duplicati al master:
- Storico ordini.
- Note.
- Contatti.
- Allegati.
Step 4: marca/elimina duplicati
Due strategie:
- Soft delete: flag "duplicato" (recuperabile).
- Hard delete: eliminazione fisica (irreversibile).
Soft delete consigliato per audit.
Step 5: prevenzione
- Validation P.IVA in fase inserimento.
- Alert "cliente già esistente?" con suggerimenti.
- Permessi: solo certi ruoli inseriscono nuovi.
L'anagrafica unificata di Gestya
Il modulo Anagrafiche di Gestya:
- Validazione P.IVA automatica.
- Validazione CF con algoritmo.
- Alert duplicati al momento dell'inserimento.
- Merge tool per riconciliazione.
- Storico unificato: ordini, fatture, note del cliente master.
- Multi-tenant per gruppi.
Statistiche tipiche post-pulizia
Caso azienda media con 5.000 clienti:
- ~500-750 duplicati identificati (10-15%).
- ~400 facilmente riconciliabili (P.IVA match).
- ~200 richiedono review manuale.
- ~50-100 ambigui (decisione caso per caso).
Tempo pulizia: 2-5 giorni di lavoro per anagrafica medio-grande.
I moduli Gestya correlati
Scopri Gestya e anagrafica pulita.