Ricerca e Rimozione dei Duplicati
Scorri per mostrare il menu
Quando si lavora con set di dati, uno dei problemi strutturali più comuni è la presenza di righe duplicate. Questi sono record che compaiono più di una volta e di solito rappresentano gli stessi dati.
I duplicati si verificano spesso quando i dati vengono uniti da più fonti, importati più volte o inseriti manualmente. A prima vista, tutto può sembrare corretto, ma i duplicati possono distorcere seriamente l'analisi. Ad esempio, i totali possono risultare gonfiati e i report possono mostrare risultati errati.
Individuazione dei duplicati
Prima di eliminare qualsiasi cosa, è importante identificare prima i duplicati.
Un modo per farlo è utilizzare la funzione COUNTIF:
=COUNTIF(A:A, A2)
Questa formula conta quante volte un valore appare in una colonna. Se il risultato è maggiore di 1, significa che il valore è duplicato.
Rimozione dei duplicati
Una volta identificati i duplicati, Excel offre uno strumento integrato per rimuoverli.
È possibile selezionare la tabella, andare alla scheda Dati e utilizzare Rimuovi Duplicati. Excel eseguirà la scansione delle colonne selezionate e rimuoverà automaticamente le righe ripetute.
Excel confronta le colonne selezionate riga per riga. Se trova valori identici, mantiene una sola occorrenza e rimuove le altre. Questo aiuta a garantire che ogni record compaia una sola volta.
Individuazione dei record duplicati nel dataset.
Si può notare che la colonna Order ID contiene duplicati. Identificare prima questi record duplicati, quindi rimuovere completamente le righe duplicate utilizzando lo strumento Rimuovi Duplicati.
Utilizzare =COUNTIF(A:A, A2) sulla colonna Order ID per contare quante volte compare ciascun ID. Se il risultato è maggiore di 1, significa che il valore è un duplicato.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione