Ricerca e Rimozione dei Duplicati
Scorri per mostrare il menu
Quando si lavora con i dataset, uno dei problemi strutturali più comuni è la presenza di righe duplicate. Questi sono record che compaiono più di una volta e di solito rappresentano gli stessi dati.
I duplicati si verificano spesso quando i dati vengono uniti da più fonti, importati più volte o inseriti manualmente. A prima vista, tutto può sembrare corretto, ma i duplicati possono distorcere seriamente l'analisi. Ad esempio, i totali possono risultare gonfiati e i report possono mostrare risultati errati.
Ricerca dei duplicati
Prima di eliminare qualsiasi cosa, è importante identificare prima i duplicati.
Un modo per farlo è utilizzare la funzione COUNTIF:
=COUNTIF(A:A, A2)
Questa formula conta quante volte un valore appare in una colonna. Se il risultato è maggiore di 1, significa che il valore è duplicato.
Rimozione dei duplicati
Una volta identificati i duplicati, Excel offre uno strumento integrato per rimuoverli.
Puoi selezionare la tabella, andare alla scheda Dati e utilizzare Rimuovi Duplicati. Excel eseguirà la scansione delle colonne selezionate e rimuoverà automaticamente le righe ripetute.
Excel confronta le colonne selezionate riga per riga. Se trova valori identici, mantiene una sola occorrenza e rimuove le altre. Questo aiuta a garantire che ogni record compaia una sola volta.
Attività
-
Individuare i record duplicati nel dataset.
-
Si può notare che la colonna
Order IDcontiene duplicati. Identificare prima questi record duplicati, quindi rimuovere completamente le righe duplicate utilizzando lo strumento Rimuovi Duplicati.
Usa =COUNTIF(A:A, A2) sulla colonna Order ID per contare quante volte compare ciascun ID. Se il risultato è maggiore di 1, significa che il valore è un duplicato.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione