Utilizzare Copilot per rimuovere i duplicati
Scorri per mostrare il menu
Dopo aver pulito il tuo dataset, l'ultimo passaggio è la rimozione dei duplicati.
In molti casi, le righe duplicate non sono identiche. La stessa persona può comparire più volte con valori diversi, quindi è necessario definire cosa si intende per duplicato.
Invece di confrontare intere righe, concentrarsi su una colonna chiave. In questo caso, utilizzare l'indirizzo email per identificare i duplicati.
Questo garantisce che ogni persona compaia solo una volta nel dataset.
Non eliminare subito i duplicati. Queste righe potrebbero contenere informazioni utili.
Prima, copiare tutte le voci duplicate in un nuovo foglio di lavoro. Successivamente, rimuoverle dalla tabella principale.
Questo mantiene i dati al sicuro e consente di rivedere le voci rimosse in seguito.
Quando si lavora con attività in più passaggi, scrivere i prompt in una sequenza chiara.
Creare un nuovo foglio di lavoro, identificare i duplicati in base all'email, copiarli nel nuovo foglio e poi rimuoverli dalla tabella originale.
Istruzioni chiare riducono gli errori e rendono il comportamento di Copilot più prevedibile.
Dopo aver eseguito l'attività, controllare entrambi i fogli.
Assicurarsi che la tabella principale contenga solo voci uniche e che tutte le righe rimosse siano salvate nel nuovo foglio di lavoro.
Hai pulito e strutturato dati disordinati utilizzando Copilot. Il tuo dataset ora è coerente, completo e pronto per l'analisi nella prossima sezione.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione