Використання Copilot для видалення дублікатів
Свайпніть щоб показати меню
Після очищення набору даних останнім кроком є видалення дублікатів.
У багатьох випадках дублікати рядків не є ідентичними. Одна й та сама особа може з’являтися кілька разів із різними значеннями, тому потрібно визначити, що вважати дублікатом.
Замість порівняння всіх рядків зосередьтеся на ключовому стовпці. У цьому випадку використовуйте Email Address для ідентифікації дублікатів.
Це гарантує, що кожна особа з’являється лише один раз у вашому наборі даних.
Не видаляйте дублікати одразу. Ці рядки можуть містити корисну інформацію.
Спочатку скопіюйте всі дублікати в окремий аркуш. Після цього видаліть їх з основної таблиці.
Це забезпечує безпеку ваших даних і дозволяє переглянути видалені записи пізніше.
Під час роботи з багатокроковими завданнями формулюйте підказки у чіткій послідовності.
Створіть новий аркуш, визначте дублікати за email, скопіюйте їх у новий аркуш, а потім видаліть їх з оригінальної таблиці.
Чіткі інструкції зменшують кількість помилок і роблять поведінку Copilot більш передбачуваною.
Після виконання завдання перевірте обидва аркуші.
Переконайтеся, що основна таблиця містить лише унікальні записи, а всі видалені рядки збережені в новому аркуші.
Ви очистили та структурували неструктуровані дані за допомогою Copilot. Ваш набір даних тепер є послідовним, повним і готовим до аналізу в наступному розділі.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат