Пошук і видалення дублікатів
Свайпніть щоб показати меню
Під час роботи з наборами даних однією з найпоширеніших структурних проблем є дублікати рядків. Це записи, які з'являються більше одного разу та зазвичай представляють одні й ті самі дані.
Дублікати часто виникають під час об'єднання даних з кількох джерел, багаторазового імпорту або ручного введення. На перший погляд усе може виглядати нормально, але дублікати можуть серйозно спотворити аналіз. Наприклад, підсумки можуть бути завищені, а звіти — містити некоректні результати.
Пошук дублікатів
Перш ніж щось видаляти, важливо спочатку ідентифікувати дублікати.
Один зі способів зробити це — використати функцію COUNTIF:
=COUNTIF(A:A, A2)
Ця формула підраховує, скільки разів значення зустрічається у стовпці. Якщо результат більший за 1, це означає, що значення дублюється.
Видалення дублікатів
Після ідентифікації дублікатів Excel надає вбудований інструмент для їх видалення.
Виберіть таблицю, перейдіть на вкладку Дані та скористайтеся функцією Видалити дублікати. Excel просканує вибрані стовпці та автоматично видалить повторювані рядки.
Excel порівнює вибрані стовпці по рядках. Якщо знаходить ідентичні значення, залишає лише один екземпляр, а решту видаляє. Це допомагає гарантувати, що кожен запис з’являється лише один раз.
Завдання
-
Знайти дублікати записів у наборі даних.
-
Ви можете помітити, що стовпець
Order IDмістить дублікати. Спочатку визначте ці дублікати, а потім повністю видаліть повторювані рядки за допомогою інструмента Видалити дублікати.
Використовуйте =COUNTIF(A:A, A2) у стовпці Order ID, щоб підрахувати, скільки разів кожен ідентифікатор з'являється. Якщо результат більший за 1, це означає, що значення є дублікатом.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат