Пошук і видалення дублікатів
Свайпніть щоб показати меню
Під час роботи з наборами даних однією з найпоширеніших структурних проблем є дублікати рядків. Це записи, які з’являються більше одного разу та зазвичай представляють одні й ті самі дані.
Дублікати часто виникають під час об’єднання даних з кількох джерел, багаторазового імпорту або ручного введення. На перший погляд усе може виглядати коректно, але дублікати можуть суттєво спотворити аналіз. Наприклад, підсумки можуть бути завищеними, а звіти — містити некоректні результати.
Пошук дублікатів
Перш ніж щось видаляти, важливо спочатку ідентифікувати дублікати.
Один зі способів зробити це — використати функцію COUNTIF:
=COUNTIF(A:A, A2)
Ця формула підраховує, скільки разів значення зустрічається у стовпці. Якщо результат більший за 1, це означає, що значення дублюється.
Видалення дублікатів
Після ідентифікації дублікатів Excel пропонує вбудований інструмент для їх видалення.
Можна вибрати таблицю, перейти на вкладку Дані та скористатися функцією Видалити дублікати. Excel просканує вибрані стовпці та автоматично видалить повторювані рядки.
Excel порівнює вибрані стовпці по рядках. Якщо знаходить ідентичні значення, залишає один екземпляр і видаляє решту. Це допомагає гарантувати, що кожен запис з’являється лише один раз.
Пошук дублікатів у наборі даних.
Можна помітити, що стовпець Order ID містить дублікати. Спочатку ідентифікуйте ці дублікати, а потім повністю видаліть повторювані рядки за допомогою інструменту Видалити дублікати.
Використовуйте =COUNTIF(A:A, A2) у стовпці Order ID, щоб підрахувати, скільки разів кожен ідентифікатор зустрічається. Якщо результат більший за 1, це означає, що значення є дублікатом.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат