Видалення Викидів за Допомогою Методу IQR
Ще одним ефективним способом виявлення та видалення викидів є використання методу міжквартильного розмаху (IQR).
Що таке IQR?
Міжквартильний розмах (IQR) — це міра статистичного розсіювання, яка обчислюється за формулою:
IQR=Q3−Q1Де:
- Q1: 25-й процентиль (перший квартиль);
- Q3: 75-й процентиль (третій квартиль).
Значення, що лежать нижче Q1−1.5×IQR або вище Q3+1.5×IQR, зазвичай вважаються викидами.
Обчислення IQR
Щоб обчислити значення IQR та виявити викиди, спочатку потрібно знати значення 25-го та 75-го процентилів. Їх можна отримати за допомогою функції quantile()
. Далі можна обчислити значення IQR за наведеною формулою.
q1_placement <- quantile(df$placement_exam_marks, 0.25)
q3_placement <- quantile(df$placement_exam_marks, 0.75)
iqr_placement <- q3_placement - q1_placement
Визначення викидів
Подібно до методу z-оцінки, необхідно визначити нижню та верхню межі:
Thresh_hold <- 1.5
upper_boundary <- q3_placement + (Thresh_hold * iqr_placement)
lower_boundary <- q1_placement - (Thresh_hold * iqr_placement)
Далі можна вибрати всі викиди для їх аналізу:
df[df$placement_exam_marks > upper_boundary | df$placement_exam_marks < lower_boundary,]
Або створити набір даних без викидів:
df2 <- df[df$placement_exam_marks <= upper_boundary & df$placement_exam_marks >= lower_boundary,]
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 4
Видалення Викидів за Допомогою Методу IQR
Свайпніть щоб показати меню
Ще одним ефективним способом виявлення та видалення викидів є використання методу міжквартильного розмаху (IQR).
Що таке IQR?
Міжквартильний розмах (IQR) — це міра статистичного розсіювання, яка обчислюється за формулою:
IQR=Q3−Q1Де:
- Q1: 25-й процентиль (перший квартиль);
- Q3: 75-й процентиль (третій квартиль).
Значення, що лежать нижче Q1−1.5×IQR або вище Q3+1.5×IQR, зазвичай вважаються викидами.
Обчислення IQR
Щоб обчислити значення IQR та виявити викиди, спочатку потрібно знати значення 25-го та 75-го процентилів. Їх можна отримати за допомогою функції quantile()
. Далі можна обчислити значення IQR за наведеною формулою.
q1_placement <- quantile(df$placement_exam_marks, 0.25)
q3_placement <- quantile(df$placement_exam_marks, 0.75)
iqr_placement <- q3_placement - q1_placement
Визначення викидів
Подібно до методу z-оцінки, необхідно визначити нижню та верхню межі:
Thresh_hold <- 1.5
upper_boundary <- q3_placement + (Thresh_hold * iqr_placement)
lower_boundary <- q1_placement - (Thresh_hold * iqr_placement)
Далі можна вибрати всі викиди для їх аналізу:
df[df$placement_exam_marks > upper_boundary | df$placement_exam_marks < lower_boundary,]
Або створити набір даних без викидів:
df2 <- df[df$placement_exam_marks <= upper_boundary & df$placement_exam_marks >= lower_boundary,]
Дякуємо за ваш відгук!