Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Видалення Викидів за Допомогою Методу IQR | Базовий Статистичний Аналіз
Аналіз Даних у R

bookВидалення Викидів за Допомогою Методу IQR

Ще одним ефективним способом виявлення та видалення викидів є використання методу міжквартильного розмаху (IQR).

Що таке IQR?

Міжквартильний розмах (IQR) — це міра статистичного розсіювання, яка обчислюється за формулою:

IQR=Q3Q1IQR = Q3−Q1

Де:

  • Q1Q1: 25-й процентиль (перший квартиль);
  • Q3Q3: 75-й процентиль (третій квартиль).

Значення, що лежать нижче Q11.5×IQRQ1 − 1.5 \times IQR або вище Q3+1.5×IQRQ3 + 1.5 \times IQR, зазвичай вважаються викидами.

Обчислення IQR

Щоб обчислити значення IQR та виявити викиди, спочатку потрібно знати значення 25-го та 75-го процентилів. Їх можна отримати за допомогою функції quantile(). Далі можна обчислити значення IQR за наведеною формулою.

q1_placement <- quantile(df$placement_exam_marks, 0.25)
q3_placement <- quantile(df$placement_exam_marks, 0.75)
iqr_placement <- q3_placement - q1_placement

Визначення викидів

Подібно до методу z-оцінки, необхідно визначити нижню та верхню межі:

Thresh_hold <- 1.5
upper_boundary <- q3_placement + (Thresh_hold * iqr_placement)
lower_boundary <- q1_placement - (Thresh_hold * iqr_placement)

Далі можна вибрати всі викиди для їх аналізу:

df[df$placement_exam_marks > upper_boundary | df$placement_exam_marks < lower_boundary,]

Або створити набір даних без викидів:

df2 <- df[df$placement_exam_marks <= upper_boundary & df$placement_exam_marks >= lower_boundary,]
question mark

Що означає IQR?

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 4

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Awesome!

Completion rate improved to 4

bookВидалення Викидів за Допомогою Методу IQR

Свайпніть щоб показати меню

Ще одним ефективним способом виявлення та видалення викидів є використання методу міжквартильного розмаху (IQR).

Що таке IQR?

Міжквартильний розмах (IQR) — це міра статистичного розсіювання, яка обчислюється за формулою:

IQR=Q3Q1IQR = Q3−Q1

Де:

  • Q1Q1: 25-й процентиль (перший квартиль);
  • Q3Q3: 75-й процентиль (третій квартиль).

Значення, що лежать нижче Q11.5×IQRQ1 − 1.5 \times IQR або вище Q3+1.5×IQRQ3 + 1.5 \times IQR, зазвичай вважаються викидами.

Обчислення IQR

Щоб обчислити значення IQR та виявити викиди, спочатку потрібно знати значення 25-го та 75-го процентилів. Їх можна отримати за допомогою функції quantile(). Далі можна обчислити значення IQR за наведеною формулою.

q1_placement <- quantile(df$placement_exam_marks, 0.25)
q3_placement <- quantile(df$placement_exam_marks, 0.75)
iqr_placement <- q3_placement - q1_placement

Визначення викидів

Подібно до методу z-оцінки, необхідно визначити нижню та верхню межі:

Thresh_hold <- 1.5
upper_boundary <- q3_placement + (Thresh_hold * iqr_placement)
lower_boundary <- q1_placement - (Thresh_hold * iqr_placement)

Далі можна вибрати всі викиди для їх аналізу:

df[df$placement_exam_marks > upper_boundary | df$placement_exam_marks < lower_boundary,]

Або створити набір даних без викидів:

df2 <- df[df$placement_exam_marks <= upper_boundary & df$placement_exam_marks >= lower_boundary,]
question mark

Що означає IQR?

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 4
some-alt