Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Видалення Викидів за Допомогою Методу IQR | Базовий Статистичний Аналіз
Quizzes & Challenges
Quizzes
Challenges
/
Аналіз Даних у R

bookВидалення Викидів за Допомогою Методу IQR

Ще одним ефективним способом виявлення та видалення викидів є використання методу міжквартильного розмаху (IQR).

Що таке IQR?

Міжквартильний розмах (IQR) — це міра статистичного розсіювання, яка обчислюється за формулою:

IQR=Q3Q1IQR = Q3−Q1

Де:

  • Q1Q1: 25-й процентиль (перший квартиль);
  • Q3Q3: 75-й процентиль (третій квартиль).

Значення, що лежать нижче Q11.5×IQRQ1 − 1.5 \times IQR або вище Q3+1.5×IQRQ3 + 1.5 \times IQR, зазвичай вважаються викидами.

Обчислення IQR

Щоб обчислити значення IQR та виявити викиди, спочатку потрібно знати значення 25-го та 75-го процентилів. Їх можна отримати за допомогою функції quantile(). Далі можна обчислити значення IQR за наведеною формулою.

q1_placement <- quantile(df$placement_exam_marks, 0.25)
q3_placement <- quantile(df$placement_exam_marks, 0.75)
iqr_placement <- q3_placement - q1_placement

Визначення викидів

Подібно до методу z-оцінки, необхідно визначити нижню та верхню межі:

Thresh_hold <- 1.5
upper_boundary <- q3_placement + (Thresh_hold * iqr_placement)
lower_boundary <- q1_placement - (Thresh_hold * iqr_placement)

Далі можна або вибрати всі викиди для аналізу:

df[df$placement_exam_marks > upper_boundary | df$placement_exam_marks < lower_boundary,]

Або створити набір даних без викидів:

df2 <- df[df$placement_exam_marks <= upper_boundary & df$placement_exam_marks >= lower_boundary,]
question mark

Що означає IQR?

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 4

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

bookВидалення Викидів за Допомогою Методу IQR

Свайпніть щоб показати меню

Ще одним ефективним способом виявлення та видалення викидів є використання методу міжквартильного розмаху (IQR).

Що таке IQR?

Міжквартильний розмах (IQR) — це міра статистичного розсіювання, яка обчислюється за формулою:

IQR=Q3Q1IQR = Q3−Q1

Де:

  • Q1Q1: 25-й процентиль (перший квартиль);
  • Q3Q3: 75-й процентиль (третій квартиль).

Значення, що лежать нижче Q11.5×IQRQ1 − 1.5 \times IQR або вище Q3+1.5×IQRQ3 + 1.5 \times IQR, зазвичай вважаються викидами.

Обчислення IQR

Щоб обчислити значення IQR та виявити викиди, спочатку потрібно знати значення 25-го та 75-го процентилів. Їх можна отримати за допомогою функції quantile(). Далі можна обчислити значення IQR за наведеною формулою.

q1_placement <- quantile(df$placement_exam_marks, 0.25)
q3_placement <- quantile(df$placement_exam_marks, 0.75)
iqr_placement <- q3_placement - q1_placement

Визначення викидів

Подібно до методу z-оцінки, необхідно визначити нижню та верхню межі:

Thresh_hold <- 1.5
upper_boundary <- q3_placement + (Thresh_hold * iqr_placement)
lower_boundary <- q1_placement - (Thresh_hold * iqr_placement)

Далі можна або вибрати всі викиди для аналізу:

df[df$placement_exam_marks > upper_boundary | df$placement_exam_marks < lower_boundary,]

Або створити набір даних без викидів:

df2 <- df[df$placement_exam_marks <= upper_boundary & df$placement_exam_marks >= lower_boundary,]
question mark

Що означає IQR?

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 4
some-alt