Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Видалення Викидів за Допомогою Методу Z-Оцінки | Базовий Статистичний Аналіз
Аналіз Даних у R

bookВидалення Викидів за Допомогою Методу Z-Оцінки

Одним із поширених методів виявлення та видалення викидів є метод z-оцінки. Цей підхід визначає, наскільки далеко точка даних знаходиться від середнього значення у стандартних відхиленнях. Якщо точка даних виходить за певний поріг (зазвичай ±3), її вважають викидом.

Що таке z-оцінка?

Z-оцінка (також відома як стандартна оцінка) обчислюється за формулою:

Z=XμσZ = \frac{X - \mu}{\sigma}

Де:

  • XX: вихідна точка даних;
  • μ\mu: середнє значення набору даних;
  • σ\sigma: стандартне відхилення набору даних.

Обчислення z-оцінок

Ви можете обчислити z-оцінки вручну за формулою:

mean_cgpa <- mean(df$cgpa)
sd_cgpa <- sd(df$cgpa)
df$cgpa_zscore <- (df$cgpa - mean_cgpa) / sd_cgpa

Або скористатися вбудованою функцією:

df$cgpa_zscore <- scale(df$cgpa)

Виявлення викидів

Після обчислення z-оцінок можна вибрати порогове значення (±3 у цьому випадку) та застосувати просту операцію фільтрації для вибору всіх записів, що виходять за межі діапазону:

thresh_hold <- 3
outliers <- df[df$cgpa_zscore > thresh_hold | df$cgpa_zscore < -thresh_hold, ]

Або можна вибрати всі записи всередині діапазону, щоб створити набір даних без викидів:

df2 <- df[df$cgpa_zscore < thresh_hold & df$cgpa_zscore > -thresh_hold, ]
question mark

Що відбувається зі значеннями із z-оцінками за межами ±3?

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 3

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Awesome!

Completion rate improved to 4

bookВидалення Викидів за Допомогою Методу Z-Оцінки

Свайпніть щоб показати меню

Одним із поширених методів виявлення та видалення викидів є метод z-оцінки. Цей підхід визначає, наскільки далеко точка даних знаходиться від середнього значення у стандартних відхиленнях. Якщо точка даних виходить за певний поріг (зазвичай ±3), її вважають викидом.

Що таке z-оцінка?

Z-оцінка (також відома як стандартна оцінка) обчислюється за формулою:

Z=XμσZ = \frac{X - \mu}{\sigma}

Де:

  • XX: вихідна точка даних;
  • μ\mu: середнє значення набору даних;
  • σ\sigma: стандартне відхилення набору даних.

Обчислення z-оцінок

Ви можете обчислити z-оцінки вручну за формулою:

mean_cgpa <- mean(df$cgpa)
sd_cgpa <- sd(df$cgpa)
df$cgpa_zscore <- (df$cgpa - mean_cgpa) / sd_cgpa

Або скористатися вбудованою функцією:

df$cgpa_zscore <- scale(df$cgpa)

Виявлення викидів

Після обчислення z-оцінок можна вибрати порогове значення (±3 у цьому випадку) та застосувати просту операцію фільтрації для вибору всіх записів, що виходять за межі діапазону:

thresh_hold <- 3
outliers <- df[df$cgpa_zscore > thresh_hold | df$cgpa_zscore < -thresh_hold, ]

Або можна вибрати всі записи всередині діапазону, щоб створити набір даних без викидів:

df2 <- df[df$cgpa_zscore < thresh_hold & df$cgpa_zscore > -thresh_hold, ]
question mark

Що відбувається зі значеннями із z-оцінками за межами ±3?

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 3
some-alt