Описова Статистика
Розуміння даних починається з описової статистики — вона надає ключові підсумки щодо розподілу, центральної тенденції та розсіювання змінних.
Базова описова статистика
Найпоширеніші статистичні показники:
- Середнє: середнє значення;
- Стандартне відхилення: ступінь відхилення значень від середнього;
- Медіана: середнє значення;
- Мін / макс: найменше та найбільше значення.
Ці показники дають швидке уявлення про розподіл ваших змінних.
Базовий R
Базовий R надає прості функції для обчислення описової статистики. Функція summary()
також створює короткий статистичний огляд усіх числових стовпців.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
За допомогою dplyr
можна використовувати summarise()
для обчислення кількох статистичних показників одночасно у зручному та читабельному форматі.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 4
Описова Статистика
Свайпніть щоб показати меню
Розуміння даних починається з описової статистики — вона надає ключові підсумки щодо розподілу, центральної тенденції та розсіювання змінних.
Базова описова статистика
Найпоширеніші статистичні показники:
- Середнє: середнє значення;
- Стандартне відхилення: ступінь відхилення значень від середнього;
- Медіана: середнє значення;
- Мін / макс: найменше та найбільше значення.
Ці показники дають швидке уявлення про розподіл ваших змінних.
Базовий R
Базовий R надає прості функції для обчислення описової статистики. Функція summary()
також створює короткий статистичний огляд усіх числових стовпців.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
За допомогою dplyr
можна використовувати summarise()
для обчислення кількох статистичних показників одночасно у зручному та читабельному форматі.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Дякуємо за ваш відгук!