Описова Статистика
Розуміння ваших даних починається з описової статистики — вона надає основні підсумки щодо розподілу, центральної тенденції та розсіювання змінних.
Базова описова статистика
Найпоширеніші статистичні показники:
- Середнє: середнє значення;
- Стандартне відхилення: наскільки значення відхиляються від середнього;
- Медіана: серединне значення;
- Мін / макс: найменше та найбільше значення.
Ці показники дають швидке уявлення про розподіл ваших змінних.
Базовий R
Базовий R надає прості функції для обчислення описової статистики. Функція summary()
також створює швидкий статистичний огляд усіх числових стовпців.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
За допомогою dplyr
можна використовувати summarise()
для обчислення кількох статистичних показників одночасно у зручному та читабельному форматі.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
What is the difference between mean, median, and mode?
Can you explain how to interpret standard deviation and variance?
How do I use dplyr to calculate descriptive statistics for grouped data?
Awesome!
Completion rate improved to 4
Описова Статистика
Свайпніть щоб показати меню
Розуміння ваших даних починається з описової статистики — вона надає основні підсумки щодо розподілу, центральної тенденції та розсіювання змінних.
Базова описова статистика
Найпоширеніші статистичні показники:
- Середнє: середнє значення;
- Стандартне відхилення: наскільки значення відхиляються від середнього;
- Медіана: серединне значення;
- Мін / макс: найменше та найбільше значення.
Ці показники дають швидке уявлення про розподіл ваших змінних.
Базовий R
Базовий R надає прості функції для обчислення описової статистики. Функція summary()
також створює швидкий статистичний огляд усіх числових стовпців.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
За допомогою dplyr
можна використовувати summarise()
для обчислення кількох статистичних показників одночасно у зручному та читабельному форматі.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Дякуємо за ваш відгук!