Statistiche Descrittive
La comprensione dei dati inizia con le statistiche descrittive: queste forniscono riepiloghi essenziali sulla distribuzione, la tendenza centrale e la dispersione delle variabili.
Statistiche descrittive di base
Le misure statistiche più comuni sono:
- Media: valore medio;
- Deviazione standard: quanto i valori si discostano dalla media;
- Mediana: valore centrale;
- Min / max: valori minimo e massimo.
Queste misure offrono una panoramica rapida della distribuzione delle variabili.
Base R
Base R offre funzioni semplici per calcolare le statistiche descrittive. La funzione summary()
produce anche una panoramica statistica rapida di tutte le colonne numeriche.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Con dplyr
, è possibile utilizzare summarise()
per calcolare più statistiche contemporaneamente in un formato chiaro e leggibile.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
What is the difference between mean, median, and mode?
Can you explain how to interpret standard deviation and variance?
How do I use dplyr to calculate descriptive statistics for grouped data?
Awesome!
Completion rate improved to 4
Statistiche Descrittive
Scorri per mostrare il menu
La comprensione dei dati inizia con le statistiche descrittive: queste forniscono riepiloghi essenziali sulla distribuzione, la tendenza centrale e la dispersione delle variabili.
Statistiche descrittive di base
Le misure statistiche più comuni sono:
- Media: valore medio;
- Deviazione standard: quanto i valori si discostano dalla media;
- Mediana: valore centrale;
- Min / max: valori minimo e massimo.
Queste misure offrono una panoramica rapida della distribuzione delle variabili.
Base R
Base R offre funzioni semplici per calcolare le statistiche descrittive. La funzione summary()
produce anche una panoramica statistica rapida di tutte le colonne numeriche.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Con dplyr
, è possibile utilizzare summarise()
per calcolare più statistiche contemporaneamente in un formato chiaro e leggibile.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Grazie per i tuoi commenti!