Statistiche Descrittive
La comprensione dei dati inizia con le statistiche descrittive: queste forniscono sintesi essenziali sulla distribuzione, la tendenza centrale e la dispersione delle variabili.
Statistiche descrittive di base
Le misure statistiche più comuni sono:
- Media: valore medio;
- Deviazione standard: misura di quanto i valori si discostano dalla media;
- Mediana: valore centrale;
- Min / max: valori minimo e massimo.
Queste misure offrono una panoramica rapida della distribuzione delle variabili.
Base R
Base R offre funzioni semplici per il calcolo delle statistiche descrittive. La funzione summary()
produce anche una panoramica statistica rapida di tutte le colonne numeriche.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Con dplyr
, è possibile utilizzare summarise()
per calcolare più statistiche contemporaneamente in un formato chiaro e leggibile.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 4
Statistiche Descrittive
Scorri per mostrare il menu
La comprensione dei dati inizia con le statistiche descrittive: queste forniscono sintesi essenziali sulla distribuzione, la tendenza centrale e la dispersione delle variabili.
Statistiche descrittive di base
Le misure statistiche più comuni sono:
- Media: valore medio;
- Deviazione standard: misura di quanto i valori si discostano dalla media;
- Mediana: valore centrale;
- Min / max: valori minimo e massimo.
Queste misure offrono una panoramica rapida della distribuzione delle variabili.
Base R
Base R offre funzioni semplici per il calcolo delle statistiche descrittive. La funzione summary()
produce anche una panoramica statistica rapida di tutte le colonne numeriche.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Con dplyr
, è possibile utilizzare summarise()
per calcolare più statistiche contemporaneamente in un formato chiaro e leggibile.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Grazie per i tuoi commenti!