Deskriptiv Statistik
Att förstå dina data börjar med deskriptiv statistik – dessa ger viktiga sammanfattningar om fördelning, centralmått och spridning av variabler.
Grundläggande deskriptiv statistik
De vanligaste statistiska måtten är:
- Medelvärde: genomsnittligt värde;
- Standardavvikelse: hur mycket värdena avviker från medelvärdet;
- Median: mittersta värdet;
- Min / max: minsta och största värdena.
Dessa ger en snabb översikt över hur dina variabler är fördelade.
Base R
Base R tillhandahåller enkla funktioner för att beräkna deskriptiv statistik. Funktionen summary()
ger också en snabb statistisk översikt av alla numeriska kolumner.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Med dplyr
kan du använda summarise()
för att beräkna flera statistiska mått samtidigt i ett tydligt och läsbart format.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 4
Deskriptiv Statistik
Svep för att visa menyn
Att förstå dina data börjar med deskriptiv statistik – dessa ger viktiga sammanfattningar om fördelning, centralmått och spridning av variabler.
Grundläggande deskriptiv statistik
De vanligaste statistiska måtten är:
- Medelvärde: genomsnittligt värde;
- Standardavvikelse: hur mycket värdena avviker från medelvärdet;
- Median: mittersta värdet;
- Min / max: minsta och största värdena.
Dessa ger en snabb översikt över hur dina variabler är fördelade.
Base R
Base R tillhandahåller enkla funktioner för att beräkna deskriptiv statistik. Funktionen summary()
ger också en snabb statistisk översikt av alla numeriska kolumner.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Med dplyr
kan du använda summarise()
för att beräkna flera statistiska mått samtidigt i ett tydligt och läsbart format.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Tack för dina kommentarer!