Deskriptiv Statistik
Att förstå dina data börjar med deskriptiv statistik – dessa ger viktiga sammanfattningar om fördelning, centralmått och spridning av variabler.
Grundläggande deskriptiv statistik
De vanligaste statistiska måtten är:
- Medelvärde: genomsnittligt värde;
- Standardavvikelse: hur mycket värdena avviker från medelvärdet;
- Median: mittersta värdet;
- Min / max: minsta och största värdena.
Dessa ger en snabb överblick över hur dina variabler är fördelade.
Base R
Base R tillhandahåller enkla funktioner för att beräkna deskriptiv statistik. Funktionen summary()
ger också en snabb statistisk översikt av alla numeriska kolumner.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Med dplyr
kan du använda summarise()
för att beräkna flera statistikvärden samtidigt i ett tydligt och läsbart format.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
What is the difference between mean, median, and mode?
Can you explain how to interpret standard deviation and variance?
How do I use dplyr to calculate descriptive statistics for grouped data?
Awesome!
Completion rate improved to 4
Deskriptiv Statistik
Svep för att visa menyn
Att förstå dina data börjar med deskriptiv statistik – dessa ger viktiga sammanfattningar om fördelning, centralmått och spridning av variabler.
Grundläggande deskriptiv statistik
De vanligaste statistiska måtten är:
- Medelvärde: genomsnittligt värde;
- Standardavvikelse: hur mycket värdena avviker från medelvärdet;
- Median: mittersta värdet;
- Min / max: minsta och största värdena.
Dessa ger en snabb överblick över hur dina variabler är fördelade.
Base R
Base R tillhandahåller enkla funktioner för att beräkna deskriptiv statistik. Funktionen summary()
ger också en snabb statistisk översikt av alla numeriska kolumner.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Med dplyr
kan du använda summarise()
för att beräkna flera statistikvärden samtidigt i ett tydligt och läsbart format.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Tack för dina kommentarer!