Beschrijvende Statistiek
Inzicht in uw gegevens begint met beschrijvende statistieken - deze bieden essentiële samenvattingen over de verdeling, centrale tendentie en spreiding van variabelen.
Basis Beschrijvende Statistieken
De meest voorkomende statistische maten zijn:
- Gemiddelde: gemiddelde waarde;
- Standaarddeviatie: mate van afwijking van waarden ten opzichte van het gemiddelde;
- Mediaan: middelste waarde;
- Min / max: kleinste en grootste waarden.
Deze geven een snel overzicht van hoe uw variabelen zijn verdeeld.
Base R
Base R biedt eenvoudige functies voor het berekenen van beschrijvende statistieken. De functie summary()
geeft ook een snel statistisch overzicht van alle numerieke kolommen.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Met dplyr
kun je met summarise()
meerdere statistieken tegelijk berekenen in een overzichtelijk en leesbaar formaat.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
What is the difference between mean, median, and mode?
Can you explain how to interpret standard deviation and variance?
How do I use dplyr to calculate descriptive statistics for grouped data?
Awesome!
Completion rate improved to 4
Beschrijvende Statistiek
Veeg om het menu te tonen
Inzicht in uw gegevens begint met beschrijvende statistieken - deze bieden essentiële samenvattingen over de verdeling, centrale tendentie en spreiding van variabelen.
Basis Beschrijvende Statistieken
De meest voorkomende statistische maten zijn:
- Gemiddelde: gemiddelde waarde;
- Standaarddeviatie: mate van afwijking van waarden ten opzichte van het gemiddelde;
- Mediaan: middelste waarde;
- Min / max: kleinste en grootste waarden.
Deze geven een snel overzicht van hoe uw variabelen zijn verdeeld.
Base R
Base R biedt eenvoudige functies voor het berekenen van beschrijvende statistieken. De functie summary()
geeft ook een snel statistisch overzicht van alle numerieke kolommen.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Met dplyr
kun je met summarise()
meerdere statistieken tegelijk berekenen in een overzichtelijk en leesbaar formaat.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Bedankt voor je feedback!