Beschrijvende Statistiek
Inzicht in uw gegevens begint met beschrijvende statistieken - deze bieden essentiële samenvattingen over de verdeling, centrale tendens en spreiding van variabelen.
Basis Beschrijvende Statistieken
De meest voorkomende statistische maten zijn:
- Gemiddelde: gemiddelde waarde;
- Standaarddeviatie: mate van afwijking van waarden ten opzichte van het gemiddelde;
- Mediaan: middelste waarde;
- Min / max: kleinste en grootste waarden.
Deze geven een snel overzicht van hoe uw variabelen zijn verdeeld.
Base R
Base R biedt eenvoudige functies voor het berekenen van beschrijvende statistieken. De functie summary()
geeft ook een snel statistisch overzicht van alle numerieke kolommen.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Met dplyr
kun je summarise()
gebruiken om meerdere statistieken tegelijk te berekenen in een overzichtelijk en leesbaar formaat.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 4
Beschrijvende Statistiek
Veeg om het menu te tonen
Inzicht in uw gegevens begint met beschrijvende statistieken - deze bieden essentiële samenvattingen over de verdeling, centrale tendens en spreiding van variabelen.
Basis Beschrijvende Statistieken
De meest voorkomende statistische maten zijn:
- Gemiddelde: gemiddelde waarde;
- Standaarddeviatie: mate van afwijking van waarden ten opzichte van het gemiddelde;
- Mediaan: middelste waarde;
- Min / max: kleinste en grootste waarden.
Deze geven een snel overzicht van hoe uw variabelen zijn verdeeld.
Base R
Base R biedt eenvoudige functies voor het berekenen van beschrijvende statistieken. De functie summary()
geeft ook een snel statistisch overzicht van alle numerieke kolommen.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Met dplyr
kun je summarise()
gebruiken om meerdere statistieken tegelijk te berekenen in een overzichtelijk en leesbaar formaat.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Bedankt voor je feedback!