Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Beskrivende Statistik | Grundlæggende Statistisk Analyse
Dataanalyse med R

bookBeskrivende Statistik

Forståelse af dine data begynder med deskriptiv statistik – disse giver væsentlige sammenfatninger om fordelingen, centraltendensen og spredningen af variable.

Grundlæggende deskriptiv statistik

De mest almindelige statistiske mål er:

  • Gennemsnit: gennemsnitsværdi;
  • Standardafvigelse: hvor meget værdierne afviger fra gennemsnittet;
  • Median: midterste værdi;
  • Min / max: mindste og største værdier.

Disse giver et hurtigt overblik over, hvordan dine variable er fordelt.

Base R

Base R tilbyder enkle funktioner til beregning af deskriptiv statistik. Funktionen summary() giver også et hurtigt statistisk overblik over alle numeriske kolonner.

mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)

dplyr

Med dplyr kan du bruge summarise() til at beregne flere statistikker på én gang i et overskueligt og læsbart format.

df %>%
  summarise(
    avg_power = mean(max_power, na.rm = TRUE),
    sd_power = sd(max_power, na.rm = TRUE),
    median_power = median(max_power, na.rm = TRUE)
  )
question mark

Hvad gør funktionen group_by()?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 1

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

What is the difference between mean, median, and mode?

Can you explain how to interpret standard deviation and variance?

How do I use dplyr to calculate descriptive statistics for grouped data?

Awesome!

Completion rate improved to 4

bookBeskrivende Statistik

Stryg for at vise menuen

Forståelse af dine data begynder med deskriptiv statistik – disse giver væsentlige sammenfatninger om fordelingen, centraltendensen og spredningen af variable.

Grundlæggende deskriptiv statistik

De mest almindelige statistiske mål er:

  • Gennemsnit: gennemsnitsværdi;
  • Standardafvigelse: hvor meget værdierne afviger fra gennemsnittet;
  • Median: midterste værdi;
  • Min / max: mindste og største værdier.

Disse giver et hurtigt overblik over, hvordan dine variable er fordelt.

Base R

Base R tilbyder enkle funktioner til beregning af deskriptiv statistik. Funktionen summary() giver også et hurtigt statistisk overblik over alle numeriske kolonner.

mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)

dplyr

Med dplyr kan du bruge summarise() til at beregne flere statistikker på én gang i et overskueligt og læsbart format.

df %>%
  summarise(
    avg_power = mean(max_power, na.rm = TRUE),
    sd_power = sd(max_power, na.rm = TRUE),
    median_power = median(max_power, na.rm = TRUE)
  )
question mark

Hvad gør funktionen group_by()?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 1
some-alt