Visualisering af Korrelationer med Spredningsdiagrammer
Stryg for at vise menuen
Selvom korrelationsvarmekort giver et overblik over lineære sammenhænge mellem variable, kan de ikke bruges til at identificere ikke-lineære relationer. I disse situationer er spredningsdiagrammer mere anvendelige.
Hvorfor bruge spredningsdiagrammer?
Spredningsdiagrammer er en enkel, men effektiv metode til at visualisere forholdet mellem to numeriske variable. De gør det muligt at opdage både lineære og ikke-lineære tendenser, fremhæve afvigere eller anomalier og give dybere indsigt i relationer, som måske kun fremstår abstrakt i et korrelationsvarmekort. Ved at plotte individuelle datapunkter giver spredningsdiagrammer et klart og intuitivt billede af, hvordan variable interagerer.
Eksempel: Selling Price vs. Max Power
Et spredningsdiagram kan bruges til at undersøge, hvordan en bils effekt påvirker dens markedsværdi. I dette tilfælde repræsenterer x-aksen maksimal effekt, mens y-aksen repræsenterer salgsprisen.
ggplot(data = df, aes(x = max_power, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Max Power",
x = "Max Power",
y = "Selling Price")
Denne visualisering gør det let at se, om der eksisterer en positiv lineær sammenhæng, hvor højere effekt generelt svarer til en højere salgspris.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat