Korrelationsanalyse
Korrelationsanalyse ist eine statistische Methode zur Messung der Stärke und Richtung einer Beziehung zwischen zwei numerischen Variablen. Sie ermöglicht das Verständnis, wie Veränderungen in einer Variablen mit Veränderungen in einer anderen zusammenhängen.
Was ist Korrelation?
Ein Korrelationskoeffizient (in der Regel als r dargestellt) liegt zwischen -1 und 1 und bedeutet:
- 1: perfekte positive Korrelation;
- 0: keine Korrelation;
- −1: perfekte negative Korrelation.
Es gibt verschiedene Arten von Korrelationsmethoden, aber die Pearson-Korrelation ist die am häufigsten verwendete Methode für numerische kontinuierliche Daten in R.
Korrelation zwischen zwei Variablen
Mit der Funktion cor()
kann der Korrelationskoeffizient zwischen zwei Variablen berechnet werden. Es müssen lediglich zwei Spalten als Parameter angegeben werden.
cor(df$selling_price, df$km_driven)
Als Ergebnis gibt die Funktion einen Wert zwischen -1 und 1 zurück.
Korrelationsmatrix (Mehrere Variablen)
Die gleiche Funktion kann verwendet werden, um Beziehungen zwischen mehreren Variablen zu untersuchen.
# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs") # Ignores any rows with missing data
Das Ergebnis wird als Matrix gespeichert, die paarweise Korrelationswerte zwischen allen ausgewählten numerischen Variablen anzeigt.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 4
Korrelationsanalyse
Swipe um das Menü anzuzeigen
Korrelationsanalyse ist eine statistische Methode zur Messung der Stärke und Richtung einer Beziehung zwischen zwei numerischen Variablen. Sie ermöglicht das Verständnis, wie Veränderungen in einer Variablen mit Veränderungen in einer anderen zusammenhängen.
Was ist Korrelation?
Ein Korrelationskoeffizient (in der Regel als r dargestellt) liegt zwischen -1 und 1 und bedeutet:
- 1: perfekte positive Korrelation;
- 0: keine Korrelation;
- −1: perfekte negative Korrelation.
Es gibt verschiedene Arten von Korrelationsmethoden, aber die Pearson-Korrelation ist die am häufigsten verwendete Methode für numerische kontinuierliche Daten in R.
Korrelation zwischen zwei Variablen
Mit der Funktion cor()
kann der Korrelationskoeffizient zwischen zwei Variablen berechnet werden. Es müssen lediglich zwei Spalten als Parameter angegeben werden.
cor(df$selling_price, df$km_driven)
Als Ergebnis gibt die Funktion einen Wert zwischen -1 und 1 zurück.
Korrelationsmatrix (Mehrere Variablen)
Die gleiche Funktion kann verwendet werden, um Beziehungen zwischen mehreren Variablen zu untersuchen.
# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs") # Ignores any rows with missing data
Das Ergebnis wird als Matrix gespeichert, die paarweise Korrelationswerte zwischen allen ausgewählten numerischen Variablen anzeigt.
Danke für Ihr Feedback!