Correlatieanalyse
Correlatieanalyse is een statistische techniek die wordt gebruikt om de sterkte en richting van een relatie tussen twee numerieke variabelen te meten. Het helpt ons te begrijpen hoe veranderingen in de ene variabele samenhangen met veranderingen in een andere.
Wat is correlatie?
Een correlatiecoëfficiënt (meestal weergegeven als r) varieert tussen -1 en 1 en betekent:
- 1: perfecte positieve correlatie;
- 0: geen correlatie;
- −1: perfecte negatieve correlatie.
Er zijn verschillende soorten correlatiemethoden, maar de Pearson-correlatie is de meest gebruikte voor numerieke continue gegevens in R.
Correlatie tussen twee variabelen
U kunt de functie cor()
gebruiken om de correlatiecoëfficiënt tussen twee variabelen te berekenen. U hoeft alleen twee kolommen als parameters op te geven.
cor(df$selling_price, df$km_driven)
Als resultaat geeft de functie een waarde tussen -1 en 1 terug.
Correlatiematrix (Meerdere Variabelen)
Dezelfde functie kan worden gebruikt om relaties tussen meerdere variabelen te onderzoeken.
# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs") # Ignores any rows with missing data
Het resultaat wordt opgeslagen als een matrix die de paargewijze correlatiewaarden tussen alle geselecteerde numerieke variabelen toont.
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 4
Correlatieanalyse
Veeg om het menu te tonen
Correlatieanalyse is een statistische techniek die wordt gebruikt om de sterkte en richting van een relatie tussen twee numerieke variabelen te meten. Het helpt ons te begrijpen hoe veranderingen in de ene variabele samenhangen met veranderingen in een andere.
Wat is correlatie?
Een correlatiecoëfficiënt (meestal weergegeven als r) varieert tussen -1 en 1 en betekent:
- 1: perfecte positieve correlatie;
- 0: geen correlatie;
- −1: perfecte negatieve correlatie.
Er zijn verschillende soorten correlatiemethoden, maar de Pearson-correlatie is de meest gebruikte voor numerieke continue gegevens in R.
Correlatie tussen twee variabelen
U kunt de functie cor()
gebruiken om de correlatiecoëfficiënt tussen twee variabelen te berekenen. U hoeft alleen twee kolommen als parameters op te geven.
cor(df$selling_price, df$km_driven)
Als resultaat geeft de functie een waarde tussen -1 en 1 terug.
Correlatiematrix (Meerdere Variabelen)
Dezelfde functie kan worden gebruikt om relaties tussen meerdere variabelen te onderzoeken.
# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs") # Ignores any rows with missing data
Het resultaat wordt opgeslagen als een matrix die de paargewijze correlatiewaarden tussen alle geselecteerde numerieke variabelen toont.
Bedankt voor je feedback!