Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Correlatieanalyse | Basisstatistische Analyse
Data-analyse met R

bookCorrelatieanalyse

Correlatieanalyse is een statistische techniek die wordt gebruikt om de sterkte en richting van een relatie tussen twee numerieke variabelen te meten. Het helpt om te begrijpen hoe veranderingen in de ene variabele samenhangen met veranderingen in een andere.

Wat is correlatie?

Een correlatiecoëfficiënt (meestal weergegeven als rr) varieert tussen -1 en 1 en betekent:

  • 1: perfecte positieve correlatie;
  • 0: geen correlatie;
  • −1: perfecte negatieve correlatie.

Er zijn verschillende soorten correlatiemethoden, maar de Pearson-correlatie is het meest gebruikt voor numerieke continue gegevens in R.

Correlatie tussen twee variabelen

De cor()-functie kan worden gebruikt om de correlatiecoëfficiënt tussen twee variabelen te berekenen. Hiervoor moeten twee kolommen als parameters worden opgegeven.

cor(df$selling_price, df$km_driven)

Als resultaat geeft de functie een waarde tussen -1 en 1 terug.

Correlatiematrix (Meerdere Variabelen)

Dezelfde functie kan worden gebruikt om relaties tussen meerdere variabelen te onderzoeken.

# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")  # Ignores any rows with missing data

Het resultaat wordt opgeslagen als een matrix die de pairwise correlatiewaarden tussen alle geselecteerde numerieke variabelen toont.

question mark

Een correlatiecoëfficiënt van -0,9 geeft aan:

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 5

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Suggested prompts:

Can you explain the difference between positive and negative correlation with more examples?

How do I interpret the values in a correlation matrix?

What should I do if my data contains non-numeric columns or missing values?

Awesome!

Completion rate improved to 4

bookCorrelatieanalyse

Veeg om het menu te tonen

Correlatieanalyse is een statistische techniek die wordt gebruikt om de sterkte en richting van een relatie tussen twee numerieke variabelen te meten. Het helpt om te begrijpen hoe veranderingen in de ene variabele samenhangen met veranderingen in een andere.

Wat is correlatie?

Een correlatiecoëfficiënt (meestal weergegeven als rr) varieert tussen -1 en 1 en betekent:

  • 1: perfecte positieve correlatie;
  • 0: geen correlatie;
  • −1: perfecte negatieve correlatie.

Er zijn verschillende soorten correlatiemethoden, maar de Pearson-correlatie is het meest gebruikt voor numerieke continue gegevens in R.

Correlatie tussen twee variabelen

De cor()-functie kan worden gebruikt om de correlatiecoëfficiënt tussen twee variabelen te berekenen. Hiervoor moeten twee kolommen als parameters worden opgegeven.

cor(df$selling_price, df$km_driven)

Als resultaat geeft de functie een waarde tussen -1 en 1 terug.

Correlatiematrix (Meerdere Variabelen)

Dezelfde functie kan worden gebruikt om relaties tussen meerdere variabelen te onderzoeken.

# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")  # Ignores any rows with missing data

Het resultaat wordt opgeslagen als een matrix die de pairwise correlatiewaarden tussen alle geselecteerde numerieke variabelen toont.

question mark

Een correlatiecoëfficiënt van -0,9 geeft aan:

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 5
some-alt