Analisi della Correlazione
L'analisi della correlazione è una tecnica statistica utilizzata per misurare l'intensità e la direzione di una relazione tra due variabili numeriche. Aiuta a comprendere come le variazioni di una variabile siano associate alle variazioni di un'altra.
Che cos'è la correlazione?
Un coefficiente di correlazione (solitamente rappresentato come r) varia tra -1 e 1 e indica:
- 1: correlazione positiva perfetta;
- 0: nessuna correlazione;
- −1: correlazione negativa perfetta.
Esistono diversi metodi di correlazione, ma la correlazione di Pearson è la più comunemente utilizzata per dati numerici continui in R.
Correlazione tra due variabili
È possibile utilizzare la funzione cor()
per calcolare il coefficiente di correlazione tra due variabili. È sufficiente fornire due colonne come parametri.
cor(df$selling_price, df$km_driven)
Come risultato, la funzione restituisce un valore compreso tra -1 e 1.
Matrice di Correlazione (Variabili Multiple)
La stessa funzione può essere utilizzata per esaminare le relazioni tra più variabili.
# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs") # Ignores any rows with missing data
Il risultato viene memorizzato come una matrice che mostra i valori di correlazione a coppie tra tutte le variabili numeriche selezionate.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 4
Analisi della Correlazione
Scorri per mostrare il menu
L'analisi della correlazione è una tecnica statistica utilizzata per misurare l'intensità e la direzione di una relazione tra due variabili numeriche. Aiuta a comprendere come le variazioni di una variabile siano associate alle variazioni di un'altra.
Che cos'è la correlazione?
Un coefficiente di correlazione (solitamente rappresentato come r) varia tra -1 e 1 e indica:
- 1: correlazione positiva perfetta;
- 0: nessuna correlazione;
- −1: correlazione negativa perfetta.
Esistono diversi metodi di correlazione, ma la correlazione di Pearson è la più comunemente utilizzata per dati numerici continui in R.
Correlazione tra due variabili
È possibile utilizzare la funzione cor()
per calcolare il coefficiente di correlazione tra due variabili. È sufficiente fornire due colonne come parametri.
cor(df$selling_price, df$km_driven)
Come risultato, la funzione restituisce un valore compreso tra -1 e 1.
Matrice di Correlazione (Variabili Multiple)
La stessa funzione può essere utilizzata per esaminare le relazioni tra più variabili.
# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs") # Ignores any rows with missing data
Il risultato viene memorizzato come una matrice che mostra i valori di correlazione a coppie tra tutte le variabili numeriche selezionate.
Grazie per i tuoi commenti!