Análisis de Correlación
El análisis de correlación es una técnica estadística utilizada para medir la fuerza y la dirección de la relación entre dos variables numéricas. Nos ayuda a comprender cómo los cambios en una variable están asociados con los cambios en otra.
¿Qué es la correlación?
Un coeficiente de correlación (usualmente representado como r) varía entre -1 y 1 y significa:
- 1: correlación positiva perfecta;
- 0: sin correlación;
- −1: correlación negativa perfecta.
Existen varios tipos de métodos de correlación, pero la correlación de Pearson es la más utilizada para datos numéricos continuos en R.
Correlación entre dos variables
Se puede utilizar la función cor()
para calcular el coeficiente de correlación entre dos variables. Solo es necesario proporcionar dos columnas como parámetros.
cor(df$selling_price, df$km_driven)
Como resultado, la función devuelve un valor entre -1 y 1.
Matriz de correlación (múltiples variables)
La misma función puede utilizarse para examinar las relaciones entre múltiples variables.
# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs") # Ignores any rows with missing data
El resultado se almacena como una matriz que muestra los valores de correlación por pares entre todas las variables numéricas seleccionadas.
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 4
Análisis de Correlación
Desliza para mostrar el menú
El análisis de correlación es una técnica estadística utilizada para medir la fuerza y la dirección de la relación entre dos variables numéricas. Nos ayuda a comprender cómo los cambios en una variable están asociados con los cambios en otra.
¿Qué es la correlación?
Un coeficiente de correlación (usualmente representado como r) varía entre -1 y 1 y significa:
- 1: correlación positiva perfecta;
- 0: sin correlación;
- −1: correlación negativa perfecta.
Existen varios tipos de métodos de correlación, pero la correlación de Pearson es la más utilizada para datos numéricos continuos en R.
Correlación entre dos variables
Se puede utilizar la función cor()
para calcular el coeficiente de correlación entre dos variables. Solo es necesario proporcionar dos columnas como parámetros.
cor(df$selling_price, df$km_driven)
Como resultado, la función devuelve un valor entre -1 y 1.
Matriz de correlación (múltiples variables)
La misma función puede utilizarse para examinar las relaciones entre múltiples variables.
# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs") # Ignores any rows with missing data
El resultado se almacena como una matriz que muestra los valores de correlación por pares entre todas las variables numéricas seleccionadas.
¡Gracias por tus comentarios!