Encontrar los Parámetros
Ahora sabemos que la regresión lineal es simplemente una línea que se ajusta mejor a los datos. Pero, ¿cómo se puede determinar cuál es la correcta?
Se puede calcular la diferencia entre el valor predicho y el valor objetivo real para cada punto de datos en el conjunto de entrenamiento.
Estas diferencias se denominan residuos (o errores). El objetivo es hacer que los residuos sean lo más pequeños posible.
Mínimos Cuadrados Ordinarios
El enfoque predeterminado es el método de Mínimos Cuadrados Ordinarios (OLS):
Tomar cada residuo, elevarlo al cuadrado (principalmente para eliminar el signo del residuo) y sumar todos ellos.
Esto se denomina SSR (Suma de residuos al cuadrado). La tarea consiste en encontrar los parámetros que minimicen el SSR.
Ecuación Normal
Afortunadamente, no es necesario probar todas las rectas y calcular el SSR para cada una. La tarea de minimizar el SSR tiene una solución matemática que no requiere muchos recursos computacionales.
Esta solución se denomina Ecuación Normal.
Donde:
- β0,β1,…,βn – son los parámetros del modelo;
- X – es un arreglo de valores de características del conjunto de entrenamiento;
- Xk – es la potencia elemento a elemento $k$ del arreglo $X$;
- ytrue – es un arreglo de valores objetivo del conjunto de entrenamiento.
Esta ecuación proporciona los parámetros de una recta con el menor SSR.
¿No se entiende cómo funciona? ¡No hay problema! Es matemáticamente complejo. Sin embargo, no es necesario calcular los parámetros manualmente. Muchas bibliotecas ya han implementado la regresión lineal.
Cuestionario
1. Considera la imagen de arriba. ¿Qué línea de regresión es mejor?
2. y_true - y_predicted se denomina
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Genial!
Completion tasa mejorada a 3.33
Encontrar los Parámetros
Desliza para mostrar el menú
Ahora sabemos que la regresión lineal es simplemente una línea que se ajusta mejor a los datos. Pero, ¿cómo se puede determinar cuál es la correcta?
Se puede calcular la diferencia entre el valor predicho y el valor objetivo real para cada punto de datos en el conjunto de entrenamiento.
Estas diferencias se denominan residuos (o errores). El objetivo es hacer que los residuos sean lo más pequeños posible.
Mínimos Cuadrados Ordinarios
El enfoque predeterminado es el método de Mínimos Cuadrados Ordinarios (OLS):
Tomar cada residuo, elevarlo al cuadrado (principalmente para eliminar el signo del residuo) y sumar todos ellos.
Esto se denomina SSR (Suma de residuos al cuadrado). La tarea consiste en encontrar los parámetros que minimicen el SSR.
Ecuación Normal
Afortunadamente, no es necesario probar todas las rectas y calcular el SSR para cada una. La tarea de minimizar el SSR tiene una solución matemática que no requiere muchos recursos computacionales.
Esta solución se denomina Ecuación Normal.
Donde:
- β0,β1,…,βn – son los parámetros del modelo;
- X – es un arreglo de valores de características del conjunto de entrenamiento;
- Xk – es la potencia elemento a elemento $k$ del arreglo $X$;
- ytrue – es un arreglo de valores objetivo del conjunto de entrenamiento.
Esta ecuación proporciona los parámetros de una recta con el menor SSR.
¿No se entiende cómo funciona? ¡No hay problema! Es matemáticamente complejo. Sin embargo, no es necesario calcular los parámetros manualmente. Muchas bibliotecas ya han implementado la regresión lineal.
Cuestionario
1. Considera la imagen de arriba. ¿Qué línea de regresión es mejor?
2. y_true - y_predicted se denomina
¡Gracias por tus comentarios!