Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Escalado de Datos vs Normalización de Datos | Procesamiento de Datos Cuantitativos
Procesamiento Previo de Datos
course content

Contenido del Curso

Procesamiento Previo de Datos

Procesamiento Previo de Datos

1. Introducción Breve
2. Procesamiento de Datos Cuantitativos
3. Procesamiento de Datos Categóricos
4. Procesamiento de Datos de Series Temporales
5. Ingeniería de Características
6. Avanzando a Tareas

bookEscalado de Datos vs Normalización de Datos

Escalado de datos y normalización son dos términos que a menudo se utilizan indistintamente, pero en realidad se refieren a conceptos ligeramente diferentes.

El escalado de datos se refiere a la transformación de los valores de un conjunto de datos para que caigan dentro de un rango específico. Esto puede implicar reescalar los datos a un valor mínimo y máximo específico, o estandarizar los datos para que tengan una media de cero y una desviación estándar de uno. El objetivo del escalado de datos es garantizar que todas las características del conjunto de datos estén en la misma escala para que ninguna domine sobre las demás.

La normalización, por su parte, se refiere al proceso de transformar los valores de un conjunto de datos para que se ajusten a una distribución específica. Esto puede implicar la transformación de los datos para que tengan una distribución normal (gaussiana) u otra distribución. El objetivo de la normalización es hacer que los datos sean más interpretables o que cumplan los supuestos de una prueba estadística concreta o de un algoritmo de aprendizaje automático.

El escalado de datos es un paso de preprocesamiento más común en el aprendizaje automático, ya que a menudo es necesario asegurarse de que todas las características están en la misma escala para evitar sesgos y mejorar la precisión. La normalización se utiliza con menos frecuencia, pero puede ser importante en determinadas situaciones, como cuando se trabaja con datos con una distribución sesgada o cuando se utilizan determinadas pruebas estadísticas.

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 2. Capítulo 2
some-alt