**Escalado de datos** y **normalización** son dos términos que a menudo se utilizan indistintamente, pero en realidad se refieren a conceptos ligeramente diferentes.

El escalado de datos se refiere a la transformación de los valores de un conjunto de datos para que caigan dentro de un rango específico. Esto puede implicar reescalar los datos a un valor mínimo y máximo específico, o estandarizar los datos para que tengan una media de cero y una desviación estándar de uno. *El objetivo del escalado de datos es garantizar que todas las características del conjunto de datos estén en la misma escala para que ninguna domine sobre las demás*.

La normalización, por su parte, se refiere al proceso de transformar los valores de un conjunto de datos para que se ajusten a una distribución específica. Esto puede implicar la transformación de los datos para que tengan una distribución normal (gaussiana) u otra distribución. *El objetivo de la normalización es hacer que los datos sean más interpretables o que cumplan los supuestos de una prueba estadística concreta o de un algoritmo de aprendizaje automático*.

El escalado de datos es un paso de preprocesamiento más común en el aprendizaje automático, ya que a menudo es necesario asegurarse de que todas las características están en la misma escala para evitar sesgos y mejorar la precisión. La normalización se utiliza con menos frecuencia, pero puede ser importante en determinadas situaciones, como cuando se trabaja con datos con una distribución sesgada o cuando se utilizan determinadas pruebas estadísticas.


Crear un modelo de aprendizaje automático parece ser la tarea más difícil y esencial. Pero primero, ¡hay que trabajar con datos! Aprenda a procesar conjuntos de datos y a prepararlos completamente para su uso. En nuestro curso le esperan datos numéricos, categóricos y temporales.

¿Diferentes tipos de datos? ¿Cómo trabajar con ellos? Si tienes los ojos bien abiertos, no te preocupes, vamos a empezar con una breve descripción de la librería pandas y aprender cómo trabajar con ella en el futuro.

Este capítulo trata en detalle cómo trabajar con datos cuantitativos, con qué métodos se procesan, en qué se diferencian el escalado y la normalización de los datos, y mucho más.

¿Son los datos categóricos tan sencillos como cree? Averigüe cuál es la complejidad de procesarlos y trabajar con ellos.


El tratamiento de datos de series temporales es el proceso de manipulación, análisis y preparación de datos que se presentan como una secuencia de valores ordenados temporalmente. Descubra qué pasos incluye en esta sección.

¿Sabía que puede extraer aún más valores de sus datos y crear características más informativas? En esta sección, aprenderá a trabajar con la ingeniería de características.

Ha llegado al final de este curso. Pongamos a prueba tus conocimientos. Tienes 3 tareas para resolver.

Escalado de Datos vs Normalización de Datos