Tipos de Datos
Cada columna (característica) en un conjunto de entrenamiento tiene un tipo de dato asociado. Estos tipos de datos pueden agruparse en numéricos, categóricos y fecha y/o hora.
La mayoría de los algoritmos de aprendizaje automático funcionan correctamente solo con datos numéricos, por lo que los valores categóricos y de fecha y hora deben convertirse en números.
Para fecha y hora, se pueden extraer características como 'year', 'month' y similares, dependiendo de la tarea. Estos ya son valores numéricos, por lo que pueden utilizarse directamente.
Los datos categóricos presentan un desafío adicional.
Tipos de datos categóricos
Los datos categóricos se clasifican en dos tipos:
-
Datos ordinales: tipo de datos categóricos en los que las categorías siguen un orden natural. Por ejemplo, nivel educativo (de escuela primaria a doctorado) o calificaciones (de muy malo a muy bueno), etc.;
-
Datos nominales: tipo de datos categóricos que no siguen un orden natural. Por ejemplo, nombre, género, país de origen, etc.
La conversión de los tipos de datos ordinales y nominales en valores numéricos requiere enfoques diferentes, por lo que deben tratarse por separado.
Existen mejores formas de convertir fechas en valores numéricos que van más allá del alcance de este curso introductorio. Por ejemplo, si solo usamos la característica 'month', no se considera que el mes 12 está en realidad más cerca del mes 1 que del mes 9.
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 3.13
Tipos de Datos
Desliza para mostrar el menú
Cada columna (característica) en un conjunto de entrenamiento tiene un tipo de dato asociado. Estos tipos de datos pueden agruparse en numéricos, categóricos y fecha y/o hora.
La mayoría de los algoritmos de aprendizaje automático funcionan correctamente solo con datos numéricos, por lo que los valores categóricos y de fecha y hora deben convertirse en números.
Para fecha y hora, se pueden extraer características como 'year', 'month' y similares, dependiendo de la tarea. Estos ya son valores numéricos, por lo que pueden utilizarse directamente.
Los datos categóricos presentan un desafío adicional.
Tipos de datos categóricos
Los datos categóricos se clasifican en dos tipos:
-
Datos ordinales: tipo de datos categóricos en los que las categorías siguen un orden natural. Por ejemplo, nivel educativo (de escuela primaria a doctorado) o calificaciones (de muy malo a muy bueno), etc.;
-
Datos nominales: tipo de datos categóricos que no siguen un orden natural. Por ejemplo, nombre, género, país de origen, etc.
La conversión de los tipos de datos ordinales y nominales en valores numéricos requiere enfoques diferentes, por lo que deben tratarse por separado.
Existen mejores formas de convertir fechas en valores numéricos que van más allá del alcance de este curso introductorio. Por ejemplo, si solo usamos la característica 'month', no se considera que el mes 12 está en realidad más cerca del mes 1 que del mes 9.
¡Gracias por tus comentarios!