Tipos de Datos
Cada columna (característica) en un conjunto de entrenamiento tiene un tipo de dato asociado. Estos tipos de datos pueden agruparse en numéricos, categóricos y fecha y/o hora.
Desafortunadamente, la mayoría de los algoritmos de aprendizaje automático solo funcionan bien con números. Por lo tanto, es necesario convertir los datos categóricos y los datos de fecha y hora a números.
En cuanto a la fecha y la hora, se pueden utilizar características como 'year'
, 'month'
, etc., según la tarea. Estas características son valores numéricos, por lo que no presentan inconvenientes.
Los datos categóricos son un poco más difíciles de manejar.
Tipos de datos categóricos
Los datos categóricos se clasifican en dos tipos:
-
Datos ordinales: son un tipo de datos categóricos en los que las categorías siguen un orden natural. Por ejemplo, nivel de educación (desde escuela primaria hasta doctorado) o calificaciones (de muy malo a muy bueno), etc.;
-
Datos nominales: son un tipo de datos categóricos que no siguen un orden natural. Por ejemplo, nombre, género, país de origen, etc.
Como verás en capítulos posteriores, la conversión de los tipos de datos ordinales y nominales a valores numéricos es diferente, por eso necesitamos separarlos.
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 3.13
Tipos de Datos
Desliza para mostrar el menú
Cada columna (característica) en un conjunto de entrenamiento tiene un tipo de dato asociado. Estos tipos de datos pueden agruparse en numéricos, categóricos y fecha y/o hora.
Desafortunadamente, la mayoría de los algoritmos de aprendizaje automático solo funcionan bien con números. Por lo tanto, es necesario convertir los datos categóricos y los datos de fecha y hora a números.
En cuanto a la fecha y la hora, se pueden utilizar características como 'year'
, 'month'
, etc., según la tarea. Estas características son valores numéricos, por lo que no presentan inconvenientes.
Los datos categóricos son un poco más difíciles de manejar.
Tipos de datos categóricos
Los datos categóricos se clasifican en dos tipos:
-
Datos ordinales: son un tipo de datos categóricos en los que las categorías siguen un orden natural. Por ejemplo, nivel de educación (desde escuela primaria hasta doctorado) o calificaciones (de muy malo a muy bueno), etc.;
-
Datos nominales: son un tipo de datos categóricos que no siguen un orden natural. Por ejemplo, nombre, género, país de origen, etc.
Como verás en capítulos posteriores, la conversión de los tipos de datos ordinales y nominales a valores numéricos es diferente, por eso necesitamos separarlos.
¡Gracias por tus comentarios!