Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Tipos de Datos | Conceptos de Machine Learning
Introducción al ML con Scikit-Learn

bookTipos de Datos

Cada columna (característica) en un conjunto de entrenamiento tiene un tipo de dato asociado. Estos tipos de datos pueden agruparse en numéricos, categóricos y fecha y/o hora.

Desafortunadamente, la mayoría de los algoritmos de aprendizaje automático solo funcionan bien con números. Por lo tanto, es necesario convertir los datos categóricos y los datos de fecha y hora a números.

En cuanto a la fecha y la hora, se pueden utilizar características como 'year', 'month', etc., según la tarea. Estas características son valores numéricos, por lo que no presentan inconvenientes.

Los datos categóricos son un poco más difíciles de manejar.

Tipos de datos categóricos

Los datos categóricos se clasifican en dos tipos:

  • Datos ordinales: son un tipo de datos categóricos en los que las categorías siguen un orden natural. Por ejemplo, nivel de educación (desde escuela primaria hasta doctorado) o calificaciones (de muy malo a muy bueno), etc.;

  • Datos nominales: son un tipo de datos categóricos que no siguen un orden natural. Por ejemplo, nombre, género, país de origen, etc.

Como verás en capítulos posteriores, la conversión de los tipos de datos ordinales y nominales a valores numéricos es diferente, por eso necesitamos separarlos.

question-icon

Relaciona la característica con su tipo de dato.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Click or drag`n`drop items and fill in the blanks

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 4

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Awesome!

Completion rate improved to 3.13

bookTipos de Datos

Desliza para mostrar el menú

Cada columna (característica) en un conjunto de entrenamiento tiene un tipo de dato asociado. Estos tipos de datos pueden agruparse en numéricos, categóricos y fecha y/o hora.

Desafortunadamente, la mayoría de los algoritmos de aprendizaje automático solo funcionan bien con números. Por lo tanto, es necesario convertir los datos categóricos y los datos de fecha y hora a números.

En cuanto a la fecha y la hora, se pueden utilizar características como 'year', 'month', etc., según la tarea. Estas características son valores numéricos, por lo que no presentan inconvenientes.

Los datos categóricos son un poco más difíciles de manejar.

Tipos de datos categóricos

Los datos categóricos se clasifican en dos tipos:

  • Datos ordinales: son un tipo de datos categóricos en los que las categorías siguen un orden natural. Por ejemplo, nivel de educación (desde escuela primaria hasta doctorado) o calificaciones (de muy malo a muy bueno), etc.;

  • Datos nominales: son un tipo de datos categóricos que no siguen un orden natural. Por ejemplo, nombre, género, país de origen, etc.

Como verás en capítulos posteriores, la conversión de los tipos de datos ordinales y nominales a valores numéricos es diferente, por eso necesitamos separarlos.

question-icon

Relaciona la característica con su tipo de dato.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Click or drag`n`drop items and fill in the blanks

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 4
some-alt