Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende ¿Qué Haremos con los Valores NaN? | Preprocesamiento de Datos
Técnicas Avanzadas en Pandas

book¿Qué Haremos con los Valores NaN?

En el capítulo anterior, obtuviste el siguiente resultado:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

El conjunto de datos tiene 418 filas. Observa la columna Cabin, donde hay 327 valores faltantes. No tiene sentido rellenarlos porque la información disponible es mínima. Por lo tanto, en este caso, la mejor solución es eliminar la columna que no aporta valor. Una de las razones es que podríamos eliminar solo las filas que contienen valores faltantes, pero no podemos eliminar 327 filas de 418. Así que, veamos cómo hacerlo.

Para eliminar una columna, se debe aplicar el método .drop() al conjunto de datos. La sintaxis es la siguiente:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Explicación:

  • .drop() - método que elimina columnas;
  • columns = 'column_name' o columns = ['column_1', 'column_2'] - argumento de la función donde se especifica el nombre o los nombres de las columnas que se desean eliminar;
  • inplace = True - argumento útil de pandas que permite guardar todos los cambios. También puede utilizarse en otras funciones; aprenderemos algunas de ellas más adelante.
Tarea

Swipe to start coding

La tarea consiste en eliminar la columna con el mayor número de valores NaN. Siga el siguiente algoritmo:

  1. Eliminar la columna 'Cabin' utilizando el argumento inplace = True.
  2. Mostrar 5 filas aleatorias del conjunto de datos.

Solución

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 5. Capítulo 3
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

close

Awesome!

Completion rate improved to 3.03

book¿Qué Haremos con los Valores NaN?

Desliza para mostrar el menú

En el capítulo anterior, obtuviste el siguiente resultado:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

El conjunto de datos tiene 418 filas. Observa la columna Cabin, donde hay 327 valores faltantes. No tiene sentido rellenarlos porque la información disponible es mínima. Por lo tanto, en este caso, la mejor solución es eliminar la columna que no aporta valor. Una de las razones es que podríamos eliminar solo las filas que contienen valores faltantes, pero no podemos eliminar 327 filas de 418. Así que, veamos cómo hacerlo.

Para eliminar una columna, se debe aplicar el método .drop() al conjunto de datos. La sintaxis es la siguiente:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Explicación:

  • .drop() - método que elimina columnas;
  • columns = 'column_name' o columns = ['column_1', 'column_2'] - argumento de la función donde se especifica el nombre o los nombres de las columnas que se desean eliminar;
  • inplace = True - argumento útil de pandas que permite guardar todos los cambios. También puede utilizarse en otras funciones; aprenderemos algunas de ellas más adelante.
Tarea

Swipe to start coding

La tarea consiste en eliminar la columna con el mayor número de valores NaN. Siga el siguiente algoritmo:

  1. Eliminar la columna 'Cabin' utilizando el argumento inplace = True.
  2. Mostrar 5 filas aleatorias del conjunto de datos.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 5. Capítulo 3
single

single

some-alt