¿Qué Haremos con los Valores NaN?
En el capítulo anterior, obtuviste el siguiente resultado:
PassengerId | 0 |
Survived | 0 |
Pclass | 0 |
Name | 0 |
Sex | 0 |
Age | 86 |
SibSp | 0 |
Parch | 0 |
Ticket | 0 |
Fare | 1 |
Cabin | 327 |
Embarked | 0 |
El conjunto de datos tiene 418 filas. Observa la columna Cabin
, donde hay 327
valores faltantes. No tiene sentido rellenarlos porque la información disponible es mínima. Por lo tanto, en este caso, la mejor solución es eliminar la columna que no aporta valor. Una de las razones es que podríamos eliminar solo las filas que contienen valores faltantes, pero no podemos eliminar 327 filas de 418. Así que, veamos cómo hacerlo.
Para eliminar una columna, se debe aplicar el método .drop()
al conjunto de datos. La sintaxis es la siguiente:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Explicación:
.drop()
- método que elimina columnas;columns = 'column_name'
ocolumns = ['column_1', 'column_2']
- argumento de la función donde se especifica el nombre o los nombres de las columnas que se desean eliminar;inplace = True
- argumento útil de pandas que permite guardar todos los cambios. También puede utilizarse en otras funciones; aprenderemos algunas de ellas más adelante.
Swipe to start coding
La tarea consiste en eliminar la columna con el mayor número de valores NaN. Siga el siguiente algoritmo:
- Eliminar la columna
'Cabin'
utilizando el argumentoinplace = True
. - Mostrar
5
filas aleatorias del conjunto de datos.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 3.03
¿Qué Haremos con los Valores NaN?
Desliza para mostrar el menú
En el capítulo anterior, obtuviste el siguiente resultado:
PassengerId | 0 |
Survived | 0 |
Pclass | 0 |
Name | 0 |
Sex | 0 |
Age | 86 |
SibSp | 0 |
Parch | 0 |
Ticket | 0 |
Fare | 1 |
Cabin | 327 |
Embarked | 0 |
El conjunto de datos tiene 418 filas. Observa la columna Cabin
, donde hay 327
valores faltantes. No tiene sentido rellenarlos porque la información disponible es mínima. Por lo tanto, en este caso, la mejor solución es eliminar la columna que no aporta valor. Una de las razones es que podríamos eliminar solo las filas que contienen valores faltantes, pero no podemos eliminar 327 filas de 418. Así que, veamos cómo hacerlo.
Para eliminar una columna, se debe aplicar el método .drop()
al conjunto de datos. La sintaxis es la siguiente:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Explicación:
.drop()
- método que elimina columnas;columns = 'column_name'
ocolumns = ['column_1', 'column_2']
- argumento de la función donde se especifica el nombre o los nombres de las columnas que se desean eliminar;inplace = True
- argumento útil de pandas que permite guardar todos los cambios. También puede utilizarse en otras funciones; aprenderemos algunas de ellas más adelante.
Swipe to start coding
La tarea consiste en eliminar la columna con el mayor número de valores NaN. Siga el siguiente algoritmo:
- Eliminar la columna
'Cabin'
utilizando el argumentoinplace = True
. - Mostrar
5
filas aleatorias del conjunto de datos.
Solución
¡Gracias por tus comentarios!
single