single
What Will We Do With the NaN Values?
Desliza para mostrar el menú
En el capítulo anterior, obtuviste el siguiente resultado:
| PassengerId | 0 |
| Survived | 0 |
| Pclass | 0 |
| Name | 0 |
| Sex | 0 |
| Age | 86 |
| SibSp | 0 |
| Parch | 0 |
| Ticket | 0 |
| Fare | 1 |
| Cabin | 327 |
| Embarked | 0 |
El conjunto de datos tiene 418 filas. Observa la columna Cabin, donde hay 327 valores faltantes. No tiene sentido rellenarlos porque la información disponible es mínima. Por lo tanto, en este caso, la mejor solución es eliminar la columna que no nos aporta información relevante. Una de las razones es que podríamos eliminar solo las filas que contienen valores faltantes, pero no podemos eliminar 327 filas de 418. Así que, veamos cómo hacerlo.
Para eliminar una columna, debes aplicar el método .drop() al conjunto de datos. La sintaxis es la siguiente:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Explicación:
.drop()- método que elimina columnas;columns = 'column_name'ocolumns = ['column_1', 'column_2']- argumento de la función donde se especifica el nombre o los nombres de las columnas que se desean eliminar;inplace = True- argumento útil de pandas que permite guardar todos los cambios. También puedes usarlo en otras funciones; aprenderemos algunas de ellas más adelante.
Desliza para comenzar a programar
Su tarea es eliminar la columna con la mayor cantidad de valores NaN. Siga el siguiente algoritmo:
- Elimine la columna
'Cabin'utilizando el argumentoinplace = True. - Muestre
5filas aleatorias del conjunto de datos.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla