Sección 1. Capítulo 4
single
Desafío: Limpieza de Datos
Desliza para mostrar el menú
Tarea
Desliza para comenzar a programar
Se proporciona el conjunto de datos Titanic cargado mediante la biblioteca Seaborn. La tarea consiste en limpiar el conjunto de datos utilizando pandas siguiendo estos pasos:
- Cargar el conjunto de datos con
sns.load_dataset("titanic"). - Sustituir los valores faltantes en la columna
agepor la media de la columna. - Sustituir los valores faltantes en la columna
embarkedpor el valor más frecuente (moda). - Eliminar filas duplicadas.
- Eliminar valores atípicos en la columna
fareutilizando el método IQR.
Devolver el conjunto de datos limpio final como un DataFrame llamado cleaned_data.
Solución
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 1. Capítulo 4
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla