Describiendo los Datos
pandas
ofrece el útil método mean()
que calcula el promedio de todos los valores para cada columna.
df = pd.read_csv(file.csv)
mean_values = df.mean()
También puedes usar el mismo método para determinar el valor promedio de una columna específica:
df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()
pandas
también proporciona el método mode()
, que identifica el valor que ocurre con más frecuencia en cada columna.
df = pd.read_csv(file.csv)
mode_values = df.mode()
Para encontrar la moda de una columna en particular, se utiliza el mismo método:
df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
Otro método útil en pandas
es describe()
.
df = pd.read_csv(file.csv)
important_metrics = df.describe()
Este método proporciona una visión general de varias métricas del conjunto de datos, incluyendo:
- Número total de entradas;
- Valor medio o promedio;
- Desviación estándar;
- Los valores mínimo y máximo;
- Los percentiles 25, 50 (mediana) y 75.
Tarea
Swipe to start coding
- Calcula la media de la columna
'residual sugar'
. - Calcula la moda de la columna
'fixed acidity'
. - Obtén una visión general de varias estadísticas de
wine_data
y almacena el resultado endescribed_data
.
Solución
¿Todo estuvo claro?
¡Gracias por tus comentarios!