Desliza para mostrar el menú

Me alegra verte en esta sección. Aquí, agruparemos nuestros datos para encontrar información sobre diferentes grupos de filas. Examina el conjunto de datos sobre retrasos (puedes desplazarte horizontalmente por esta tabla):

Agrupar datos es beneficioso, y ahora profundizaremos en ello. Imagina que quieres calcular el número de retrasos para cada número de vuelo. Observa el ejemplo de código y luego la explicación:


              1234
            
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0)
data_flights = data[['Flight', 'Delay']].groupby('Flight').sum()
print(data_flights.head())

Explicación:

data[['Flight', 'Delay']].groupby('Flight').sum()

data[['Flight', 'Delay']] - Estas son las columnas sobre las que se trabajará, incluyendo las columnas por las que se agrupará;
groupby('Flight') - La columna 'Flight' es el argumento para la función .groupby(). Esto significa que las filas con el mismo valor en la columna 'Flight' se agruparán juntas;
.sum() - Esta función opera sobre las filas dentro de cada grupo creado por .groupby(). En este caso, suma los valores en la columna 'Delay' para las filas que pertenecen al mismo grupo de 'Flight'.

Nota

Dado que la columna 'Delay' contiene únicamente 0 (no ocurrió retraso) o 1 (ocurrió un retraso) como valores posibles, la suma de las filas representa el número de retrasos para cada vuelo.

De hecho, .sum() es una de muchas funciones de agregación que se pueden utilizar. Se presentarán todas ellas a medida que avances.

Completa los espacios para encontrar el valor medio de la columna 'Time' según la columna 'DayOfWeek'.

data_extracted = data[['', 'Time']]('

').mean()
print(data_extracted)

DayOfWeek	Time
3	804.993130
4	804.452984
5	702.888362

¿Todo estuvo claro?

¡Gracias por tus comentarios!

Sección 4. Capítulo 1

Pregunte a AI

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Familiarizándose con el método .groupby()