Familiarización con el Método .groupby()
Me alegra verte en esta sección. Aquí, agruparemos nuestros datos para encontrar información sobre diferentes grupos de filas. Examina el conjunto de datos sobre retrasos (puedes desplazarte horizontalmente por esta tabla):
Agrupar datos es beneficioso, y ahora profundizaremos en ello. Imagina que deseas calcular el número de retrasos para cada número de vuelo. Observa el ejemplo de código y luego la explicación:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data[['Flight', 'Delay']].groupby('Flight').sum() print(data_flights.head())
Explicación:
data[['Flight', 'Delay']].groupby('Flight').sum()
data[['Flight', 'Delay']]
- Estas son las columnas sobre las que se trabajará, incluyendo las columnas que se agruparán;groupby('Flight')
- La columna'Flight'
es el argumento para la función.groupby()
. Esto significa que las filas con el mismo valor en la columna'Flight'
se agruparán juntas;.sum()
- Esta función opera sobre las filas dentro de cada grupo creado por.groupby()
. En este caso, suma los valores en la columna'Delay'
para las filas que pertenecen al mismo grupo de'Flight'
.
Dado que la columna 'Delay'
contiene únicamente 0
(no ocurrió retraso) o 1
(ocurrió retraso) como valores posibles, la suma de las filas representa el número de retrasos para cada vuelo.
De hecho, .sum()
es una de muchas funciones de agregación que se pueden utilizar. Se presentarán todas ellas a medida que avance.
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 3.03
Familiarización con el Método .groupby()
Desliza para mostrar el menú
Me alegra verte en esta sección. Aquí, agruparemos nuestros datos para encontrar información sobre diferentes grupos de filas. Examina el conjunto de datos sobre retrasos (puedes desplazarte horizontalmente por esta tabla):
Agrupar datos es beneficioso, y ahora profundizaremos en ello. Imagina que deseas calcular el número de retrasos para cada número de vuelo. Observa el ejemplo de código y luego la explicación:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data[['Flight', 'Delay']].groupby('Flight').sum() print(data_flights.head())
Explicación:
data[['Flight', 'Delay']].groupby('Flight').sum()
data[['Flight', 'Delay']]
- Estas son las columnas sobre las que se trabajará, incluyendo las columnas que se agruparán;groupby('Flight')
- La columna'Flight'
es el argumento para la función.groupby()
. Esto significa que las filas con el mismo valor en la columna'Flight'
se agruparán juntas;.sum()
- Esta función opera sobre las filas dentro de cada grupo creado por.groupby()
. En este caso, suma los valores en la columna'Delay'
para las filas que pertenecen al mismo grupo de'Flight'
.
Dado que la columna 'Delay'
contiene únicamente 0
(no ocurrió retraso) o 1
(ocurrió retraso) como valores posibles, la suma de las filas representa el número de retrasos para cada vuelo.
De hecho, .sum()
es una de muchas funciones de agregación que se pueden utilizar. Se presentarán todas ellas a medida que avance.
¡Gracias por tus comentarios!