Agrupamiento Avanzado
Ampliemos nuestro conocimiento sobre el método .groupby()
. Como recordará, podemos utilizar el método .agg()
. De hecho, la principal ventaja de esta función es que permite aplicar diferentes funciones a las columnas numéricas utilizando una sola clave de agrupación. Observe el ejemplo donde agrupamos los vuelos por la columna 'Airline'
, luego contamos los valores en 'Delay'
para cada 'Airline'
y calculamos los valores mínimo y máximo para la columna 'Length'
. Muy conveniente, ¿verdad?
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data.groupby('Airline').agg({'Delay': 'count', 'Length': ['min', 'max']}) print(data_flights.head(10))
Explicación:
.agg({'Delay': 'count', 'Length': ['min', 'max']})
.agg()
- método que permite aplicar funciones sobre una serie o sobre cada elemento por separado;{}
- se utilizan llaves para especificar la columna y aplicar funciones directamente sobre ellas;'Delay': 'count'
- aplica la función.count()
a los valores de la columna'Delay'
que tienen la misma clave de grupo;'Length': ['min', 'max']
- aplica las funciones.min()
y.max()
a los valores de la columna'Length'
que tienen la misma clave de grupo. Solo es necesario poner el nombre de la columna sin los símbolos()
o.
en la función. Tenga en cuenta que, si desea aplicar varias funciones a la misma columna, debe colocarlas en una lista.
Swipe to start coding
Su tarea es profundizar y analizar los tiempos promedio y máximo de retraso según el aeropuerto de origen del vuelo y luego según el aeropuerto de destino. Además, observe la mediana de la duración del vuelo. Siga el siguiente algoritmo:
Agrupar datos:
- Aplique el método
.groupby()
al conjunto de datosdata
; - Dentro del método
.groupby()
, coloque las columnas'AirportFrom'
y'AirportTo'
; el orden es fundamental; - Utilizando el método
.agg()
, calcule los valores agregados: el valor promedio y máximo en la columna'Time'
, y el valor mediano de la columna'Length'
.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 3.03
Agrupamiento Avanzado
Desliza para mostrar el menú
Ampliemos nuestro conocimiento sobre el método .groupby()
. Como recordará, podemos utilizar el método .agg()
. De hecho, la principal ventaja de esta función es que permite aplicar diferentes funciones a las columnas numéricas utilizando una sola clave de agrupación. Observe el ejemplo donde agrupamos los vuelos por la columna 'Airline'
, luego contamos los valores en 'Delay'
para cada 'Airline'
y calculamos los valores mínimo y máximo para la columna 'Length'
. Muy conveniente, ¿verdad?
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data.groupby('Airline').agg({'Delay': 'count', 'Length': ['min', 'max']}) print(data_flights.head(10))
Explicación:
.agg({'Delay': 'count', 'Length': ['min', 'max']})
.agg()
- método que permite aplicar funciones sobre una serie o sobre cada elemento por separado;{}
- se utilizan llaves para especificar la columna y aplicar funciones directamente sobre ellas;'Delay': 'count'
- aplica la función.count()
a los valores de la columna'Delay'
que tienen la misma clave de grupo;'Length': ['min', 'max']
- aplica las funciones.min()
y.max()
a los valores de la columna'Length'
que tienen la misma clave de grupo. Solo es necesario poner el nombre de la columna sin los símbolos()
o.
en la función. Tenga en cuenta que, si desea aplicar varias funciones a la misma columna, debe colocarlas en una lista.
Swipe to start coding
Su tarea es profundizar y analizar los tiempos promedio y máximo de retraso según el aeropuerto de origen del vuelo y luego según el aeropuerto de destino. Además, observe la mediana de la duración del vuelo. Siga el siguiente algoritmo:
Agrupar datos:
- Aplique el método
.groupby()
al conjunto de datosdata
; - Dentro del método
.groupby()
, coloque las columnas'AirportFrom'
y'AirportTo'
; el orden es fundamental; - Utilizando el método
.agg()
, calcule los valores agregados: el valor promedio y máximo en la columna'Time'
, y el valor mediano de la columna'Length'
.
Solución
¡Gracias por tus comentarios!
single