Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Agrupamiento Avanzado | Agregación de Datos
Técnicas Avanzadas en Pandas

bookAgrupamiento Avanzado

Ampliemos nuestro conocimiento sobre el método .groupby(). Como recordará, podemos utilizar el método .agg(). De hecho, la principal ventaja de esta función es que permite aplicar diferentes funciones a las columnas numéricas utilizando una sola clave de agrupación. Observe el ejemplo donde agrupamos los vuelos por la columna 'Airline', luego contamos los valores en 'Delay' para cada 'Airline' y calculamos los valores mínimo y máximo para la columna 'Length'. Muy conveniente, ¿verdad?

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data.groupby('Airline').agg({'Delay': 'count', 'Length': ['min', 'max']}) print(data_flights.head(10))
copy

Explicación:

.agg({'Delay': 'count', 'Length': ['min', 'max']})
  • .agg() - método que permite aplicar funciones sobre una serie o sobre cada elemento por separado;
  • {} - se utilizan llaves para especificar la columna y aplicar funciones directamente sobre ellas;
  • 'Delay': 'count' - aplica la función .count() a los valores de la columna 'Delay' que tienen la misma clave de grupo;
  • 'Length': ['min', 'max'] - aplica las funciones .min() y .max() a los valores de la columna 'Length' que tienen la misma clave de grupo. Solo es necesario poner el nombre de la columna sin los símbolos () o . en la función. Tenga en cuenta que, si desea aplicar varias funciones a la misma columna, debe colocarlas en una lista.
Tarea

Swipe to start coding

Su tarea es profundizar y analizar los tiempos promedio y máximo de retraso según el aeropuerto de origen del vuelo y luego según el aeropuerto de destino. Además, observe la mediana de la duración del vuelo. Siga el siguiente algoritmo:

Agrupar datos:

  • Aplique el método .groupby() al conjunto de datos data;
  • Dentro del método .groupby(), coloque las columnas 'AirportFrom' y 'AirportTo'; el orden es fundamental;
  • Utilizando el método .agg(), calcule los valores agregados: el valor promedio y máximo en la columna 'Time', y el valor mediano de la columna 'Length'.

Solución

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 4. Capítulo 4
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

close

Awesome!

Completion rate improved to 3.03

bookAgrupamiento Avanzado

Desliza para mostrar el menú

Ampliemos nuestro conocimiento sobre el método .groupby(). Como recordará, podemos utilizar el método .agg(). De hecho, la principal ventaja de esta función es que permite aplicar diferentes funciones a las columnas numéricas utilizando una sola clave de agrupación. Observe el ejemplo donde agrupamos los vuelos por la columna 'Airline', luego contamos los valores en 'Delay' para cada 'Airline' y calculamos los valores mínimo y máximo para la columna 'Length'. Muy conveniente, ¿verdad?

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data.groupby('Airline').agg({'Delay': 'count', 'Length': ['min', 'max']}) print(data_flights.head(10))
copy

Explicación:

.agg({'Delay': 'count', 'Length': ['min', 'max']})
  • .agg() - método que permite aplicar funciones sobre una serie o sobre cada elemento por separado;
  • {} - se utilizan llaves para especificar la columna y aplicar funciones directamente sobre ellas;
  • 'Delay': 'count' - aplica la función .count() a los valores de la columna 'Delay' que tienen la misma clave de grupo;
  • 'Length': ['min', 'max'] - aplica las funciones .min() y .max() a los valores de la columna 'Length' que tienen la misma clave de grupo. Solo es necesario poner el nombre de la columna sin los símbolos () o . en la función. Tenga en cuenta que, si desea aplicar varias funciones a la misma columna, debe colocarlas en una lista.
Tarea

Swipe to start coding

Su tarea es profundizar y analizar los tiempos promedio y máximo de retraso según el aeropuerto de origen del vuelo y luego según el aeropuerto de destino. Además, observe la mediana de la duración del vuelo. Siga el siguiente algoritmo:

Agrupar datos:

  • Aplique el método .groupby() al conjunto de datos data;
  • Dentro del método .groupby(), coloque las columnas 'AirportFrom' y 'AirportTo'; el orden es fundamental;
  • Utilizando el método .agg(), calcule los valores agregados: el valor promedio y máximo en la columna 'Time', y el valor mediano de la columna 'Length'.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 4. Capítulo 4
single

single

some-alt