Trabajando con Tablas Dinámicas
Desliza para mostrar el menú
Python tiene un análogo del método .groupby() que puede llevar al mismo resultado. Depende de ti cuál función utilizar. Aprendámoslo usando un ejemplo. Utilizando la siguiente función, llamada .pivot_table(), calcularemos los valores medios de la columna 'Length' que tienen el mismo valor en la columna 'Flight':
123456789101112131415import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) # The code using .groupby() data_flights_1 = data[['Length', 'Flight']].groupby('Flight').mean() # The same code using .groupby() data_flights_2 = data[['Length', 'Flight']].groupby('Flight').agg('mean') # The same code using .pivot_table() data_flights_3 = pd.pivot_table(data, values = 'Length', index = 'Flight', aggfunc = 'mean') print(data_flights_1.head())
Explicación:
data = pd.pivot_table(data, values = 'Length',
index = 'Flight',
aggfunc = 'mean')
pd.pivot_table()- función que crea tablas dinámicas;data- data frame que utilizamos;values = 'Length'- al argumentovalues, asignamos columnas que tienen el mismo grupo, para las cuales aplicaremos el cálculo del promedio, máximo, etc. Si deseas agrupar por varias columnas, colócalas en una lista; el orden no es crucial;index = 'Flight'-indexes un argumento al que asignas el nombre de una columna o columnas por las que deseas agrupar. Si deseas agrupar por varias columnas, colócalas en una lista; el orden sí es crucial, como en la función.groupby();aggfunc = 'mean'- igual queaggen el método.groupby(),aggfunctiene exactamente la misma sintaxis queagg. Así, puedes colocar varias funciones aquí poniéndolas en una lista para especificar funciones para diferentes columnas usando llaves.
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 4. Capítulo 5
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Sección 4. Capítulo 5