Calcular la Varianza con Python
Cálculo de la varianza con NumPy
En numpy
, pasa la secuencia de valores (como una columna del conjunto de datos) a la función np.var()
, por ejemplo: np.var(df['work_year'])
.
Cálculo de la varianza con pandas
En pandas
, aplica el método .var()
directamente a la columna, así: df['work_year'].var()
.
Ambos métodos producen resultados similares, con ligeras diferencias debido al uso de diferentes denominadores: N en numpy
(varianza poblacional) y N-1 en pandas
(varianza muestral).
123456789101112import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 2.63
Calcular la Varianza con Python
Desliza para mostrar el menú
Cálculo de la varianza con NumPy
En numpy
, pasa la secuencia de valores (como una columna del conjunto de datos) a la función np.var()
, por ejemplo: np.var(df['work_year'])
.
Cálculo de la varianza con pandas
En pandas
, aplica el método .var()
directamente a la columna, así: df['work_year'].var()
.
Ambos métodos producen resultados similares, con ligeras diferencias debido al uso de diferentes denominadores: N en numpy
(varianza poblacional) y N-1 en pandas
(varianza muestral).
123456789101112import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
¡Gracias por tus comentarios!