Ambos métodos producen resultados similares, con ligeras diferencias debido al uso de diferentes denominadores: N en numpy (varianza poblacional) y N-1 en pandas (varianza muestral).


              123456789101112
            
import pandas as pd
import numpy as np

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0)

# Calculate the variance using the function from the NumPy library
var_1 = np.var(df['salary_in_usd'])
# Calculate the variance using the function from the pandas library
var_2 = df['salary_in_usd'].var()

print('The variace using NumPy library is', var_1)
print('The variace using pandas library is', var_2)

¿Todo estuvo claro?

¡Gracias por tus comentarios!

Sección 3. Capítulo 3

Pregunte a AI

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Contenido del Curso

Aprendiendo Estadística con Python

1. Conceptos Básicos

Muestra vs Población Tipos de Estadística Tipos de Datos Valor Medio Valor Mediano Valor Mediano de un Número Par de Valores Media o Mediana Valor Modal Cuestionario de Estadística Descriptiva

2. Media, Mediana y Moda con Python

Examinar el Conjunto de Datos Cálculo de Valores de Media y Mediana con Python Estadísticas con Pandas Calcular la Media y la Mediana Salarial

3. Varianza y Desviación Estándar

Varianza Poblacional Varianza Muestral Calcular la Varianza con Python Desviación Estándar Desviación Estándar con Python Cálculo de la Varianza y la Desviación Estándar

4. Covarianza vs Correlación

Covarianza Correlación Cuestionario de Covarianza y Correlación Calcular Covarianza y Correlación

5. Intervalo de Confianza

6. Pruebas Estadísticas

Qué es la Prueba t Hipótesis T-test Matemáticamente Prueba Unilateral y Prueba Bilateral Supuestos del T-Test Realización de una Prueba t en Python Realizar una Prueba T T de Student Pareada

Calcular la Varianza con Python

Cálculo de la varianza con NumPy

En numpy, pasa la secuencia de valores (como una columna del conjunto de datos) a la función np.var(), por ejemplo: np.var(df['work_year']).

Cálculo de la varianza con pandas

En pandas, aplica el método .var() directamente a la columna, así: df['work_year'].var().

Ambos métodos producen resultados similares, con ligeras diferencias debido al uso de diferentes denominadores: N en numpy (varianza poblacional) y N-1 en pandas (varianza muestral).


              123456789101112
            
import pandas as pd
import numpy as np

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0)

# Calculate the variance using the function from the NumPy library
var_1 = np.var(df['salary_in_usd'])
# Calculate the variance using the function from the pandas library
var_2 = df['salary_in_usd'].var()

print('The variace using NumPy library is', var_1)
print('The variace using pandas library is', var_2)

¿Todo estuvo claro?

¡Gracias por tus comentarios!

Sección 3. Capítulo 3