Implementación de la Dispersión en Python
Definir el conjunto de datos
Aquí, se asigna un arreglo a la variable data para asegurar que se dispone de un conjunto de datos consistente para todas las operaciones de cálculo.
import numpy as np
# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])
Calcular estadísticas poblacionales
Esta función toma el arreglo como entrada y devuelve el valor promedio de todos los elementos, lo que resume la tendencia central del conjunto de datos.
mean_val = np.mean(data) # Mean
variance_val = np.var(data) # Population variance (ddof=0 by default)
std_dev_val = np.std(data) # Population standard deviation
np.mean(data)calcula la media aritmética (promedio);np.var(data)calcula la varianza poblacional (divide por n);np.std(data)calcula la desviación estándar poblacional (raíz cuadrada de la varianza).
123456789101112import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) mean_val = np.mean(data) # Mean variance_val = np.var(data) # Population variance (ddof=0 by default) std_dev_val = np.std(data) # Population standard deviation print(f"Mean: {mean_val}") print(f"Variance (Population): {variance_val}") print(f"Standard Deviation (Population): {std_dev_val}")
Calcular estadísticas muestrales
Para obtener estimaciones insesgadas de una muestra, utilizamos ddof=1.
Esto aplica la corrección de Bessel, dividiendo la varianza por $(n-1)$ en lugar de $n$.
sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
np.var(data, ddof=1)- varianza muestral;np.std(data, ddof=1)- desviación estándar muestral.
12345678910import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) sample_variance_val = np.var(data, ddof=1) sample_std_dev_val = np.std(data, ddof=1) print(f"Variance (Sample): {sample_variance_val}") print(f"Standard Deviation (Sample): {sample_std_dev_val}")
La desviación estándar es la raíz cuadrada de la varianza, proporcionando una medida de dispersión en las mismas unidades que los datos originales, lo que facilita su interpretación.
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Can you explain the difference between population and sample statistics again?
Why do we use Bessel's correction (ddof=1) for sample statistics?
How do these statistics help in real business scenarios?
Awesome!
Completion rate improved to 1.96
Implementación de la Dispersión en Python
Desliza para mostrar el menú
Definir el conjunto de datos
Aquí, se asigna un arreglo a la variable data para asegurar que se dispone de un conjunto de datos consistente para todas las operaciones de cálculo.
import numpy as np
# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])
Calcular estadísticas poblacionales
Esta función toma el arreglo como entrada y devuelve el valor promedio de todos los elementos, lo que resume la tendencia central del conjunto de datos.
mean_val = np.mean(data) # Mean
variance_val = np.var(data) # Population variance (ddof=0 by default)
std_dev_val = np.std(data) # Population standard deviation
np.mean(data)calcula la media aritmética (promedio);np.var(data)calcula la varianza poblacional (divide por n);np.std(data)calcula la desviación estándar poblacional (raíz cuadrada de la varianza).
123456789101112import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) mean_val = np.mean(data) # Mean variance_val = np.var(data) # Population variance (ddof=0 by default) std_dev_val = np.std(data) # Population standard deviation print(f"Mean: {mean_val}") print(f"Variance (Population): {variance_val}") print(f"Standard Deviation (Population): {std_dev_val}")
Calcular estadísticas muestrales
Para obtener estimaciones insesgadas de una muestra, utilizamos ddof=1.
Esto aplica la corrección de Bessel, dividiendo la varianza por $(n-1)$ en lugar de $n$.
sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
np.var(data, ddof=1)- varianza muestral;np.std(data, ddof=1)- desviación estándar muestral.
12345678910import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) sample_variance_val = np.var(data, ddof=1) sample_std_dev_val = np.std(data, ddof=1) print(f"Variance (Sample): {sample_variance_val}") print(f"Standard Deviation (Sample): {sample_std_dev_val}")
La desviación estándar es la raíz cuadrada de la varianza, proporcionando una medida de dispersión en las mismas unidades que los datos originales, lo que facilita su interpretación.
¡Gracias por tus comentarios!