Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Implementación de la Dispersión en Python | Probabilidad y Estadística
Matemáticas para Ciencia de Datos

bookImplementación de la Dispersión en Python

Definir el conjunto de datos

Aquí, se asigna un arreglo a la variable data para asegurar que se dispone de un conjunto de datos consistente para todas las operaciones de cálculo.

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

Calcular estadísticas poblacionales

Esta función toma el arreglo como entrada y devuelve el valor promedio de todos los elementos, lo que resume la tendencia central del conjunto de datos.

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation
  • np.mean(data) calcula la media aritmética (promedio);
  • np.var(data) calcula la varianza poblacional (divide por nn);
  • np.std(data) calcula la desviación estándar poblacional (raíz cuadrada de la varianza).
123456789101112
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) mean_val = np.mean(data) # Mean variance_val = np.var(data) # Population variance (ddof=0 by default) std_dev_val = np.std(data) # Population standard deviation print(f"Mean: {mean_val}") print(f"Variance (Population): {variance_val}") print(f"Standard Deviation (Population): {std_dev_val}")
copy

Calcular estadísticas muestrales

Para obtener estimaciones insesgadas de una muestra, utilizamos ddof=1. Esto aplica la corrección de Bessel, dividiendo la varianza por $(n-1)$ en lugar de $n$.

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
  • np.var(data, ddof=1) - varianza muestral;
  • np.std(data, ddof=1) - desviación estándar muestral.
12345678910
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) sample_variance_val = np.var(data, ddof=1) sample_std_dev_val = np.std(data, ddof=1) print(f"Variance (Sample): {sample_variance_val}") print(f"Standard Deviation (Sample): {sample_std_dev_val}")
copy
Note
Nota

La desviación estándar es la raíz cuadrada de la varianza, proporcionando una medida de dispersión en las mismas unidades que los datos originales, lo que facilita su interpretación.

question mark

¿Cómo calculamos la desviación estándar con la biblioteca numpy?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 5. Capítulo 8

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Suggested prompts:

Can you explain the difference between population and sample statistics again?

Why do we use Bessel's correction (ddof=1) for sample statistics?

How do these statistics help in real business scenarios?

Awesome!

Completion rate improved to 1.96

bookImplementación de la Dispersión en Python

Desliza para mostrar el menú

Definir el conjunto de datos

Aquí, se asigna un arreglo a la variable data para asegurar que se dispone de un conjunto de datos consistente para todas las operaciones de cálculo.

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

Calcular estadísticas poblacionales

Esta función toma el arreglo como entrada y devuelve el valor promedio de todos los elementos, lo que resume la tendencia central del conjunto de datos.

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation
  • np.mean(data) calcula la media aritmética (promedio);
  • np.var(data) calcula la varianza poblacional (divide por nn);
  • np.std(data) calcula la desviación estándar poblacional (raíz cuadrada de la varianza).
123456789101112
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) mean_val = np.mean(data) # Mean variance_val = np.var(data) # Population variance (ddof=0 by default) std_dev_val = np.std(data) # Population standard deviation print(f"Mean: {mean_val}") print(f"Variance (Population): {variance_val}") print(f"Standard Deviation (Population): {std_dev_val}")
copy

Calcular estadísticas muestrales

Para obtener estimaciones insesgadas de una muestra, utilizamos ddof=1. Esto aplica la corrección de Bessel, dividiendo la varianza por $(n-1)$ en lugar de $n$.

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
  • np.var(data, ddof=1) - varianza muestral;
  • np.std(data, ddof=1) - desviación estándar muestral.
12345678910
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) sample_variance_val = np.var(data, ddof=1) sample_std_dev_val = np.std(data, ddof=1) print(f"Variance (Sample): {sample_variance_val}") print(f"Standard Deviation (Sample): {sample_std_dev_val}")
copy
Note
Nota

La desviación estándar es la raíz cuadrada de la varianza, proporcionando una medida de dispersión en las mismas unidades que los datos originales, lo que facilita su interpretación.

question mark

¿Cómo calculamos la desviación estándar con la biblioteca numpy?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 5. Capítulo 8
some-alt