Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Comprensión de la Tendencia Central y la Dispersión | Probabilidad y Estadística
Matemáticas para Ciencia de Datos

bookComprensión de la Tendencia Central y la Dispersión

Media (Promedio)

Note
Definición

La media es la suma de todos los valores dividida por el número de valores. Representa el valor "central" o "típico" en tu conjunto de datos.

Fórmula:

Mean=xin\text{Mean} = \frac{\sum x_i}{n}

Ejemplo:
Si tu sitio web tuvo 100, 120 y 110 visitantes durante tres días:

100+120+1103=110\frac{100 + 120 + 110}{3} = 110

Interpretación:
En promedio, el sitio recibió 110 visitantes por día.

Varianza

Note
Definición

La varianza mide qué tan lejos está cada número del conjunto respecto a la media. Proporciona una idea de cuán "dispersos" están los datos.

Fórmula:

σ2=(xiμ)2n\sigma^2 = \frac{\sum (x_i - \mu)^2}{n}

Ejemplo (utilizando los datos anteriores):

  • Media = 110;
  • (100110)2=100(100 − 110)^2 = 100;
  • (120110)2=100(120 − 110)^2 = 100;
  • (110110)2=0(110 − 110)^2 = 0.

Suma = 200

Varianza=200366.67\text{Varianza} = \frac{200}{3} \approx 66.67

Interpretación:
La distancia cuadrática media respecto a la media es aproximadamente 66.67.

Desviación estándar

Note
Definición

La desviación estándar es la raíz cuadrada de la varianza. Permite expresar la dispersión en las unidades originales de los datos.

Fórmula:

σ=σ2\sigma = \sqrt{\sigma^2}

Ejemplo:
Si la varianza es 66.67:

σ=66.678.16\sigma = \sqrt{66.67} \approx 8.16

Interpretación:
En promedio, el conteo de visitantes diarios se encuentra aproximadamente a 8.16 del valor medio.

Problema del mundo real: Análisis del tráfico web

Problema:
Un científico de datos registra el número de visitantes de un sitio web durante 5 días:

120,150,130,170,140120, 150, 130, 170, 140

Paso 1 — Media:

120+150+130+170+1405=142\frac{120 + 150 + 130 + 170 + 140}{5} = 142

Paso 2 — Varianza:

  • (120142)2=484(120 - 142)^2 = 484;
  • (150142)2=64(150 - 142)^2 = 64;
  • (130142)2=144(130 - 142)^2 = 144;
  • (170142)2=784(170 - 142)^2 = 784;
  • (140142)2=4(140 - 142)^2 = 4.
Varianza=484+64+144+784+45=14805=296\text{Varianza} = \frac{484+64+144+784+4}{5} = \frac{1480}{5} = 296

Paso 3 — Desviación estándar:

σ=29617.2\sigma = \sqrt{296} \approx 17.2

Conclusión:

  • Media = 142 visitantes por día;
  • Varianza = 296;
  • Desviación estándar = 17.2.

El tráfico del sitio web varía aproximadamente en 17.2 visitantes respecto al día promedio.

question mark

¿Cuál es la relación entre la varianza y la desviación estándar?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 5. Capítulo 7

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Awesome!

Completion rate improved to 1.96

bookComprensión de la Tendencia Central y la Dispersión

Desliza para mostrar el menú

Media (Promedio)

Note
Definición

La media es la suma de todos los valores dividida por el número de valores. Representa el valor "central" o "típico" en tu conjunto de datos.

Fórmula:

Mean=xin\text{Mean} = \frac{\sum x_i}{n}

Ejemplo:
Si tu sitio web tuvo 100, 120 y 110 visitantes durante tres días:

100+120+1103=110\frac{100 + 120 + 110}{3} = 110

Interpretación:
En promedio, el sitio recibió 110 visitantes por día.

Varianza

Note
Definición

La varianza mide qué tan lejos está cada número del conjunto respecto a la media. Proporciona una idea de cuán "dispersos" están los datos.

Fórmula:

σ2=(xiμ)2n\sigma^2 = \frac{\sum (x_i - \mu)^2}{n}

Ejemplo (utilizando los datos anteriores):

  • Media = 110;
  • (100110)2=100(100 − 110)^2 = 100;
  • (120110)2=100(120 − 110)^2 = 100;
  • (110110)2=0(110 − 110)^2 = 0.

Suma = 200

Varianza=200366.67\text{Varianza} = \frac{200}{3} \approx 66.67

Interpretación:
La distancia cuadrática media respecto a la media es aproximadamente 66.67.

Desviación estándar

Note
Definición

La desviación estándar es la raíz cuadrada de la varianza. Permite expresar la dispersión en las unidades originales de los datos.

Fórmula:

σ=σ2\sigma = \sqrt{\sigma^2}

Ejemplo:
Si la varianza es 66.67:

σ=66.678.16\sigma = \sqrt{66.67} \approx 8.16

Interpretación:
En promedio, el conteo de visitantes diarios se encuentra aproximadamente a 8.16 del valor medio.

Problema del mundo real: Análisis del tráfico web

Problema:
Un científico de datos registra el número de visitantes de un sitio web durante 5 días:

120,150,130,170,140120, 150, 130, 170, 140

Paso 1 — Media:

120+150+130+170+1405=142\frac{120 + 150 + 130 + 170 + 140}{5} = 142

Paso 2 — Varianza:

  • (120142)2=484(120 - 142)^2 = 484;
  • (150142)2=64(150 - 142)^2 = 64;
  • (130142)2=144(130 - 142)^2 = 144;
  • (170142)2=784(170 - 142)^2 = 784;
  • (140142)2=4(140 - 142)^2 = 4.
Varianza=484+64+144+784+45=14805=296\text{Varianza} = \frac{484+64+144+784+4}{5} = \frac{1480}{5} = 296

Paso 3 — Desviación estándar:

σ=29617.2\sigma = \sqrt{296} \approx 17.2

Conclusión:

  • Media = 142 visitantes por día;
  • Varianza = 296;
  • Desviación estándar = 17.2.

El tráfico del sitio web varía aproximadamente en 17.2 visitantes respecto al día promedio.

question mark

¿Cuál es la relación entre la varianza y la desviación estándar?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 5. Capítulo 7
some-alt