Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Comprensión del Muestreo | Probabilidad y Estadística
Matemáticas para Ciencia de Datos

bookComprensión del Muestreo

Note
Definición

Muestreo es el proceso de seleccionar un subconjunto de datos de una población más grande para obtener información y hacer inferencias sobre el conjunto total. Dado que a menudo es poco práctico o imposible recopilar datos de toda la población, el muestreo permite un análisis eficiente manteniendo la calidad y precisión de los resultados.

Muestreo Aleatorio Simple

Cada miembro de la población tiene la misma probabilidad de ser seleccionado.
Esto es como sacar nombres de un sombrero.

P(Seleccionar cualquier individuo)=1NP(\text{Seleccionar cualquier individuo}) = \frac{1}{N}

Donde:

  • NN = tamaño de la población.

Ejemplo 1:

Tienes una clase de 30 estudiantes. Quieres seleccionar aleatoriamente 5 para una encuesta.

Solución: Utiliza un generador de números aleatorios para seleccionar 5 números únicos entre 1 y 30. Cada estudiante tiene una probabilidad de 130\tfrac{\raisebox{1pt}{$1$}}{\raisebox{-1pt}{$30$}} de ser seleccionado.

Ejemplo 2:

Tienes una clase de 30 estudiantes y deseas seleccionar 5 para participar en una encuesta.

  • Población total: N=30N=30;
  • Tamaño de la muestra: n=5n=5.

¿Cuál es la probabilidad de que tanto Alice como Bob sean seleccionados?

Número total de formas de elegir 5 estudiantes de 30:

(305)\binom{30}{5}

Número de muestras favorables que contienen tanto a Alice como a Bob:
Fija a Alice y Bob — elige 3 más de los 28 restantes:

(283)\binom{28}{3}

Por lo tanto, la probabilidad es:

P=(283)(305)P = \frac{\binom{28}{3}}{\binom{30}{5}}

Muestreo Estratificado

La población se divide en subgrupos significativos (estratos), y se toman muestras aleatorias de cada uno.

nh=NhN×nn_h = \frac{N_h}{N} \times n

Donde:

  • NhN_h - tamaño del subgrupo hh;
  • NN - tamaño total de la población;
  • nn - tamaño total de la muestra;
  • nhn_{\raisebox{-1pt}{$h$}} - tamaño de la muestra del subgrupo hh.

Ejemplo:

Una clase tiene 30 estudiantes: 18 hombres y 12 mujeres. Se desea muestrear 10 estudiantes proporcionalmente:

  • De los hombres: 1830×10=6\tfrac{\raisebox{1pt}{$18$}}{\raisebox{-1pt}{$30$}} \times 10 = 6;
  • De las mujeres: 1230×10=4\tfrac{\raisebox{1pt}{$12$}}{\raisebox{-1pt}{$30$}} \times 10 = 4.

Ventaja: Garantiza la representación de subgrupos clave.

Muestreo por Conglomerados

La población se divide en grupos (conglomerados), y se seleccionan aleatoriamente conglomerados completos.

c=nuˊmero de conglomerados a muestrearc = \text{número de conglomerados a muestrear}

Donde:

  • Los conglomerados son grupos preexistentes (por ejemplo, aulas, equipos);
  • Se seleccionan aleatoriamente conglomerados completos, no individuos.

Ejemplo 1:

Tu escuela tiene 5 aulas. Se requiere una muestra de 25 estudiantes, pero encuestar a cada individuo es demasiado laborioso.

Solución: Seleccionar aleatoriamente 1 aula (ya que cada una tiene aproximadamente 25 estudiantes) y encuestar a todos.

Ejemplo 2:

Una universidad tiene 20 residencias, cada una con 50 estudiantes. Se seleccionan aleatoriamente 4 residencias y se encuesta a todos los residentes.

  • Número de conglomerados: N=20N=20;
  • Conglomerados seleccionados: n=4n=4;
  • Estudiantes por residencia: M=50M=50;
  • Total de estudiantes muestreados: n×M=200n \times M = 200.

¿Cuál es la probabilidad de que un estudiante específico (por ejemplo, Sarah) sea incluido?
Equivale a la probabilidad de que su residencia sea seleccionada:

P(Sarah selected)=420=0.2P(\text{Sarah selected}) = \frac{4}{20} = 0.2

Caso complejo:
Si 10 residencias tienen 30 estudiantes y 10 tienen 70 estudiantes, y se seleccionan 4 residencias al azar, ¿cuál es el tamaño esperado de la muestra?

Sea:

  • D30=10D_{30} = 10 residencias con 30 estudiantes;
  • D70=10D_{70} = 10 residencias con 70 estudiantes.

Tamaño esperado de la muestra:

E=1020(4×30)+1020(4×70)=200E = \frac{10}{20} \cdot (4 \times 30) + \frac{10}{20} \cdot (4 \times 70) = 200

Por lo tanto, incluso si los conglomerados difieren en tamaño, el tamaño esperado de la muestra permanece igual si los tipos de residencias están equilibrados.

Muestreo Sistemático

Seleccionar cada kk-ésimo elemento de una lista.

k=Nnk = \frac{N}{n}

Donde:

  • NN - población total;
  • nn - tamaño de muestra deseado;
  • kk - intervalo de muestreo.

Ejemplo:

Una lista de 1000 clientes. Se requiere una muestra de 100. Así:

k=1000100=10k = \frac{1000}{100} = 10

Elegir un punto de inicio aleatorio (por ejemplo, 7), luego seleccionar cada décimo cliente: 7, 17, 27, etc.

Ventaja: Fácil de implementar y sistemático.

Todos los métodos aplicados a un mismo problema

Planteamiento del problema:
Estás estudiando la satisfacción con la cafetería en una escuela con 300 estudiantes distribuidos en 10 aulas (30 por aula). Quieres una muestra de 30 estudiantes.

  • Aleatorio simple: selecciona al azar 30 nombres de la lista completa;
  • Estratificado: si el 60% son niños y el 40% niñas, selecciona 18 niños y 12 niñas;
  • Por conglomerados: selecciona al azar 1 aula (30 estudiantes) y encuesta a todos;
  • Sistemático: elige cada décimo estudiante de una lista ordenada.

Resumen

  • El muestreo reduce el esfuerzo de recolección de datos y permite la generalización;
  • El muestreo aleatorio y estratificado son los más precisos;
  • El muestreo por conglomerados es eficiente pero funciona mejor cuando los conglomerados son similares;
  • El muestreo sistemático es sencillo y práctico;
  • El muestreo por conveniencia es riesgoso y debe evitarse cuando sea posible;
  • Siempre documenta tu método de muestreo en análisis del mundo real.
question mark

¿Qué método garantiza que cada individuo tenga la misma probabilidad de ser seleccionado?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 5. Capítulo 5

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Suggested prompts:

Can you explain the differences between these sampling methods in more detail?

When should I use each sampling method?

Can you provide more real-world examples for each sampling method?

Awesome!

Completion rate improved to 1.96

bookComprensión del Muestreo

Desliza para mostrar el menú

Note
Definición

Muestreo es el proceso de seleccionar un subconjunto de datos de una población más grande para obtener información y hacer inferencias sobre el conjunto total. Dado que a menudo es poco práctico o imposible recopilar datos de toda la población, el muestreo permite un análisis eficiente manteniendo la calidad y precisión de los resultados.

Muestreo Aleatorio Simple

Cada miembro de la población tiene la misma probabilidad de ser seleccionado.
Esto es como sacar nombres de un sombrero.

P(Seleccionar cualquier individuo)=1NP(\text{Seleccionar cualquier individuo}) = \frac{1}{N}

Donde:

  • NN = tamaño de la población.

Ejemplo 1:

Tienes una clase de 30 estudiantes. Quieres seleccionar aleatoriamente 5 para una encuesta.

Solución: Utiliza un generador de números aleatorios para seleccionar 5 números únicos entre 1 y 30. Cada estudiante tiene una probabilidad de 130\tfrac{\raisebox{1pt}{$1$}}{\raisebox{-1pt}{$30$}} de ser seleccionado.

Ejemplo 2:

Tienes una clase de 30 estudiantes y deseas seleccionar 5 para participar en una encuesta.

  • Población total: N=30N=30;
  • Tamaño de la muestra: n=5n=5.

¿Cuál es la probabilidad de que tanto Alice como Bob sean seleccionados?

Número total de formas de elegir 5 estudiantes de 30:

(305)\binom{30}{5}

Número de muestras favorables que contienen tanto a Alice como a Bob:
Fija a Alice y Bob — elige 3 más de los 28 restantes:

(283)\binom{28}{3}

Por lo tanto, la probabilidad es:

P=(283)(305)P = \frac{\binom{28}{3}}{\binom{30}{5}}

Muestreo Estratificado

La población se divide en subgrupos significativos (estratos), y se toman muestras aleatorias de cada uno.

nh=NhN×nn_h = \frac{N_h}{N} \times n

Donde:

  • NhN_h - tamaño del subgrupo hh;
  • NN - tamaño total de la población;
  • nn - tamaño total de la muestra;
  • nhn_{\raisebox{-1pt}{$h$}} - tamaño de la muestra del subgrupo hh.

Ejemplo:

Una clase tiene 30 estudiantes: 18 hombres y 12 mujeres. Se desea muestrear 10 estudiantes proporcionalmente:

  • De los hombres: 1830×10=6\tfrac{\raisebox{1pt}{$18$}}{\raisebox{-1pt}{$30$}} \times 10 = 6;
  • De las mujeres: 1230×10=4\tfrac{\raisebox{1pt}{$12$}}{\raisebox{-1pt}{$30$}} \times 10 = 4.

Ventaja: Garantiza la representación de subgrupos clave.

Muestreo por Conglomerados

La población se divide en grupos (conglomerados), y se seleccionan aleatoriamente conglomerados completos.

c=nuˊmero de conglomerados a muestrearc = \text{número de conglomerados a muestrear}

Donde:

  • Los conglomerados son grupos preexistentes (por ejemplo, aulas, equipos);
  • Se seleccionan aleatoriamente conglomerados completos, no individuos.

Ejemplo 1:

Tu escuela tiene 5 aulas. Se requiere una muestra de 25 estudiantes, pero encuestar a cada individuo es demasiado laborioso.

Solución: Seleccionar aleatoriamente 1 aula (ya que cada una tiene aproximadamente 25 estudiantes) y encuestar a todos.

Ejemplo 2:

Una universidad tiene 20 residencias, cada una con 50 estudiantes. Se seleccionan aleatoriamente 4 residencias y se encuesta a todos los residentes.

  • Número de conglomerados: N=20N=20;
  • Conglomerados seleccionados: n=4n=4;
  • Estudiantes por residencia: M=50M=50;
  • Total de estudiantes muestreados: n×M=200n \times M = 200.

¿Cuál es la probabilidad de que un estudiante específico (por ejemplo, Sarah) sea incluido?
Equivale a la probabilidad de que su residencia sea seleccionada:

P(Sarah selected)=420=0.2P(\text{Sarah selected}) = \frac{4}{20} = 0.2

Caso complejo:
Si 10 residencias tienen 30 estudiantes y 10 tienen 70 estudiantes, y se seleccionan 4 residencias al azar, ¿cuál es el tamaño esperado de la muestra?

Sea:

  • D30=10D_{30} = 10 residencias con 30 estudiantes;
  • D70=10D_{70} = 10 residencias con 70 estudiantes.

Tamaño esperado de la muestra:

E=1020(4×30)+1020(4×70)=200E = \frac{10}{20} \cdot (4 \times 30) + \frac{10}{20} \cdot (4 \times 70) = 200

Por lo tanto, incluso si los conglomerados difieren en tamaño, el tamaño esperado de la muestra permanece igual si los tipos de residencias están equilibrados.

Muestreo Sistemático

Seleccionar cada kk-ésimo elemento de una lista.

k=Nnk = \frac{N}{n}

Donde:

  • NN - población total;
  • nn - tamaño de muestra deseado;
  • kk - intervalo de muestreo.

Ejemplo:

Una lista de 1000 clientes. Se requiere una muestra de 100. Así:

k=1000100=10k = \frac{1000}{100} = 10

Elegir un punto de inicio aleatorio (por ejemplo, 7), luego seleccionar cada décimo cliente: 7, 17, 27, etc.

Ventaja: Fácil de implementar y sistemático.

Todos los métodos aplicados a un mismo problema

Planteamiento del problema:
Estás estudiando la satisfacción con la cafetería en una escuela con 300 estudiantes distribuidos en 10 aulas (30 por aula). Quieres una muestra de 30 estudiantes.

  • Aleatorio simple: selecciona al azar 30 nombres de la lista completa;
  • Estratificado: si el 60% son niños y el 40% niñas, selecciona 18 niños y 12 niñas;
  • Por conglomerados: selecciona al azar 1 aula (30 estudiantes) y encuesta a todos;
  • Sistemático: elige cada décimo estudiante de una lista ordenada.

Resumen

  • El muestreo reduce el esfuerzo de recolección de datos y permite la generalización;
  • El muestreo aleatorio y estratificado son los más precisos;
  • El muestreo por conglomerados es eficiente pero funciona mejor cuando los conglomerados son similares;
  • El muestreo sistemático es sencillo y práctico;
  • El muestreo por conveniencia es riesgoso y debe evitarse cuando sea posible;
  • Siempre documenta tu método de muestreo en análisis del mundo real.
question mark

¿Qué método garantiza que cada individuo tenga la misma probabilidad de ser seleccionado?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 5. Capítulo 5
some-alt