Розуміння Вибірки
Свайпніть щоб показати меню
Вибірка — це процес відбору підмножини даних із більшої сукупності для отримання висновків і формування припущень щодо всієї сукупності. Оскільки часто є недоцільним або неможливим зібрати дані з усієї сукупності, вибірка дозволяє ефективно аналізувати дані, зберігаючи якість і точність результатів.
Проста випадкова вибірка
Кожен елемент сукупності має однакову ймовірність бути обраним.
Це подібно до витягування імен із капелюха.
Де:
- N = population size.
Приклад 1:
У вас є клас із 30 студентів. Потрібно випадково обрати 5 для опитування.
Розв'язок: Використайте генератор випадкових чисел, щоб обрати 5 унікальних чисел від 1 до 30. Кожен студент має 301 ймовірність бути обраним.
Приклад 2:
У вас є клас із 30 студентів, і потрібно обрати 5 для участі в опитуванні.
- Загальна сукупність: N=30;
- Розмір вибірки: n=5.
Яка ймовірність того, що і Аліса, і Боб будуть обрані?
Загальна кількість способів обрати 5 студентів із 30:
(530)Кількість сприятливих вибірок, що містять і Алісу, і Боба:
Фіксуємо Алісу та Боба — обираємо ще 3 з решти 28:
Отже, ймовірність:
P=(530)(328)Стратифіковане вибіркове дослідження
Сукупність поділяється на значущі підгрупи (страти), і з кожної випадково відбираються зразки.
nh=NNh×nДе:
- Nh — розмір підгрупи h;
- N — загальний розмір сукупності;
- n — загальний розмір вибірки;
- nh — розмір вибірки з підгрупи h.
Приклад:
У класі 30 студентів: 18 хлопців і 12 дівчат. Потрібно пропорційно відібрати 10 студентів:
- Серед хлопців: 3018×10=6;
- Серед дівчат: 3012×10=4.
Перевага: Забезпечує представлення ключових підгруп.
Кластерне вибіркове дослідження
Сукупність розбивається на групи (кластери), і випадково обираються цілі кластери.
c=кількість кластерів для вибіркиДе:
- Кластери — це вже існуючі групи (наприклад, класи, команди);
- Випадково обираються цілі кластери, а не окремі особи.
Приклад 1:
У вашій школі є 5 класних кімнат. Потрібна вибірка з 25 учнів, але опитування кожного окремо займає надто багато часу.
Рішення: Випадковим чином оберіть 1 клас (оскільки в кожному приблизно 25 учнів) і опитайте всіх у ньому.
Приклад 2:
В університеті є 20 гуртожитків, у кожному проживає 50 студентів. Випадковим чином обираються 4 гуртожитки, і опитуються всі мешканці.
- Кількість кластерів: N=20;
- Вибрані кластери: n=4;
- Студентів у гуртожитку: M=50;
- Загальна кількість опитаних студентів: n×M=200.
Яка ймовірність того, що конкретний студент (наприклад, Сара) буде включений?
Вона дорівнює ймовірності того, що її гуртожиток буде обрано:
Складний випадок:
Якщо 10 гуртожитків мають по 30 студентів, а 10 — по 70 студентів, і випадково обираються 4 гуртожитки, яким буде очікуваний розмір вибірки?
Позначимо:
- D30=10 гуртожитків по 30 студентів;
- D70=10 гуртожитків по 70 студентів.
Очікуваний розмір вибірки:
E=2010⋅(4×30)+2010⋅(4×70)=200Отже, навіть якщо кластери різного розміру, очікуваний розмір вибірки залишається незмінним, якщо типи гуртожитків збалансовані.
Систематичне вибіркове дослідження
Вибір кожного k-го елемента зі списку.
k=nNДе:
- N — загальна сукупність;
- n — бажаний розмір вибірки;
- k — інтервал вибірки.
Приклад:
Список із 1000 клієнтів. Потрібна вибірка зі 100 осіб. Тоді:
k=1001000=10Виберіть випадкову стартову точку (наприклад, 7), потім обирайте кожного 10-го клієнта: 7, 17, 27 тощо.
Переваги: Легко реалізується та є систематичним.
Усі методи, застосовані до однієї задачі
Постановка задачі:
Ви досліджуєте задоволеність їдальнею у школі з 300 учнями, розподіленими по 10 класах (по 30 у кожному). Потрібно отримати вибірку з 30 учнів.
- Простий випадковий відбір: випадковим чином оберіть 30 імен зі всього списку;
- Стратифікований відбір: якщо 60% хлопців і 40% дівчат, відібрати 18 хлопців і 12 дівчат;
- Кластерний відбір: випадково оберіть 1 клас (30 учнів) і опитайте всіх;
- Систематичний відбір: обирайте кожного 10-го учня зі впорядкованого списку.
Підсумок
- Вибірка зменшує зусилля на збір даних і дозволяє робити узагальнення;
- Випадкова та стратифікована вибірка забезпечують найкращу точність;
- Кластерна вибірка ефективна, але найкраще працює, коли кластери подібні;
- Систематична вибірка проста й практична;
- Вибірка за зручністю є ризикованою і її слід уникати, якщо можливо;
- Завжди документуйте метод вибірки у реальному аналізі.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат