Розуміння Вибірки
Вибірка — це процес відбору підмножини даних із більшої сукупності для отримання висновків і формування припущень щодо всієї сукупності. Оскільки часто є недоцільним або неможливим зібрати дані з усієї сукупності, вибірка дозволяє ефективно аналізувати дані, зберігаючи якість і точність результатів.
Проста випадкова вибірка
Кожен елемент сукупності має однакову ймовірність бути обраним.
Це подібно до витягування імен із капелюха.
Де:
- N = population size.
Приклад 1:
У вас є клас із 30 студентів. Потрібно випадково обрати 5 для опитування.
Розв'язок: Використайте генератор випадкових чисел, щоб обрати 5 унікальних чисел від 1 до 30. Кожен студент має 301 ймовірність бути обраним.
Приклад 2:
У вас є клас із 30 студентів, і потрібно обрати 5 для участі в опитуванні.
- Загальна сукупність: N=30;
- Розмір вибірки: n=5.
Яка ймовірність того, що і Аліса, і Боб будуть обрані?
Загальна кількість способів обрати 5 студентів із 30:
(530)Кількість сприятливих вибірок, що містять і Алісу, і Боба:
Фіксуємо Алісу та Боба — обираємо ще 3 з решти 28:
Отже, ймовірність:
P=(530)(328)Стратифікована вибірка
Сукупність поділяється на значущі підгрупи (страти), і з кожної випадково відбираються елементи.
nh=NNh×nДе:
- Nh — розмір підгрупи h;
- N — загальний розмір сукупності;
- n — загальний розмір вибірки;
- nh — розмір вибірки з підгрупи h.
Приклад:
У класі 30 студентів: 18 хлопців і 12 дівчат. Потрібно пропорційно відібрати 10 студентів:
- Серед хлопців: 3018×10=6;
- Серед дівчат: 3012×10=4.
Перевага: Забезпечує представлення ключових підгруп.
Кластерна вибірка
Сукупність розбивається на групи (кластери), і випадково обираються цілі кластери.
c=кількість кластерів для вибіркиДе:
- Кластери — це вже існуючі групи (наприклад, класи, команди);
- Випадково обираються цілі кластери, а не окремі особи.
Приклад 1:
У вашій школі є 5 класів. Потрібна вибірка з 25 учнів, але опитування кожного окремо займає надто багато часу.
Рішення: Випадково оберіть 1 клас (оскільки в кожному приблизно 25 учнів) і опитайте всіх у ньому.
Приклад 2:
В університеті є 20 гуртожитків, у кожному проживає 50 студентів. Ви випадково обираєте 4 гуртожитки та опитуєте всіх мешканців.
- Кількість кластерів: N=20;
- Вибрані кластери: n=4;
- Студентів у гуртожитку: M=50;
- Загальна кількість опитаних студентів: n×M=200.
Яка ймовірність, що конкретний студент (наприклад, Сара) потрапить у вибірку?
Вона дорівнює ймовірності, що її гуртожиток буде обрано:
Складний випадок:
Якщо 10 гуртожитків мають по 30 студентів, а 10 — по 70 студентів, і ви випадково обираєте 4 гуртожитки, яким буде очікуваний розмір вибірки?
Позначимо:
- D30=10 гуртожитків по 30 студентів;
- D70=10 гуртожитків по 70 студентів.
Очікуваний розмір вибірки:
E=2010⋅(4×30)+2010⋅(4×70)=200Отже, навіть якщо кластери різняться за розміром, очікуваний розмір вибірки залишається незмінним, якщо типи гуртожитків збалансовані.
Систематичне вибіркове дослідження
Вибір кожного k-го елемента зі списку.
k=nNДе:
- N — загальна сукупність;
- n — бажаний розмір вибірки;
- k — інтервал вибірки.
Приклад:
Список із 1000 клієнтів. Потрібна вибірка зі 100 осіб. Тоді:
k=1001000=10Виберіть випадкову стартову позицію (наприклад, 7), потім обирайте кожного 10-го клієнта: 7, 17, 27 тощо.
Переваги: Легко реалізувати та систематично.
Усі методи, застосовані до однієї задачі
Постановка задачі:
Ви досліджуєте рівень задоволеності їдальнею у школі з 300 учнями, розподіленими по 10 класах (по 30 учнів у кожному). Потрібно отримати вибірку з 30 учнів.
- Простий випадковий відбір: випадковим чином обираються 30 імен зі списку всіх учнів;
- Стратифікований відбір: якщо 60% хлопців і 40% дівчат, відбирають 18 хлопців і 12 дівчат;
- Кластерний відбір: випадковим чином обирається 1 клас (30 учнів) і опитуються всі;
- Систематичний відбір: обирається кожний 10-й учень зі впорядкованого списку.
Підсумок
- Вибірка зменшує зусилля на збір даних і дозволяє робити узагальнення;
- Випадкова та стратифікована вибірка забезпечують найкращу точність;
- Кластерна вибірка ефективна, але найкраще працює, коли кластери подібні;
- Систематична вибірка проста й практична;
- Вибірка за зручністю є ризикованою і її слід уникати, якщо можливо;
- Завжди документуйте метод вибірки у реальному аналізі.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 1.96
Розуміння Вибірки
Свайпніть щоб показати меню
Вибірка — це процес відбору підмножини даних із більшої сукупності для отримання висновків і формування припущень щодо всієї сукупності. Оскільки часто є недоцільним або неможливим зібрати дані з усієї сукупності, вибірка дозволяє ефективно аналізувати дані, зберігаючи якість і точність результатів.
Проста випадкова вибірка
Кожен елемент сукупності має однакову ймовірність бути обраним.
Це подібно до витягування імен із капелюха.
Де:
- N = population size.
Приклад 1:
У вас є клас із 30 студентів. Потрібно випадково обрати 5 для опитування.
Розв'язок: Використайте генератор випадкових чисел, щоб обрати 5 унікальних чисел від 1 до 30. Кожен студент має 301 ймовірність бути обраним.
Приклад 2:
У вас є клас із 30 студентів, і потрібно обрати 5 для участі в опитуванні.
- Загальна сукупність: N=30;
- Розмір вибірки: n=5.
Яка ймовірність того, що і Аліса, і Боб будуть обрані?
Загальна кількість способів обрати 5 студентів із 30:
(530)Кількість сприятливих вибірок, що містять і Алісу, і Боба:
Фіксуємо Алісу та Боба — обираємо ще 3 з решти 28:
Отже, ймовірність:
P=(530)(328)Стратифікована вибірка
Сукупність поділяється на значущі підгрупи (страти), і з кожної випадково відбираються елементи.
nh=NNh×nДе:
- Nh — розмір підгрупи h;
- N — загальний розмір сукупності;
- n — загальний розмір вибірки;
- nh — розмір вибірки з підгрупи h.
Приклад:
У класі 30 студентів: 18 хлопців і 12 дівчат. Потрібно пропорційно відібрати 10 студентів:
- Серед хлопців: 3018×10=6;
- Серед дівчат: 3012×10=4.
Перевага: Забезпечує представлення ключових підгруп.
Кластерна вибірка
Сукупність розбивається на групи (кластери), і випадково обираються цілі кластери.
c=кількість кластерів для вибіркиДе:
- Кластери — це вже існуючі групи (наприклад, класи, команди);
- Випадково обираються цілі кластери, а не окремі особи.
Приклад 1:
У вашій школі є 5 класів. Потрібна вибірка з 25 учнів, але опитування кожного окремо займає надто багато часу.
Рішення: Випадково оберіть 1 клас (оскільки в кожному приблизно 25 учнів) і опитайте всіх у ньому.
Приклад 2:
В університеті є 20 гуртожитків, у кожному проживає 50 студентів. Ви випадково обираєте 4 гуртожитки та опитуєте всіх мешканців.
- Кількість кластерів: N=20;
- Вибрані кластери: n=4;
- Студентів у гуртожитку: M=50;
- Загальна кількість опитаних студентів: n×M=200.
Яка ймовірність, що конкретний студент (наприклад, Сара) потрапить у вибірку?
Вона дорівнює ймовірності, що її гуртожиток буде обрано:
Складний випадок:
Якщо 10 гуртожитків мають по 30 студентів, а 10 — по 70 студентів, і ви випадково обираєте 4 гуртожитки, яким буде очікуваний розмір вибірки?
Позначимо:
- D30=10 гуртожитків по 30 студентів;
- D70=10 гуртожитків по 70 студентів.
Очікуваний розмір вибірки:
E=2010⋅(4×30)+2010⋅(4×70)=200Отже, навіть якщо кластери різняться за розміром, очікуваний розмір вибірки залишається незмінним, якщо типи гуртожитків збалансовані.
Систематичне вибіркове дослідження
Вибір кожного k-го елемента зі списку.
k=nNДе:
- N — загальна сукупність;
- n — бажаний розмір вибірки;
- k — інтервал вибірки.
Приклад:
Список із 1000 клієнтів. Потрібна вибірка зі 100 осіб. Тоді:
k=1001000=10Виберіть випадкову стартову позицію (наприклад, 7), потім обирайте кожного 10-го клієнта: 7, 17, 27 тощо.
Переваги: Легко реалізувати та систематично.
Усі методи, застосовані до однієї задачі
Постановка задачі:
Ви досліджуєте рівень задоволеності їдальнею у школі з 300 учнями, розподіленими по 10 класах (по 30 учнів у кожному). Потрібно отримати вибірку з 30 учнів.
- Простий випадковий відбір: випадковим чином обираються 30 імен зі списку всіх учнів;
- Стратифікований відбір: якщо 60% хлопців і 40% дівчат, відбирають 18 хлопців і 12 дівчат;
- Кластерний відбір: випадковим чином обирається 1 клас (30 учнів) і опитуються всі;
- Систематичний відбір: обирається кожний 10-й учень зі впорядкованого списку.
Підсумок
- Вибірка зменшує зусилля на збір даних і дозволяє робити узагальнення;
- Випадкова та стратифікована вибірка забезпечують найкращу точність;
- Кластерна вибірка ефективна, але найкраще працює, коли кластери подібні;
- Систематична вибірка проста й практична;
- Вибірка за зручністю є ризикованою і її слід уникати, якщо можливо;
- Завжди документуйте метод вибірки у реальному аналізі.
Дякуємо за ваш відгук!