Проведення t-тесту
Компанія хоче визначити, чи існує суттєва різниця у рівнях продуктивності розробників, які працюють з дому, порівняно з тими, хто працює в офісі. На щастя, ви вже знаєте, що t-тест може допомогти у цьому.
У компанії є дві незалежні команди розробників: одна працює віддалено, а інша — з офісу. Вам надали два файли: 'work_from_home.csv'
та 'work_from_office.csv'
, які містять щомісячну кількість виконаних завдань для кожного розробника.
Завдання — провести t-тест. Компанія хоче дізнатися, чи є розробники, які працюють в офісі, продуктивнішими за тих, хто працює з дому. Якщо так, то другу команду також переведуть до офісу. Якщо ж продуктивність домашніх працівників вища, компанія не вноситиме змін. Отже, бажана альтернативна гіпотеза: «Середня продуктивність офісних працівників вища, ніж у тих, хто працює з дому».
Перевіримо, чи однакові дисперсії:
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
Друге стандартне відхилення у два рази більше за перше, отже дисперсії відрізняються.
Згадайте функцію ttest_ind
для проведення t-тесту.
python
Swipe to start coding
- Імпортувати
scipy.stats
з використанням псевдонімуst
. - Провести t-тест із наступними налаштуваннями:
- Вибірки:
home_workers
,office_workers
; - Альтернативна гіпотеза: office > home;
- Відсутність однорідності дисперсій.
- Вибірки:
Рішення
Дякуємо за ваш відгук!