Вивчайте Проведення t-Тесту | Статистичне Тестування

Секція 6. Розділ 7

single

Свайпніть щоб показати меню

Компанія хоче визначити, чи існує суттєва різниця у рівнях продуктивності розробників, які працюють з дому, порівняно з тими, хто працює в офісі. На щастя, ви вже знаєте, що t-тест може допомогти у цьому.

У компанії є дві незалежні команди розробників: одна працює віддалено, а інша — з офісу. Вам надали два файли: 'work_from_home.csv' та 'work_from_office.csv', які містять щомісячну кількість виконаних завдань для кожного розробника.

Завдання — провести t-тест. Компанія хоче дізнатися, чи є розробники, які працюють в офісі, продуктивнішими за тих, хто працює з дому. Якщо так, то другу команду також переведуть до офісу. Якщо ж працівники з дому продуктивніші, компанія не вноситиме змін. Отже, бажана альтернативна гіпотеза: «Середня продуктивність офісних працівників вища, ніж у працівників, які працюють з дому».

Перевірка однаковості дисперсій:


              1234567
            
import pandas as pd

home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze()
office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze()
# Printing sample standard deviations
print('Home workers std:', home_workers.std())
print('Office workers std:', office_workers.std())

Друге стандартне відхилення у два рази більше за перше, отже дисперсії відрізняються. Згадайте функцію ttest_ind для проведення t-тесту.

st.ttest_ind(a, b, equal_var=True, alternative='two-sided')

Завдання

Swipe to start coding

Ви порівнюєте продуктивність співробітників, які працюють з дому та з офісу. Ваша мета — визначити, чи мають офісні працівники більшу середню продуктивність, ніж ті, хто працює з дому, використовуючи t-тест для незалежних вибірок.

Імпортуйте бібліотеку scipy.stats з псевдонімом st.
Використайте функцію st.ttest_ind() для проведення t-тесту з такими параметрами:

Вибірки: office_workers, home_workers.
Альтернативна гіпотеза: office > home.
Дисперсії не рівні (equal_var=False).

Збережіть результати у змінних tstat та pvalue.
В залежності від значення pvalue, виведіть одне з наступних повідомлень:

"We support the null hypothesis, the mean values are equal", якщо pvalue > 0.05.
"We reject the null hypothesis, the mean values are different" в іншому випадку.

Рішення

Перейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів

Все було зрозуміло?

Дякуємо за ваш відгук!

Секція 6. Розділ 7

single

Запитати АІ

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат