Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Проведення t-Тесту | Статистичне Тестування
Вивчення Статистики з Python

bookПроведення t-Тесту

Компанія хоче визначити, чи існує суттєва різниця у рівнях продуктивності розробників, які працюють з дому, порівняно з тими, хто працює в офісі. На щастя, ви вже знаєте, що t-тест може допомогти у цьому.

У компанії є дві незалежні команди розробників: одна працює віддалено, а інша — з офісу. Вам надали два файли: 'work_from_home.csv' та 'work_from_office.csv', які містять щомісячну кількість виконаних завдань для кожного розробника.

Завдання — провести t-тест. Компанія хоче дізнатися, чи є розробники, які працюють в офісі, продуктивнішими за тих, хто працює з дому. Якщо так, то другу команду також переведуть до офісу. Якщо ж працівники з дому продуктивніші, компанія не вноситиме змін. Отже, бажана альтернативна гіпотеза: «Середня продуктивність офісних працівників вища, ніж у працівників, які працюють з дому».

Перевірка однаковості дисперсій:

1234567
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
copy

Друге стандартне відхилення у два рази більше за перше, отже дисперсії відрізняються. Згадайте функцію ttest_ind для проведення t-тесту.

st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Завдання

Swipe to start coding

Ви порівнюєте продуктивність співробітників, які працюють з дому та з офісу. Ваша мета — визначити, чи мають офісні працівники більшу середню продуктивність, ніж ті, хто працює з дому, використовуючи t-тест для незалежних вибірок.

  1. Імпортуйте бібліотеку scipy.stats з псевдонімом st.
  2. Використайте функцію st.ttest_ind() для проведення t-тесту з такими параметрами:
  • Вибірки: office_workers, home_workers.
  • Альтернативна гіпотеза: office > home.
  • Дисперсії не рівні (equal_var=False).
  1. Збережіть результати у змінних tstat та pvalue.
  2. В залежності від значення pvalue, виведіть одне з наступних повідомлень:
  • "We support the null hypothesis, the mean values are equal", якщо pvalue > 0.05.
  • "We reject the null hypothesis, the mean values are different" в іншому випадку.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 6. Розділ 7
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

close

Awesome!

Completion rate improved to 2.63

bookПроведення t-Тесту

Свайпніть щоб показати меню

Компанія хоче визначити, чи існує суттєва різниця у рівнях продуктивності розробників, які працюють з дому, порівняно з тими, хто працює в офісі. На щастя, ви вже знаєте, що t-тест може допомогти у цьому.

У компанії є дві незалежні команди розробників: одна працює віддалено, а інша — з офісу. Вам надали два файли: 'work_from_home.csv' та 'work_from_office.csv', які містять щомісячну кількість виконаних завдань для кожного розробника.

Завдання — провести t-тест. Компанія хоче дізнатися, чи є розробники, які працюють в офісі, продуктивнішими за тих, хто працює з дому. Якщо так, то другу команду також переведуть до офісу. Якщо ж працівники з дому продуктивніші, компанія не вноситиме змін. Отже, бажана альтернативна гіпотеза: «Середня продуктивність офісних працівників вища, ніж у працівників, які працюють з дому».

Перевірка однаковості дисперсій:

1234567
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
copy

Друге стандартне відхилення у два рази більше за перше, отже дисперсії відрізняються. Згадайте функцію ttest_ind для проведення t-тесту.

st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Завдання

Swipe to start coding

Ви порівнюєте продуктивність співробітників, які працюють з дому та з офісу. Ваша мета — визначити, чи мають офісні працівники більшу середню продуктивність, ніж ті, хто працює з дому, використовуючи t-тест для незалежних вибірок.

  1. Імпортуйте бібліотеку scipy.stats з псевдонімом st.
  2. Використайте функцію st.ttest_ind() для проведення t-тесту з такими параметрами:
  • Вибірки: office_workers, home_workers.
  • Альтернативна гіпотеза: office > home.
  • Дисперсії не рівні (equal_var=False).
  1. Збережіть результати у змінних tstat та pvalue.
  2. В залежності від значення pvalue, виведіть одне з наступних повідомлень:
  • "We support the null hypothesis, the mean values are equal", якщо pvalue > 0.05.
  • "We reject the null hypothesis, the mean values are different" в іншому випадку.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 6. Розділ 7
single

single

some-alt