Зміст курсу
Вивчення Статистики з Використанням Python
Вивчення Статистики з Використанням Python
Виклик
Компанія хоче визначити, чи є значна різниця у рівнях продуктивності розробників, які працюють з дому, порівняно з тими, хто працює в офісі. Добре, що ви вже знаєте, що t-критерій може з цим допомогти.
Компанія має дві незалежні команди розробників: одна працює віддалено, а друга працює з офісу. Вам надано два файли, 'work_from_home.csv'
та 'work_from_office.csv'
, які містять дані щодо кількості завдань, виконаних кожним розробником щомісяця.
Ваше завдання полягає у проведенні t-тесту. Компанія хоче знати, чи є розробники, які працюють у офісі, продуктивнішими, ніж працівники на дому. Якщо так, то вони також змусять другу команду працювати в офісі. У разі, якщо працівники на дому будуть продуктивніші, компанія не буде вносити жодних змін. Отже, бажана альтернативна гіпотеза звучить так: "Середня продуктивність працівників офісу є вищою, ніж у працівників на дому."
Давайте перевіримо, чи варіанти однакові:
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
Друге стандартне відхилення в два рази більше ніж перше, тому дисперсії відрізняються.
Згадайте функцію ttest_ind
, щоб виконати t-тест.
Завдання
- Імпортуйте
scipy.stats
, використовуючи псевдонімst
. - Проведіть t-тест із наступними параметрами:
- Вибірки:
home_workers
,office_workers
; - Альтернативна гіпотеза: офіс > дім;
- Відсутність однорідності дисперсій.
- Вибірки:
Дякуємо за ваш відгук!
Виклик
Компанія хоче визначити, чи є значна різниця у рівнях продуктивності розробників, які працюють з дому, порівняно з тими, хто працює в офісі. Добре, що ви вже знаєте, що t-критерій може з цим допомогти.
Компанія має дві незалежні команди розробників: одна працює віддалено, а друга працює з офісу. Вам надано два файли, 'work_from_home.csv'
та 'work_from_office.csv'
, які містять дані щодо кількості завдань, виконаних кожним розробником щомісяця.
Ваше завдання полягає у проведенні t-тесту. Компанія хоче знати, чи є розробники, які працюють у офісі, продуктивнішими, ніж працівники на дому. Якщо так, то вони також змусять другу команду працювати в офісі. У разі, якщо працівники на дому будуть продуктивніші, компанія не буде вносити жодних змін. Отже, бажана альтернативна гіпотеза звучить так: "Середня продуктивність працівників офісу є вищою, ніж у працівників на дому."
Давайте перевіримо, чи варіанти однакові:
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
Друге стандартне відхилення в два рази більше ніж перше, тому дисперсії відрізняються.
Згадайте функцію ttest_ind
, щоб виконати t-тест.
Завдання
- Імпортуйте
scipy.stats
, використовуючи псевдонімst
. - Проведіть t-тест із наступними параметрами:
- Вибірки:
home_workers
,office_workers
; - Альтернативна гіпотеза: офіс > дім;
- Відсутність однорідності дисперсій.
- Вибірки:
Дякуємо за ваш відгук!
Виклик
Компанія хоче визначити, чи є значна різниця у рівнях продуктивності розробників, які працюють з дому, порівняно з тими, хто працює в офісі. Добре, що ви вже знаєте, що t-критерій може з цим допомогти.
Компанія має дві незалежні команди розробників: одна працює віддалено, а друга працює з офісу. Вам надано два файли, 'work_from_home.csv'
та 'work_from_office.csv'
, які містять дані щодо кількості завдань, виконаних кожним розробником щомісяця.
Ваше завдання полягає у проведенні t-тесту. Компанія хоче знати, чи є розробники, які працюють у офісі, продуктивнішими, ніж працівники на дому. Якщо так, то вони також змусять другу команду працювати в офісі. У разі, якщо працівники на дому будуть продуктивніші, компанія не буде вносити жодних змін. Отже, бажана альтернативна гіпотеза звучить так: "Середня продуктивність працівників офісу є вищою, ніж у працівників на дому."
Давайте перевіримо, чи варіанти однакові:
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
Друге стандартне відхилення в два рази більше ніж перше, тому дисперсії відрізняються.
Згадайте функцію ttest_ind
, щоб виконати t-тест.
Завдання
- Імпортуйте
scipy.stats
, використовуючи псевдонімst
. - Проведіть t-тест із наступними параметрами:
- Вибірки:
home_workers
,office_workers
; - Альтернативна гіпотеза: офіс > дім;
- Відсутність однорідності дисперсій.
- Вибірки:
Дякуємо за ваш відгук!
Компанія хоче визначити, чи є значна різниця у рівнях продуктивності розробників, які працюють з дому, порівняно з тими, хто працює в офісі. Добре, що ви вже знаєте, що t-критерій може з цим допомогти.
Компанія має дві незалежні команди розробників: одна працює віддалено, а друга працює з офісу. Вам надано два файли, 'work_from_home.csv'
та 'work_from_office.csv'
, які містять дані щодо кількості завдань, виконаних кожним розробником щомісяця.
Ваше завдання полягає у проведенні t-тесту. Компанія хоче знати, чи є розробники, які працюють у офісі, продуктивнішими, ніж працівники на дому. Якщо так, то вони також змусять другу команду працювати в офісі. У разі, якщо працівники на дому будуть продуктивніші, компанія не буде вносити жодних змін. Отже, бажана альтернативна гіпотеза звучить так: "Середня продуктивність працівників офісу є вищою, ніж у працівників на дому."
Давайте перевіримо, чи варіанти однакові:
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
Друге стандартне відхилення в два рази більше ніж перше, тому дисперсії відрізняються.
Згадайте функцію ttest_ind
, щоб виконати t-тест.
Завдання
- Імпортуйте
scipy.stats
, використовуючи псевдонімst
. - Проведіть t-тест із наступними параметрами:
- Вибірки:
home_workers
,office_workers
; - Альтернативна гіпотеза: офіс > дім;
- Відсутність однорідності дисперсій.
- Вибірки: