Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Suorita t-testi | Tilastollinen Testaus
Tilastotieteen Opiskelu Pythonilla

bookSuorita t-testi

Yritys haluaa selvittää, onko etätyötä tekevien ja toimistolla työskentelevien kehittäjien tuottavuustasoissa merkittävää eroa. Onneksi tiedät jo, että t-testi voi auttaa tässä.

Yrityksellä on kaksi toisistaan riippumatonta kehittäjätiimiä: toinen työskentelee etänä ja toinen toimistolla. Sinulle on toimitettu kaksi tiedostoa, 'work_from_home.csv' ja 'work_from_office.csv', jotka sisältävät kunkin kehittäjän kuukausittaiset tehtävien suoritusmäärät.

Tehtävänä on suorittaa t-testi. Yritys haluaa tietää, ovatko toimistolla työskentelevät kehittäjät tuottavampia kuin etätyöntekijät. Jos näin on, myös toinen tiimi määrätään työskentelemään toimistolla. Mikäli etätyöntekijät ovat tuottavampia, yritys ei tee muutoksia. Haluttu vaihtoehtoinen hypoteesi on "Toimistotyöntekijöiden keskimääräinen tuottavuus on suurempi kuin etätyöntekijöiden".

Tarkista, ovatko varianssit samat:

1234567
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
copy

Toinen keskihajonta on kaksinkertainen ensimmäiseen verrattuna, joten varianssit eroavat toisistaan. Muista käyttää funktiota ttest_ind t-testin suorittamiseen.

st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Tehtävä

Swipe to start coding

Vertaat työntekijöiden tuottavuutta, jotka työskentelevät kotoa käsin ja toimistolta käsin. Tavoitteena on selvittää, onko toimistotyöntekijöillä keskimäärin suurempi tuottavuus kuin etätyöntekijöillä käyttämällä kahden riippumattoman otoksen t-testiä.

  1. Tuo scipy.stats-kirjasto aliaksella st.
  2. Käytä st.ttest_ind()-funktiota t-testin suorittamiseen seuraavasti:
  • Otokset: office_workers, home_workers.
  • Vaihtoehtoinen hypoteesi: office > home.
  • Varianssit eivät ole yhtä suuret (equal_var=False).
  1. Tallenna tulokset muuttujiin tstat ja pvalue.
  2. Perustaen pvalue-arvoon, tulosta jompikumpi seuraavista viesteistä:
  • "We support the null hypothesis, the mean values are equal" jos pvalue > 0.05.
  • "We reject the null hypothesis, the mean values are different" muussa tapauksessa.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 6. Luku 7
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

Awesome!

Completion rate improved to 2.63

bookSuorita t-testi

Pyyhkäise näyttääksesi valikon

Yritys haluaa selvittää, onko etätyötä tekevien ja toimistolla työskentelevien kehittäjien tuottavuustasoissa merkittävää eroa. Onneksi tiedät jo, että t-testi voi auttaa tässä.

Yrityksellä on kaksi toisistaan riippumatonta kehittäjätiimiä: toinen työskentelee etänä ja toinen toimistolla. Sinulle on toimitettu kaksi tiedostoa, 'work_from_home.csv' ja 'work_from_office.csv', jotka sisältävät kunkin kehittäjän kuukausittaiset tehtävien suoritusmäärät.

Tehtävänä on suorittaa t-testi. Yritys haluaa tietää, ovatko toimistolla työskentelevät kehittäjät tuottavampia kuin etätyöntekijät. Jos näin on, myös toinen tiimi määrätään työskentelemään toimistolla. Mikäli etätyöntekijät ovat tuottavampia, yritys ei tee muutoksia. Haluttu vaihtoehtoinen hypoteesi on "Toimistotyöntekijöiden keskimääräinen tuottavuus on suurempi kuin etätyöntekijöiden".

Tarkista, ovatko varianssit samat:

1234567
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
copy

Toinen keskihajonta on kaksinkertainen ensimmäiseen verrattuna, joten varianssit eroavat toisistaan. Muista käyttää funktiota ttest_ind t-testin suorittamiseen.

st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Tehtävä

Swipe to start coding

Vertaat työntekijöiden tuottavuutta, jotka työskentelevät kotoa käsin ja toimistolta käsin. Tavoitteena on selvittää, onko toimistotyöntekijöillä keskimäärin suurempi tuottavuus kuin etätyöntekijöillä käyttämällä kahden riippumattoman otoksen t-testiä.

  1. Tuo scipy.stats-kirjasto aliaksella st.
  2. Käytä st.ttest_ind()-funktiota t-testin suorittamiseen seuraavasti:
  • Otokset: office_workers, home_workers.
  • Vaihtoehtoinen hypoteesi: office > home.
  • Varianssit eivät ole yhtä suuret (equal_var=False).
  1. Tallenna tulokset muuttujiin tstat ja pvalue.
  2. Perustaen pvalue-arvoon, tulosta jompikumpi seuraavista viesteistä:
  • "We support the null hypothesis, the mean values are equal" jos pvalue > 0.05.
  • "We reject the null hypothesis, the mean values are different" muussa tapauksessa.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 6. Luku 7
single

single

some-alt