Kursinnehåll

Lära Sig Statistik med Python

1. Grundläggande Begrepp

Stickprov kontra Population Typer av Statistik Datatyper Medelvärde Medianvärde Medianvärde för ett jämnt antal värden Medelvärde eller Median Typvärde Quiz om Beskrivande Statistik

2. Medelvärde, Median och Typvärde med Python

Undersök Datasetet Beräkning av Medelvärde och Medianvärde med Python Statistik med Pandas Beräkna Medel- och Medianlön

3. Varians och Standardavvikelse

Populationsvarians Stickprovsvarians Beräkna Varians med Python Standardavvikelse Standardavvikelse med Python Beräkning av varians och standardavvikelse

4. Kovarians vs Korrelation

Kovarians Korrelation Quiz om Kovarians och Korrelation Beräkna Kovarians och Korrelation

5. Konfidensintervall

Utforska Datamängden Konfidensintervall Beräkning av Konfidensintervall med Python Quiz om Konfidensintervallens Bredd Beräkna 95 % Konfidensintervall Avancerad Konfidensintervallberäkning med Python Matcha Funktionerna

6. Statistisk Testning

Vad är t-test Hypoteser T-test Matematiskt Enkelriktat och Dubbelriktat Test Antaganden för T-test Utföra ett t-test i Python Utföra ett t-test Parat t-test

Utföra ett t-test i Python

För att utföra ett t-test i Python behöver du endast ange den alternativa hypotesen och ange om varianserna är ungefär lika (homogena).

Funktionen ttest_ind() i scipy.stats hanterar resten. Nedan visas syntaxen:

st.ttest_ind(a, b, equal_var=True, alternative='two-sided')

Parametrar:

a — det första urvalet;
b — det andra urvalet;
equal_var — sätt till True om varianserna är ungefär lika, och False om de inte är det;
alternative — typ av alternativ hypotes:
- 'two-sided' — anger att medelvärdena inte är lika;
- 'less' — innebär att det första medelvärdet är mindre än det andra;
- 'greater' — innebär att det första medelvärdet är större än det andra.

Returvärden:

statistic — värdet på t-statistikan;
pvalue — p-värdet.

Fokus ligger på p-value. Om p-value är lägre än α (vanligtvis 0,05) hamnar t-statistikan inom det kritiska området, vilket leder till att den alternativa hypotesen accepteras. Om p-value är större än α accepteras nollhypotesen, vilket indikerar att medelvärdena är lika.

Här är ett exempel på hur t-testet tillämpas på höjddatamängden:


              123456789101112131415
            
import pandas as pd
import scipy.stats as st

# Load the data
male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze()
female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze()

# Apply t-test
t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater")

if pvalue > 0.05:
# Check if we should support or not the null hypothesis if pvalue > 0.05:
    print("We support the null hypothesis, the mean values are equal")
else:
    print("We reject the null hypothesis, males are taller")

Var allt tydligt?

Tack för dina kommentarer!

Avsnitt 6. Kapitel 6

Fråga AI

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal