Kursinnhold
Lære Statistikk med Python
Lære Statistikk med Python
2. Gjennomsnitt, Median og Modus med Python
4. Kovarians vs. Korrelasjon
Statistikk med Pandas
Pandas-biblioteket har allerede tre innebygde funksjoner for å beregne gjennomsnitt og median. For å importere pandas
med aliaset pd
, bruk følgende syntaks:
python
Her er et eksempel på hvordan du beregner .mean()
og .median()
for kolonnen 'work_year'
i datasettet kalt df
.
Du kan gjerne endre kolonnene og observere resultatene:
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculating the mean value mean = df['work_year'].mean() # Calculating the median value median = df['work_year'].median() print('The mean value is', mean) print('The median value is', median)
For å beregne sentrale statistiske verdier, bruk metoder som er utviklet for å håndtere målinger, slik som:
python
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 2. Kapittel 3