Cursusinhoud
Statistiek Leren Met Python
Statistiek Leren Met Python
2. Gemiddelde, Mediaan en Modus met Python
4. Covariantie Versus Correlatie
Statistiek met Pandas
De Pandas-bibliotheek bevat al drie ingebouwde functies voor het berekenen van het gemiddelde en de mediaan. Om pandas
te importeren met het alias pd
, gebruik je de volgende syntaxis:
python
Hier is een voorbeeld van het berekenen van de .mean()
en .median()
voor de kolom 'work_year'
in de dataset genaamd df
.
Voel je vrij om de kolommen te wijzigen en de resultaten te observeren:
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculating the mean value mean = df['work_year'].mean() # Calculating the median value median = df['work_year'].median() print('The mean value is', mean) print('The median value is', median)
Voor het berekenen van belangrijke statistische waarden, gebruik methoden die ontworpen zijn voor het verwerken van metingen, zoals:
python
Was alles duidelijk?
Bedankt voor je feedback!
Sectie 2. Hoofdstuk 3