Kursinhalt
Lernen von Statistik mit Python
Lernen von Statistik mit Python
2. Mittelwert, Median und Modus mit Python
4. Kovarianz vs. Korrelation
Varianz mit Python Berechnen
Berechnung der Varianz mit NumPy
In NumPy müssen Sie die Sequenz von Werten (in unserem Fall die Spalte des Datensatzes) in die Funktion np.var()
eingeben, so: np.var(df['work_year'])
.
Berechnung der Varianz mit pandas
In pandas sollten Sie die Methode .var()
auf die Sequenz von Werten (in unserem Fall die Spalte des Datensatzes) anwenden, so: df['work_year'].var()
.
In beiden Fällen sind die Ergebnisse fast gleich. Die Unterschiede ergeben sich aus verschiedenen Nennern: N in NumPy und N-1 in pandas. Überprüfen Sie es jetzt!
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
War alles klar?
Danke für Ihr Feedback!
Abschnitt 3. Kapitel 3