Kursinhalt
Lernen von Statistik mit Python
Lernen von Statistik mit Python
2. Mittelwert, Median und Modus mit Python
4. Kovarianz vs. Korrelation
Untersuchen Sie den Datensatz
In diesem Abschnitt werden wir eine Stichprobe von IT-Spezialisten-Gehältern analysieren. Werfen wir zunächst einen Blick auf die ersten fünf Beobachtungen des Datensatzes:
work_year | experience_level | job_title | salary | salary_currency | salary_in_usd | company_location | company_size | |
---|---|---|---|---|---|---|---|---|
0 | 2020 | MI | Data Scientist | 70000 | EUR | 79833 | DE | L |
1 | 2020 | SE | Machine Learning Scientist | 260000 | USD | 260000 | JP | S |
2 | 2020 | SE | Big Data Engineer | 85000 | GBP | 109024 | GB | M |
3 | 2020 | MI | Product Data Analyst | 20000 | USD | 20000 | HN | S |
4 | 2020 | SE | Machine Learning Engineer | 150000 | USD | 150000 | US | L |
work_year
- das Jahr, in dem das Gehalt gezahlt wurde;experience_level
- das Erfahrungsniveau: EN ist Einstiegsniveau, MI ist mittleres Niveau, SE ist Senior-Niveau, EX ist Führungsebene;job_title
- der Name eines Jobs;salary
- der Wert des Gehalts;salary_currency
- die Währung des Gehalts;salary_in_usd
- der Wert des Gehalts in USD;company_location
- der Standort des Unternehmens;company_size
- die Größe des Unternehmens: S-Klein, M-Mittel, L-Groß.
Nun lassen Sie uns die Datentypen in der Statistik überprüfen, und anschließend ordnen Sie jeden Spaltennamen seinem jeweiligen Typ zu.
War alles klar?
Danke für Ihr Feedback!
Abschnitt 2. Kapitel 1