Kursinhalt
Pandas Erste Schritte
Pandas Erste Schritte
1. Die Allerersten Schritte
Was Ist Pandas? SerieHerausforderung: Eine Serie ErstellenDataframeQuiz: Erstellen Einer SerieQuiz: Erstellen Eines DataFrameHinzufügen Einer Neuen SpalteEinfügen Einer Neuen SpalteLöschen Einer Zeile/SpalteQuiz: Zuordnung der FunktionenMit Spalten ArbeitenQuiz: Spalten ExtrahierenIloc GrundlagenHerausforderung: Verwendung von Iloc
2. Dateien in Pandas Lesen
3. Daten Analysieren
Daten AnzeigenQuiz: Verwendung von HeadQuiz: Kopf, Ende und StichprobeErkundung des DatensatzesSpaltennamen und DatentypenNullwerte FindenQuiz: Nullwerte IdentifizierenHerausforderung: Nullwerte EntfernenHerausforderung: Nullwerte FüllenQuiz: NullwerteBeschreibung der DatenMax() und Min()Quiz: Statistische OperationenSum() und Count()Eindeutige Werte
Iloc Grundlagen
Sie können auch auf Zeilen in einem DataFrame über ihren Index zugreifen. Es gibt mehrere Möglichkeiten, dies zu tun:
.iloc
- wird verwendet, um auf Zeilen über ihren numerischen Index zuzugreifen, beginnend bei 0;.loc
- wird verwendet, um auf Zeilen über ihr String-Label zuzugreifen.
In diesem Kurs werden wir uns ausschließlich auf die Verwendung des .iloc
-Attributs konzentrieren.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
Das DataFrame hat die folgende Struktur:
Sie können die erste Spalte bemerken, die als Zeilenindex dient. Wir werden diese Indizes verwenden, um auf bestimmte Zeilen im DataFrame zuzugreifen. Die Syntax dieses Attributs ist wie folgt:
Wir können dieses Attribut anwenden, um auf die dritte und siebte Zeile unseres DataFrames zuzugreifen:
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) # Accessing to the third and seventh rows print(countries.iloc[2]) print(countries.iloc[6])
Nach dem Ausführen des obigen Codes erhalten Sie Zeilen, die den im Bild unten angegebenen Indizes entsprechen:
War alles klar?
Danke für Ihr Feedback!
Abschnitt 1. Kapitel 13