Kursinhalt
Pandas Erste Schritte
Pandas Erste Schritte
CSV-Dateien
Da pandas
die bevorzugte Bibliothek für Datenanalyse und -manipulation ist, ist eine ihrer Hauptfunktionen die Fähigkeit, verschiedene Dateitypen zu lesen und zu schreiben, einschließlich CSV-Dateien.
Eine CSV (Comma-Separated Values)-Datei ist eine einfache Textdatei, die zur Speicherung tabellarischer Daten verwendet wird, wobei jede Zeile einen Datensatz darstellt und die Spalten durch Kommas getrennt sind.
Eine CSV-Datei kann die folgenden Daten enthalten:
- Zahlen: Ganzzahlen oder Dezimalwerte (z.B.
42
,3.14
); - Text: Zeichenfolgen oder kategoriale Daten (z.B.
John
,Active
); - Daten/Zeitangaben: Zeitstempel (z.B.
2023-12-30
); - Booleans: logische Werte (
True
,False
).
Jede Zeile muss die gleiche Anzahl von Spalten haben, und die erste Zeile enthält oft Spaltenüberschriften.
Funktionen wie read_csv()
und to_csv()
sind nützlich für den Umgang mit CSV-Daten.
Die grundlegende Syntax von read_csv()
und die wichtigsten Parameter sind wie folgt:
filepath_or_buffer
: Pfad zur CSV-Datei (String oder URL);sep
: Trennzeichen (Standard ist ein Komma,
);header
: Zeilennummer, die als Spaltenüberschriften verwendet werden soll (Standard ist die erste Zeile);names
: Liste der zu verwendenden Spaltennamen;usecols
: zu lesende Spalten (Teilmenge der Spalten).
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Hinweis
Stellen Sie sicher, dass der Datensatzlink in Anführungszeichen gesetzt ist.
Die grundlegende Syntax von to_csv()
und die wichtigsten Parameter sind wie folgt:
path_or_buf
: Dateipfad oder Objekt, in das die CSV geschrieben werden soll;sep
: Trennzeichen zum Trennen von Werten (Standard ist ein Komma,
);columns
: Teilmenge der zu schreibenden Spalten (Standard sind alle Spalten);header
: ob Spaltennamen als Kopfzeile enthalten sein sollen (Standard istTrue
);index
: ob Zeilenindizes in die Datei geschrieben werden sollen (Standard istTrue
).
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
- Lesen Sie die CSV-Datei in ein DataFrame ein.
- Zeigen Sie den Inhalt auf Ihrem Bildschirm an.
Lösung
Danke für Ihr Feedback!
CSV-Dateien
Da pandas
die bevorzugte Bibliothek für Datenanalyse und -manipulation ist, ist eine ihrer Hauptfunktionen die Fähigkeit, verschiedene Dateitypen zu lesen und zu schreiben, einschließlich CSV-Dateien.
Eine CSV (Comma-Separated Values)-Datei ist eine einfache Textdatei, die zur Speicherung tabellarischer Daten verwendet wird, wobei jede Zeile einen Datensatz darstellt und die Spalten durch Kommas getrennt sind.
Eine CSV-Datei kann die folgenden Daten enthalten:
- Zahlen: Ganzzahlen oder Dezimalwerte (z.B.
42
,3.14
); - Text: Zeichenfolgen oder kategoriale Daten (z.B.
John
,Active
); - Daten/Zeitangaben: Zeitstempel (z.B.
2023-12-30
); - Booleans: logische Werte (
True
,False
).
Jede Zeile muss die gleiche Anzahl von Spalten haben, und die erste Zeile enthält oft Spaltenüberschriften.
Funktionen wie read_csv()
und to_csv()
sind nützlich für den Umgang mit CSV-Daten.
Die grundlegende Syntax von read_csv()
und die wichtigsten Parameter sind wie folgt:
filepath_or_buffer
: Pfad zur CSV-Datei (String oder URL);sep
: Trennzeichen (Standard ist ein Komma,
);header
: Zeilennummer, die als Spaltenüberschriften verwendet werden soll (Standard ist die erste Zeile);names
: Liste der zu verwendenden Spaltennamen;usecols
: zu lesende Spalten (Teilmenge der Spalten).
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Hinweis
Stellen Sie sicher, dass der Datensatzlink in Anführungszeichen gesetzt ist.
Die grundlegende Syntax von to_csv()
und die wichtigsten Parameter sind wie folgt:
path_or_buf
: Dateipfad oder Objekt, in das die CSV geschrieben werden soll;sep
: Trennzeichen zum Trennen von Werten (Standard ist ein Komma,
);columns
: Teilmenge der zu schreibenden Spalten (Standard sind alle Spalten);header
: ob Spaltennamen als Kopfzeile enthalten sein sollen (Standard istTrue
);index
: ob Zeilenindizes in die Datei geschrieben werden sollen (Standard istTrue
).
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
- Lesen Sie die CSV-Datei in ein DataFrame ein.
- Zeigen Sie den Inhalt auf Ihrem Bildschirm an.
Lösung
Danke für Ihr Feedback!