CSV-Dateien

Da pandas die Standardbibliothek für Datenanalyse und -manipulation ist, gehört zu seinen wichtigsten Funktionen die Fähigkeit, verschiedene Dateitypen zu lesen und zu schreiben, einschließlich CSV-Dateien.

Eine CSV (Comma-Separated Values)-Datei ist eine Textdatei zur Speicherung tabellarischer Daten, wobei jede Zeile einen Datensatz darstellt und die Spalten durch Kommas getrennt sind.

Eine CSV-Datei kann folgende Daten enthalten:

Zahlen: Ganzzahlen oder Dezimalwerte (z. B. 42, 3.14);
Text: Zeichenketten oder kategoriale Daten (z. B. John, Active);
Daten/Uhrzeiten: Zeitstempel (z. B. 2023-12-30);
Booleans: Logische Werte (True, False).

Jede Zeile muss die gleiche Anzahl an Spalten haben, und die erste Zeile enthält häufig die Spaltenüberschriften.

Funktionen wie read_csv() und to_csv() sind nützlich für die Arbeit mit CSV-Daten.

Die grundlegende Syntax von read_csv() und wichtige Parameter sind wie folgt:

Hier ist die aktualisierte Version mit dem index_col-Parameter, der klar erklärt wird:

pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, index_col=None, ...)

filepath_or_buffer: Pfad zur CSV-Datei (String oder URL);
sep: Trennzeichen (Standard ist ein Komma ,);
header: Zeilennummer, die als Spaltenüberschriften verwendet wird (Standard ist die erste Zeile);
names: Liste der zu verwendenden Spaltennamen;
usecols: Teilmenge der zu lesenden Spalten;
index_col: Spalte (oder Liste von Spalten), die als DataFrame-Index gesetzt wird.


              12345
            
# Loading the CSV into a `DataFrame`
import pandas as pd

salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv')
print(salary_data)

Hinweis

Stelle sicher, dass der Datensatz-Link in Anführungszeichen steht.

Die grundlegende Syntax von to_csv() und die wichtigsten Parameter sind wie folgt:

pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)

path_or_buf: Dateipfad oder Objekt, in das die CSV-Datei geschrieben werden soll;
sep: Trennzeichen zur Abgrenzung der Werte (Standard ist ein Komma ,);
columns: Teilmenge der zu schreibenden Spalten (Standard sind alle Spalten);
header: Gibt an, ob die Spaltennamen als Kopfzeile eingefügt werden sollen (Standard ist True);
index: Gibt an, ob die Zeilenindizes in die Datei geschrieben werden sollen (Standard ist True).


              1234567
            
import pandas as pd

countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']}
countries = pd.DataFrame(countries_data)

countries.to_csv('countries.csv')
print('Done')

War alles klar?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 1

single

Swipe um das Menü anzuzeigen

Eine CSV (Comma-Separated Values)-Datei ist eine Textdatei zur Speicherung tabellarischer Daten, wobei jede Zeile einen Datensatz darstellt und die Spalten durch Kommas getrennt sind.

Eine CSV-Datei kann folgende Daten enthalten:

Zahlen: Ganzzahlen oder Dezimalwerte (z. B. 42, 3.14);
Text: Zeichenketten oder kategoriale Daten (z. B. John, Active);
Daten/Uhrzeiten: Zeitstempel (z. B. 2023-12-30);
Booleans: Logische Werte (True, False).

Jede Zeile muss die gleiche Anzahl an Spalten haben, und die erste Zeile enthält häufig die Spaltenüberschriften.

Funktionen wie read_csv() und to_csv() sind nützlich für die Arbeit mit CSV-Daten.

Die grundlegende Syntax von read_csv() und wichtige Parameter sind wie folgt:

Hier ist die aktualisierte Version mit dem index_col-Parameter, der klar erklärt wird:

pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, index_col=None, ...)

filepath_or_buffer: Pfad zur CSV-Datei (String oder URL);
sep: Trennzeichen (Standard ist ein Komma ,);
header: Zeilennummer, die als Spaltenüberschriften verwendet wird (Standard ist die erste Zeile);
names: Liste der zu verwendenden Spaltennamen;
usecols: Teilmenge der zu lesenden Spalten;
index_col: Spalte (oder Liste von Spalten), die als DataFrame-Index gesetzt wird.


              12345
            
# Loading the CSV into a `DataFrame`
import pandas as pd

salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv')
print(salary_data)

Hinweis

Stelle sicher, dass der Datensatz-Link in Anführungszeichen steht.

Die grundlegende Syntax von to_csv() und die wichtigsten Parameter sind wie folgt:

pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)

path_or_buf: Dateipfad oder Objekt, in das die CSV-Datei geschrieben werden soll;
sep: Trennzeichen zur Abgrenzung der Werte (Standard ist ein Komma ,);
columns: Teilmenge der zu schreibenden Spalten (Standard sind alle Spalten);
header: Gibt an, ob die Spaltennamen als Kopfzeile eingefügt werden sollen (Standard ist True);
index: Gibt an, ob die Zeilenindizes in die Datei geschrieben werden sollen (Standard ist True).


              1234567
            
import pandas as pd

countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']}
countries = pd.DataFrame(countries_data)

countries.to_csv('countries.csv')
print('Done')

Aufgabe

Wischen, um mit dem Codieren zu beginnen

Sie erhalten eine URL zu einer CSV-Datei, die als Zeichenkette in der Variablen file_url gespeichert ist.

Lesen Sie die CSV-Datei von der angegebenen URL in ein DataFrame mit dem Namen wine_data ein.

Lösung

Wechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden

War alles klar?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 1

single

Fragen Sie AI

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen