Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen CSV-Dateien | Dateien in Pandas Einlesen
Pandas Erste Schritte

bookCSV-Dateien

Da pandas die Standardbibliothek für Datenanalyse und -manipulation ist, gehört zu seinen wichtigsten Funktionen die Fähigkeit, verschiedene Dateitypen zu lesen und zu schreiben, einschließlich CSV-Dateien.

Eine CSV (Comma-Separated Values)-Datei ist eine Textdatei zur Speicherung tabellarischer Daten, wobei jede Zeile einen Datensatz darstellt und die Spalten durch Kommas getrennt sind.

Eine CSV-Datei kann folgende Daten enthalten:

  • Zahlen: Ganzzahlen oder Dezimalwerte (z. B. 42, 3.14);
  • Text: Zeichenketten oder kategoriale Daten (z. B. John, Active);
  • Datum/Uhrzeit: Zeitstempel (z. B. 2023-12-30);
  • Booleans: Logische Werte (True, False).

Jede Zeile muss die gleiche Anzahl an Spalten haben, und die erste Zeile enthält häufig die Spaltenüberschriften.

Funktionen wie read_csv() und to_csv() sind nützlich für die Arbeit mit CSV-Daten.

Die grundlegende Syntax von read_csv() und wichtige Parameter sind wie folgt:

pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
  • filepath_or_buffer: Pfad zur CSV-Datei (String oder URL);
  • sep: Trennzeichen (Standard ist ein Komma ,);
  • header: Zeilennummer, die als Spaltenüberschrift verwendet wird (Standard ist die erste Zeile);
  • names: Liste der zu verwendenden Spaltennamen;
  • usecols: Zu lesende Spalten (Teilmenge der Spalten).
12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy
Note
Hinweis

Stellen Sie sicher, dass der Link zum Datensatz in Anführungszeichen steht.

Die grundlegende Syntax von to_csv() und die wichtigsten Parameter sind wie folgt:

pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
  • path_or_buf: Dateipfad oder Objekt, in das die CSV-Datei geschrieben werden soll;
  • sep: Trennzeichen zur Abgrenzung der Werte (Standard ist ein Komma ,);
  • columns: Teilmenge der zu schreibenden Spalten (Standard ist alle Spalten);
  • header: Gibt an, ob die Spaltennamen als Kopfzeile eingefügt werden sollen (Standard ist True);
  • index: Gibt an, ob die Zeilenindizes in die Datei geschrieben werden sollen (Standard ist True).
1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Aufgabe

Swipe to start coding

Ihnen wird eine URL zu einer CSV-Datei gegeben, die als Zeichenkette in der Variablen file_url gespeichert ist.

  • Lesen Sie die CSV-Datei von der angegebenen URL in ein DataFrame mit dem Namen wine_data ein.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 1
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

What are some common use cases for reading and writing CSV files with pandas?

Can you explain the difference between the `header` and `names` parameters in `read_csv()`?

How do I select only specific columns when reading a CSV file with pandas?

close

Awesome!

Completion rate improved to 3.03

bookCSV-Dateien

Swipe um das Menü anzuzeigen

Da pandas die Standardbibliothek für Datenanalyse und -manipulation ist, gehört zu seinen wichtigsten Funktionen die Fähigkeit, verschiedene Dateitypen zu lesen und zu schreiben, einschließlich CSV-Dateien.

Eine CSV (Comma-Separated Values)-Datei ist eine Textdatei zur Speicherung tabellarischer Daten, wobei jede Zeile einen Datensatz darstellt und die Spalten durch Kommas getrennt sind.

Eine CSV-Datei kann folgende Daten enthalten:

  • Zahlen: Ganzzahlen oder Dezimalwerte (z. B. 42, 3.14);
  • Text: Zeichenketten oder kategoriale Daten (z. B. John, Active);
  • Datum/Uhrzeit: Zeitstempel (z. B. 2023-12-30);
  • Booleans: Logische Werte (True, False).

Jede Zeile muss die gleiche Anzahl an Spalten haben, und die erste Zeile enthält häufig die Spaltenüberschriften.

Funktionen wie read_csv() und to_csv() sind nützlich für die Arbeit mit CSV-Daten.

Die grundlegende Syntax von read_csv() und wichtige Parameter sind wie folgt:

pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
  • filepath_or_buffer: Pfad zur CSV-Datei (String oder URL);
  • sep: Trennzeichen (Standard ist ein Komma ,);
  • header: Zeilennummer, die als Spaltenüberschrift verwendet wird (Standard ist die erste Zeile);
  • names: Liste der zu verwendenden Spaltennamen;
  • usecols: Zu lesende Spalten (Teilmenge der Spalten).
12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy
Note
Hinweis

Stellen Sie sicher, dass der Link zum Datensatz in Anführungszeichen steht.

Die grundlegende Syntax von to_csv() und die wichtigsten Parameter sind wie folgt:

pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
  • path_or_buf: Dateipfad oder Objekt, in das die CSV-Datei geschrieben werden soll;
  • sep: Trennzeichen zur Abgrenzung der Werte (Standard ist ein Komma ,);
  • columns: Teilmenge der zu schreibenden Spalten (Standard ist alle Spalten);
  • header: Gibt an, ob die Spaltennamen als Kopfzeile eingefügt werden sollen (Standard ist True);
  • index: Gibt an, ob die Zeilenindizes in die Datei geschrieben werden sollen (Standard ist True).
1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Aufgabe

Swipe to start coding

Ihnen wird eine URL zu einer CSV-Datei gegeben, die als Zeichenkette in der Variablen file_url gespeichert ist.

  • Lesen Sie die CSV-Datei von der angegebenen URL in ein DataFrame mit dem Namen wine_data ein.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 1
single

single

some-alt