CSV-Verarbeitung
Dies ist das abschließende Kapitel des Kurses und behandelt eines der gebräuchlichsten Formate für tabellarische Daten – CSV-Dateien.
CSV (Comma-Separated Values) ist ein einfaches Textformat, bei dem jede Zeile einen Datensatz darstellt und die Werte durch ein Trennzeichen, üblicherweise ein Komma (aber manchmal auch Semikolons, Tabs usw.), getrennt werden.
Das in Python integrierte Modul csv ermöglicht das Lesen, Schreiben und Verarbeiten von CSV-Dateien, ohne dass eine manuelle Zeichenkettenverarbeitung erforderlich ist.
CSV-Dateien lesen
Eine CSV-Datei öffnen und an csv.reader oder csv.DictReader übergeben:
csv.reader– jede Zeile als Liste, z. B.['Alice', '30', 'New York'];csv.DictReader– jede Zeile als Wörterbuch, wobei die erste Zeile als Kopfzeile verwendet wird, z. B.{'name': 'Alice', 'age': '30', 'city': 'New York'}.
DictReader ist oft praktischer, da auf Werte anhand von Spaltennamen statt Indizes zugegriffen werden kann.
CSV-Dateien schreiben
Um Daten in einer CSV-Datei zu speichern, csv.writer oder csv.DictWriter verwenden:
csv.writer– schreibt Zeilen als Listen mit.writerow()oder.writerows();csv.DictWriter– schreibt Zeilen als Wörterbücher.fieldnamesdefinieren,.writeheader()aufrufen und anschließend Zeilen mit.writerow()hinzufügen.
Dateien mit newline="" öffnen, um zusätzliche Leerzeilen auf manchen Systemen zu vermeiden.
Arbeiten mit CSV-Daten
Das csv-Modul bietet Optionen zur Anpassung der Datenverarbeitung:
- Trennzeichen – Änderung mit
delimiter=";"oder"\t"; - Anführungszeichen/Escaping – Steuerung mit
quotechar='"'undquoting=csv.QUOTE_ALLodercsv.QUOTE_MINIMAL; - Zeilenenden – Festlegung mit
lineterminator="\n"oder"\r\n"für Konsistenz; - Kodierung – Verwendung von
encoding="utf-8"(oder einer anderen) für nicht-englische Texte; - Große Dateien – zeilenweises Einlesen, um das Laden des gesamten Inhalts in den Speicher zu vermeiden.
Zusammenfassung
- CSV ist ein universelles, menschenlesbares Format für tabellarische Daten;
- Verwendung von
csv.reader/csv.DictReaderzum Lesen; - Verwendung von
csv.writer/csv.DictWriterzum Schreiben; - Konfiguration von Trennzeichen, Anführungszeichen und Kodierung entsprechend der Dateistruktur;
- Verarbeitung großer Dateien durch Datenstreaming anstelle des vollständigen Ladens in den Speicher.
Damit ist der Kurs abgeschlossen. Im Verlauf haben wir die Grundlagen der Python-Programmierung behandelt.
Sie haben grundlegende Datentypen und Variablen kennengelernt, mit Listen, Tupeln, Mengen und Dictionaries gearbeitet und verstanden, wie man Logik mit Schleifen und Bedingungen strukturiert. Außerdem haben wir behandelt, wie Klassen und Objekte erstellt werden und schließlich, wie Dateien verarbeitet werden — einschließlich Textdateien, JSON und CSV.
Diese Fähigkeiten bilden eine solide Grundlage zur Lösung praxisnaher Programmieraufgaben und zur Vorbereitung auf weiterführende Themen. Vielen Dank für Ihre Teilnahme an diesem Kurs.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 5
CSV-Verarbeitung
Swipe um das Menü anzuzeigen
Dies ist das abschließende Kapitel des Kurses und behandelt eines der gebräuchlichsten Formate für tabellarische Daten – CSV-Dateien.
CSV (Comma-Separated Values) ist ein einfaches Textformat, bei dem jede Zeile einen Datensatz darstellt und die Werte durch ein Trennzeichen, üblicherweise ein Komma (aber manchmal auch Semikolons, Tabs usw.), getrennt werden.
Das in Python integrierte Modul csv ermöglicht das Lesen, Schreiben und Verarbeiten von CSV-Dateien, ohne dass eine manuelle Zeichenkettenverarbeitung erforderlich ist.
CSV-Dateien lesen
Eine CSV-Datei öffnen und an csv.reader oder csv.DictReader übergeben:
csv.reader– jede Zeile als Liste, z. B.['Alice', '30', 'New York'];csv.DictReader– jede Zeile als Wörterbuch, wobei die erste Zeile als Kopfzeile verwendet wird, z. B.{'name': 'Alice', 'age': '30', 'city': 'New York'}.
DictReader ist oft praktischer, da auf Werte anhand von Spaltennamen statt Indizes zugegriffen werden kann.
CSV-Dateien schreiben
Um Daten in einer CSV-Datei zu speichern, csv.writer oder csv.DictWriter verwenden:
csv.writer– schreibt Zeilen als Listen mit.writerow()oder.writerows();csv.DictWriter– schreibt Zeilen als Wörterbücher.fieldnamesdefinieren,.writeheader()aufrufen und anschließend Zeilen mit.writerow()hinzufügen.
Dateien mit newline="" öffnen, um zusätzliche Leerzeilen auf manchen Systemen zu vermeiden.
Arbeiten mit CSV-Daten
Das csv-Modul bietet Optionen zur Anpassung der Datenverarbeitung:
- Trennzeichen – Änderung mit
delimiter=";"oder"\t"; - Anführungszeichen/Escaping – Steuerung mit
quotechar='"'undquoting=csv.QUOTE_ALLodercsv.QUOTE_MINIMAL; - Zeilenenden – Festlegung mit
lineterminator="\n"oder"\r\n"für Konsistenz; - Kodierung – Verwendung von
encoding="utf-8"(oder einer anderen) für nicht-englische Texte; - Große Dateien – zeilenweises Einlesen, um das Laden des gesamten Inhalts in den Speicher zu vermeiden.
Zusammenfassung
- CSV ist ein universelles, menschenlesbares Format für tabellarische Daten;
- Verwendung von
csv.reader/csv.DictReaderzum Lesen; - Verwendung von
csv.writer/csv.DictWriterzum Schreiben; - Konfiguration von Trennzeichen, Anführungszeichen und Kodierung entsprechend der Dateistruktur;
- Verarbeitung großer Dateien durch Datenstreaming anstelle des vollständigen Ladens in den Speicher.
Damit ist der Kurs abgeschlossen. Im Verlauf haben wir die Grundlagen der Python-Programmierung behandelt.
Sie haben grundlegende Datentypen und Variablen kennengelernt, mit Listen, Tupeln, Mengen und Dictionaries gearbeitet und verstanden, wie man Logik mit Schleifen und Bedingungen strukturiert. Außerdem haben wir behandelt, wie Klassen und Objekte erstellt werden und schließlich, wie Dateien verarbeitet werden — einschließlich Textdateien, JSON und CSV.
Diese Fähigkeiten bilden eine solide Grundlage zur Lösung praxisnaher Programmieraufgaben und zur Vorbereitung auf weiterführende Themen. Vielen Dank für Ihre Teilnahme an diesem Kurs.
Danke für Ihr Feedback!