Basic Data Operations in Polars
Swipe um das Menü anzuzeigen
Bei der Arbeit mit großen Datensätzen ist eine effiziente Datenmanipulation unerlässlich. Die Bibliothek polars ist für leistungsstarke Datenoperationen konzipiert und daher eine beliebte Wahl für die Verarbeitung großer Datenmengen in Python. In diesem Kapitel werden das Laden von Daten, die Auswahl bestimmter Spalten und das Filtern von Zeilen mit polars behandelt. Diese grundlegenden Aktionen bilden die Basis für komplexere Datenumwandlungen.
Die folgende Tabelle fasst die wichtigsten Funktionen in polars für diese grundlegenden Operationen zusammen.
123456789import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Display the first 5 rows print(df.head())
In diesem Code wird die Bibliothek polars importiert und die Funktion pl.read_csv() verwendet, um Daten aus einer Datei namens "data/people.csv" zu laden. Das resultierende DataFrame wird in der Variablen df gespeichert. Mit dem Aufruf von df.head() werden die ersten fünf Zeilen des DataFrames angezeigt, was hilfreich ist, um die Daten nach dem Laden schnell zu überprüfen.
1234567891011import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Select the "name" and "age" columns selected = df.select(["Variable name"]) print(selected)
Hier wird die Methode select() verwendet, um nur die Spalten "name" und "age" aus dem DataFrame auszuwählen. Dadurch entsteht ein neues DataFrame namens selected, das nur diese Spalten enthält. Das Auswählen von Spalten ist eine gängige Operation, wenn bestimmte Teile der Daten für eine weitere Analyse betrachtet werden sollen.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen