Operazioni di Base sui Dati in Polars
Scorri per mostrare il menu
Quando si lavora con grandi set di dati, una manipolazione efficiente dei dati è fondamentale. La libreria polars è progettata per operazioni sui dati ad alte prestazioni, rendendola una scelta popolare per la gestione di grandi quantità di dati in Python. In questo capitolo, verrà illustrato come caricare i dati, selezionare colonne specifiche e filtrare le righe utilizzando polars. Queste azioni di base costituiscono la base per trasformazioni dei dati più complesse.
La tabella seguente riassume le principali funzioni di polars per eseguire queste operazioni di base.
123456789import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Display the first 5 rows print(df.head())
In questo codice, viene importata la libreria polars e viene utilizzata la funzione pl.read_csv() per caricare i dati da un file chiamato "data/people.csv". Il DataFrame risultante viene memorizzato nella variabile df. Chiamando df.head(), è possibile visualizzare le prime cinque righe del DataFrame, utile per ispezionare rapidamente i dati dopo il caricamento.
1234567891011import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Select the "name" and "age" columns selected = df.select(["Variable name"]) print(selected)
Qui viene utilizzato il metodo select() per scegliere solo le colonne "name" e "age" dal DataFrame. Questo crea un nuovo DataFrame chiamato selected contenente solo queste colonne. La selezione delle colonne è un'operazione comune quando si desidera concentrarsi su parti specifiche dei dati per ulteriori analisi.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione