File CSV
Poiché pandas
è la libreria di riferimento per l'analisi e la manipolazione dei dati, una delle sue caratteristiche principali è la capacità di leggere e scrivere vari tipi di file, inclusi i file CSV.
Un CSV (Comma-Separated Values) è un file di testo semplice utilizzato per memorizzare dati tabulari, dove ogni riga rappresenta un record e le colonne sono separate da virgole.
Un file CSV può contenere i seguenti dati:
Numeri: valori interi o decimali (ad es.,
42
,3.14
);Testo: stringhe o dati categorici (ad es.,
John
,Active
);Date/Orari: timestamp (ad es.,
2023-12-30
);Booleani: valori logici (
True
,False
).
Ogni riga deve avere lo stesso numero di colonne e la prima riga spesso contiene le intestazioni delle colonne.
Funzioni come read_csv()
e to_csv()
sono utili per gestire i dati CSV.
La sintassi di base di read_csv()
e i parametri chiave sono i seguenti:
pythonpandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer
: percorso al file CSV (stringa o URL);sep
: delimitatore (il valore predefinito è una virgola,
);header
: numero di riga da utilizzare come intestazioni delle colonne (il valore predefinito è la prima riga);names
: Elenco dei nomi delle colonne da utilizzare;usecols
: colonne da leggere (sottoinsieme di colonne).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Nota
Assicurati che il link del dataset sia racchiuso tra virgolette.
La sintassi di base di to_csv()
e i parametri chiave sono i seguenti:
pythonpandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf
: percorso del file o oggetto dove il CSV dovrebbe essere scritto;sep
: delimitatore per separare i valori (il valore predefinito è una virgola,
);columns
: sottoinsieme di colonne da scrivere (il valore predefinito è tutte le colonne);header
: se includere i nomi delle colonne come intestazione (il valore predefinito èTrue
);index
: se scrivere gli indici delle righe nel file (il valore predefinito èTrue
).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Ti viene fornito un URL a un file CSV memorizzato come stringa nella variabile file_url
.
- Leggi il file CSV dall'URL fornito in un
DataFrame
chiamatowine_data
.
Soluzione
Grazie per i tuoi commenti!
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione