File CSV
Poiché pandas
è la libreria di riferimento per l'analisi e la manipolazione dei dati, una delle sue caratteristiche principali è la capacità di leggere e scrivere vari tipi di file, inclusi i file CSV.
Un CSV (Comma-Separated Values) è un file di testo semplice utilizzato per memorizzare dati tabulari, dove ogni riga rappresenta un record e le colonne sono separate da virgole.
Un file CSV può contenere i seguenti dati:
- Numeri: valori interi o decimali (ad es.,
42
,3.14
); - Testo: stringhe o dati categorici (ad es.,
John
,Active
); - Date/Orari: timestamp (ad es.,
2023-12-30
); - Booleani: valori logici (
True
,False
).
Ogni riga deve avere lo stesso numero di colonne e la prima riga spesso contiene le intestazioni delle colonne.
Funzioni come read_csv()
e to_csv()
sono utili per gestire i dati CSV.
La sintassi di base di read_csv()
e i parametri chiave sono i seguenti:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer
: percorso al file CSV (stringa o URL);sep
: delimitatore (il valore predefinito è una virgola,
);header
: numero di riga da utilizzare come intestazioni delle colonne (il valore predefinito è la prima riga);names
: Elenco dei nomi delle colonne da utilizzare;usecols
: colonne da leggere (sottoinsieme di colonne).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Nota
Assicurati che il link del dataset sia racchiuso tra virgolette.
La sintassi di base di to_csv()
e i parametri chiave sono i seguenti:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf
: percorso del file o oggetto dove il CSV dovrebbe essere scritto;sep
: delimitatore per separare i valori (il valore predefinito è una virgola,
);columns
: sottoinsieme di colonne da scrivere (il valore predefinito è tutte le colonne);header
: se includere i nomi delle colonne come intestazione (il valore predefinito èTrue
);index
: se scrivere gli indici delle righe nel file (il valore predefinito èTrue
).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Ti viene fornito un URL a un file CSV memorizzato come stringa nella variabile file_url
.
- Leggi il file CSV dall'URL fornito in un
DataFrame
chiamatowine_data
.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
What are some common use cases for reading and writing CSV files with pandas?
Can you explain the difference between the `header` and `names` parameters in `read_csv()`?
How do I select only specific columns when reading a CSV file with pandas?
Awesome!
Completion rate improved to 3.03
File CSV
Scorri per mostrare il menu
Poiché pandas
è la libreria di riferimento per l'analisi e la manipolazione dei dati, una delle sue caratteristiche principali è la capacità di leggere e scrivere vari tipi di file, inclusi i file CSV.
Un CSV (Comma-Separated Values) è un file di testo semplice utilizzato per memorizzare dati tabulari, dove ogni riga rappresenta un record e le colonne sono separate da virgole.
Un file CSV può contenere i seguenti dati:
- Numeri: valori interi o decimali (ad es.,
42
,3.14
); - Testo: stringhe o dati categorici (ad es.,
John
,Active
); - Date/Orari: timestamp (ad es.,
2023-12-30
); - Booleani: valori logici (
True
,False
).
Ogni riga deve avere lo stesso numero di colonne e la prima riga spesso contiene le intestazioni delle colonne.
Funzioni come read_csv()
e to_csv()
sono utili per gestire i dati CSV.
La sintassi di base di read_csv()
e i parametri chiave sono i seguenti:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer
: percorso al file CSV (stringa o URL);sep
: delimitatore (il valore predefinito è una virgola,
);header
: numero di riga da utilizzare come intestazioni delle colonne (il valore predefinito è la prima riga);names
: Elenco dei nomi delle colonne da utilizzare;usecols
: colonne da leggere (sottoinsieme di colonne).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Nota
Assicurati che il link del dataset sia racchiuso tra virgolette.
La sintassi di base di to_csv()
e i parametri chiave sono i seguenti:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf
: percorso del file o oggetto dove il CSV dovrebbe essere scritto;sep
: delimitatore per separare i valori (il valore predefinito è una virgola,
);columns
: sottoinsieme di colonne da scrivere (il valore predefinito è tutte le colonne);header
: se includere i nomi delle colonne come intestazione (il valore predefinito èTrue
);index
: se scrivere gli indici delle righe nel file (il valore predefinito èTrue
).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Ti viene fornito un URL a un file CSV memorizzato come stringa nella variabile file_url
.
- Leggi il file CSV dall'URL fornito in un
DataFrame
chiamatowine_data
.
Soluzione
Grazie per i tuoi commenti!
single