File CSV
Poiché pandas è la libreria di riferimento per l'analisi e la manipolazione dei dati, una delle sue caratteristiche principali è la capacità di leggere e scrivere vari tipi di file, inclusi i file CSV.
Un file CSV (Comma-Separated Values) è un file di testo semplice utilizzato per memorizzare dati tabellari, dove ogni riga rappresenta un record e le colonne sono separate da virgole.
Un file CSV può contenere i seguenti dati:
- Numeri: valori interi o decimali (ad esempio,
42,3.14); - Testo: stringhe o dati categoriali (ad esempio,
John,Active); - Date/Ore: timestamp (ad esempio,
2023-12-30); - Booleani: valori logici (
True,False).
Ogni riga deve avere lo stesso numero di colonne e la prima riga spesso contiene le intestazioni delle colonne.
Funzioni come read_csv() e to_csv() sono utili per lavorare con i dati CSV.
La sintassi di base di read_csv() e i parametri principali sono i seguenti:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer: percorso del file CSV (stringa o URL);sep: delimitatore (il valore predefinito è la virgola,);header: numero della riga da utilizzare come intestazioni delle colonne (predefinito è la prima riga);names: elenco dei nomi delle colonne da utilizzare;usecols: colonne da leggere (sottoinsieme delle colonne).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Assicurarsi che il link al dataset sia racchiuso tra virgolette.
La sintassi di base di to_csv() e i parametri chiave sono i seguenti:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: percorso del file o oggetto dove il CSV deve essere scritto;sep: delimitatore per separare i valori (il valore predefinito è la virgola,);columns: sottoinsieme di colonne da scrivere (predefinito: tutte le colonne);header: se includere o meno i nomi delle colonne come intestazione (predefinito:True);index: se scrivere o meno gli indici delle righe nel file (predefinito:True).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Ti viene fornito un URL a un file CSV memorizzato come stringa nella variabile file_url.
- Leggi il file CSV dall'URL fornito in un
DataFramechiamatowine_data.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 3.03
File CSV
Scorri per mostrare il menu
Poiché pandas è la libreria di riferimento per l'analisi e la manipolazione dei dati, una delle sue caratteristiche principali è la capacità di leggere e scrivere vari tipi di file, inclusi i file CSV.
Un file CSV (Comma-Separated Values) è un file di testo semplice utilizzato per memorizzare dati tabellari, dove ogni riga rappresenta un record e le colonne sono separate da virgole.
Un file CSV può contenere i seguenti dati:
- Numeri: valori interi o decimali (ad esempio,
42,3.14); - Testo: stringhe o dati categoriali (ad esempio,
John,Active); - Date/Ore: timestamp (ad esempio,
2023-12-30); - Booleani: valori logici (
True,False).
Ogni riga deve avere lo stesso numero di colonne e la prima riga spesso contiene le intestazioni delle colonne.
Funzioni come read_csv() e to_csv() sono utili per lavorare con i dati CSV.
La sintassi di base di read_csv() e i parametri principali sono i seguenti:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer: percorso del file CSV (stringa o URL);sep: delimitatore (il valore predefinito è la virgola,);header: numero della riga da utilizzare come intestazioni delle colonne (predefinito è la prima riga);names: elenco dei nomi delle colonne da utilizzare;usecols: colonne da leggere (sottoinsieme delle colonne).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Assicurarsi che il link al dataset sia racchiuso tra virgolette.
La sintassi di base di to_csv() e i parametri chiave sono i seguenti:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: percorso del file o oggetto dove il CSV deve essere scritto;sep: delimitatore per separare i valori (il valore predefinito è la virgola,);columns: sottoinsieme di colonne da scrivere (predefinito: tutte le colonne);header: se includere o meno i nomi delle colonne come intestazione (predefinito:True);index: se scrivere o meno gli indici delle righe nel file (predefinito:True).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Ti viene fornito un URL a un file CSV memorizzato come stringa nella variabile file_url.
- Leggi il file CSV dall'URL fornito in un
DataFramechiamatowine_data.
Soluzione
Grazie per i tuoi commenti!
single