Fichiers CSV
Puisque pandas est la bibliothèque de référence pour l’analyse et la manipulation de données, l’une de ses fonctionnalités clés est sa capacité à lire et écrire différents types de fichiers, y compris les fichiers CSV.
Un fichier CSV (Comma-Separated Values) est un fichier texte brut utilisé pour stocker des données tabulaires, où chaque ligne représente un enregistrement et les colonnes sont séparées par des virgules.
Un fichier CSV peut contenir les types de données suivants :
- Nombres : valeurs entières ou décimales (par exemple,
42,3.14) ; - Texte : chaînes de caractères ou données catégorielles (par exemple,
John,Active) ; - Dates/Heures : horodatages (par exemple,
2023-12-30) ; - Booléens : valeurs logiques (
True,False).
Chaque ligne doit comporter le même nombre de colonnes, et la première ligne contient souvent les en-têtes de colonnes.
Des fonctions telles que read_csv() et to_csv() sont utiles pour manipuler les données CSV.
La syntaxe de base de read_csv() et ses paramètres principaux sont les suivants :
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer: chemin d’accès au fichier CSV (chaîne de caractères ou URL) ;sep: séparateur (par défaut une virgule,) ;header: numéro de la ligne à utiliser comme en-têtes de colonnes (par défaut la première ligne) ;names: liste des noms de colonnes à utiliser ;usecols: colonnes à lire (sous-ensemble de colonnes).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Vérifier que le lien du jeu de données est bien entouré de guillemets.
La syntaxe de base de to_csv() et les paramètres clés sont les suivants :
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: chemin du fichier ou objet où le CSV doit être écrit ;sep: délimiteur pour séparer les valeurs (par défaut une virgule,) ;columns: sous-ensemble de colonnes à écrire (par défaut toutes les colonnes) ;header: inclure ou non les noms de colonnes comme en-tête (par défautTrue) ;index: inclure ou non les indices de lignes dans le fichier (par défautTrue).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Vous disposez d'une URL vers un fichier CSV stocké sous forme de chaîne de caractères dans la variable file_url.
- Lire le fichier CSV à partir de l'URL donnée dans un
DataFramenomméwine_data.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
What are some common use cases for reading and writing CSV files with pandas?
Can you explain the difference between the `header` and `names` parameters in `read_csv()`?
How do I select only specific columns when reading a CSV file with pandas?
Awesome!
Completion rate improved to 3.03
Fichiers CSV
Glissez pour afficher le menu
Puisque pandas est la bibliothèque de référence pour l’analyse et la manipulation de données, l’une de ses fonctionnalités clés est sa capacité à lire et écrire différents types de fichiers, y compris les fichiers CSV.
Un fichier CSV (Comma-Separated Values) est un fichier texte brut utilisé pour stocker des données tabulaires, où chaque ligne représente un enregistrement et les colonnes sont séparées par des virgules.
Un fichier CSV peut contenir les types de données suivants :
- Nombres : valeurs entières ou décimales (par exemple,
42,3.14) ; - Texte : chaînes de caractères ou données catégorielles (par exemple,
John,Active) ; - Dates/Heures : horodatages (par exemple,
2023-12-30) ; - Booléens : valeurs logiques (
True,False).
Chaque ligne doit comporter le même nombre de colonnes, et la première ligne contient souvent les en-têtes de colonnes.
Des fonctions telles que read_csv() et to_csv() sont utiles pour manipuler les données CSV.
La syntaxe de base de read_csv() et ses paramètres principaux sont les suivants :
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer: chemin d’accès au fichier CSV (chaîne de caractères ou URL) ;sep: séparateur (par défaut une virgule,) ;header: numéro de la ligne à utiliser comme en-têtes de colonnes (par défaut la première ligne) ;names: liste des noms de colonnes à utiliser ;usecols: colonnes à lire (sous-ensemble de colonnes).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Vérifier que le lien du jeu de données est bien entouré de guillemets.
La syntaxe de base de to_csv() et les paramètres clés sont les suivants :
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: chemin du fichier ou objet où le CSV doit être écrit ;sep: délimiteur pour séparer les valeurs (par défaut une virgule,) ;columns: sous-ensemble de colonnes à écrire (par défaut toutes les colonnes) ;header: inclure ou non les noms de colonnes comme en-tête (par défautTrue) ;index: inclure ou non les indices de lignes dans le fichier (par défautTrue).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Vous disposez d'une URL vers un fichier CSV stocké sous forme de chaîne de caractères dans la variable file_url.
- Lire le fichier CSV à partir de l'URL donnée dans un
DataFramenomméwine_data.
Solution
Merci pour vos commentaires !
single