Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Basic Data Operations in Polars | Efficient Data Manipulation With Polars
Gestion de Grandes Données avec Python

Basic Data Operations in Polars

Glissez pour afficher le menu

Lorsque vous travaillez avec de grands ensembles de données, une manipulation efficace des données est essentielle. La bibliothèque polars est conçue pour des opérations de données à haute performance, ce qui en fait un choix populaire pour la gestion de grandes quantités de données en Python. Dans ce chapitre, vous apprendrez à charger des données, sélectionner des colonnes spécifiques et filtrer des lignes à l'aide de polars. Ces actions de base constituent le socle pour des transformations de données plus complexes.

Le tableau ci-dessous résume les principales fonctions de polars pour effectuer ces opérations de base.

123456789
import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Display the first 5 rows print(df.head())

Dans ce code, la bibliothèque polars est importée et la fonction pl.read_csv() est utilisée pour charger des données à partir d'un fichier nommé "data/people.csv". Le DataFrame résultant est stocké dans la variable df. En appelant df.head(), les cinq premières lignes du DataFrame sont affichées, ce qui permet d'inspecter rapidement les données après le chargement.

1234567891011
import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Select the "name" and "age" columns selected = df.select(["Variable name"]) print(selected)

Ici, la méthode select() est utilisée pour choisir uniquement les colonnes "name" et "age" du DataFrame. Cela crée un nouveau DataFrame appelé selected contenant uniquement ces colonnes. La sélection de colonnes est une opération courante lorsque l'on souhaite se concentrer sur des parties spécifiques des données pour une analyse approfondie.

question mark

Quelle méthode est utilisée pour lire un fichier CSV dans polars ?

Sélectionnez la réponse correcte

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 2

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Section 3. Chapitre 2
some-alt