Polarsにおける基本的なデータ操作
メニューを表示するにはスワイプしてください
大規模なデータセットを扱う際には、効率的なデータ操作が不可欠です。polarsライブラリは高性能なデータ処理のために設計されており、Pythonで大規模データを扱う際によく利用されています。本章では、polarsを使ったデータの読み込み、特定の列の選択、行のフィルタリング方法について学びます。これらの基本操作は、より複雑なデータ変換の基礎となります。
下表は、これらの基本操作を実行するためのpolarsの主な関数をまとめたものです。
123456789import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Display the first 5 rows print(df.head())
このコードでは、polarsライブラリをインポートし、pl.read_csv()関数を使用して"data/people.csv"というファイルからデータを読み込みます。生成されたDataFrameは変数dfに格納されます。df.head()を呼び出すことで、DataFrameの最初の5行を表示でき、データを読み込んだ直後に素早く内容を確認するのに便利です。
1234567891011import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Select the "name" and "age" columns selected = df.select(["Variable name"]) print(selected)
ここでは、select()メソッドを使用してDataFrameから"name"と"age"の列のみを選択しています。これにより、これらの列だけを含む新しいDataFrameであるselectedが作成されます。特定のデータ部分に注目してさらに分析を行いたい場合、列の選択は一般的な操作です。
すべて明確でしたか?
フィードバックありがとうございます!
セクション 3. 章 2
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください
セクション 3. 章 2