Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ Polarsにおける基本的なデータ操作 | Polarsによる効率的なデータ操作
Pythonによる大規模データハンドリング

Polarsにおける基本的なデータ操作

メニューを表示するにはスワイプしてください

大規模なデータセットを扱う際には、効率的なデータ操作が不可欠です。polarsライブラリは高性能なデータ処理のために設計されており、Pythonで大規模データを扱う際によく利用されています。本章では、polarsを使ったデータの読み込み、特定の列の選択、行のフィルタリング方法について学びます。これらの基本操作は、より複雑なデータ変換の基礎となります。

下表は、これらの基本操作を実行するためのpolarsの主な関数をまとめたものです。

123456789
import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Display the first 5 rows print(df.head())

このコードでは、polarsライブラリをインポートし、pl.read_csv()関数を使用して"data/people.csv"というファイルからデータを読み込みます。生成されたDataFrameは変数dfに格納されます。df.head()を呼び出すことで、DataFrameの最初の5行を表示でき、データを読み込んだ直後に素早く内容を確認するのに便利です。

1234567891011
import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Select the "name" and "age" columns selected = df.select(["Variable name"]) print(selected)

ここでは、select()メソッドを使用してDataFrameから"name""age"の列のみを選択しています。これにより、これらの列だけを含む新しいDataFrameであるselectedが作成されます。特定のデータ部分に注目してさらに分析を行いたい場合、列の選択は一般的な操作です。

question mark

polarsでCSVファイルを読み込むために使用されるメソッドはどれですか?

正しい答えを選んでください

すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 3.  2

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

セクション 3.  2
some-alt