セクション 2. 章 1
single
CSVファイル
メニューを表示するにはスワイプしてください
pandasはデータ分析および操作のための主要なライブラリであり、その重要な機能の一つがCSVファイルを含む様々なファイル形式の読み書き機能です。
**CSV(カンマ区切り値)**ファイルは、表形式データを保存するためのプレーンテキストファイルであり、各行がレコードを表し、列はカンマで区切られています。
CSVファイルには以下のようなデータが含まれます:
- 数値:整数または小数値(例:
42、3.14) - テキスト:文字列またはカテゴリカルデータ(例:
John、Active) - 日付/時刻:タイムスタンプ(例:
2023-12-30) - ブール値:論理値(
True、False)
各行は同じ数の列を持つ必要があり、最初の行には列ヘッダーが含まれることが一般的です。
read_csv()やto_csv()のような関数は、CSVデータを扱う際に便利です。
read_csv()の基本構文と主なパラメータは以下の通りです:
ここでは、**index_col**パラメータを追加し、明確に説明しています:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, index_col=None, ...)
filepath_or_buffer:CSVファイルへのパス(文字列またはURL)sep:区切り文字(デフォルトはカンマ,)header:列ヘッダーとして使用する行番号(デフォルトは最初の行)names:使用する列名のリストusecols:読み込む列のサブセットindex_col:DataFrameのインデックスとして設定する列(または列のリスト)
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
注意
データセットのリンクは必ず引用符で囲むこと。
to_csv() の基本構文と主なパラメータは以下の通り:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf:CSVを書き込むファイルパスまたはオブジェクトsep:値を区切るデリミタ(デフォルトはカンマ,)columns:書き込むカラムのサブセット(デフォルトは全カラム)header:カラム名をヘッダーとして含めるか(デフォルトはTrue)index:行インデックスをファイルに書き込むか(デフォルトはTrue)
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
タスク
スワイプしてコーディングを開始
文字列として保存された CSV ファイルのURLが file_url 変数に与えられています。
- 指定されたURLからCSVファイルを読み込み、
DataFrameという名前のwine_dataに格納してください。
解答
すべて明確でしたか?
フィードバックありがとうございます!
セクション 2. 章 1
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください