セクション 3. 章 11
single
データの記述
メニューを表示するにはスワイプしてください
pandas には、各列のすべての値の平均値を計算する便利な mean() メソッドが用意されています。
df = pd.read_csv(file.csv)
mean_values = df.mean()
同じメソッドを使用して、特定の列の平均値を求めることも可能です。
df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()
pandas には、各列で最も頻繁に出現する値を特定する mode() メソッドも用意されています。
df = pd.read_csv(file.csv)
mode_values = df.mode()
特定の列の最頻値(モード)を求めるには、同じメソッドを使用します:
df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
注意
複数の最頻値が存在する場合、[0]の後に.mode()を付けて最初の値を抽出します。これを付けない場合、メソッドは全体のSeriesを返します。
pandasで便利なもう一つのメソッドはdescribe()です。
df = pd.read_csv(file.csv)
important_metrics = df.describe()
このメソッドは、データセットから得られるさまざまな指標の概要を提供します。含まれる内容は以下の通りです:
- エントリーの総数
- 平均値
- 標準偏差
- 最小値と最大値
- 第25パーセンタイル、第50パーセンタイル(中央値)、第75パーセンタイル
タスク
スワイプしてコーディングを開始
DataFrame という名前の wine_data が与えられています。
'residual sugar'列の平均値を計算し、その結果をresidual_sugar_mean変数に格納してください。'fixed acidity'列の最頻値(モード)を計算し、その結果をfixed_acidity_mode変数に格納してください。wine_dataからさまざまな統計量の概要を取得し、その結果をdescribed_data変数に格納してください。
解答
すべて明確でしたか?
フィードバックありがとうございます!
セクション 3. 章 11
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください