セクション 5. 章 4
single
KDEプロット
メニューを表示するにはスワイプしてください
定義
カーネル密度推定(KDE)プロットは、連続変数の推定確率密度関数を可視化するプロットの一種。ヒストグラムが区間ごとに離散的なバーでデータを表示するのに対し、KDEプロットは全データポイントに基づいて分布を滑らかで連続的な曲線として表現。
この例は、ヒストグラムとKDEプロット(オレンジ色の曲線)を組み合わせて表示し、ヒストグラム単体よりも確率密度関数の近似をより明確に示している。
seabornでは、kdeplot()関数を使うことでKDEプロットを簡単に作成可能。主なパラメータであるdata、x、yは、countplot()と同様に機能。
最初のオプション
パラメータのうち一つだけに値のシーケンスを渡すことができ、各要素ごとに個別のカスタマイズが可能。
123456789101112import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting only the data parameter sns.kdeplot(data=weather_df['Seattle'], fill=True) plt.show()
dataパラメータにはSeriesオブジェクトを渡し、fillパラメータで曲線下の領域を塗りつぶす(デフォルトでは塗りつぶされていない)。
セカンドオプション
data に 2次元オブジェクト(例:DataFrame)を設定し、data(縦方向)または x(横方向)に y が辞書の場合はカラム名やキーを指定することも可能。
123456789101112import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting both the data and x parameters sns.kdeplot(data=weather_df, x='Seattle', fill=True) plt.show()
DataFrame 全体を data パラメータとして渡し、x パラメータにカラム名を指定することで同じ結果が得られる。
注記
作成されたKDEプロットは、特徴的なベルカーブを示し、平均値が約52°Fの正規分布に非常によく似ている。
さらに学ぶ
KDEプロット関数についてさらに詳しく知りたい場合は、 kdeplot() ドキュメントを参照。
タスク
スワイプしてコーディングを開始
- 正しい関数を使用してKDEプロットを作成。
- プロットのデータとして
countries_dfを使用(第1引数)。 - 使用するカラムを
'GDP per capita'に設定し、第2引数で水平方向の向きを指定。 - 第3(最も右側の)引数で曲線下の領域を塗りつぶし。
解答
すべて明確でしたか?
フィードバックありがとうございます!
セクション 5. 章 4
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください