Pythonで分散を計算する
メニューを表示するにはスワイプしてください
NumPyによる分散の計算
numpyでは、値のシーケンス(データセットのカラムなど)をnp.var()関数に渡します。例:np.var(df['work_year'])
pandasによる分散の計算
pandasでは、カラムに直接.var()メソッドを適用します。例:df['work_year'].var()
どちらの方法もほぼ同じ結果を返しますが、分母の違いによりわずかな差が生じます。numpyはN(母分散)、pandasはN-1(標本分散)を使用します。
123456789101112import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
すべて明確でしたか?
フィードバックありがとうございます!
セクション 3. 章 3
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください
セクション 3. 章 3