Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ Pythonで分散を計算する | セクション
データ分析のための統計学

bookPythonで分散を計算する

メニューを表示するにはスワイプしてください

NumPyによる分散の計算

numpyでは、値のシーケンス(データセットの列など)をnp.var()関数に渡します。例:np.var(df['work_year'])

pandasによる分散の計算

pandasでは、.var()メソッドを列に直接適用します。例:df['work_year'].var()

両方の方法はほぼ同じ結果を出しますが、分母の違いによりわずかな差異があります。numpy(母分散)はNpandas(標本分散)はN-1を使用します。

123456789101112
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
copy
question mark

numpyとpandasにおける母分散と標本分散の計算の違いを正しく説明している文はどれですか?

正しい答えを選んでください

すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 1.  15

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

セクション 1.  15
some-alt