相関
メニューを表示するにはスワイプしてください
定義
相関は、2つの変数間の関連性や関係の強さを定量化する統計的指標。つまり、2つの変数が互いにどのように動く傾向があるかを理解するための指標。
相関は、結果を簡単に確認する方法を提供。相関値は [-1, 1] の範囲内に収まる。以下の表を参照:
Pythonによる相関
相関を計算するには、np.corrcoef() の numpy 関数を使用。2つのパラメータ(相関を計算したいデータ列)が必要。以下は例:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
ここでは、共分散の場合と同様に、インデックス [0, 1] の値を抽出しています。前の章では 74955.85 という値を得ましたが、共分散関数の結果を解釈するのは難しい場合があります。しかし、この場合は、値同士が強く関連していると結論付けることができます。
すべて明確でしたか?
フィードバックありがとうございます!
セクション 1. 章 20
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください
セクション 1. 章 20