Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Covariance | Covariance vs Corrélation
Apprendre les Statistiques avec Python
course content

Contenu du cours

Apprendre les Statistiques avec Python

Apprendre les Statistiques avec Python

1. Concepts de Base
2. Moyenne, Médiane et Mode avec Python
3. Variance et Écart-Type
4. Covariance vs Corrélation
5. Intervalle de Confiance
6. Tests Statistiques

book
Covariance

Covariance est une mesure de la variabilité conjointe de deux variables aléatoires.

La valeur de la covarianceSignification
PositiveDeux variables évoluent dans la même direction
0Deux variables sans relation linéaire
NégativeDeux variables évoluent dans des directions opposées

Les formules sont différentes pour l'échantillon et la population, mais nous n'approfondirons pas ce sujet. Dans ce chapitre, nous discuterons des covariances du jeu de données suivant :

Store_IDStore_AreaItems_AvailableDaily_Customer_CountStore_Sales
001659196153066490
111461175221039820
221340160972054010
331451174862053730
441770211145046620
  • Store_ID - L'identifiant unique du magasin ;
  • Store_Area - La superficie du magasin ;
  • Items_Available - Le nombre d'articles disponibles dans le magasin ;
  • Daily_Customer_Count - Le nombre quotidien de clients dans le magasin ;
  • Store_Sales - Le nombre de ventes dans le magasin.

Calcul de la Covariance avec Python :

Pour calculer la covariance en Python, vous pouvez utiliser la fonction np.cov() de la bibliothèque NumPy. Elle nécessite deux paramètres : les séquences de données pour lesquelles vous souhaitez calculer la covariance.

Le résultat est la valeur à l'index [0,1]. Ce cours ne couvrira pas les autres valeurs de la sortie, référez-vous à l'exemple :

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
copy

Cela indique que les valeurs évoluent dans la même direction. Cela a du sens car une plus grande superficie de magasin correspond à un plus grand nombre d'articles. Un inconvénient majeur de la covariance est que la valeur peut être infinie.

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 4. Chapitre 1
We're sorry to hear that something went wrong. What happened?
some-alt