Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Compréhension des Distributions de Probabilité | Probabilité et Statistiques
Mathématiques pour la Science des Données

bookCompréhension des Distributions de Probabilité

Distributions de probabilité

Une distribution de probabilité indique la vraisemblance des différents résultats possibles. Pour les issues discrètes (comme « combien de tiges défectueuses »), on énumère les probabilités pour chaque nombre possible. Pour les mesures continues (comme la longueur ou le poids), on décrit la densité sur un intervalle. Formules générales pour le discret et le continu :

P(XA)=xAp(x)(discret)P(aXb)=abf(x)dx(continu)P(X \in A) = \sum_{x \in A}p(x)\quad(\text{discret}) \\[6pt] P(a \le X \le b) = \int_a^b f(x)dx \quad (continu)

Exemple (vérification rapide) : Si un procédé garantit que toutes les longueurs entre 49,5 et 50,5 cm sont également probables, la probabilité qu’une tige se trouve dans une sous-plage de 0,4 cm sera la largeur de la sous-plage divisée par 1,0 cm (c’est l’idée d’uniformité — nous la détaillons ci-dessous).

Distribution binomiale

La loi binomiale modélise le nombre de succès (par exemple, tiges défectueuses) dans un nombre fixe d’essais indépendants (par exemple, 100 tiges), lorsque chaque essai a la même probabilité de succès.

Formule :

P(X=k)=(nk)pk(1p)nkP(X = k) = \begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}

Exemple :

Dans un lot de n=100n=100 tiges où chaque tige a indépendamment une probabilité p=0.02p=0.02 d’être défectueuse, quelle est la probabilité d’avoir exactement k=3k=3 tiges défectueuses ?

Étape 1 — calculer la combinaison :

(1003)=100!3!97!=161700\begin{pmatrix}100 \\ 3\end{pmatrix} = \frac{100!}{3!97!} = 161700

Étape 2 — calculer les puissances :

p3=0.023=0.000008(1p)97=0.98970.1409059532p^3 = 0.02^3 = 0.000008 \\ (1-p)^{97} = 0.98^{97} \approx 0.1409059532

Étape 3 — multiplier toutes les parties :

P(X=3)=161700×0.000008×0.14090595320.182275941P(X = 3) = 161700 \times 0.000008 \times 0.1409059532 \approx 0.182275941

Interprétation : Environ 18,23% de chance d’obtenir exactement 3 tiges défectueuses dans un échantillon de 100 tiges. Si vous observez 3 défauts, c’est un résultat plausible.

Note
Remarque

Si la probabilité calculée semble supérieure à 1 ou négative, vérifiez à nouveau le calcul de la combinaison ou des puissances. Comparez également une valeur de la fonction de masse binomiale (pmf) à la fonction de répartition (cdf) si vous souhaitez des réponses du type « au plus » ou « au moins ».

Distribution uniforme

La distribution uniforme modélise une mesure continue où chaque valeur dans un intervalle [a,b] est également probable (par exemple, une plage de tolérance pour la longueur d'une tige).

Formule :

f(x)=1ba,axbf(x) = \frac{1}{b-a},\quad a \le x \le b

Probabilité entre deux points :

P(lXu)=ulbaP(l \le X \le u) = \frac{u - l}{b - a}

Exemple :

Paramètres : a=49.5, b=50.5. Quelle est la probabilité que la longueur d'une tige X soit comprise entre 49.8 et 50.2 ? Calcul de la largeur de l'intervalle :

ba=50.549.5=1.0b-a = 50.5 - 49.5 = 1.0

Calcul du sous-intervalle :

ul=50.249.8=0.4u - l = 50.2 - 49.8 = 0.4

Probabilité :

P(49.8X50.2)=0.41.0=0.4P(49.8 \le X \le 50.2) = \frac{0.4}{1.0} = 0.4

Interprétation : Il y a 40% de chances qu'une tige mesurée au hasard se situe dans cette plage de tolérance plus étroite.

Note
Remarque

Assurez-vous que a<ba<b et que votre sous-intervalle est inclus dans [a,b][a,b] ; sinon, il faut ajuster les bornes et considérer les intervalles extérieurs avec une probabilité nulle.

Distribution normale

La distribution normale décrit des mesures continues qui se regroupent autour d'une moyenne μμ avec une dispersion mesurée par l'écart type σσ. De nombreuses erreurs de mesure et variations naturelles suivent cette courbe en cloche.

Formule :

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

Standardisation avec le score z :

z=xμσz = \frac{x-\mu}{\sigma}

La probabilité entre deux valeurs utilise la fonction de répartition cumulative (CDF) ou la symétrie pour les cas standards :

P(aXb)=Φ(bμσ)Φ(aμσ)P(a \le X \le b) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)

Ici Φ\Phi est la CDF normale standard.

Exemple A :

Paramètres : μ=200μ=200, σ=5σ=5, trouver P(195X205)P(195≤X≤205).

Scores z :

z1=1952005=1z2=2052005=1z_1 = \frac{195 - 200}{5} = -1 \\[6pt] z_2 = \frac{205 - 200}{5} = 1

En utilisant la symétrie de la distribution normale, la probabilité entre 1−1 et +1+1 écart type est bien connue :

P(195X205)0.6826894921P(195 \le X \le 205) \approx 0.6826894921

Interprétation : Environ 68,27% des poids des tiges se situent à ±1 écart type de la moyenne — la fameuse « règle des 68% ».

Note
Remarque

Lorsque les bornes sont symétriques autour de utilisez les règles empiriques connues (689599.768–95–99.7). Pour d'autres bornes, calculez puis utilisez un tableau ou une calculatrice.

question mark

Score Z pour X=195X=195, μ=200μ=200, σ=5σ=5 ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 10

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

Can you explain the difference between discrete and continuous probability distributions again?

How do I know which distribution to use for a given problem?

Can you walk me through another example using one of these distributions?

Awesome!

Completion rate improved to 1.96

bookCompréhension des Distributions de Probabilité

Glissez pour afficher le menu

Distributions de probabilité

Une distribution de probabilité indique la vraisemblance des différents résultats possibles. Pour les issues discrètes (comme « combien de tiges défectueuses »), on énumère les probabilités pour chaque nombre possible. Pour les mesures continues (comme la longueur ou le poids), on décrit la densité sur un intervalle. Formules générales pour le discret et le continu :

P(XA)=xAp(x)(discret)P(aXb)=abf(x)dx(continu)P(X \in A) = \sum_{x \in A}p(x)\quad(\text{discret}) \\[6pt] P(a \le X \le b) = \int_a^b f(x)dx \quad (continu)

Exemple (vérification rapide) : Si un procédé garantit que toutes les longueurs entre 49,5 et 50,5 cm sont également probables, la probabilité qu’une tige se trouve dans une sous-plage de 0,4 cm sera la largeur de la sous-plage divisée par 1,0 cm (c’est l’idée d’uniformité — nous la détaillons ci-dessous).

Distribution binomiale

La loi binomiale modélise le nombre de succès (par exemple, tiges défectueuses) dans un nombre fixe d’essais indépendants (par exemple, 100 tiges), lorsque chaque essai a la même probabilité de succès.

Formule :

P(X=k)=(nk)pk(1p)nkP(X = k) = \begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}

Exemple :

Dans un lot de n=100n=100 tiges où chaque tige a indépendamment une probabilité p=0.02p=0.02 d’être défectueuse, quelle est la probabilité d’avoir exactement k=3k=3 tiges défectueuses ?

Étape 1 — calculer la combinaison :

(1003)=100!3!97!=161700\begin{pmatrix}100 \\ 3\end{pmatrix} = \frac{100!}{3!97!} = 161700

Étape 2 — calculer les puissances :

p3=0.023=0.000008(1p)97=0.98970.1409059532p^3 = 0.02^3 = 0.000008 \\ (1-p)^{97} = 0.98^{97} \approx 0.1409059532

Étape 3 — multiplier toutes les parties :

P(X=3)=161700×0.000008×0.14090595320.182275941P(X = 3) = 161700 \times 0.000008 \times 0.1409059532 \approx 0.182275941

Interprétation : Environ 18,23% de chance d’obtenir exactement 3 tiges défectueuses dans un échantillon de 100 tiges. Si vous observez 3 défauts, c’est un résultat plausible.

Note
Remarque

Si la probabilité calculée semble supérieure à 1 ou négative, vérifiez à nouveau le calcul de la combinaison ou des puissances. Comparez également une valeur de la fonction de masse binomiale (pmf) à la fonction de répartition (cdf) si vous souhaitez des réponses du type « au plus » ou « au moins ».

Distribution uniforme

La distribution uniforme modélise une mesure continue où chaque valeur dans un intervalle [a,b] est également probable (par exemple, une plage de tolérance pour la longueur d'une tige).

Formule :

f(x)=1ba,axbf(x) = \frac{1}{b-a},\quad a \le x \le b

Probabilité entre deux points :

P(lXu)=ulbaP(l \le X \le u) = \frac{u - l}{b - a}

Exemple :

Paramètres : a=49.5, b=50.5. Quelle est la probabilité que la longueur d'une tige X soit comprise entre 49.8 et 50.2 ? Calcul de la largeur de l'intervalle :

ba=50.549.5=1.0b-a = 50.5 - 49.5 = 1.0

Calcul du sous-intervalle :

ul=50.249.8=0.4u - l = 50.2 - 49.8 = 0.4

Probabilité :

P(49.8X50.2)=0.41.0=0.4P(49.8 \le X \le 50.2) = \frac{0.4}{1.0} = 0.4

Interprétation : Il y a 40% de chances qu'une tige mesurée au hasard se situe dans cette plage de tolérance plus étroite.

Note
Remarque

Assurez-vous que a<ba<b et que votre sous-intervalle est inclus dans [a,b][a,b] ; sinon, il faut ajuster les bornes et considérer les intervalles extérieurs avec une probabilité nulle.

Distribution normale

La distribution normale décrit des mesures continues qui se regroupent autour d'une moyenne μμ avec une dispersion mesurée par l'écart type σσ. De nombreuses erreurs de mesure et variations naturelles suivent cette courbe en cloche.

Formule :

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

Standardisation avec le score z :

z=xμσz = \frac{x-\mu}{\sigma}

La probabilité entre deux valeurs utilise la fonction de répartition cumulative (CDF) ou la symétrie pour les cas standards :

P(aXb)=Φ(bμσ)Φ(aμσ)P(a \le X \le b) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)

Ici Φ\Phi est la CDF normale standard.

Exemple A :

Paramètres : μ=200μ=200, σ=5σ=5, trouver P(195X205)P(195≤X≤205).

Scores z :

z1=1952005=1z2=2052005=1z_1 = \frac{195 - 200}{5} = -1 \\[6pt] z_2 = \frac{205 - 200}{5} = 1

En utilisant la symétrie de la distribution normale, la probabilité entre 1−1 et +1+1 écart type est bien connue :

P(195X205)0.6826894921P(195 \le X \le 205) \approx 0.6826894921

Interprétation : Environ 68,27% des poids des tiges se situent à ±1 écart type de la moyenne — la fameuse « règle des 68% ».

Note
Remarque

Lorsque les bornes sont symétriques autour de utilisez les règles empiriques connues (689599.768–95–99.7). Pour d'autres bornes, calculez puis utilisez un tableau ou une calculatrice.

question mark

Score Z pour X=195X=195, μ=200μ=200, σ=5σ=5 ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 10
some-alt