Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Compréhension de l'Échantillonnage | Probabilité et Statistiques
Mathématiques pour la Science des Données

bookCompréhension de l'Échantillonnage

Note
Définition

Échantillonnage est le processus de sélection d’un sous-ensemble de données à partir d’une population plus large afin d’obtenir des informations et de faire des inférences sur l’ensemble. Puisqu’il est souvent peu pratique ou impossible de collecter des données sur toute une population, l’échantillonnage permet une analyse efficace tout en maintenant la qualité et la précision des résultats.

Échantillonnage aléatoire simple

Chaque membre de la population a une chance égale d’être sélectionné.
Ceci est comparable à tirer des noms d’un chapeau.

P(Seˊlectionner un individu)=1NP(\text{Sélectionner un individu}) = \frac{1}{N}

Où :

  • NN = taille de la population.

Exemple 1 :

Vous avez une classe de 30 étudiants. Vous souhaitez en sélectionner 5 au hasard pour une enquête.

Solution : Utiliser un générateur de nombres aléatoires pour sélectionner 5 numéros uniques entre 1 et 30. Chaque étudiant a une chance de 130\tfrac{\raisebox{1pt}{$1$}}{\raisebox{-1pt}{$30$}} d’être sélectionné.

Exemple 2 :

Vous disposez d'une classe de 30 élèves et souhaitez en sélectionner 5 pour participer à une enquête.

  • Population totale : N=30N=30 ;
  • Taille de l'échantillon : n=5n=5.

Quelle est la probabilité qu'Alice et Bob soient tous deux sélectionnés ?

Nombre total de façons de choisir 5 élèves parmi 30 :

(305)\binom{30}{5}

Nombre d'échantillons favorables contenant à la fois Alice et Bob :
Fixer Alice et Bob — choisir 3 autres parmi les 28 restants :

(283)\binom{28}{3}

La probabilité est donc :

P=(283)(305)P = \frac{\binom{28}{3}}{\binom{30}{5}}

Échantillonnage stratifié

La population est divisée en sous-groupes significatifs (strates), et des échantillons aléatoires sont prélevés dans chacun d'eux.

nh=NhN×nn_h = \frac{N_h}{N} \times n

Où :

  • NhN_h : taille du sous-groupe hh ;
  • NN : taille totale de la population ;
  • nn : taille totale de l'échantillon ;
  • nhn_{\raisebox{-1pt}{$h$}} : taille de l'échantillon du sous-groupe hh.

Exemple :

Une classe compte 30 élèves : 18 garçons et 12 filles. Vous souhaitez échantillonner 10 élèves proportionnellement :

  • Parmi les garçons : 1830×10=6\tfrac{\raisebox{1pt}{$18$}}{\raisebox{-1pt}{$30$}} \times 10 = 6 ;
  • Parmi les filles : 1230×10=4\tfrac{\raisebox{1pt}{$12$}}{\raisebox{-1pt}{$30$}} \times 10 = 4.

Intérêt : Garantit la représentation des sous-groupes clés.

Échantillonnage par grappes

La population est divisée en groupes (grappes), et des grappes entières sont sélectionnées aléatoirement.

c=nombre de grappes aˋ eˊchantillonnerc = \text{nombre de grappes à échantillonner}

Où :

  • Les grappes sont des groupes préexistants (par exemple, classes, équipes) ;
  • La sélection porte sur des grappes entières, non sur des individus.

Exemple 1 :

Votre école compte 5 salles de classe. Vous souhaitez obtenir un échantillon de 25 élèves, mais interroger chaque individu prendrait trop de temps.

Solution : Sélectionner aléatoirement 1 salle de classe (chacune ayant environ 25 élèves) et interroger tous les élèves de cette salle.

Exemple 2 :

Une université possède 20 bâtiments de dortoirs, chacun hébergeant 50 étudiants. Vous sélectionnez aléatoirement 4 dortoirs et interrogez tous les résidents.

  • Nombre de grappes : N=20N=20 ;
  • Groupes sélectionnés : n=4n=4 ;
  • Étudiants par dortoir : M=50M=50 ;
  • Nombre total d'étudiants interrogés : n×M=200n \times M = 200.

Quelle est la probabilité qu'un étudiant spécifique (par exemple, Sarah) soit inclus ?
Elle correspond à la probabilité que son dortoir soit sélectionné :

P(Sarah selected)=420=0.2P(\text{Sarah selected}) = \frac{4}{20} = 0.2

Cas complexe :
Si 10 dortoirs comptent 30 étudiants et 10 en comptent 70, et que vous sélectionnez 4 dortoirs au hasard, quelle est la taille d'échantillon attendue ?

Soit :

  • D30=10D_{30} = 10 dortoirs de 30 étudiants ;
  • D70=10D_{70} = 10 dortoirs de 70 étudiants.

Taille d'échantillon attendue :

E=1020(4×30)+1020(4×70)=200E = \frac{10}{20} \cdot (4 \times 30) + \frac{10}{20} \cdot (4 \times 70) = 200

Ainsi, même si les grappes diffèrent en taille, la taille d'échantillon attendue reste la même si les types de dortoirs sont équilibrés.

Échantillonnage systématique

Sélection de chaque kk-ième élément d'une liste.

k=Nnk = \frac{N}{n}

Où :

  • NN - population totale ;
  • nn - taille d'échantillon souhaitée ;
  • kk - intervalle d'échantillonnage.

Exemple :

Une liste de 1000 clients. Vous souhaitez obtenir un échantillon de 100. Donc :

k=1000100=10k = \frac{1000}{100} = 10

Choisir un point de départ aléatoire (par exemple, 7), puis sélectionner chaque 10ème client : 7, 17, 27, etc.

Avantage : Facile à mettre en œuvre et systématique.

Toutes les méthodes appliquées à un même problème

Mise en situation :
Vous étudiez la satisfaction à la cafétéria dans une école de 300 élèves répartis dans 10 classes (30 par classe). Vous souhaitez obtenir un échantillon de 30 élèves.

  • Aléatoire simple : sélectionner au hasard 30 noms dans la liste complète ;
  • Stratifié : si 60 % sont des garçons et 40 % des filles, échantillonner 18 garçons et 12 filles ;
  • Par grappes : sélectionner au hasard 1 classe (30 élèves) et interroger tous les élèves de cette classe ;
  • Systématique : choisir chaque 10ᵉ élève dans une liste ordonnée.

Résumé

  • L'échantillonnage réduit l'effort de collecte de données tout en permettant la généralisation ;
  • L'échantillonnage aléatoire et stratifié sont les plus précis ;
  • L'échantillonnage par grappes est efficace mais fonctionne mieux lorsque les grappes sont similaires ;
  • L'échantillonnage systématique est simple et pratique ;
  • L'échantillonnage de commodité est risqué et doit être évité si possible ;
  • Toujours documenter la méthode d'échantillonnage lors d'une analyse réelle.
question mark

Quelle méthode garantit à chaque individu une chance égale d'être sélectionné ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 5

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

Can you explain the differences between these sampling methods in more detail?

When should I use each sampling method?

Can you provide more real-world examples for each sampling method?

Awesome!

Completion rate improved to 1.96

bookCompréhension de l'Échantillonnage

Glissez pour afficher le menu

Note
Définition

Échantillonnage est le processus de sélection d’un sous-ensemble de données à partir d’une population plus large afin d’obtenir des informations et de faire des inférences sur l’ensemble. Puisqu’il est souvent peu pratique ou impossible de collecter des données sur toute une population, l’échantillonnage permet une analyse efficace tout en maintenant la qualité et la précision des résultats.

Échantillonnage aléatoire simple

Chaque membre de la population a une chance égale d’être sélectionné.
Ceci est comparable à tirer des noms d’un chapeau.

P(Seˊlectionner un individu)=1NP(\text{Sélectionner un individu}) = \frac{1}{N}

Où :

  • NN = taille de la population.

Exemple 1 :

Vous avez une classe de 30 étudiants. Vous souhaitez en sélectionner 5 au hasard pour une enquête.

Solution : Utiliser un générateur de nombres aléatoires pour sélectionner 5 numéros uniques entre 1 et 30. Chaque étudiant a une chance de 130\tfrac{\raisebox{1pt}{$1$}}{\raisebox{-1pt}{$30$}} d’être sélectionné.

Exemple 2 :

Vous disposez d'une classe de 30 élèves et souhaitez en sélectionner 5 pour participer à une enquête.

  • Population totale : N=30N=30 ;
  • Taille de l'échantillon : n=5n=5.

Quelle est la probabilité qu'Alice et Bob soient tous deux sélectionnés ?

Nombre total de façons de choisir 5 élèves parmi 30 :

(305)\binom{30}{5}

Nombre d'échantillons favorables contenant à la fois Alice et Bob :
Fixer Alice et Bob — choisir 3 autres parmi les 28 restants :

(283)\binom{28}{3}

La probabilité est donc :

P=(283)(305)P = \frac{\binom{28}{3}}{\binom{30}{5}}

Échantillonnage stratifié

La population est divisée en sous-groupes significatifs (strates), et des échantillons aléatoires sont prélevés dans chacun d'eux.

nh=NhN×nn_h = \frac{N_h}{N} \times n

Où :

  • NhN_h : taille du sous-groupe hh ;
  • NN : taille totale de la population ;
  • nn : taille totale de l'échantillon ;
  • nhn_{\raisebox{-1pt}{$h$}} : taille de l'échantillon du sous-groupe hh.

Exemple :

Une classe compte 30 élèves : 18 garçons et 12 filles. Vous souhaitez échantillonner 10 élèves proportionnellement :

  • Parmi les garçons : 1830×10=6\tfrac{\raisebox{1pt}{$18$}}{\raisebox{-1pt}{$30$}} \times 10 = 6 ;
  • Parmi les filles : 1230×10=4\tfrac{\raisebox{1pt}{$12$}}{\raisebox{-1pt}{$30$}} \times 10 = 4.

Intérêt : Garantit la représentation des sous-groupes clés.

Échantillonnage par grappes

La population est divisée en groupes (grappes), et des grappes entières sont sélectionnées aléatoirement.

c=nombre de grappes aˋ eˊchantillonnerc = \text{nombre de grappes à échantillonner}

Où :

  • Les grappes sont des groupes préexistants (par exemple, classes, équipes) ;
  • La sélection porte sur des grappes entières, non sur des individus.

Exemple 1 :

Votre école compte 5 salles de classe. Vous souhaitez obtenir un échantillon de 25 élèves, mais interroger chaque individu prendrait trop de temps.

Solution : Sélectionner aléatoirement 1 salle de classe (chacune ayant environ 25 élèves) et interroger tous les élèves de cette salle.

Exemple 2 :

Une université possède 20 bâtiments de dortoirs, chacun hébergeant 50 étudiants. Vous sélectionnez aléatoirement 4 dortoirs et interrogez tous les résidents.

  • Nombre de grappes : N=20N=20 ;
  • Groupes sélectionnés : n=4n=4 ;
  • Étudiants par dortoir : M=50M=50 ;
  • Nombre total d'étudiants interrogés : n×M=200n \times M = 200.

Quelle est la probabilité qu'un étudiant spécifique (par exemple, Sarah) soit inclus ?
Elle correspond à la probabilité que son dortoir soit sélectionné :

P(Sarah selected)=420=0.2P(\text{Sarah selected}) = \frac{4}{20} = 0.2

Cas complexe :
Si 10 dortoirs comptent 30 étudiants et 10 en comptent 70, et que vous sélectionnez 4 dortoirs au hasard, quelle est la taille d'échantillon attendue ?

Soit :

  • D30=10D_{30} = 10 dortoirs de 30 étudiants ;
  • D70=10D_{70} = 10 dortoirs de 70 étudiants.

Taille d'échantillon attendue :

E=1020(4×30)+1020(4×70)=200E = \frac{10}{20} \cdot (4 \times 30) + \frac{10}{20} \cdot (4 \times 70) = 200

Ainsi, même si les grappes diffèrent en taille, la taille d'échantillon attendue reste la même si les types de dortoirs sont équilibrés.

Échantillonnage systématique

Sélection de chaque kk-ième élément d'une liste.

k=Nnk = \frac{N}{n}

Où :

  • NN - population totale ;
  • nn - taille d'échantillon souhaitée ;
  • kk - intervalle d'échantillonnage.

Exemple :

Une liste de 1000 clients. Vous souhaitez obtenir un échantillon de 100. Donc :

k=1000100=10k = \frac{1000}{100} = 10

Choisir un point de départ aléatoire (par exemple, 7), puis sélectionner chaque 10ème client : 7, 17, 27, etc.

Avantage : Facile à mettre en œuvre et systématique.

Toutes les méthodes appliquées à un même problème

Mise en situation :
Vous étudiez la satisfaction à la cafétéria dans une école de 300 élèves répartis dans 10 classes (30 par classe). Vous souhaitez obtenir un échantillon de 30 élèves.

  • Aléatoire simple : sélectionner au hasard 30 noms dans la liste complète ;
  • Stratifié : si 60 % sont des garçons et 40 % des filles, échantillonner 18 garçons et 12 filles ;
  • Par grappes : sélectionner au hasard 1 classe (30 élèves) et interroger tous les élèves de cette classe ;
  • Systématique : choisir chaque 10ᵉ élève dans une liste ordonnée.

Résumé

  • L'échantillonnage réduit l'effort de collecte de données tout en permettant la généralisation ;
  • L'échantillonnage aléatoire et stratifié sont les plus précis ;
  • L'échantillonnage par grappes est efficace mais fonctionne mieux lorsque les grappes sont similaires ;
  • L'échantillonnage systématique est simple et pratique ;
  • L'échantillonnage de commodité est risqué et doit être évité si possible ;
  • Toujours documenter la méthode d'échantillonnage lors d'une analyse réelle.
question mark

Quelle méthode garantit à chaque individu une chance égale d'être sélectionné ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 5
some-alt