Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Inzicht in Steekproeven | Kansrekening & Statistiek
Wiskunde voor Data Science

bookInzicht in Steekproeven

Note
Definitie

Steekproeftrekking is het proces waarbij een deelverzameling van gegevens uit een grotere populatie wordt geselecteerd om inzichten te verkrijgen en conclusies te trekken over het geheel. Omdat het vaak onpraktisch of onmogelijk is om gegevens van een volledige populatie te verzamelen, maakt steekproeftrekking efficiënte analyse mogelijk met behoud van de kwaliteit en nauwkeurigheid van de resultaten.

Eenvoudige aselecte steekproef

Elk lid van de populatie heeft een gelijke kans om geselecteerd te worden.
Dit is vergelijkbaar met het trekken van namen uit een hoed.

P(Select any individual)=1NP(\text{Select any individual}) = \frac{1}{N}

Waarbij:

  • NN = populatiegrootte.

Voorbeeld 1:

Er is een klas van 30 studenten. Er moeten willekeurig 5 studenten worden geselecteerd voor een enquête.

Oplossing: Gebruik een willekeurige getallengenerator om 5 unieke nummers tussen 1 en 30 te selecteren. Elke student heeft een 130\tfrac{\raisebox{1pt}{$1$}}{\raisebox{-1pt}{$30$}} kans om geselecteerd te worden.

Voorbeeld 2:

Er is een klas van 30 studenten en u wilt 5 studenten selecteren om deel te nemen aan een enquête.

  • Totale populatie: N=30N=30;
  • Steekproefgrootte: n=5n=5.

Wat is de kans dat zowel Alice als Bob worden geselecteerd?

Totaal aantal manieren om 5 studenten uit 30 te kiezen:

(305)\binom{30}{5}

Aantal gunstige steekproeven waarin zowel Alice als Bob zitten:
Fixeer Alice en Bob — kies nog 3 uit de resterende 28:

(283)\binom{28}{3}

Dus de kans is:

P=(283)(305)P = \frac{\binom{28}{3}}{\binom{30}{5}}

Gestratificeerde steekproef

De populatie wordt verdeeld in betekenisvolle subgroepen (strata), en uit elke subgroep worden willekeurige steekproeven genomen.

nh=NhN×nn_h = \frac{N_h}{N} \times n

Waarbij:

  • NhN_h - grootte van subgroep hh;
  • NN - totale populatiegrootte;
  • nn - totale steekproefgrootte;
  • nhn_{\raisebox{-1pt}{$h$}} - steekproefgrootte uit subgroep hh.

Voorbeeld:

Een klas heeft 30 studenten: 18 mannen en 12 vrouwen. U wilt 10 studenten proportioneel bemonsteren:

  • Uit mannen: 1830×10=6\tfrac{\raisebox{1pt}{$18$}}{\raisebox{-1pt}{$30$}} \times 10 = 6;
  • Uit vrouwen: 1230×10=4\tfrac{\raisebox{1pt}{$12$}}{\raisebox{-1pt}{$30$}} \times 10 = 4.

Waarom dit goed is: Zorgt voor vertegenwoordiging van belangrijke subgroepen.

Clustersteekproef

De populatie wordt opgedeeld in groepen (clusters), en volledige clusters worden willekeurig geselecteerd.

c=aantal te bemonsteren clustersc = \text{aantal te bemonsteren clusters}

Waarbij:

  • Clusters zijn bestaande groepen (bijv. klaslokalen, teams);
  • Willekeurige selectie van volledige clusters, niet van individuen.

Voorbeeld 1:

Je school heeft 5 klaslokalen. Je wilt een steekproef van 25 studenten, maar het individueel ondervragen is te tijdrovend.

Oplossing: Selecteer willekeurig 1 klaslokaal (aangezien elk ongeveer 25 studenten heeft) en ondervraag iedereen.

Voorbeeld 2:

Een universiteit heeft 20 studentenflats, elk met 50 studenten. Je selecteert willekeurig 4 flats en ondervraagt iedereen binnen.

  • Aantal clusters: N=20N=20;
  • Geselecteerde clusters: n=4n=4;
  • Studenten per flat: M=50M=50;
  • Totaal aantal ondervraagde studenten: n×M=200n \times M = 200.

Wat is de kans dat een specifieke student (bijvoorbeeld Sarah) wordt opgenomen?
Dit is gelijk aan de kans dat haar flat wordt geselecteerd:

P(Sarah geselecteerd)=420=0.2P(\text{Sarah geselecteerd}) = \frac{4}{20} = 0.2

Complex geval:
Als 10 flats 30 studenten hebben en 10 flats 70 studenten, en je selecteert willekeurig 4 flats, wat is de verwachte steekproefgrootte?

Laat:

  • D30=10D_{30} = 10 flats met 30 studenten;
  • D70=10D_{70} = 10 flats met 70 studenten.

Verwachte steekproefgrootte:

E=1020(4×30)+1020(4×70)=200E = \frac{10}{20} \cdot (4 \times 30) + \frac{10}{20} \cdot (4 \times 70) = 200

Dus zelfs als clusters in grootte verschillen, blijft de verwachte steekproefgrootte gelijk als de flattypes in balans zijn.

Systematische Steekproef

Selecteer elk kk-de item uit een lijst.

k=Nnk = \frac{N}{n}

Waarbij:

  • NN - totale populatie;
  • nn - gewenste steekproefgrootte;
  • kk - steekproefinterval.

Voorbeeld:

Een lijst van 1000 klanten. Je wilt een steekproef van 100. Dus:

k=1000100=10k = \frac{1000}{100} = 10

Kies een willekeurig startpunt (bijvoorbeeld 7), selecteer vervolgens elke 10e klant: 7, 17, 27, enz.

Waarom het goed is: Eenvoudig te implementeren en systematisch.

Alle methoden toegepast op één probleem

Probleemstelling:
Je onderzoekt de tevredenheid over de kantine op een school met 300 leerlingen verdeeld over 10 klassen (30 per klas). Je wilt een steekproef van 30 leerlingen.

  • Eenvoudig aselect: willekeurig 30 namen kiezen uit de volledige lijst;
  • Gestratificeerd: als 60% jongens en 40% meisjes zijn, neem dan 18 jongens en 12 meisjes in de steekproef;
  • Cluster: willekeurig 1 klas selecteren (30 leerlingen) en allen ondervragen;
  • Systematisch: elke 10e leerling uit een geordende lijst kiezen.

Samenvatting

  • Steekproeven verminderen de inspanning voor gegevensverzameling en maken generalisatie mogelijk;
  • Aselecte en gestratificeerde steekproeven zijn het meest nauwkeurig;
  • Clustersteekproeven zijn efficiënt, maar werken het beste als clusters vergelijkbaar zijn;
  • Systematische steekproeven zijn eenvoudig en praktisch;
  • Gemakssteekproeven zijn risicovol en moeten indien mogelijk worden vermeden;
  • Documenteer altijd je steekproefmethode bij analyse in de praktijk.
question mark

Welke methode zorgt ervoor dat elk individu een gelijke kans heeft om geselecteerd te worden?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 5

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Awesome!

Completion rate improved to 1.96

bookInzicht in Steekproeven

Veeg om het menu te tonen

Note
Definitie

Steekproeftrekking is het proces waarbij een deelverzameling van gegevens uit een grotere populatie wordt geselecteerd om inzichten te verkrijgen en conclusies te trekken over het geheel. Omdat het vaak onpraktisch of onmogelijk is om gegevens van een volledige populatie te verzamelen, maakt steekproeftrekking efficiënte analyse mogelijk met behoud van de kwaliteit en nauwkeurigheid van de resultaten.

Eenvoudige aselecte steekproef

Elk lid van de populatie heeft een gelijke kans om geselecteerd te worden.
Dit is vergelijkbaar met het trekken van namen uit een hoed.

P(Select any individual)=1NP(\text{Select any individual}) = \frac{1}{N}

Waarbij:

  • NN = populatiegrootte.

Voorbeeld 1:

Er is een klas van 30 studenten. Er moeten willekeurig 5 studenten worden geselecteerd voor een enquête.

Oplossing: Gebruik een willekeurige getallengenerator om 5 unieke nummers tussen 1 en 30 te selecteren. Elke student heeft een 130\tfrac{\raisebox{1pt}{$1$}}{\raisebox{-1pt}{$30$}} kans om geselecteerd te worden.

Voorbeeld 2:

Er is een klas van 30 studenten en u wilt 5 studenten selecteren om deel te nemen aan een enquête.

  • Totale populatie: N=30N=30;
  • Steekproefgrootte: n=5n=5.

Wat is de kans dat zowel Alice als Bob worden geselecteerd?

Totaal aantal manieren om 5 studenten uit 30 te kiezen:

(305)\binom{30}{5}

Aantal gunstige steekproeven waarin zowel Alice als Bob zitten:
Fixeer Alice en Bob — kies nog 3 uit de resterende 28:

(283)\binom{28}{3}

Dus de kans is:

P=(283)(305)P = \frac{\binom{28}{3}}{\binom{30}{5}}

Gestratificeerde steekproef

De populatie wordt verdeeld in betekenisvolle subgroepen (strata), en uit elke subgroep worden willekeurige steekproeven genomen.

nh=NhN×nn_h = \frac{N_h}{N} \times n

Waarbij:

  • NhN_h - grootte van subgroep hh;
  • NN - totale populatiegrootte;
  • nn - totale steekproefgrootte;
  • nhn_{\raisebox{-1pt}{$h$}} - steekproefgrootte uit subgroep hh.

Voorbeeld:

Een klas heeft 30 studenten: 18 mannen en 12 vrouwen. U wilt 10 studenten proportioneel bemonsteren:

  • Uit mannen: 1830×10=6\tfrac{\raisebox{1pt}{$18$}}{\raisebox{-1pt}{$30$}} \times 10 = 6;
  • Uit vrouwen: 1230×10=4\tfrac{\raisebox{1pt}{$12$}}{\raisebox{-1pt}{$30$}} \times 10 = 4.

Waarom dit goed is: Zorgt voor vertegenwoordiging van belangrijke subgroepen.

Clustersteekproef

De populatie wordt opgedeeld in groepen (clusters), en volledige clusters worden willekeurig geselecteerd.

c=aantal te bemonsteren clustersc = \text{aantal te bemonsteren clusters}

Waarbij:

  • Clusters zijn bestaande groepen (bijv. klaslokalen, teams);
  • Willekeurige selectie van volledige clusters, niet van individuen.

Voorbeeld 1:

Je school heeft 5 klaslokalen. Je wilt een steekproef van 25 studenten, maar het individueel ondervragen is te tijdrovend.

Oplossing: Selecteer willekeurig 1 klaslokaal (aangezien elk ongeveer 25 studenten heeft) en ondervraag iedereen.

Voorbeeld 2:

Een universiteit heeft 20 studentenflats, elk met 50 studenten. Je selecteert willekeurig 4 flats en ondervraagt iedereen binnen.

  • Aantal clusters: N=20N=20;
  • Geselecteerde clusters: n=4n=4;
  • Studenten per flat: M=50M=50;
  • Totaal aantal ondervraagde studenten: n×M=200n \times M = 200.

Wat is de kans dat een specifieke student (bijvoorbeeld Sarah) wordt opgenomen?
Dit is gelijk aan de kans dat haar flat wordt geselecteerd:

P(Sarah geselecteerd)=420=0.2P(\text{Sarah geselecteerd}) = \frac{4}{20} = 0.2

Complex geval:
Als 10 flats 30 studenten hebben en 10 flats 70 studenten, en je selecteert willekeurig 4 flats, wat is de verwachte steekproefgrootte?

Laat:

  • D30=10D_{30} = 10 flats met 30 studenten;
  • D70=10D_{70} = 10 flats met 70 studenten.

Verwachte steekproefgrootte:

E=1020(4×30)+1020(4×70)=200E = \frac{10}{20} \cdot (4 \times 30) + \frac{10}{20} \cdot (4 \times 70) = 200

Dus zelfs als clusters in grootte verschillen, blijft de verwachte steekproefgrootte gelijk als de flattypes in balans zijn.

Systematische Steekproef

Selecteer elk kk-de item uit een lijst.

k=Nnk = \frac{N}{n}

Waarbij:

  • NN - totale populatie;
  • nn - gewenste steekproefgrootte;
  • kk - steekproefinterval.

Voorbeeld:

Een lijst van 1000 klanten. Je wilt een steekproef van 100. Dus:

k=1000100=10k = \frac{1000}{100} = 10

Kies een willekeurig startpunt (bijvoorbeeld 7), selecteer vervolgens elke 10e klant: 7, 17, 27, enz.

Waarom het goed is: Eenvoudig te implementeren en systematisch.

Alle methoden toegepast op één probleem

Probleemstelling:
Je onderzoekt de tevredenheid over de kantine op een school met 300 leerlingen verdeeld over 10 klassen (30 per klas). Je wilt een steekproef van 30 leerlingen.

  • Eenvoudig aselect: willekeurig 30 namen kiezen uit de volledige lijst;
  • Gestratificeerd: als 60% jongens en 40% meisjes zijn, neem dan 18 jongens en 12 meisjes in de steekproef;
  • Cluster: willekeurig 1 klas selecteren (30 leerlingen) en allen ondervragen;
  • Systematisch: elke 10e leerling uit een geordende lijst kiezen.

Samenvatting

  • Steekproeven verminderen de inspanning voor gegevensverzameling en maken generalisatie mogelijk;
  • Aselecte en gestratificeerde steekproeven zijn het meest nauwkeurig;
  • Clustersteekproeven zijn efficiënt, maar werken het beste als clusters vergelijkbaar zijn;
  • Systematische steekproeven zijn eenvoudig en praktisch;
  • Gemakssteekproeven zijn risicovol en moeten indien mogelijk worden vermeden;
  • Documenteer altijd je steekproefmethode bij analyse in de praktijk.
question mark

Welke methode zorgt ervoor dat elk individu een gelijke kans heeft om geselecteerd te worden?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 5
some-alt