Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Forståelse af Sampling | Sandsynlighed & Statistik
Matematik for Datavidenskab

bookForståelse af Sampling

Note
Definition

Udtagning er processen med at vælge et delmængde af data fra en større population for at opnå indsigt og drage konklusioner om helheden. Da det ofte er upraktisk eller umuligt at indsamle data fra hele populationen, muliggør udtagning en effektiv analyse, samtidig med at kvaliteten og nøjagtigheden af resultaterne opretholdes.

Simpel tilfældig udtagning

Hvert medlem af populationen har lige stor sandsynlighed for at blive udvalgt.
Dette svarer til at trække navne op af en hat.

P(Select any individual)=1NP(\text{Select any individual}) = \frac{1}{N}

Hvor:

  • NN = population size.

Eksempel 1:

Du har en klasse med 30 studerende. Du ønsker tilfældigt at udvælge 5 til en undersøgelse.

Løsning: Brug en tilfældig talgenerator til at vælge 5 unikke tal mellem 1 og 30. Hver studerende har 130\tfrac{\raisebox{1pt}{$1$}}{\raisebox{-1pt}{$30$}} sandsynlighed for at blive udvalgt.

Eksempel 2:

Du har en klasse med 30 studerende og ønsker at udvælge 5 til at deltage i en undersøgelse.

  • Samlet population: N=30N=30;
  • Udvalgsstørrelse: n=5n=5.

Hvad er sandsynligheden for, at både Alice og Bob bliver udvalgt?

Samlet antal måder at vælge 5 studerende ud af 30:

(305)\binom{30}{5}

Antal gunstige udtagninger, hvor både Alice og Bob er med:
Fastlås Alice og Bob — vælg 3 mere blandt de resterende 28:

(283)\binom{28}{3}

Så sandsynligheden er:

P=(283)(305)P = \frac{\binom{28}{3}}{\binom{30}{5}}

Stratificeret udtagning

Populationen opdeles i meningsfulde undergrupper (strata), og tilfældige udtagninger foretages fra hver.

nh=NhN×nn_h = \frac{N_h}{N} \times n

Hvor:

  • NhN_h - størrelse af undergruppe hh;
  • NN - samlet populationsstørrelse;
  • nn - samlet udvalgsstørrelse;
  • nhn_{\raisebox{-1pt}{$h$}} - udvalgsstørrelse fra undergruppe hh.

Eksempel:

En klasse har 30 studerende: 18 mænd og 12 kvinder. Du ønsker at udtage 10 studerende proportionalt:

  • Fra mænd: 1830×10=6\tfrac{\raisebox{1pt}{$18$}}{\raisebox{-1pt}{$30$}} \times 10 = 6;
  • Fra kvinder: 1230×10=4\tfrac{\raisebox{1pt}{$12$}}{\raisebox{-1pt}{$30$}} \times 10 = 4.

Fordel: Sikrer repræsentation af vigtige undergrupper.

Klyngeudtagning

Populationen opdeles i grupper (klynger), og hele klynger udvælges tilfældigt.

c=antal klynger der skal udtagesc = \text{antal klynger der skal udtages}

Hvor:

  • Klynger er eksisterende grupper (f.eks. klasselokaler, hold);
  • Du udvælger tilfældigt hele klynger, ikke enkeltpersoner.

Eksempel 1:

Din skole har 5 klasselokaler. Du ønsker et udvalg på 25 elever, men det er for tidskrævende at undersøge enkeltpersoner.

Løsning: Udvælg tilfældigt 1 klasselokale (da hvert har ca. 25 elever) og undersøg alle.

Eksempel 2:

Et universitet har 20 kollegiebygninger, hver med 50 beboere. Du udvælger tilfældigt 4 kollegier og undersøger alle beboere.

  • Antal klynger: N=20N=20;
  • Udvalgte klynger: n=4n=4;
  • Elever pr. kollegium: M=50M=50;
  • Samlet antal udvalgte elever: n×M=200n \times M = 200.

Hvad er sandsynligheden for, at en bestemt elev (f.eks. Sarah) er medtaget?
Det svarer til sandsynligheden for, at hendes kollegium udvælges:

P(Sarah selected)=420=0.2P(\text{Sarah selected}) = \frac{4}{20} = 0.2

Komplekst tilfælde:
Hvis 10 kollegier har 30 elever og 10 har 70 elever, og du udvælger 4 kollegier tilfældigt, hvad er det forventede stikprøvestørrelse?

Lad:

  • D30=10D_{30} = 10 kollegier med 30 elever;
  • D70=10D_{70} = 10 kollegier med 70 elever.

Forventet stikprøvestørrelse:

E=1020(4×30)+1020(4×70)=200E = \frac{10}{20} \cdot (4 \times 30) + \frac{10}{20} \cdot (4 \times 70) = 200

Så selvom klyngerne varierer i størrelse, forbliver den forventede stikprøvestørrelse den samme, hvis kollegietyperne er balancerede.

Systematisk udvælgelse

Udvælg hver kk-te element fra en liste.

k=Nnk = \frac{N}{n}

Hvor:

  • NN - samlet population;
  • nn - ønsket stikprøvestørrelse;
  • kk - udvælgelsesinterval.

Eksempel:

En liste med 1000 kunder. Du ønsker en stikprøve på 100. Så:

k=1000100=10k = \frac{1000}{100} = 10

Vælg et tilfældigt startpunkt (f.eks. 7), og udvælg derefter hver 10. kunde: 7, 17, 27 osv.

Fordel: Let at implementere og systematisk.

Alle metoder anvendt på ét problem

Problemopstilling:
Du undersøger tilfredsheden med kantinen på en skole med 300 elever fordelt på 10 klasselokaler (30 pr. lokale). Du ønsker et udvalg på 30 elever.

  • Simpel tilfældig: vælg tilfældigt 30 navne fra hele listen;
  • Stratificeret: hvis 60% er drenge og 40% piger, udvælg 18 drenge og 12 piger;
  • Klynge: vælg tilfældigt 1 klasse (30 elever) og undersøg alle;
  • Systematisk: vælg hver 10. elev fra en ordnet liste.

Sammenfatning

  • Udtagning reducerer indsatsen for dataindsamling og muliggør generalisering;
  • Tilfældig og stratificeret udtagning er bedst for nøjagtighed;
  • Klyngeudtagning er effektiv, men fungerer bedst, når klynger ligner hinanden;
  • Systematisk udtagning er enkel og praktisk;
  • Bekvemmelighedsudtagning er risikabel og bør undgås, hvis det er muligt;
  • Dokumentér altid din udtagningsmetode i analyser fra virkeligheden.
question mark

Hvilken metode sikrer, at hver enkelt har lige stor sandsynlighed for at blive udvalgt?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 5

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you explain the differences between these sampling methods in more detail?

When should I use each sampling method?

Can you provide more real-world examples for each sampling method?

Awesome!

Completion rate improved to 1.96

bookForståelse af Sampling

Stryg for at vise menuen

Note
Definition

Udtagning er processen med at vælge et delmængde af data fra en større population for at opnå indsigt og drage konklusioner om helheden. Da det ofte er upraktisk eller umuligt at indsamle data fra hele populationen, muliggør udtagning en effektiv analyse, samtidig med at kvaliteten og nøjagtigheden af resultaterne opretholdes.

Simpel tilfældig udtagning

Hvert medlem af populationen har lige stor sandsynlighed for at blive udvalgt.
Dette svarer til at trække navne op af en hat.

P(Select any individual)=1NP(\text{Select any individual}) = \frac{1}{N}

Hvor:

  • NN = population size.

Eksempel 1:

Du har en klasse med 30 studerende. Du ønsker tilfældigt at udvælge 5 til en undersøgelse.

Løsning: Brug en tilfældig talgenerator til at vælge 5 unikke tal mellem 1 og 30. Hver studerende har 130\tfrac{\raisebox{1pt}{$1$}}{\raisebox{-1pt}{$30$}} sandsynlighed for at blive udvalgt.

Eksempel 2:

Du har en klasse med 30 studerende og ønsker at udvælge 5 til at deltage i en undersøgelse.

  • Samlet population: N=30N=30;
  • Udvalgsstørrelse: n=5n=5.

Hvad er sandsynligheden for, at både Alice og Bob bliver udvalgt?

Samlet antal måder at vælge 5 studerende ud af 30:

(305)\binom{30}{5}

Antal gunstige udtagninger, hvor både Alice og Bob er med:
Fastlås Alice og Bob — vælg 3 mere blandt de resterende 28:

(283)\binom{28}{3}

Så sandsynligheden er:

P=(283)(305)P = \frac{\binom{28}{3}}{\binom{30}{5}}

Stratificeret udtagning

Populationen opdeles i meningsfulde undergrupper (strata), og tilfældige udtagninger foretages fra hver.

nh=NhN×nn_h = \frac{N_h}{N} \times n

Hvor:

  • NhN_h - størrelse af undergruppe hh;
  • NN - samlet populationsstørrelse;
  • nn - samlet udvalgsstørrelse;
  • nhn_{\raisebox{-1pt}{$h$}} - udvalgsstørrelse fra undergruppe hh.

Eksempel:

En klasse har 30 studerende: 18 mænd og 12 kvinder. Du ønsker at udtage 10 studerende proportionalt:

  • Fra mænd: 1830×10=6\tfrac{\raisebox{1pt}{$18$}}{\raisebox{-1pt}{$30$}} \times 10 = 6;
  • Fra kvinder: 1230×10=4\tfrac{\raisebox{1pt}{$12$}}{\raisebox{-1pt}{$30$}} \times 10 = 4.

Fordel: Sikrer repræsentation af vigtige undergrupper.

Klyngeudtagning

Populationen opdeles i grupper (klynger), og hele klynger udvælges tilfældigt.

c=antal klynger der skal udtagesc = \text{antal klynger der skal udtages}

Hvor:

  • Klynger er eksisterende grupper (f.eks. klasselokaler, hold);
  • Du udvælger tilfældigt hele klynger, ikke enkeltpersoner.

Eksempel 1:

Din skole har 5 klasselokaler. Du ønsker et udvalg på 25 elever, men det er for tidskrævende at undersøge enkeltpersoner.

Løsning: Udvælg tilfældigt 1 klasselokale (da hvert har ca. 25 elever) og undersøg alle.

Eksempel 2:

Et universitet har 20 kollegiebygninger, hver med 50 beboere. Du udvælger tilfældigt 4 kollegier og undersøger alle beboere.

  • Antal klynger: N=20N=20;
  • Udvalgte klynger: n=4n=4;
  • Elever pr. kollegium: M=50M=50;
  • Samlet antal udvalgte elever: n×M=200n \times M = 200.

Hvad er sandsynligheden for, at en bestemt elev (f.eks. Sarah) er medtaget?
Det svarer til sandsynligheden for, at hendes kollegium udvælges:

P(Sarah selected)=420=0.2P(\text{Sarah selected}) = \frac{4}{20} = 0.2

Komplekst tilfælde:
Hvis 10 kollegier har 30 elever og 10 har 70 elever, og du udvælger 4 kollegier tilfældigt, hvad er det forventede stikprøvestørrelse?

Lad:

  • D30=10D_{30} = 10 kollegier med 30 elever;
  • D70=10D_{70} = 10 kollegier med 70 elever.

Forventet stikprøvestørrelse:

E=1020(4×30)+1020(4×70)=200E = \frac{10}{20} \cdot (4 \times 30) + \frac{10}{20} \cdot (4 \times 70) = 200

Så selvom klyngerne varierer i størrelse, forbliver den forventede stikprøvestørrelse den samme, hvis kollegietyperne er balancerede.

Systematisk udvælgelse

Udvælg hver kk-te element fra en liste.

k=Nnk = \frac{N}{n}

Hvor:

  • NN - samlet population;
  • nn - ønsket stikprøvestørrelse;
  • kk - udvælgelsesinterval.

Eksempel:

En liste med 1000 kunder. Du ønsker en stikprøve på 100. Så:

k=1000100=10k = \frac{1000}{100} = 10

Vælg et tilfældigt startpunkt (f.eks. 7), og udvælg derefter hver 10. kunde: 7, 17, 27 osv.

Fordel: Let at implementere og systematisk.

Alle metoder anvendt på ét problem

Problemopstilling:
Du undersøger tilfredsheden med kantinen på en skole med 300 elever fordelt på 10 klasselokaler (30 pr. lokale). Du ønsker et udvalg på 30 elever.

  • Simpel tilfældig: vælg tilfældigt 30 navne fra hele listen;
  • Stratificeret: hvis 60% er drenge og 40% piger, udvælg 18 drenge og 12 piger;
  • Klynge: vælg tilfældigt 1 klasse (30 elever) og undersøg alle;
  • Systematisk: vælg hver 10. elev fra en ordnet liste.

Sammenfatning

  • Udtagning reducerer indsatsen for dataindsamling og muliggør generalisering;
  • Tilfældig og stratificeret udtagning er bedst for nøjagtighed;
  • Klyngeudtagning er effektiv, men fungerer bedst, når klynger ligner hinanden;
  • Systematisk udtagning er enkel og praktisk;
  • Bekvemmelighedsudtagning er risikabel og bør undgås, hvis det er muligt;
  • Dokumentér altid din udtagningsmetode i analyser fra virkeligheden.
question mark

Hvilken metode sikrer, at hver enkelt har lige stor sandsynlighed for at blive udvalgt?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 5
some-alt