Forståelse af Sampling
Stryg for at vise menuen
Udtagning er processen med at vælge et delmængde af data fra en større population for at opnå indsigt og drage konklusioner om helheden. Da det ofte er upraktisk eller umuligt at indsamle data fra hele populationen, muliggør udtagning en effektiv analyse, samtidig med at kvaliteten og nøjagtigheden af resultaterne opretholdes.
Simpel tilfældig udtagning
Hvert medlem af populationen har lige stor sandsynlighed for at blive udvalgt.
Dette svarer til at trække navne op af en hat.
Hvor:
- N = population size.
Eksempel 1:
Du har en klasse med 30 elever. Du ønsker tilfældigt at udvælge 5 til en undersøgelse.
Løsning: Brug en tilfældig talgenerator til at vælge 5 unikke tal mellem 1 og 30. Hver elev har 301 sandsynlighed for at blive udvalgt.
Eksempel 2:
Du har en klasse med 30 elever og ønsker at udvælge 5 til at deltage i en undersøgelse.
- Samlet population: N=30;
- Udvalgsstørrelse: n=5.
Hvad er sandsynligheden for, at både Alice og Bob bliver udvalgt?
Samlet antal måder at vælge 5 elever ud af 30:
(530)Antal gunstige udtagninger, hvor både Alice og Bob er med:
Fastlås Alice og Bob — vælg 3 mere blandt de resterende 28:
Så sandsynligheden er:
P=(530)(328)Stratificeret udtagning
Populationen opdeles i meningsfulde undergrupper (strata), og der udtages tilfældige prøver fra hver.
nh=NNh×nHvor:
- Nh - størrelse af undergruppe h;
- N - samlet populationsstørrelse;
- n - samlet udvalgsstørrelse;
- nh - udvalgsstørrelse fra undergruppe h.
Eksempel:
En klasse har 30 elever: 18 drenge og 12 piger. Du ønsker at udtage 10 elever proportionalt:
- Fra drenge: 3018×10=6;
- Fra piger: 3012×10=4.
Fordel: Sikrer repræsentation af vigtige undergrupper.
Klyngeudtagning
Populationen opdeles i grupper (klynger), og hele klynger udvælges tilfældigt.
c=antal klynger der skal udtagesHvor:
- Klynger er eksisterende grupper (f.eks. klasselokaler, hold);
- Hele klynger udvælges tilfældigt, ikke enkeltpersoner.
Eksempel 1:
Din skole har 5 klasselokaler. Du ønsker et udvalg på 25 elever, men det er for tidskrævende at undersøge enkeltpersoner.
Løsning: Udvælg tilfældigt 1 klasselokale (da hvert har ca. 25 elever) og undersøg alle.
Eksempel 2:
Et universitet har 20 kollegiebygninger, hver med 50 beboere. Du udvælger tilfældigt 4 kollegier og undersøger alle beboere.
- Antal klynger: N=20;
- Udvalgte klynger: n=4;
- Studerende pr. kollegium: M=50;
- Samlet antal udvalgte studerende: n×M=200.
Hvad er sandsynligheden for, at en bestemt studerende (f.eks. Sarah) er medtaget?
Det svarer til sandsynligheden for, at hendes kollegium bliver udvalgt:
Komplekst tilfælde:
Hvis 10 kollegier har 30 studerende og 10 har 70 studerende, og du udvælger 4 kollegier tilfældigt, hvad er det forventede stikprøvestørrelse?
Lad:
- D30=10 kollegier med 30 studerende;
- D70=10 kollegier med 70 studerende.
Forventet stikprøvestørrelse:
E=2010⋅(4×30)+2010⋅(4×70)=200Så selvom klyngerne varierer i størrelse, forbliver den forventede stikprøvestørrelse den samme, hvis kollegietyperne er balancerede.
Systematisk udvælgelse
Udvælg hver k-te element fra en liste.
k=nNHvor:
- N - samlet population;
- n - ønsket stikprøvestørrelse;
- k - udvælgelsesinterval.
Eksempel:
En liste med 1000 kunder. Du ønsker en stikprøve på 100. Så:
k=1001000=10Vælg et tilfældigt startpunkt (f.eks. 7), og udvælg derefter hver 10. kunde: 7, 17, 27, osv.
Fordel: Let at implementere og systematisk.
Alle metoder anvendt på ét problem
Problemopstilling:
Du undersøger tilfredsheden med kantinen på en skole med 300 elever fordelt på 10 klasselokaler (30 per lokale). Du ønsker et udsnit på 30 elever.
- Simpel tilfældig: vælg tilfældigt 30 navne fra hele listen;
- Stratificeret: hvis 60% er drenge og 40% piger, udvælg 18 drenge og 12 piger;
- Klynge: vælg tilfældigt 1 klasse (30 elever) og undersøg alle;
- Systematisk: vælg hver 10. elev fra en ordnet liste.
Sammenfatning
- Udtagning reducerer indsatsen for dataindsamling og muliggør generalisering;
- Tilfældig og stratificeret udtagning er bedst for nøjagtighed;
- Klyngeudtagning er effektiv, men fungerer bedst, når klynger ligner hinanden;
- Systematisk udtagning er enkel og praktisk;
- Bekvemmelighedsudtagning er risikabel og bør undgås, hvis det er muligt;
- Dokumentér altid din udtagningsmetode i analyser fra virkeligheden.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat