Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Forståelse av Utvalg | Sannsynlighet og Statistikk
Matematikk for Datavitenskap

bookForståelse av Utvalg

Note
Definisjon

Utvalg er prosessen med å velge et delsett av data fra en større populasjon for å oppnå innsikt og trekke slutninger om helheten. Siden det ofte er upraktisk eller umulig å samle inn data fra hele populasjonen, gir utvalg mulighet for effektiv analyse samtidig som kvaliteten og nøyaktigheten i resultatene opprettholdes.

Enkel tilfeldig utvelgelse

Hvert medlem av populasjonen har like stor sjanse for å bli valgt.
Dette kan sammenlignes med å trekke navn fra en hatt.

P(Select any individual)=1NP(\text{Select any individual}) = \frac{1}{N}

Hvor:

  • NN = population size.

Eksempel 1:

Du har en klasse med 30 studenter. Du ønsker å tilfeldig velge 5 til en undersøkelse.

Løsning: Bruk en tilfeldig tallgenerator for å velge 5 unike tall mellom 1 og 30. Hver student har 130\tfrac{\raisebox{1pt}{$1$}}{\raisebox{-1pt}{$30$}} sjanse for å bli valgt.

Eksempel 2:

Du har en klasse med 30 elever og ønsker å velge 5 til å delta i en undersøkelse.

  • Total populasjon: N=30N=30;
  • Utvalgsstørrelse: n=5n=5.

Hva er sannsynligheten for at både Alice og Bob blir valgt?

Totalt antall måter å velge 5 elever fra 30:

(305)\binom{30}{5}

Antall gunstige utvalg som inneholder både Alice og Bob:
Fiks Alice og Bob — velg 3 til fra de resterende 28:

(283)\binom{28}{3}

Sannsynligheten blir da:

P=(283)(305)P = \frac{\binom{28}{3}}{\binom{30}{5}}

Stratifisert utvalg

Populasjonen deles inn i meningsfulle undergrupper (strata), og tilfeldige utvalg tas fra hver gruppe.

nh=NhN×nn_h = \frac{N_h}{N} \times n

Hvor:

  • NhN_h – størrelse på undergruppe hh;
  • NN – total populasjonsstørrelse;
  • nn – total utvalgsstørrelse;
  • nhn_{\raisebox{-1pt}{$h$}} – utvalgsstørrelse fra undergruppe hh.

Eksempel:

En klasse har 30 elever: 18 gutter og 12 jenter. Du ønsker å trekke ut 10 elever proporsjonalt:

  • Fra gutter: 1830×10=6\tfrac{\raisebox{1pt}{$18$}}{\raisebox{-1pt}{$30$}} \times 10 = 6;
  • Fra jenter: 1230×10=4\tfrac{\raisebox{1pt}{$12$}}{\raisebox{-1pt}{$30$}} \times 10 = 4.

Hvorfor det er bra: Sikrer representasjon av viktige undergrupper.

Klyngeutvalg

Populasjonen deles inn i grupper (klynger), og hele klynger velges tilfeldig.

c=number of clusters to samplec = \text{number of clusters to sample}

Hvor:

  • Klynger er forhåndsdefinerte grupper (f.eks. klasserom, lag);
  • Hele klynger velges tilfeldig, ikke enkeltindivider.

Eksempel 1:

Skolen din har 5 klasserom. Du ønsker et utvalg på 25 elever, men å undersøke enkeltpersoner tar for lang tid.

Løsning: Velg tilfeldig ett klasserom (siden hvert har omtrent 25 elever) og undersøk alle.

Eksempel 2:

Et universitet har 20 sovesalsbygninger, hver med 50 studenter. Du velger tilfeldig 4 sovesaler og undersøker alle som bor der.

  • Antall klynger: N=20N=20;
  • Valgte klynger: n=4n=4;
  • Studenter per sovesal: M=50M=50;
  • Totalt antall studenter i utvalget: n×M=200n \times M = 200.

Hva er sannsynligheten for at en bestemt student (f.eks. Sarah) blir inkludert?
Dette tilsvarer sannsynligheten for at hennes sovesal blir valgt:

P(Sarah selected)=420=0.2P(\text{Sarah selected}) = \frac{4}{20} = 0.2

Komplekst tilfelle:
Hvis 10 sovesaler har 30 studenter og 10 har 70 studenter, og du velger 4 sovesaler tilfeldig, hva er forventet utvalgsstørrelse?

La:

  • D30=10D_{30} = 10 sovesaler med 30 studenter;
  • D70=10D_{70} = 10 sovesaler med 70 studenter.

Forventet utvalgsstørrelse:

E=1020(4×30)+1020(4×70)=200E = \frac{10}{20} \cdot (4 \times 30) + \frac{10}{20} \cdot (4 \times 70) = 200

Så selv om klyngene varierer i størrelse, forblir forventet utvalgsstørrelse den samme dersom sovesaltypene er balanserte.

Systematisk utvalg

Velg hver kk-te enhet fra en liste.

k=Nnk = \frac{N}{n}

Hvor:

  • NN – total populasjon;
  • nn – ønsket utvalgsstørrelse;
  • kk – utvalgsintervall.

Eksempel:

En liste med 1000 kunder. Du ønsker et utvalg på 100. Da:

k=1000100=10k = \frac{1000}{100} = 10

Velg et tilfeldig startpunkt (f.eks. 7), og velg deretter hver 10. kunde: 7, 17, 27, osv.

Fordeler: Enkel å gjennomføre og systematisk.

Alle metoder brukt på ett problem

Problemstilling:
Du undersøker tilfredshet med kantinen på en skole med 300 elever fordelt på 10 klasserom (30 per rom). Du ønsker et utvalg på 30 elever.

  • Enkel tilfeldig: trekk tilfeldig ut 30 navn fra hele listen;
  • Stratifisert: hvis 60 % er gutter og 40 % jenter, trekk 18 gutter og 12 jenter;
  • Klynge: velg tilfeldig én klasse (30 elever) og undersøk alle;
  • Systematisk: velg hver tiende elev fra en ordnet liste.

Sammendrag

  • Utvalg reduserer datainnsamlingens omfang og muliggjør generalisering;
  • Tilfeldig og stratifisert utvalg gir best nøyaktighet;
  • Klyngeutvalg er effektivt, men fungerer best når klyngene er like;
  • Systematisk utvalg er enkelt og praktisk;
  • Bekvemmelighetsutvalg er risikabelt og bør unngås om mulig;
  • Dokumenter alltid utvalgsmetoden i reelle analyser.
question mark

Hvilken metode sikrer at hver enkelt har like stor sjanse for å bli valgt?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 5. Kapittel 5

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Suggested prompts:

Can you explain the differences between these sampling methods in more detail?

When should I use each sampling method?

Can you provide more real-world examples for each sampling method?

Awesome!

Completion rate improved to 1.96

bookForståelse av Utvalg

Sveip for å vise menyen

Note
Definisjon

Utvalg er prosessen med å velge et delsett av data fra en større populasjon for å oppnå innsikt og trekke slutninger om helheten. Siden det ofte er upraktisk eller umulig å samle inn data fra hele populasjonen, gir utvalg mulighet for effektiv analyse samtidig som kvaliteten og nøyaktigheten i resultatene opprettholdes.

Enkel tilfeldig utvelgelse

Hvert medlem av populasjonen har like stor sjanse for å bli valgt.
Dette kan sammenlignes med å trekke navn fra en hatt.

P(Select any individual)=1NP(\text{Select any individual}) = \frac{1}{N}

Hvor:

  • NN = population size.

Eksempel 1:

Du har en klasse med 30 studenter. Du ønsker å tilfeldig velge 5 til en undersøkelse.

Løsning: Bruk en tilfeldig tallgenerator for å velge 5 unike tall mellom 1 og 30. Hver student har 130\tfrac{\raisebox{1pt}{$1$}}{\raisebox{-1pt}{$30$}} sjanse for å bli valgt.

Eksempel 2:

Du har en klasse med 30 elever og ønsker å velge 5 til å delta i en undersøkelse.

  • Total populasjon: N=30N=30;
  • Utvalgsstørrelse: n=5n=5.

Hva er sannsynligheten for at både Alice og Bob blir valgt?

Totalt antall måter å velge 5 elever fra 30:

(305)\binom{30}{5}

Antall gunstige utvalg som inneholder både Alice og Bob:
Fiks Alice og Bob — velg 3 til fra de resterende 28:

(283)\binom{28}{3}

Sannsynligheten blir da:

P=(283)(305)P = \frac{\binom{28}{3}}{\binom{30}{5}}

Stratifisert utvalg

Populasjonen deles inn i meningsfulle undergrupper (strata), og tilfeldige utvalg tas fra hver gruppe.

nh=NhN×nn_h = \frac{N_h}{N} \times n

Hvor:

  • NhN_h – størrelse på undergruppe hh;
  • NN – total populasjonsstørrelse;
  • nn – total utvalgsstørrelse;
  • nhn_{\raisebox{-1pt}{$h$}} – utvalgsstørrelse fra undergruppe hh.

Eksempel:

En klasse har 30 elever: 18 gutter og 12 jenter. Du ønsker å trekke ut 10 elever proporsjonalt:

  • Fra gutter: 1830×10=6\tfrac{\raisebox{1pt}{$18$}}{\raisebox{-1pt}{$30$}} \times 10 = 6;
  • Fra jenter: 1230×10=4\tfrac{\raisebox{1pt}{$12$}}{\raisebox{-1pt}{$30$}} \times 10 = 4.

Hvorfor det er bra: Sikrer representasjon av viktige undergrupper.

Klyngeutvalg

Populasjonen deles inn i grupper (klynger), og hele klynger velges tilfeldig.

c=number of clusters to samplec = \text{number of clusters to sample}

Hvor:

  • Klynger er forhåndsdefinerte grupper (f.eks. klasserom, lag);
  • Hele klynger velges tilfeldig, ikke enkeltindivider.

Eksempel 1:

Skolen din har 5 klasserom. Du ønsker et utvalg på 25 elever, men å undersøke enkeltpersoner tar for lang tid.

Løsning: Velg tilfeldig ett klasserom (siden hvert har omtrent 25 elever) og undersøk alle.

Eksempel 2:

Et universitet har 20 sovesalsbygninger, hver med 50 studenter. Du velger tilfeldig 4 sovesaler og undersøker alle som bor der.

  • Antall klynger: N=20N=20;
  • Valgte klynger: n=4n=4;
  • Studenter per sovesal: M=50M=50;
  • Totalt antall studenter i utvalget: n×M=200n \times M = 200.

Hva er sannsynligheten for at en bestemt student (f.eks. Sarah) blir inkludert?
Dette tilsvarer sannsynligheten for at hennes sovesal blir valgt:

P(Sarah selected)=420=0.2P(\text{Sarah selected}) = \frac{4}{20} = 0.2

Komplekst tilfelle:
Hvis 10 sovesaler har 30 studenter og 10 har 70 studenter, og du velger 4 sovesaler tilfeldig, hva er forventet utvalgsstørrelse?

La:

  • D30=10D_{30} = 10 sovesaler med 30 studenter;
  • D70=10D_{70} = 10 sovesaler med 70 studenter.

Forventet utvalgsstørrelse:

E=1020(4×30)+1020(4×70)=200E = \frac{10}{20} \cdot (4 \times 30) + \frac{10}{20} \cdot (4 \times 70) = 200

Så selv om klyngene varierer i størrelse, forblir forventet utvalgsstørrelse den samme dersom sovesaltypene er balanserte.

Systematisk utvalg

Velg hver kk-te enhet fra en liste.

k=Nnk = \frac{N}{n}

Hvor:

  • NN – total populasjon;
  • nn – ønsket utvalgsstørrelse;
  • kk – utvalgsintervall.

Eksempel:

En liste med 1000 kunder. Du ønsker et utvalg på 100. Da:

k=1000100=10k = \frac{1000}{100} = 10

Velg et tilfeldig startpunkt (f.eks. 7), og velg deretter hver 10. kunde: 7, 17, 27, osv.

Fordeler: Enkel å gjennomføre og systematisk.

Alle metoder brukt på ett problem

Problemstilling:
Du undersøker tilfredshet med kantinen på en skole med 300 elever fordelt på 10 klasserom (30 per rom). Du ønsker et utvalg på 30 elever.

  • Enkel tilfeldig: trekk tilfeldig ut 30 navn fra hele listen;
  • Stratifisert: hvis 60 % er gutter og 40 % jenter, trekk 18 gutter og 12 jenter;
  • Klynge: velg tilfeldig én klasse (30 elever) og undersøk alle;
  • Systematisk: velg hver tiende elev fra en ordnet liste.

Sammendrag

  • Utvalg reduserer datainnsamlingens omfang og muliggjør generalisering;
  • Tilfeldig og stratifisert utvalg gir best nøyaktighet;
  • Klyngeutvalg er effektivt, men fungerer best når klyngene er like;
  • Systematisk utvalg er enkelt og praktisk;
  • Bekvemmelighetsutvalg er risikabelt og bør unngås om mulig;
  • Dokumenter alltid utvalgsmetoden i reelle analyser.
question mark

Hvilken metode sikrer at hver enkelt har like stor sjanse for å bli valgt?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 5. Kapittel 5
some-alt