Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Compreendendo Amostragem | Probabilidade e Estatística
Matemática para Ciência de Dados

bookCompreendendo Amostragem

Note
Definição

Amostragem é o processo de selecionar um subconjunto de dados de uma população maior para obter insights e fazer inferências sobre o todo. Como muitas vezes é impraticável ou impossível coletar dados de toda a população, a amostragem permite uma análise eficiente, mantendo a qualidade e a precisão dos resultados.

Amostragem Aleatória Simples

Cada membro da população tem a mesma chance de ser selecionado.
Isso é como sortear nomes de um chapéu.

P(Selecionar qualquer indivıˊduo)=1NP(\text{Selecionar qualquer indivíduo}) = \frac{1}{N}

Onde:

  • NN = tamanho da população.

Exemplo 1:

Há uma turma com 30 alunos. O objetivo é selecionar aleatoriamente 5 para uma pesquisa.

Solução: Utilizar um gerador de números aleatórios para selecionar 5 números únicos entre 1 e 30. Cada aluno tem uma chance de 130\tfrac{\raisebox{1pt}{$1$}}{\raisebox{-1pt}{$30$}} de ser selecionado.

Exemplo 2:

Você tem uma turma com 30 alunos e deseja selecionar 5 para participar de uma pesquisa.

  • População total: N=30N=30;
  • Tamanho da amostra: n=5n=5.

Qual é a probabilidade de Alice e Bob serem ambos selecionados?

Número total de maneiras de escolher 5 alunos entre 30:

(305)\binom{30}{5}

Número de amostras favoráveis contendo Alice e Bob:
Fixe Alice e Bob — escolha mais 3 entre os 28 restantes:

(283)\binom{28}{3}

Portanto, a probabilidade é:

P=(283)(305)P = \frac{\binom{28}{3}}{\binom{30}{5}}

Amostragem Estratificada

A população é dividida em subgrupos significativos (estratos), e amostras aleatórias são retiradas de cada um.

nh=NhN×nn_h = \frac{N_h}{N} \times n

Onde:

  • NhN_h - tamanho do subgrupo hh;
  • NN - tamanho total da população;
  • nn - tamanho total da amostra;
  • nhn_{\raisebox{-1pt}{$h$}} - tamanho da amostra do subgrupo hh.

Exemplo:

Uma turma possui 30 alunos: 18 do sexo masculino e 12 do sexo feminino. Deseja-se amostrar 10 alunos proporcionalmente:

  • Dos masculinos: 1830×10=6\tfrac{\raisebox{1pt}{$18$}}{\raisebox{-1pt}{$30$}} \times 10 = 6;
  • Dos femininos: 1230×10=4\tfrac{\raisebox{1pt}{$12$}}{\raisebox{-1pt}{$30$}} \times 10 = 4.

Por que é bom: Garante a representação dos principais subgrupos.

Amostragem por Conglomerados

A população é dividida em grupos (conglomerados), e conglomerados inteiros são selecionados aleatoriamente.

c=nuˊmero de conglomerados a serem amostradosc = \text{número de conglomerados a serem amostrados}

Onde:

  • Os conglomerados são grupos pré-existentes (por exemplo, salas de aula, equipes);
  • Selecionam-se aleatoriamente conglomerados inteiros, não indivíduos.

Exemplo 1:

Sua escola possui 5 salas de aula. Você deseja uma amostra de 25 alunos, mas entrevistar indivíduos é muito demorado.

Solução: Selecione aleatoriamente 1 sala de aula (já que cada uma possui aproximadamente 25 alunos) e pesquise todos.

Exemplo 2:

Uma universidade possui 20 prédios de dormitórios, cada um abrigando 50 alunos. Você seleciona aleatoriamente 4 dormitórios e pesquisa todos os residentes.

  • Número de conglomerados: N=20N=20;
  • Conglomerados selecionados: n=4n=4;
  • Alunos por dormitório: M=50M=50;
  • Total de alunos na amostra: n×M=200n \times M = 200.

Qual a probabilidade de um aluno específico (por exemplo, Sarah) ser incluído?
É igual à probabilidade de seu dormitório ser selecionado:

P(Sarah selected)=420=0.2P(\text{Sarah selected}) = \frac{4}{20} = 0.2

Caso complexo:
Se 10 dormitórios têm 30 alunos e 10 têm 70 alunos, e você seleciona 4 dormitórios aleatoriamente, qual o tamanho esperado da amostra?

Seja:

  • D30=10D_{30} = 10 dormitórios com 30 alunos;
  • D70=10D_{70} = 10 dormitórios com 70 alunos.

Tamanho esperado da amostra:

E=1020(4×30)+1020(4×70)=200E = \frac{10}{20} \cdot (4 \times 30) + \frac{10}{20} \cdot (4 \times 70) = 200

Portanto, mesmo que os conglomerados tenham tamanhos diferentes, o tamanho esperado da amostra permanece o mesmo se os tipos de dormitórios estiverem equilibrados.

Amostragem Sistemática

Seleção de cada kk-ésimo item de uma lista.

k=Nnk = \frac{N}{n}

Onde:

  • NN - população total;
  • nn - tamanho desejado da amostra;
  • kk - intervalo de amostragem.

Exemplo:

Uma lista de 1000 clientes. Você deseja uma amostra de 100. Assim:

k=1000100=10k = \frac{1000}{100} = 10

Escolha um ponto de início aleatório (por exemplo, 7), depois selecione cada 10º cliente: 7, 17, 27, etc.

Por que é bom: Fácil de implementar e sistemático.

Todos os Métodos Aplicados a um Problema

Configuração do Problema:
Você está estudando a satisfação com a cafeteria em uma escola com 300 alunos distribuídos em 10 salas de aula (30 por sala). Você deseja uma amostra de 30 alunos.

  • Aleatório simples: selecionar aleatoriamente 30 nomes da lista completa;
  • Estratificado: se 60% são meninos e 40% meninas, amostrar 18 meninos e 12 meninas;
  • Por conglomerado: selecionar aleatoriamente 1 sala (30 alunos) e pesquisar todos;
  • Sistemático: escolher cada 10º aluno de uma lista ordenada.

Resumo

  • A amostragem reduz o esforço de coleta de dados e permite generalização;
  • Amostragem aleatória e estratificada são as melhores para precisão;
  • Amostragem por conglomerado é eficiente, mas funciona melhor quando os grupos são semelhantes;
  • Amostragem sistemática é simples e prática;
  • Amostragem por conveniência é arriscada e deve ser evitada sempre que possível;
  • Sempre documentar o método de amostragem em análises do mundo real.
question mark

Qual método garante que cada indivíduo tenha a mesma chance de ser selecionado?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 5. Capítulo 5

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Awesome!

Completion rate improved to 1.96

bookCompreendendo Amostragem

Deslize para mostrar o menu

Note
Definição

Amostragem é o processo de selecionar um subconjunto de dados de uma população maior para obter insights e fazer inferências sobre o todo. Como muitas vezes é impraticável ou impossível coletar dados de toda a população, a amostragem permite uma análise eficiente, mantendo a qualidade e a precisão dos resultados.

Amostragem Aleatória Simples

Cada membro da população tem a mesma chance de ser selecionado.
Isso é como sortear nomes de um chapéu.

P(Selecionar qualquer indivıˊduo)=1NP(\text{Selecionar qualquer indivíduo}) = \frac{1}{N}

Onde:

  • NN = tamanho da população.

Exemplo 1:

Há uma turma com 30 alunos. O objetivo é selecionar aleatoriamente 5 para uma pesquisa.

Solução: Utilizar um gerador de números aleatórios para selecionar 5 números únicos entre 1 e 30. Cada aluno tem uma chance de 130\tfrac{\raisebox{1pt}{$1$}}{\raisebox{-1pt}{$30$}} de ser selecionado.

Exemplo 2:

Você tem uma turma com 30 alunos e deseja selecionar 5 para participar de uma pesquisa.

  • População total: N=30N=30;
  • Tamanho da amostra: n=5n=5.

Qual é a probabilidade de Alice e Bob serem ambos selecionados?

Número total de maneiras de escolher 5 alunos entre 30:

(305)\binom{30}{5}

Número de amostras favoráveis contendo Alice e Bob:
Fixe Alice e Bob — escolha mais 3 entre os 28 restantes:

(283)\binom{28}{3}

Portanto, a probabilidade é:

P=(283)(305)P = \frac{\binom{28}{3}}{\binom{30}{5}}

Amostragem Estratificada

A população é dividida em subgrupos significativos (estratos), e amostras aleatórias são retiradas de cada um.

nh=NhN×nn_h = \frac{N_h}{N} \times n

Onde:

  • NhN_h - tamanho do subgrupo hh;
  • NN - tamanho total da população;
  • nn - tamanho total da amostra;
  • nhn_{\raisebox{-1pt}{$h$}} - tamanho da amostra do subgrupo hh.

Exemplo:

Uma turma possui 30 alunos: 18 do sexo masculino e 12 do sexo feminino. Deseja-se amostrar 10 alunos proporcionalmente:

  • Dos masculinos: 1830×10=6\tfrac{\raisebox{1pt}{$18$}}{\raisebox{-1pt}{$30$}} \times 10 = 6;
  • Dos femininos: 1230×10=4\tfrac{\raisebox{1pt}{$12$}}{\raisebox{-1pt}{$30$}} \times 10 = 4.

Por que é bom: Garante a representação dos principais subgrupos.

Amostragem por Conglomerados

A população é dividida em grupos (conglomerados), e conglomerados inteiros são selecionados aleatoriamente.

c=nuˊmero de conglomerados a serem amostradosc = \text{número de conglomerados a serem amostrados}

Onde:

  • Os conglomerados são grupos pré-existentes (por exemplo, salas de aula, equipes);
  • Selecionam-se aleatoriamente conglomerados inteiros, não indivíduos.

Exemplo 1:

Sua escola possui 5 salas de aula. Você deseja uma amostra de 25 alunos, mas entrevistar indivíduos é muito demorado.

Solução: Selecione aleatoriamente 1 sala de aula (já que cada uma possui aproximadamente 25 alunos) e pesquise todos.

Exemplo 2:

Uma universidade possui 20 prédios de dormitórios, cada um abrigando 50 alunos. Você seleciona aleatoriamente 4 dormitórios e pesquisa todos os residentes.

  • Número de conglomerados: N=20N=20;
  • Conglomerados selecionados: n=4n=4;
  • Alunos por dormitório: M=50M=50;
  • Total de alunos na amostra: n×M=200n \times M = 200.

Qual a probabilidade de um aluno específico (por exemplo, Sarah) ser incluído?
É igual à probabilidade de seu dormitório ser selecionado:

P(Sarah selected)=420=0.2P(\text{Sarah selected}) = \frac{4}{20} = 0.2

Caso complexo:
Se 10 dormitórios têm 30 alunos e 10 têm 70 alunos, e você seleciona 4 dormitórios aleatoriamente, qual o tamanho esperado da amostra?

Seja:

  • D30=10D_{30} = 10 dormitórios com 30 alunos;
  • D70=10D_{70} = 10 dormitórios com 70 alunos.

Tamanho esperado da amostra:

E=1020(4×30)+1020(4×70)=200E = \frac{10}{20} \cdot (4 \times 30) + \frac{10}{20} \cdot (4 \times 70) = 200

Portanto, mesmo que os conglomerados tenham tamanhos diferentes, o tamanho esperado da amostra permanece o mesmo se os tipos de dormitórios estiverem equilibrados.

Amostragem Sistemática

Seleção de cada kk-ésimo item de uma lista.

k=Nnk = \frac{N}{n}

Onde:

  • NN - população total;
  • nn - tamanho desejado da amostra;
  • kk - intervalo de amostragem.

Exemplo:

Uma lista de 1000 clientes. Você deseja uma amostra de 100. Assim:

k=1000100=10k = \frac{1000}{100} = 10

Escolha um ponto de início aleatório (por exemplo, 7), depois selecione cada 10º cliente: 7, 17, 27, etc.

Por que é bom: Fácil de implementar e sistemático.

Todos os Métodos Aplicados a um Problema

Configuração do Problema:
Você está estudando a satisfação com a cafeteria em uma escola com 300 alunos distribuídos em 10 salas de aula (30 por sala). Você deseja uma amostra de 30 alunos.

  • Aleatório simples: selecionar aleatoriamente 30 nomes da lista completa;
  • Estratificado: se 60% são meninos e 40% meninas, amostrar 18 meninos e 12 meninas;
  • Por conglomerado: selecionar aleatoriamente 1 sala (30 alunos) e pesquisar todos;
  • Sistemático: escolher cada 10º aluno de uma lista ordenada.

Resumo

  • A amostragem reduz o esforço de coleta de dados e permite generalização;
  • Amostragem aleatória e estratificada são as melhores para precisão;
  • Amostragem por conglomerado é eficiente, mas funciona melhor quando os grupos são semelhantes;
  • Amostragem sistemática é simples e prática;
  • Amostragem por conveniência é arriscada e deve ser evitada sempre que possível;
  • Sempre documentar o método de amostragem em análises do mundo real.
question mark

Qual método garante que cada indivíduo tenha a mesma chance de ser selecionado?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 5. Capítulo 5
some-alt