Buscar

Aula 14 Amostragem Inferência Estatística

Prévia do material em texto

ESTATÍSTICA E
PROBABILIDADE
Amostragem
Tipos de amostragem
Inferência Estatística
Estimação e Intervalo de Confiança para média 
populacional
Exercícios
Amostragem
• Conceitos Preliminares:
• População: Conjunto dos elementos
a serem estudados.
• Amostra: Subconjunto da população.
• Amostragem: Processos de obtenção
de uma amostra a partir de uma
população.
• Em geral não se tem acesso a toda a
população em que desejamos estudar o
fenômeno, com isso recorremos a uma
amostra da nossa população de
interesse.
Tipos de Amostragem
• A amostragem será probabilística se todos os elementos da
população tiverem probabilidade conhecida, e diferente de
zero, de pertencer à amostra. Caso contrário, a amostragem
será não-probabilística.
• Amostragem Probabilística pode ser classificada em:
• Amostragem Aleatória Simples;
• Amostragem Sistemática;
• Amostragem Estratificada;
• Amostragem por Conglomerados.
• A grande vantagem deste método é que os resultados obtidos na
pesquisa podem ser projetados para a população total.
Tipos de Amostragem
• Amostragem Aleatória Simples
• É o processo mais elementar e muito frequentemente utilizado;
• Todos os elementos da população têm a mesma probabilidade de
ser selecionado;
• Dado um conjunto, enumeramos seus elementos e realizamos um
sorteio, os elementos sorteados constituirão nossa amostra;
• Podem ser com ou sem repetição dos elementos.
Tipos de Amostragem
• Amostragem Sistemática
• Dado um conjunto de elementos ordenados retiramos
periodicamente um elemento para a amostra. (Não recomendada
para eventos sazonais);
• A população deve ser ordenada de forma que os elementos sejam
identificados pela posição.
Tipos de Amostragem
• Amostragem Sistemática
• Para encontrarmos os pontos onde faremos as coletas sistemáticas das
amostras, podemos seguir os seguintes passos:
1) Calcular o intervalo de amostragem K= N/n onde N é o tamanho da
população e n é o tamanho da amostra.
2) Sortear um número de 01 a K.
3) Obter a amostra: número sorteado, número sorteado + K, número
sorteado + 2K, número sorteado + 3K, ...
• Exemplo: N=100 e n=10
K=100/10=10
Número sorteado = 8
Amostra: 8, 18, 28, 38, 48, 58, 68, 78, 88 e 98.
Tipos de Amostragem
• Amostragem Estratificada
• Quando uma população pode ser dividida em subgrupos
(estratos) que são mais ou menos homogêneos. Após a
determinação dos estratos, seleciona-se uma amostra aleatória
simples de cada estrato.
• A definição dos estratos
pode ser de acordo com
sexo, idade, renda, grau
de instrução, etc.;
Tipos de Amostragem
• Amostragem Estratificada
1. Amostragem Estratificada Proporcional: A proporcionalidade do
tamanho de cada estrato da população é mantida na amostra.
2. Amostragem Estratificada Uniforme: Selecionamos o mesmo
número de elementos em cada estrato. É o processo usual
quando se deseja comparar os diversos estratos.
Tipos de Amostragem
• Amostragem por Conglomerados
• A população é dividida em conglomerados, onde cada
conglomerado é representativo da população. Selecionamos
aleatoriamente um conjunto de conglomerados e a amostra é
constituída por todos os elementos dos conglomerados
selecionados.
• Este esquema amostral é utilizado quando há uma subdivisão da
população em grupos que sejam bastante semelhantes entre si,
mas com fortes discrepâncias dentro dos grupos, de modo que
cada um possa ser uma pequena representação da população de
interesse específico.
• A amostragem é realizada em cima dos conglomerados, e não
mais sobre os indivíduos da população.
Tipos de Amostragem
• Amostragem por Conglomerados
• Exemplo:
Suponha que se pretende estudar o nível de satisfação dos
trabalhadores têxteis, das empresas do Norte do País. Método AAS
nos conglomerados.
Elementos Conglomerados
Eleitores Domicílios
Trabalhadores Empresas
Alunos Escolas
Tipos de Amostragem
• Amostragem por Conglomerados vs Estratificada
• A principal diferença entre a amostragem por conglomerados e a
amostragem estratificada é a unidade de amostragem.
• Conglomerados: Todos os conglomerados existentes. (Todas as
cidades, empresas, etc)
• Uma amostragem por conglomerado é indicada quando: Não se possui
uma lista contendo todos os nomes dos elementos da população; Existe
grande heterogeneidade entre os elementos da população.
• Estratificada: Os elementos da população.
• Uma amostragem estratificada é indicada quando: É fácil o acesso à uma
lista contendo todos os nomes dos elementos da população; As informações
sobre a população estão disponíveis e embora ela seja heterogênea posso
identificar grupos homogêneos dentro dessa mesma população e assim
dividi-la em diferentes estratos para depois obter uma amostra.
Inferência Estatística
• Por inúmeros motivos (tempo, custo, logística, etc...)
trabalhamos com uma (ou mais) amostra(s) retirada(s) da
população.
• A partir da teoria da Inferência Estatística, os resultados
amostrais são inferidos como resultados válidos para a
população estudada.
População é o conjunto de
todos os elementos 
(unidades experimentais) ou 
resultados sob investigação.
Amostra é um 
subconjunto de uma 
população por meio da 
qual se estabelecem ou 
estimam as propriedades 
e características de 
interesse da população.
Inferência Estatística
População
µ
….
X1 X2
X4
Xn
X3
Amostras
x1
x2
x4
xn
x3
Variação amostral
𝜇 ≅ 𝑋 ± 𝑒𝑟𝑟𝑜
Inferência Estatística
• Exemplo: Precisamos avaliar a resistência à compressão de todas as
peças produzidas por uma máquina (população de peças) e faremos
isso por meio da média. Então a variável que desejamos avaliar é a
resistência à compressão das peças (em Mpa):
Intervalo de Confiança bilateral para a média 𝜇
• O estimador de 𝜇 é a média amostral 𝑋
• Então, o IC(𝜇) vai ser da forma 𝑋 ± 𝑒
• CASO 1: a variância populacional 𝜎2 é CONHECIDA
 𝑋~𝑁 𝜇,
𝜎2
𝑛
𝑍 =
 𝑋−𝜇
 𝜎2 𝑛
𝐼𝐶1−𝛼 𝜇 = 𝑋 ± 𝑒
𝐼𝐶1−𝛼 𝜇 = 𝑋 ± 𝑧𝛼
2
𝜎
𝑛
erro da estimação (ou
a semi-amplitude do 
intervalo)
Intervalo de Confiança bilateral para a média 𝜇
• Margem de erro = 𝑒 = (valor critico=z)(desvio padrão)
• Ou seja: 𝑋 ± 𝑧𝛼
2
𝜎 𝑥 Há uma probabilidade de 1 − 𝛼 da média 
estar contida no intervalo definido.
1 − 𝛼 = nível de confiança
𝛼 = nível de significância (probabilidade 
de erro)
O valor 𝑧 𝛼 2 é o escore z que 
elimina uma área 𝛼 2 na cauda 
à direita e −𝑧 𝛼 2 elimina uma 
área 𝛼 2 na cauda à esquerda 
Intervalo de Confiança bilateral para a média 𝜇
• Exemplo: Deseja-se estimar a largura média de um tipo de peça. Para isso
considera-se uma amostra de 25 peças da qual obtemos uma largura
média igual a 5,20 cm. Pelo histórico da produção dessa peça, sabe-se que
variabilidade da largura das peças tem desvio padrão de 0,5 mm, construa
o IC com 95% de confiança desejado.
Do enunciado, temos: 𝑋 = 5,20 𝑐𝑚 𝜎 = 0,05 𝑐𝑚 𝑛 = 25 1 − 𝛼 = 0,95
Da tabela da N(0,1), obtemos que: 𝑧𝛼
2
= 1,96
𝐼𝐶95% 𝜇 = 5,2 ± 1,96
0,05
25
𝐼𝐶95% 𝜇 = 5,2 ± 0,0196
𝐼𝐶95% 𝜇 = 5,1804; 5,2196
Intervalo de Confiança bilateral para a média 𝜇
• CASO 2: a variância populacional 𝜎2 é DESCONHECIDA
Nesse caso, não vale
 𝑋~𝑁 𝜇,
𝜎2
𝑛
𝑍 =
 𝑋−𝜇
 𝜎2 𝑛
• Nesse caso substituímos a variância desconhecida ( 𝜎2 ) pela
estimativa da amostra (𝑠2).
• Assim, temos o seguinte resultado: 𝑡 =
 𝑋−𝜇
𝑠2
𝑛
Intervalo de Confiança bilateral para a média 𝜇
• CASO 2: a variância populacional 𝜎2 é DESCONHECIDA
• Em muitos casos da vida real o desviopadrão populacional é
desconhecido, portanto para uma v.a. que é normalmente
distribuída, a variável média amostral comporta-se como o modelo
de distribuição t.
• A distribuição t é uma família de curvas, cada uma determinada por
um parâmetro chamado de graus de liberdade (g.l.). Os graus de
liberdade são o número de escolhas livres deixadas depois que uma
estatística amostral tal como 𝑋 é calculada.
• Quando usamos uma distribuição t para estimar uma média populacional,
os g.l. são iguais ao tamanho da amostra menos um.
• Conforme os graus de liberdade aumentam, a distribuição t se aproxima da
distribuição normal.
Intervalo de Confiança bilateral para a média 𝜇
• CASO 2: a variância populacional 𝜎2 é DESCONHECIDA
𝑡 =
 𝑋−𝜇
𝑠2
𝑛
𝐼𝐶1−𝛼 𝜇 = 𝑋 ± 𝑒
𝐼𝐶1−𝛼 𝜇 = 𝑋 ± 𝑡 𝛼 2
𝑠
𝑛
tn-1
Intervalo de Confiança bilateral para a média 𝜇
• Exemplo: Deseja-se estimar a nota média de um exame aplicado em um
vestibular. Para isso foi considerada uma amostra de 16 candidatos
submetidos a esse vestibular e, dela, obteve-se uma nota média de 7,3 e
um desvio padrão de 0,4. Construa o IC desejado com 95%.
Do enunciado, temos: 𝑋 = 7,3 𝑠 = 0,4 𝑛 = 16 1 − 𝛼 = 0,95
Da tabela 𝑡15 obtemos que: 𝑡𝛼
2
= 2,131
𝐼𝐶95% 𝜇 = 7,3 ± 2,131
0,4
16
𝐼𝐶95% 𝜇 = 7,3 ± 0,213
𝐼𝐶95% 𝜇 = 7,087; 7,513
T
0
95%
2
t
2
αt
2,5%2,5%
t15
Graus de liberdade
Exercícios
1) Para estimar a renda média familiar (em reais) em uma cidade do
interior de SP, uma amostra de 100 famílias foi avaliada de onde
obtivemos uma renda média igual a R$ 850,00. Usando a informação
mais recente do censo, sabe-se que o desvio padrão da renda familiar
nesse município é igual a R$ 90,00. Estime a renda média familiar na
cidade através de um intervalo de 95% de confiança.
2) Um pesquisador quer saber qual é o tempo médio gasto para executar
um teste de laboratório. Para isso, observou o tempo de 25 execuções
do teste e obteve uma média de 52 minutos e um desvio padrão de 4
minutos. Obtenha o intervalo com 95% de confiança para o verdadeiro
tempo médio de execução do teste.
R: 𝐼𝐶 𝜇 = 832,36; 867,64
R: 𝐼𝐶 𝜇 = 50,349; 53,651
Exercícios
3) Com uma amostra de 16 dias do último mês estimou-se a temperatura
média e o desvio padrão das temperaturas e, obtendo-se,
respectivamente: 12,1°C e 3,0°C. Obtenha, com 99% de confiança, a
estimativa para a temperatura média das temperaturas do último mês.
4) O peso de um produto é uma variável aleatória cujo desvio padrão é
conhecido pelo processo de fabricação. Para estimar o peso médio de
um lote desse produto, colheu-se uma amostra de 25 unidades do
produto e construiu-se o intervalo com 95% de confiança para o peso
médio que resultou em (152,0 ± 19,6) gramas. Qual é o valor do desvio
padrão?
R: 𝐼𝐶 𝜇 = 9,889; 14,310
R: 50 gramas
Exercícios
5) Para estimar a renda média familiar (em reais) numa cidade, colheu-se
uma amostra de famílias dessa cidade e, sabendo-se que o desvio
padrão é conhecido, foi construído o intervalo de 90% de confiança para
a média desejada, sendo obtido o intervalo de (850 ± 82) reais. Se o
nível de confiança for alterado para 95%, qual será o novo intervalo?
6) O diretor de admissões de uma faculdade deseja estimar a idade média
de todos os estudantes atualmente matriculados. Em uma amostra
aleatória de 20 estudantes, a idade média encontrada é de 22,9 anos.
De estudos anteriores, o desvio padrão conhecido é 1,5 ano, e a
população é normalmente distribuída. Construa um intervalo de
confiança de 90% da idade média da população.
R: 𝐼𝐶 𝜇 = 752; 948
R: 𝐼𝐶 𝜇 = 22,3; 23,5
Exercícios
7) O desvio padrão do consumo diário de gás em uma fábrica é conhecido.
Deseja-se estimar o consumo médio de gás dos últimos meses. Para
isso, colheu-se uma amostra de alguns dias e, com os consumos
observados em cada dia, foi construído o intervalo de 95% de confiança
para a média desejada, obtendo-se: [2,2m3 ; 3,4m3].
a. Qual é a margem de erro dessa estimação?
b. Se o nível de confiança for alterado para 98%, qual será o novo
intervalo?
R: 𝐼𝐶 𝜇 = 2,087; 3,513
R: e = 0,6 𝑚3
Exercícios
8) Você seleciona aleatoriamente 36 carros do mesmo modelo que foram
vendidos em uma concessionária, e determina o número de dias que
cada um permaneceu no pátio da concessionária antes de ser vendido.
A média amostral é de 9,75 dias, com um desvio padrão amostral de
2,39 dias. Construa um intervalo de confiança de 99% para o número
médio populacional de dias que um carro permanece no pátio da
concessionária.
9) Uma máquina automática de suco industrial é regulada de modo que a
quantidade suprida de cada vez, tenha distribuição aproximadamente
normal com desvio-padrão de 35ml. Determine um intervalo de 96% de
confiança para a quantidade média de toda produção, sabendo que
uma amostra de 30 embalagens teve um conteúdo médio de 290 ml.
R: 𝐼𝐶 𝜇 = 8,66; 10,84
R: 𝐼𝐶 𝜇 = 276,90; 303,10
Exercícios
10) Um modelo de transferência de calor a partir de um cilindro imerso em
um líquido prevê que o coeficiente de transferência de calor para o
cilindro torna-se constante em taxas de fluxo muito baixa do fluido. Uma
amostra de 10 medições é obtida. Os resultados, em W/m2K, são:
Determine um intervalo de confiança de 95% para o coeficiente de
transferência de calor.
R: 𝐼𝐶 𝜇 = 12,318; 13,762
13,7 12,0 13,1 14,1 13,1
14,1 14,4 12,2 11,9 11,8

Continue navegando