Buscar

Aula inferencia 1

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

• Fazer inferência (ou inferir) = tirar conclusões 
 
 
• Inferência Estatística: conjunto de métodos de análise estatística que permitem tirar conclusões 
sobre uma população com base em somente uma parte dela (uma amostra) 
 
 
• Os métodos de inferência podem ser agrupados em duas categorias: 
 
 
o Estimação: pontual ou intervalar 
 
o Testes de Hipóteses 
 
 
 
INFERÊNCIA 
 
 
 
 
 
 
ESTIMAÇÃO PONTUAL 
 
 
 
 
Estimador: uma função da amostra 
 
n
x
T
n
i
i∑
=
=
1 
Estimativa: um particular valor numérico assumido por um estimador 
 
5
10
50
==T 
 
Obs: 
 
• Diferentes amostras levam a diferentes estimativas 
• Esse procedimento não permite julgar a magnitude do erro que podemos estar cometendo. 
Propriedade dos Estimadores 
 
 
 
 
É importante frisar que podem existir vários estimadores para um mesmo parâmetro 
populacional. Logo, a escolha do melhor estimador será feita com base em alguns critérios. 
 
 
 
P1. Não-Tendencioso (Não-Viciado): diz-se que um estimador é não viciado quando, em 
média, ele fornece estimativas iguais ao parâmetro que ele está estimando 
 
 
 
P2. Precisão: deseja-se que o estimador seja altamente concentrado, ou seja, que tenha 
pequena variância amostral, ou ainda, que o estimador forneça, para diferentes amostras, 
estimativas que estejam próximas entre si 
 
 
 
 
Exemplo: Suponha que alguém deseje comprar um rifle e, dentre muitos, selecione quatro (A, B, C e D). Com o 
objetivo de testá-los, foram dados 15 tiros com cada um deles. A representação gráfica é dada abaixo. 
 
 
 
 
Alguns Estimadores Pontuais Importantes 
 
 
Os estimadores apresentados a seguir possuem as propriedades: não-viesado e precisão. 
 
 
Média: o melhor estimador para a média populacional µ é a média amostral. 
 
n
x
X
n
i
i∑
=
==
1µˆ
 
 
 
Proporção: o estimador da proporção populacional (p) é dado pela proporção amostral 
 
n
Sp n=ˆ 
 
onde, Sn é o número de elementos que apresentam uma determinada característica entre os n 
elementos da amostra. 
 
 
 
 
 
 
 
 
 
o Vimos que uma estimativa pontual é um valor (ou ponto) único usado para aproximar um 
parâmetro populacional. 
 
 
o No entanto, a probabilidade de que uma estimativa pontual coincida com o verdadeiro valor de 
um parâmetro populacional é pequena. Na verdade, tal probabilidade será igual a zero caso a 
distribuição de T seja contínua. 
 
 
o Então, seria interessante se a estimativa pontual viesse acompanhada de alguma medida de erro. 
É nesse sentido, que a estimativa intervalar complementa a estimação pontual. 
 
o Assim, um intervalo de confiança (estimativa intervalar) representa uma amplitude de valores 
que tem alta probabilidade (grau de confiança) de conter o verdadeiro valor da população. 
 
 
o O grau de confiança (ou nível de confiança) é uma medida que representa a probabilidade do 
intervalo conter o parâmetro populacional. Tal probabilidade é chamada de 1- αααα. Logo, αααα (nível 
de significância) será a probabilidade de erro ao se afirmar que o intervalo contém o verdadeiro 
valor do parâmetro. 
 
ESTIMAÇÃO POR INTERVALO 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
INTERVALO DE CONFIANÇA PARA MÉDIA DA POPULAÇÃO 
 
 
Duas situações são consideradas quando desejamos estabelecer um intervalo de confiança para µ: 
 
 
o quando 2σ é conhecida 
o quando 2σ é desconhecida 
 
 
Suposições: 
 
o ( )2,~ σµNX ou 
o n > 30 
 
 
De modo geral, estamos interessados em encontrar um intervalo na forma: 
 
][];[ 000 εεε ±=+− XXX 
 
onde ε0 representa a semi-amplitude do intervalo de confiança, sendo chamado de ERRO de 
PRECISÃO em relação a µ. 
 
 
Caso 1: 2σ é conhecida 
 
Como 





n
NX
2
,~
σµ , temos que 
 
 
 
Temos então que, 
 
 
 
 
 
f(z) 
zα/2 
α/2 α/2 
-zα/2 
1 - α 
0 
Logo, 
 
 
 
Assim, 
 
 
 
 
O intervalo de confiança para a média populacional µ com (1- α)% de confiança é dado por 
 
];[ 2/2/
n
zX
n
zX σσ αα +− 
 
 
Ou seja, 
 
n
z
σ
ε α 2/0 = 
 
 
Assim, a partir da expressão acima podemos também estimar, por exemplo, o tamanho da 
amostra (n) (se ε0, z e σ são conhecidos). 
 
 
 
LEMBRANDO: 1-α é a probabilidade de que o intervalo contenha o verdadeiro valor de µ. 
 
 
 
 
 
Assim, um I.C. para µ com 95% de confiança é dado por: 
 
 
 
 
Exercício 
 
 
1) Em um estudo de subsídios de empréstimos para os estudantes, relatou-se que aqueles que 
tomam empréstimo do Banco do Brasil, com quatro anos de prazo, terão uma dívida de R$ 
4.000,00. Considere que esse valor médio de endividamento está baseado em uma amostra 
de 121 empréstimos de estudantes de graduação, e que o desvio padrão da população para a 
quantia emprestada é de R$ 1.300,00. 
 
a) Desenvolva uma estimativa por intervalo de confiança de 95% da quantia média devida pelos 
estudantes de graduação. 
b) O número de empréstimos analisados é suficiente se quisermos que a margem de erro seja 
de no máximo 3% com o mesmo nível de confiança? 
c) O que acontece com a amplitude do intervalo quando o nível de confiança é de 99%? 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
2) Em uma indústria de cerveja, a quantidade de cerveja inserida em latas tem-se comportado 
como uma variável aleatória normal com média 350 ml e desvio padrão 3 ml Após alguns problemas 
na linha de produção, suspeita-se que houve alteração na média. Uma amostra de 20 latas acusou 
média 346 ml. É possível concluir se houve alteração na média do processo? Para resolver a 
questão considere uma confiança de 95%. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Caso 2: 2σ desconhecida 
 
 
 
 
Neste caso, adota-se como estimador a variância amostral S2 
 
1
)(
1
2
2
−
−
=
∑
=
n
xx
S
n
i
i
 
 
Agora, a estatística 
 
 
)1(~/ −
−
= nt
nS
XT µ
 
 
 
 
 
terá distribuição t-student com “n-1” graus de liberdade, e não mais distribuição normal padrão. 
 
 
 
Assim, quando a variância é desconhecida, a probabilidade de que o verdadeiro valor de µ pertença ao 
intervalo 
 
 
];[ )2/,1()2/,1(
n
S
tX
n
S
tX nn αα −− +− 
 
 
 
é igual a 1-α. 
 
Logo, 
 
n
S
t n )2/,1(0 αε −= 
 
 
Assim, a partir da expressão acima podemos também estimar, por exemplo, o tamanho da 
amostra (n) (se ε0, t e S são conhecidos). 
 
 
Comparação da distribuição normal padrão com a distribuição t de Student 
 
Exemplo 
 
 
Determine um I.C. para a média populacional com 95% de confiança. 
 
 
 
1) A associação Brasileira de Agências de Propaganda registra dados sobre minutos sem programação 
nos programas de meia hora no horário nobre de televisão. Em uma amostra de 20 programas de 
horário nobre obteve-se uma média de 6,5 minutos e um desvio padrão de 1,5 minutos. Considere que 
esta variável se comporta como uma distribuição normal. 
 
a) Determine um intervalo de 99% de confiança para o número médio de minutos sem propaganda. 
b) Quantos programas deveriam ter sido selecionados para que a margem de erro fosse de no máximo 
0,3 minutos? 
c) Que erro se cometeria na estimação da média caso usássemos uma amostra com tamanho 20% 
inferior, usando o mesmo nível de confiança? 
 
 
 
 
 
 
 
 
 
 
 
 
2) O tempo de execução de uma etapa em um processo de produção foi medido doze vezes, 
obtendo-seos seguintes resultados em minutos: 
 
15,12,14,15,16,14,16,13,14,11,15,13 
 
a) Apresente um intervalo de 95% de confiança para o tempo médio. 
b) É possível afirmar, baseado no resultado anterior, que com 95% de confiança o tempo médio 
de execução de uma etapa do processo produtivo seria superior a 14 se fossem medidos os 
tempos de todos os funcionários do setor? 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
INTERVALO DE CONFIANÇA PARA PROPORÇÃO DA POPULAÇÃO 
 
 
 
Vimos que a distribuição amostral de pˆ , para n suficientemente grande, é Normal com parâmetros 
 
 





 −
n
pppNp )1(,~ˆ , 
 
 
O intervalo que estamos procurando é da forma ]ˆ[ 0ε±p . Assim, por um caminho semelhante ao 
adotado no caso da média populacional µ, chega-se facilmente a 
 
 
n
pp
z
)1(
2/0
−
= αε 
 
 
Assim, a partir da expressão acima podemos também estimar, por exemplo, o tamanho da 
amostra (n) (se ε0, z e p são conhecidos). 
 
No entanto, na prática p é desconhecido, sendo substituído pela proporção amostral pˆ . 
 
 
Assim, o intervalo de confiança para p, ao nível de confiança 1-α, é dado por 
 
 
])ˆ1(ˆˆ;)ˆ1(ˆˆ[ 2/2/
n
pp
zp
n
pp
zp −+−− αα 
 
 
 
 
Observações: 
 
• Um erro comum é dizer que a probabilidade de µ estar no intervalo de 100(1-α)% é de (1-α). 
• µ não é uma variável aleatória, portanto não existe probabilidade sobre µ. 
• µ é uma constante desconhecida, sobre a qual desejamos inferir, através das quantidades 
amostrais X e S. 
• A interpretação correta é do intervalo de confiança conter o verdadeiro valor de µ com 100(1-
α)% de confiança. 
 
Exemplo de um intervalo de confiança para proporção 
 
 
Exemplo 
 
1) Um levantamento da Globo News solicitou a 814 adultos que respondessem a uma série de 
questões sobre suas perspectivas em relação à situação financeira do Brasil. Um total de 562 adultos 
responderam Sim a questão: Você acha que as coisas estão indo bem no Brasil de hoje? 
 
a) Determine um intervalo de confiança ao nível de 95% para a proporção de adultos que sentem que 
as coisas estão indo bem no Brasil. 
b) Quantos adultos deveriam ter sido entrevistados, para que fosse de 2 pontos percentuais a 
margem de erro para estimar, com 95% de confiança, a verdadeira percentagem de adultos que 
sentem que as coisas estão indo bem no Brasil? 
 
 
 
 
 
 
 
 
2) O Instituto de Turismo do Estado da Paraíba planeja amostrar visitantes das maiores praias de 
todo o estado para estimar a proporção de visitantes que não residem na Paraíba. Observou que dos 
500 visitantes 320 eram do estado. 
 
a) Qual a estimativa pontual da proporção de visitantes que não residem na Paraíba? 
b) Que tamanho de amostra deve ser tomada para se estimar a proporção de visitantes de fora do 
estado com uma margem de erro de 2%? Use um nível de confiança de 95%. 
c) Determine um intervalo de confiança ao nível de 95% para a proporção de visitantes de fora do 
estado da Paraíba. 
 
 
 
 
 
 
 
 
 
 
 
 
FATORES DETERMINANTES DO ERRO DE ESTIMAÇÃO 
 
 
];[ 2/2/
n
zX
n
zX σσ αα +− 
 
 
O erro de estimação será menor ou maior dependendo do(a): 
 
 
1) Tamanho da amostra (n): Quanto menor o tamanho da amostra, maior será o erro de estimação. 
 
 
2) Variabilidade da característica na população (σ): Quanto maior for a variabilidade da 
característica cuja média está sendo estimada maior será o erro de estimação. 
 
 
3) Nível de confiança (1-α): Se quisermos uma confiança maior no intervalo teremos um erro de 
estimação maior.

Continue navegando