Buscar

Aula intervalo de confiança


Prévia do material em texto

MÉTODOS ESTATÍSTICOS 
APLICADOS À ATUÁRIA II
Aula 3 – Intervalo de Confiança
Profº Lucas Schmidt
Inferência Estatística – Estimação
• Estimação de parâmetros
estimação por ponto ou por intervalo
• Intervalos de confiança
 para média
 para variância
 para proporção
• Dimensionamento amostral
Objetivo geral da Inferência:
produzir afirmações sobre dada
característica da população de
interesse a partir de informações
colhidas via amostragem.
Processos de estimação
Estimação por ponto: o processo em que obtemos um único
ponto, ou seja, um único valor para estimar o parâmetro.
Exemplo: conhecer a renda média do Niterói no mês atual.
Renda média pontual estimada com base em uma amostra de
tamanho é .
Processos de estimação
Estimação por intervalo: processo que permite obter os limites de
um intervalo onde, com uma determinada probabilidade (nível de
confiança), podemos esperar encontrar o verdadeiro valor do
parâmetro.
Exemplo: Sendo a estimativa pontual para a intenção de votos para 
determinado candidato o intervalo de confiança de para 
essa proporção, em %, é de 
Estimação por ponto vs por intervalo
Estimações por intervalo são preferíveis a estimação por
ponto porque indicam a precisão e estabelecem limites
com certo grau de confiança para as estimativas.
Além disso, a partir das estimativas por intervalo pode-se
encontrar as estimativas pontuais.
Estimação por intervalo
A estimação de parâmetros por intervalo de confiança consiste em
gerar um intervalo em que se admite que esteja o parâmetro.
Estimação por intervalo
(1-α) é chamado de nível de confiança a probabilidade do
intervalo conter o verdadeiro parâmetro populacional.
α é chamado de nível de significância a probabilidade do
intervalo não conter o verdadeiro parâmetro populacional.
Um intervalo pode ou não conter o valor do parâmetro μ,
mas temos (1-α)% de confiança que contenha.
Estimação de intervalos de confiança
• Média
• Variância
• Proporção
Intervalo de confiança para média populacional
1. Intervalo de confiança para a média ( ) de uma população.
1.1 Conhecemos o valor do parâmetro (ou );
1.2 Não conhecemos o valor do parâmetro (e );
1.1 Conhecemos o valor do parâmetro σ (ou )
Parâmetro: μ (média da população da variável aleatória X)
Estimador: (média aritmética simples de uma amostra qualquer 
de tamanho )
De acordo com o Teorema Central do Limite (TCL):
Se X seguir distribuição normal , então 
Se X não seguir distribuição normal, mas , então 
Sabendo que a média segue distribuição normal, precisamos
padroniza-la:
1.1 Conhecemos o valor do parâmetro σ (ou )
1. Intervalo de confiança para a média (μ) de uma população.
1.1 Conhecemos o valor do parâmetro σ (ou )
Um atuário deseja estimar a renda média de sua carteira de clientes. Para
realizar o estudo, coletou uma amostra de 100 consumidores dentre o público
alvo, obtendo um média de e variância de . Construa e
interprete o intervalo de confiança para a renda média com de confiança.
Exemplo – questão de prova :
Com de confiança,
podemos afirmar que o
intervalo
contém a renda
média de sua carteira de
clientes.
1. Variabilidade de X pequena;
2. Diminuir o nível de confiança;
3. n grande.
Como estreitar um intervalo de confiança?
 Eficiência do estimador (menor variabilidade possível)
Com o aumento do tamanho amostral, a estatística convergirá
para o parâmetro (consistência) e diminuirá a variabilidade do
estimador. Se
com 
Pressupostos:
A distribuição amostral da média será normal e utilizaremos a
estatística Z :
Se X pode seguir qualquer distribuição (TCL); e
se σ for desconhecido, será estimado por s;
Se e σ for conhecido, X deve seguir distribuição normal, pois
o TCL não é válido.
1. Intervalo de confiança para a média (μ) de uma população.
Pode-se questionar como σ é conhecido, visto que para calcular o
desvio-padrão populacional necessita-se da média populacional μ,
também desconhecida. Porém:
i) desvios-padrão são geralmente estáveis, e pode-se ter calculado
estimativas de em estudos similares; e
ii) quando o tamanho da amostra for muito grande, é praticamente
equivalente calcular o IC com variância conhecida ou desconhecida.
Se não conhecermos o parâmetro σ, utilizamos uma estimativa
desse parâmetro: s (desvio-padrão obtido através de um amostra).
Se , a estimativa é considerada suficiente próxima ao
parâmetro.
Ideia frequentista
de repetibilidade
Jamais podemos associar probabilidade a um parâmetro (estatística
clássica).
Não pode-se afirmar que, com determinada confiança, a média está
entre os valores do intervalo, pois embora seja desconhecida, a
verdadeira média μ é única, fixa e constante.
A confiança está associada ao intervalo construído, pois ele varia de
acordo com a amostra coletada e possui determinada confiança de
conter o parâmetro.
Não confundir confiança com probabilidade.
Cuidados com a interpretação!
Exemplo: FGV - Analista Judiciário (TJ RO) (adaptada)
Para estimar o valor médio das indenizações por danos
morais, ordenadas por um determinado juiz, realiza-se, no
âmbito da vara, uma amostra aleatória simples de tamanho
. Considere que os valores das indenizações seguem
distribuição normal. Nesta amostra, a média amostral
apurada foi de . A variância já era conhecida de
outros levantamentos, sendo igual a reais². Calcule
e interprete o intervalo com confiança para a média
das indenizações ordenadas por esse juiz.
Resolução:
Variável em estudo: X=valor das indenizações ordenadas por determinado juiz
Pressuposto: X segue distribuição normal
das indenizações ordenadas pelo juiz estão entre
Concluímos que, com de confiança, o intervalo
contém a verdadeira média de indenizações ordenadas pelo juiz.
Interpretação: 
das indenizações ordenadas pelo juiz estão entre
1) Um analista do departamento pessoal seleciona aleatoriamente os
registros de empregados horistas e acha a taxa média de salário por
hora de . Supõe-se que os salários na firma sejam normalmente
distribuídos. Se o desvio-padrão dos salários é conhecido e igual a
, estimar a taxa média de salário na firma usando um intervalo de
confiança de . Resposta:
2) Suponha que você deseja estimar a média do valor de vendas, por
estabelecimento varejista, durante o último ano, de um determinado
produto, sem saber a sua distribuição. Determinar o intervalo de
confiança de para a média sabendo que, de uma
amostra de tamanho , foram calculadas as seguintes estatísticas:
e . Resposta:
Exercícios propostos:
Intervalo de confiança para média populacional
1. Intervalo de confiança para a média ( ) de uma população.
1.1 Conhecemos o valor do parâmetro (ou ):
1.2 Não conhecemos o valor do parâmetro (e )
1.2 Não conhecemos o valor do parâmetro (e )
Quando a amostra for pequena, não podemos supor que o desvio
padrão da amostra ( ) seja uma estimativa suficientemente
aproximada do parâmetro .
Portanto, para construir o intervalo de confiança para não
podemos utilizar a estatística .
Dessa forma, a média não mais seguirá distribuição normal (Z),
terá distribuição t de Student, com parâmetro .
“A distribuição T foi estabelecida pelo estatístico e químico inglês
William Sealey Gosset devido ao seu trabalho na cervejaria
Guinness (Dublin, Irlanda) em controle estatístico de qualidade em
1908. Gosset tinha disponível, somente, amostras pequenas para
várias de suas análises, com o objetivo de determinar as melhores
variedades de cevada e lúpulo para o processo de fermentação.
Como a política da empresa proibia a publicação da ferramenta
utilizada e dos resultados obtidos, Gosset usou o pseudônimo
Student em artigos que ele escreveu relatando os seus resultados.”
(https://en.wikipedia.org/wiki/William_Sealy_Gosset)
Origem da distribuição t-Student
Distribuição t de Student
Um atuário está interessado em estimar a indenização média paga aos
seus segurados por sinistro ocorrido neste ano. Para tanto, selecionou,
dentre suas filiais, aleatoriamente segurados contemplados eobteve
as seguintes estatísticas: média de e desvio-padrão de
. Sabendo que os prêmios seguem distribuição normal, construa o
intervalo de confiança para a indenização média paga aos clientes
dessa seguradora e interprete.
Variável em estudo: X = indenização paga aos seus segurados por sinistro
ocorrido neste ano.
Pressupostos atendidos: X segue distribuição normal; amostra aleatória
Exemplo
Estimativas:
Exemplo - continuação
Com 95% de confiança,
podemos afirmar que o intervalo
contém
indenização média paga aos
segurados por sinistro ocorrido.
,
Um atuário está interessado em estimar a renda média de empregados de
uma determinada empresa que estão dispostos a contratar um plano de
previdência privada. Selecionou aleatoriamente empregados e calculou as
seguintes estatísticas: média de e desvio-padrão de .
Construa o intervalo de confiança para a renda média dos empregados
dessa empresa e interprete.
Exercício proposto – questão de prova :
Com 90% de confiança,
podemos afirmar que o intervalo
contém a
renda média dos empregados
dessa empresa dispostos a
contratar o plano de previdência.
Uma operadora de telecomunicações promete entregar, em média, Mb de
velocidade de internet. Cansado de sempre encontrar a internet lenta, um
cliente verificou a velocidade da internet em momentos distintos e obteve
uma média de Mb e um desvio-padrão de Mb.
a) Visto que , podemos afirmar que, em média, a operadora não
está entregando conforme o prometido?
b) Caso fosse coletada outra amostra (em outros momentos), seria obtido
a mesma média?
c) Conforme a variação da estimativa da média e com base na amostra
coletada, o que podemos concluir a respeito da velocidade média entregue
pela operadora com de confiança?
Exemplo – IC para comparar valores 
Exemplo – IC para comparar valores 
Com de confiança, podemos afirmar que o intervalo
contém a velocidade média entregue.
Dado que o intervalo contém a velocidade prometida de Mb, podemos
afirmar, com de confiança, que a operadora está entregando conforme o
contratado.
Estimativas:
,
Exercícios propostos:
Lista 1: questões 6, 11, 13, 15.
Lista 1.2: I(b), VIII(b), XII, XIV.
Aula 3

Continue navegando