Prévia do material em texto
MÉTODOS ESTATÍSTICOS APLICADOS À ATUÁRIA II Aula 3 – Intervalo de Confiança Profº Lucas Schmidt Inferência Estatística – Estimação • Estimação de parâmetros estimação por ponto ou por intervalo • Intervalos de confiança para média para variância para proporção • Dimensionamento amostral Objetivo geral da Inferência: produzir afirmações sobre dada característica da população de interesse a partir de informações colhidas via amostragem. Processos de estimação Estimação por ponto: o processo em que obtemos um único ponto, ou seja, um único valor para estimar o parâmetro. Exemplo: conhecer a renda média do Niterói no mês atual. Renda média pontual estimada com base em uma amostra de tamanho é . Processos de estimação Estimação por intervalo: processo que permite obter os limites de um intervalo onde, com uma determinada probabilidade (nível de confiança), podemos esperar encontrar o verdadeiro valor do parâmetro. Exemplo: Sendo a estimativa pontual para a intenção de votos para determinado candidato o intervalo de confiança de para essa proporção, em %, é de Estimação por ponto vs por intervalo Estimações por intervalo são preferíveis a estimação por ponto porque indicam a precisão e estabelecem limites com certo grau de confiança para as estimativas. Além disso, a partir das estimativas por intervalo pode-se encontrar as estimativas pontuais. Estimação por intervalo A estimação de parâmetros por intervalo de confiança consiste em gerar um intervalo em que se admite que esteja o parâmetro. Estimação por intervalo (1-α) é chamado de nível de confiança a probabilidade do intervalo conter o verdadeiro parâmetro populacional. α é chamado de nível de significância a probabilidade do intervalo não conter o verdadeiro parâmetro populacional. Um intervalo pode ou não conter o valor do parâmetro μ, mas temos (1-α)% de confiança que contenha. Estimação de intervalos de confiança • Média • Variância • Proporção Intervalo de confiança para média populacional 1. Intervalo de confiança para a média ( ) de uma população. 1.1 Conhecemos o valor do parâmetro (ou ); 1.2 Não conhecemos o valor do parâmetro (e ); 1.1 Conhecemos o valor do parâmetro σ (ou ) Parâmetro: μ (média da população da variável aleatória X) Estimador: (média aritmética simples de uma amostra qualquer de tamanho ) De acordo com o Teorema Central do Limite (TCL): Se X seguir distribuição normal , então Se X não seguir distribuição normal, mas , então Sabendo que a média segue distribuição normal, precisamos padroniza-la: 1.1 Conhecemos o valor do parâmetro σ (ou ) 1. Intervalo de confiança para a média (μ) de uma população. 1.1 Conhecemos o valor do parâmetro σ (ou ) Um atuário deseja estimar a renda média de sua carteira de clientes. Para realizar o estudo, coletou uma amostra de 100 consumidores dentre o público alvo, obtendo um média de e variância de . Construa e interprete o intervalo de confiança para a renda média com de confiança. Exemplo – questão de prova : Com de confiança, podemos afirmar que o intervalo contém a renda média de sua carteira de clientes. 1. Variabilidade de X pequena; 2. Diminuir o nível de confiança; 3. n grande. Como estreitar um intervalo de confiança? Eficiência do estimador (menor variabilidade possível) Com o aumento do tamanho amostral, a estatística convergirá para o parâmetro (consistência) e diminuirá a variabilidade do estimador. Se com Pressupostos: A distribuição amostral da média será normal e utilizaremos a estatística Z : Se X pode seguir qualquer distribuição (TCL); e se σ for desconhecido, será estimado por s; Se e σ for conhecido, X deve seguir distribuição normal, pois o TCL não é válido. 1. Intervalo de confiança para a média (μ) de uma população. Pode-se questionar como σ é conhecido, visto que para calcular o desvio-padrão populacional necessita-se da média populacional μ, também desconhecida. Porém: i) desvios-padrão são geralmente estáveis, e pode-se ter calculado estimativas de em estudos similares; e ii) quando o tamanho da amostra for muito grande, é praticamente equivalente calcular o IC com variância conhecida ou desconhecida. Se não conhecermos o parâmetro σ, utilizamos uma estimativa desse parâmetro: s (desvio-padrão obtido através de um amostra). Se , a estimativa é considerada suficiente próxima ao parâmetro. Ideia frequentista de repetibilidade Jamais podemos associar probabilidade a um parâmetro (estatística clássica). Não pode-se afirmar que, com determinada confiança, a média está entre os valores do intervalo, pois embora seja desconhecida, a verdadeira média μ é única, fixa e constante. A confiança está associada ao intervalo construído, pois ele varia de acordo com a amostra coletada e possui determinada confiança de conter o parâmetro. Não confundir confiança com probabilidade. Cuidados com a interpretação! Exemplo: FGV - Analista Judiciário (TJ RO) (adaptada) Para estimar o valor médio das indenizações por danos morais, ordenadas por um determinado juiz, realiza-se, no âmbito da vara, uma amostra aleatória simples de tamanho . Considere que os valores das indenizações seguem distribuição normal. Nesta amostra, a média amostral apurada foi de . A variância já era conhecida de outros levantamentos, sendo igual a reais². Calcule e interprete o intervalo com confiança para a média das indenizações ordenadas por esse juiz. Resolução: Variável em estudo: X=valor das indenizações ordenadas por determinado juiz Pressuposto: X segue distribuição normal das indenizações ordenadas pelo juiz estão entre Concluímos que, com de confiança, o intervalo contém a verdadeira média de indenizações ordenadas pelo juiz. Interpretação: das indenizações ordenadas pelo juiz estão entre 1) Um analista do departamento pessoal seleciona aleatoriamente os registros de empregados horistas e acha a taxa média de salário por hora de . Supõe-se que os salários na firma sejam normalmente distribuídos. Se o desvio-padrão dos salários é conhecido e igual a , estimar a taxa média de salário na firma usando um intervalo de confiança de . Resposta: 2) Suponha que você deseja estimar a média do valor de vendas, por estabelecimento varejista, durante o último ano, de um determinado produto, sem saber a sua distribuição. Determinar o intervalo de confiança de para a média sabendo que, de uma amostra de tamanho , foram calculadas as seguintes estatísticas: e . Resposta: Exercícios propostos: Intervalo de confiança para média populacional 1. Intervalo de confiança para a média ( ) de uma população. 1.1 Conhecemos o valor do parâmetro (ou ): 1.2 Não conhecemos o valor do parâmetro (e ) 1.2 Não conhecemos o valor do parâmetro (e ) Quando a amostra for pequena, não podemos supor que o desvio padrão da amostra ( ) seja uma estimativa suficientemente aproximada do parâmetro . Portanto, para construir o intervalo de confiança para não podemos utilizar a estatística . Dessa forma, a média não mais seguirá distribuição normal (Z), terá distribuição t de Student, com parâmetro . “A distribuição T foi estabelecida pelo estatístico e químico inglês William Sealey Gosset devido ao seu trabalho na cervejaria Guinness (Dublin, Irlanda) em controle estatístico de qualidade em 1908. Gosset tinha disponível, somente, amostras pequenas para várias de suas análises, com o objetivo de determinar as melhores variedades de cevada e lúpulo para o processo de fermentação. Como a política da empresa proibia a publicação da ferramenta utilizada e dos resultados obtidos, Gosset usou o pseudônimo Student em artigos que ele escreveu relatando os seus resultados.” (https://en.wikipedia.org/wiki/William_Sealy_Gosset) Origem da distribuição t-Student Distribuição t de Student Um atuário está interessado em estimar a indenização média paga aos seus segurados por sinistro ocorrido neste ano. Para tanto, selecionou, dentre suas filiais, aleatoriamente segurados contemplados eobteve as seguintes estatísticas: média de e desvio-padrão de . Sabendo que os prêmios seguem distribuição normal, construa o intervalo de confiança para a indenização média paga aos clientes dessa seguradora e interprete. Variável em estudo: X = indenização paga aos seus segurados por sinistro ocorrido neste ano. Pressupostos atendidos: X segue distribuição normal; amostra aleatória Exemplo Estimativas: Exemplo - continuação Com 95% de confiança, podemos afirmar que o intervalo contém indenização média paga aos segurados por sinistro ocorrido. , Um atuário está interessado em estimar a renda média de empregados de uma determinada empresa que estão dispostos a contratar um plano de previdência privada. Selecionou aleatoriamente empregados e calculou as seguintes estatísticas: média de e desvio-padrão de . Construa o intervalo de confiança para a renda média dos empregados dessa empresa e interprete. Exercício proposto – questão de prova : Com 90% de confiança, podemos afirmar que o intervalo contém a renda média dos empregados dessa empresa dispostos a contratar o plano de previdência. Uma operadora de telecomunicações promete entregar, em média, Mb de velocidade de internet. Cansado de sempre encontrar a internet lenta, um cliente verificou a velocidade da internet em momentos distintos e obteve uma média de Mb e um desvio-padrão de Mb. a) Visto que , podemos afirmar que, em média, a operadora não está entregando conforme o prometido? b) Caso fosse coletada outra amostra (em outros momentos), seria obtido a mesma média? c) Conforme a variação da estimativa da média e com base na amostra coletada, o que podemos concluir a respeito da velocidade média entregue pela operadora com de confiança? Exemplo – IC para comparar valores Exemplo – IC para comparar valores Com de confiança, podemos afirmar que o intervalo contém a velocidade média entregue. Dado que o intervalo contém a velocidade prometida de Mb, podemos afirmar, com de confiança, que a operadora está entregando conforme o contratado. Estimativas: , Exercícios propostos: Lista 1: questões 6, 11, 13, 15. Lista 1.2: I(b), VIII(b), XII, XIV. Aula 3