Baixe o app para aproveitar ainda mais
Prévia do material em texto
Disciplina: Estatística Aplicada II Prof. Constantino Notas de Aula: Intervalo de Confiança 1 INTERVALO DE CONFIANÇA (IC) Para estabelecermos um intervalo de confiança utilizaremos a seguinte estratégia Na distribuição acima, a empresa poderá estar 90 % confiante de que o índice médio de economia de estará entre 28,1 e 34,1. Considerando os dados acima pode-se estabelecer que tem-se 90% de confiabilidade de que o índice médio de economia de combustível para toda linha de automóvel de passeio do fabricante está entre 28,1 e 34,1 milhas por galão. Estudaremos a técnica de inferência estatística – usar amostras estatísticas para estimar o valor de um parâmetro populacional desconhecido. Neste campo, estabeleceremos como usar amostras estatísticas para fazer a estimativa do parâmetro populacional quando o tamanho da amostra for pelo menos 30 ou quando a população é normalmente distribuída e o desvio 𝜎 é conhecido. 1.1. INTERVALO DE CONFIANÇA PARA A MÉDIA (AMOSTRAS GRANDES) Estimativa Pontual: É um valor único estimado para um parâmetro populacional. A estimativa pontual menos tendenciosa de uma média populacional é a média amostral 𝑥 . Exemplo: Pesquisadores de mercado usam o número de frases por anúncio como medida de legibilidade de anúncios de revistas. A seguir, representamos uma amostra aleatória do número de frases encontrado em 50 anúncios. Encontre a estimativa pontual da média populacional . Disciplina: Estatística Aplicada II Prof. Constantino Notas de Aula: Intervalo de Confiança 2 Solução: A média amostral dos dados é: 𝑥 = 𝑥 𝑛 = 620 50 = 12,4 Então, a estimativa pontual para o comprimento da média de todos os anúncios de revista é 12,4 frases 1.2. ESTIMATIVA INTERVALAR É um intervalo, ou amplitude de valores, usado para estimar um parâmetro populacional. Para formar uma estimativa intervalar, use a estimativa pontual como centro do intervalo e depois adicione e subtraia a margem de erro. Por exemplo, se a margem de erro for 2,1, então uma estimativa intervalar seria dada por 12,4 2,1 ou 10,3 < < 14,5. A estimativa pontual e a estimativa intervalar estão a seguir: Antes de encontrar a margem de erro para uma estimativa intervalar, devemos primeiro determinar o grau de confiabilidade que sua estimativa intervalar contenha a média populacional . É a probabilidade de que o intervalo estimado contenha o parâmetro populacional O nível de confiança c é a área sob a curva normal padrão entre os valores críticos, −𝑧𝑐 𝑒 𝑧𝑐 . A área remanescente é 1 – c, então a área em cada cauda é 1 2 1 − 𝑐 . Disciplina: Estatística Aplicada II Prof. Constantino Notas de Aula: Intervalo de Confiança 3 Por exemplo, se c = 90%, então 5% da área está à esquerda −𝑧𝑐 = −1,645 e 5% está à direita de 𝑧𝑐 = 1,645 Considerando c = 90% C = 0,90 Área na região central da curva 1 – c = 1- 0,90 = 0,10 Área nas regiões extremas (cauda) 1 2 1 − 𝑐 = 0,05 Área em cada cauda −𝑧𝑐 = −1,645 Valor crítico separando a cauda esquerda 𝑧𝑐 = 1,645 Valor crítico separando a cauda direita Usaremos níveis de confiança, interligados com os seguintes níveis de confiança: Nível de Confiança 𝒁𝑪 90 % 1,645 95 % 1,96 99 % 2,575 A diferença entre a estimativa pontual e o valor real do parâmetro é chamada de erro de amostragem. Quando temos estimado, o erro de amostragem é a diferença de 𝑥 − 𝜇. Na maioria dos casos, é claro, é desconhecido e 𝑥 varia de amostra para amostra. O valor máximo para o erro poderá ser calculado se o nível de confiança e a distribuição de amostragem forem conhecidos. 1.3. MARGEM DE ERRO Também denotado por erro máximo da estimativa ou tolerância de erro (E) é a maior distância entre o ponto de estimativa e o valor do parâmetro que se está estimando 𝐸 = 𝑍𝐶𝜎𝑥 = 𝑍𝐶 𝜎 𝑛 Para utilizar tal técnica, assume-se que o desvio padrão da amostra é conhecido. Esse caso é raro, mas quando n 30, o desvio padrão da amostra S pode ser usado no lugar de Exemplo 1 : Pesquisadores de mercado usam o número de frases por anúncio como medida de legibilidade de anúncios de revistas. A seguir, representamos uma amostra aleatória do número de frases encontrado em 50 anúncios.Considerando um nível de confiança de 95% e o desvio padrão da amostra é aproximadamente 5,0. CALCULE a Margem de Erro no intuito de encontrar a média de frases em todos os anúncios de revistas. Disciplina: Estatística Aplicada II Prof. Constantino Notas de Aula: Intervalo de Confiança 4 Solução: Passo 1: i) Como foi estabelecido um nível de confiança de 95%, temos que o z-escore será de 1,96 (ou seja, 95% da área abaixo da curva normal padrão está dentro de 1,96 desvios padrões da média); ii) Como n 30 podemos utilizar o desvio padrão S no lugar de iii) Sabemos também que n = 50 Passo 2: Calculando o Erro amostral teremos: 𝐸 = 𝑍𝐶 𝜎 𝑛 𝐸 = 1,96 5 50 ≅ 1,4 Passo 4: 1.4. INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL Um intervalo de confiança c para a média populacional é: 𝑥 − 𝐸 < 𝜇 < 𝑥 + 𝐸 A probabilidade de que o intervalo de confiança contenha 𝜇 é c Passos para encontrar um intervalo de confiança para a média populacional ( n 30) ou é conhecido como uma população normalmente distribuída. Encontrar a estatística amostral e 𝑥 𝑥 = 𝑥 𝑛 Especifique , se for conhecido. Caso contrário, encontre o desvio padrão amostral S e use-o como uma estimativa para 𝑆 = 𝑥 − 𝑥 2 𝑛 − 1 Encontre o valor crítico 𝑍𝐶 que corresponda ao nível de confiança dado Use a tabela Normal Padrão Encontrar a margem de erro 𝐸 = 𝑍𝐶 𝜎 𝑛 Encontre os extremos esquerdo e direito e forme o intervalo de confiança Extremo esquerdo: 𝑥 − 𝐸 Extremo direito: 𝑥 + 𝐸 Intervalo: 𝑥 − 𝐸 < 𝜇 < 𝑥 + 𝐸 Disciplina: Estatística Aplicada II Prof. Constantino Notas de Aula: Intervalo de Confiança 5 CONSTRUINDO UM INTERVALO DE CONFIANÇA Exemplo 2: Utilizando os dados do Exemplo 1 construa um intervalo de confiança de 95% para a média do número de frases em todos os anúncios da revista. Solução: Sendo 𝐸 = 1,96 5 50 ≅ 1,4 𝑥 = 𝑥 𝑛 = 620 50 = 12,4 O intervalo de confiança será: 𝐼𝐶 = 11,0; 13,8 𝐸𝑥𝑡𝑟𝑒𝑚𝑜 𝑒𝑠𝑞𝑢𝑒𝑟𝑑𝑜: 𝑥 − 𝐸 = 12,4 − 1,4 = 11,0 𝐸𝑥𝑡𝑟𝑒𝑚𝑜 𝑑𝑖𝑟𝑒𝑖𝑡𝑜 ∶ 𝑥 + 𝐸 = 12,4 + 1,4 = 13,8 CONSTRUINDO UM INTERVALO DE CONFIANÇA COM 𝝈 CONHECIDO O diretor de admissão de uma faculdade deseja estimar a idade média de todos os estudantes matriculados. Em uma amostra aleatória de 20 estudantes, a idade média encontrada é 22,9 anos. Baseado em estudos anteriores, o desvio padrão conhecido é 1,5 anos e a população é normalmente distribuída. Construa um intervalo de confiança de 90% para a média de idade da população. Solução: Usando n = 20, 𝑛 = 20 𝑎𝑛𝑜𝑠, 𝑥 = 22,9 𝑎𝑛𝑜𝑠, 𝜎 = 1,5 𝑎𝑛𝑜𝑠, 𝑧0,90 = 1,645 𝑖) 𝐸𝑟𝑟𝑜 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙: 1,645 1,5 20 ≅ 0,60 𝑖𝑖) 𝐸𝑥𝑡𝑟𝑒𝑚𝑜 𝑒𝑠𝑞𝑢𝑒𝑟𝑑𝑜: 𝑥 − 𝐸 = 22,9 − 0,60 = 16,9 𝐸𝑥𝑡𝑟𝑒𝑚𝑜 𝑑𝑖𝑟𝑒𝑖𝑡𝑜 ∶ 𝑥 + 𝐸 = 22,9 + 0,60 = 23,5 Disciplina: Estatística Aplicada II Prof. Constantino Notas de Aula: Intervalo de Confiança 6 TAMANHO DA AMOSTRA Para a mesmaamostra estatística, conforme o nível de confiança aumenta, o intervalo de confiança fica mais largo. Conforme o intervalo de confiança fica mais largo, a precisão da estimativa decresce. Uma maneira de aumentar a precisão de uma estimativa sem decrescer o nível de confiança é aumentar o tamanho da amostra. Mas, qual o tamanho de amostra necessário para garantir certo nível de confiança para uma margem de erro dada? Dado o nível de confiança c e uma margem de erro E, o tamanho mínimo da amostra n necessário para estimar a média populacional 𝜇 é: 𝑛 = 𝑍𝑐𝜎 𝐸 2 Se 𝜎 for desconhecido, você pode estimá-lo usando s, dado que você tenha uma amostra preliminar com pelo menos 30 membros. Exemplo 3: Considerando os dados do exemplo 1, DETERMINE quantos anúncios da revista devem ser incluídos na amostra se você quer estar 95% confiante de que a média amostral esteja dentro de uma frase da média populacional? Solução: Considerando 𝑐 = 0,95, 𝑍𝑐 = 1,96, 𝜎 ≈ 𝑠 ≈ 5,0 𝑒 𝐸 = 1, você pode encontra o tamanho mínimo de amostra n: 𝑛 = 𝑍𝑐𝜎 𝐸 2 = 1,96 ∙ 5,0 1 2 = 96,04 Quando necessário arredonde a quantidade de amostras no intuito de obter número inteiro, neste caso a quantidade mínima de amostras será 97. Disciplina: Estatística Aplicada II Prof. Constantino Notas de Aula: Intervalo de Confiança 7 INTERVALOS DE CONFIANÇA PARA MÉDIA (AMOSTRAS PEQUENAS) Existem situações em que temos o desvio padrão da população desconhecido e por diversos fatores não é possível coletar amostras de tamanha 30 ou mais. Se a variável aleatória for normalmente distribuída, ou aproximadamente normalmente distribuída, pode-se utilizar a distribuição t. Se a distribuição de uma variável aleatória x for aproximadamente normal, então: 𝑡 = 𝑥 − 𝜇 𝑥 𝑛 O que corresponde a uma distribuição t Valores críticos de t são denotados por 𝑡𝑐 . Diversas propriedades da distribuição t estão a seguir. 1. A distribuição t tem forma de sino e é simétrica sobre a média. 2. A distribuição t é uma família de curvas, cada uma determinada por um parâmetro chamado de grau de liberdade. Os graus de liberdade são o número de escolhas livres deixas depois que uma amostra estatística tal como 𝑥 é calculada. Quando usamos a distribuição t para estimar a média da população, os graus de liberdade são iguais ao tamanho da amostra menos um: 𝑔. 𝑙. = 𝑛 − 1 3. A área total sob a curva é 1 ou 100% 4. A média, a mediana e a moda da distribuição t são iguais a zero. 5. Conforme os graus de liberdade aumentam, a distribuição t aproxima a distribuição normal. Depois de 30 g.l. a distribuição t está muito próxima à distribuição normal padrão z. Exemplo 4: Encontre o valor crítico 𝑡𝑐 para uma confiança de 95 % quando o tamanho da amostra é 15. Em razão de n = 15, os graus de liberdade são: g.l. = n -1 = 15 – 1 = 14 Uma parte da Tabela da distribuição t é mostrada abaixo. Considerando g.l. = 14 e c = 0,95, o valor crítico 𝑡𝑐 é mostrado pela áreas destacadas na tabela. Disciplina: Estatística Aplicada II Prof. Constantino Notas de Aula: Intervalo de Confiança 8 Observando a tabela, você pode ver que 𝑡𝑐 = 2,145. O gráfico abaixo demonstra a distribuição t para 14 graus de liberdade, c = 0,95 e 𝑡𝑐 = 2,145. A interpretação do gráfico é que 95% da área sob a curva da distribuição t com 14 graus de liberdade está entre 𝑡 = ±2,145 INTERVALOS DE CONFIANÇA E A DISTRIBUIÇÃO t Construir um intervalo de confiança usando a distribuição t é similar a construir um intervalo de confiança usando a distribuição normal – ambos usam uma estimativa pontual 𝑥 e um margem de erro E. INSTRUÇÕES Em palavras Simbolos 1. Identifique a amostra estatística 𝑛, 𝑥 𝑒 𝑠 𝒙 = 𝒙 𝒏 ; 𝒔 = 𝒙 − 𝒙 𝟐 𝒏 − 𝟏 2. Identifique os graus de liberdade, o nível de confiança c e os valores críticos 𝑡𝑐 g.l. = n -1 3. Encontre a margem de erro E 𝐸 = 𝑇𝐶 𝑠 𝑛 4. Encontre os extremos esquerdo e direito e forme os intervalos de confiança 𝐸𝑥𝑡𝑟𝑒𝑚𝑜 𝑒𝑠𝑞𝑢𝑒𝑟𝑑𝑜: 𝑥 − 𝐸 𝐸𝑥𝑡𝑟𝑒𝑚𝑜 𝑑𝑖𝑟𝑒𝑖𝑡𝑜 ∶ 𝑥 + 𝐸 Intervalo: 𝑥 − 𝐸 < 𝜇 < 𝑥 + 𝐸 Disciplina: Estatística Aplicada II Prof. Constantino Notas de Aula: Intervalo de Confiança 9 CONSTRUINDO UM INTERVALO DE CONFIANÇA Exemplo 5: Considere uma seleção de 16 cafeterias para a medição da temperatura do café vendido em cada uma delas. A média de temperatura da amostra é de 162,0 ℉ com desvio padrão de 10,0 ℉. Encontre um intervalo de 95% para a temperatura média. Assuma que as temperaturas são normalmente distribuídas. Solução: i) Sabendo que 𝑛 = 16; 𝑥 = 162,0; 𝑠 = 10,0; 𝑐 = 0,95 𝑒 𝑔. 𝑙. = 16 − 1 = 15 ii) Utilizando a Tabela de Distribuição t temos que 𝑡𝑐 = 2,131 iii) A margem de erro no intervalo de confiança de 95% é: 𝐸 = 2,131 10 16 ≈ 5,3 iv) O intervalo de confiança será: Interpretação: Com 95 % de confiança, podemos dizer que a média da temperatura do café vendido está entre 156,7 ℉ 𝑒 167,3℉.
Compartilhar