Baixe o app para aproveitar ainda mais
Prévia do material em texto
Prof.: Renato Francisco Merli 2012 Inferência Estatística O que é? Inferência Estatística é poder fazer afirmações sobre características de uma população, baseando-se em resultados de uma amostra. O uso de informações da amostra para concluir sobre o todo faz parte da atividade diária da maioria das pessoas. Basta observar como uma cozinheira verifica se o prato tem ou não a quantia adequada de sal. O que é? Ou ainda, quando uma dona de casa, após experimentar um pedaço de laranja numa banca de feira, decide se as compras ou não. Essas são decisões baseadas em procedimentos amostrais. O objetivo de nosso estudo é conhecer algumas técnicas de inferência aplicada em situações científicas. Estimação A estimação é o processo que consiste no uso de dados da amostra (dados amostrais) para estimar valores de parâmetros populacionais desconhecidos, tais como média, desvio padrão, proporções etc. É um raciocínio tipicamente indutivo, em que se generalizam resultados da parte (amostra) para o todo (população). Alguns Conceitos Parâmetro: alguma característica descritiva dos elementos de uma população (média, proporção, variância,...). Estimador ou Estatística: alguma informação determinada a partir de dados amostrais. Estimativas Pontuais e Intervalares Estimativas Pontuais É quando fazemos uma única estimativa (um valor) para um determinado parâmetro populacional. Vejamos os exemplos: Estimativas Intervalares É quando fazemos uma estimativa de um intervalo de valores possíveis, no qual se admite esteja o parâmetro populacional. Vejamos: Neste tipo de estimativa temos um intervalo de valores em torno do parâmetro amostral, no qual julgamos, com um risco conhecido de erro, estar o parâmetro da população. A esse intervalo chamamos intervalo de confiança. Intervalos de Confiança Trata-se de uma técnica para se fazer inferência estatística. Ou seja, a partir de um intervalo de confiança, construído com os elementos amostrais, pode-se inferir sobre um parâmetro populacional. Intervalo de confiança é um intervalo de valores, limitado por um valor mínimo e um valor máximo, usado para estimar um parâmetro desconhecido da população, de forma que permita afirmar que o verdadeiro valor do parâmetro estará contido nesse intervalo. Intervalo de Confiança Vamos então considerar o intervalo de valores [a, b], simétricos em torno da média do parâmetro , tal que a probabilidade de pertencer ao intervalo seja igual a 1 - , isto é: Nível de Confiança Esta probabilidade 1 - é chamada de nível de confiança (ou grau de certeza), é preestabelecido pelo pesquisador e significa que, retiradas todas as amostras da população e construídos todos os intervalos de confiança, poderemos dizer que (1 - )% destes intervalos conterão o parâmetro . Nível de Significância Da mesma forma, podemos afirmar que para cada intervalo, teremos % de probabilidade de que o mesmo não contenha . Este é o erro que estaremos cometendo e é chamado nível de significância ou grau de incerteza ou grau de desconfiança. Importante Quanto maior for o nível de confiança, maior será a amplitude do intervalo. Sendo conveniente, o nível de confiança pode ser aumentado até tão próximo de 100% quanto se queira, mas isso resultará em intervalos de amplitude cada vez maiores, o que significa perda de previsão na estimação. Para amostras de tamanho n fixo, confiança e precisão variam em sentidos opostos, quanto mais confiança se deseja, menor a precisão encontrada. Determinando o IC Para encontrarmos um intervalo de confiança para um determinado parâmetro , devemos obter um intervalo [a, b], centrado em , tal que: P(a b) = 1 - . Estimativa da Média Populacional Para efetuar a Estimativa de Médias de uma População utiliza-se o Desvio Padrão da distribuição que constitui a amostra (distribuição amostral), devendo-se levar em consideração se o Desvio padrão (ou a variância) da população é ou não conhecido. Desvio Padrão Conhecido Estimativa Pontual da Média: Desvio Padrão Conhecido Estimativa Intervalar da Média A Estimativa Intervalar da Média Populacional baseia-se na hipótese de que a Distribuição das Médias Amostrais é normal, daí usarmos a nova variável z. Intervalo de Confiança α α 2 2 σ σ P X Z . μ X Z . 1 α n n σ ou simplesmente I.C. μ, 1-α X Z .α n2 Fixando-se um nível de confiança 1 - , tem-se: Ou seja : P -Z Z Z 1 - αα α 2 2 Exemplo 1 A duração da vida de uma peça de equipamento é tal que = 5 horas. Foram amostradas 100 dessas peças obtendo-se a média de 500 horas. Deseja-se construir um intervalo de confiança para a verdadeira duração média da peça com nível de 95% de confiança. Solução = 5 horas n = 100 =500 =5% 95%=0,95 0,95/2=0,475 Solução P μ 500,98499,02 95% 0,95 σ Z .α n2 5 500 1,96. 100 500 0,98 Exemplo 2 Um pesquisador está estudando a resistência média de um determinado material. Ele sabe que esta variável é normalmente distribuída com desvio padrão de 2 unidades. Utilizando os valores 4,9; 7,0; 8,1; 4,5; 5,6; 6,8; 7,2; 5,7; 6,2 unidades obtidos de uma amostra de tamanho 9, determine o intervalo de confiança para a resistência média com um nível de confiança de 95%. Solução = 2 n = 9 Média==6,22222 =5% Solução P 4,915 μ 7,529 4,915;7,529 95% 0,95 σ Z .α n2 2 6,222.. 1,96. 9 6,222 1,30666 Exemplo 3 Considerando que uma amostra de cem elementos extraída de uma população aproximadamente normal, cujo desvio padrão é igual a 2, forneceu média de 35,6, construir intervalos de confiança de 90%, 95% e 99% para a média dessa população. O que temos? = 2 n = 100 Média==35,6 =10%, 5% e 1% Solução Exercícios 01) Foram retiradas 25 peças da produção diária de uma máquina, encontrando-se para uma certa medida uma média de 5,2 mm. Sabendo-se que as medidas têm distribuição normal com desvio padrão 1,2 mm, construir intervalos de confiança para a média aos níveis de: a) 90% R = [4,81 ; 5,59] b) 95% R = [4,73 ; 5,67] c) 99% R = [4,58 ; 5,82] Exercícios 02) De uma distribuição normal com 2=1,96,obteve- se a seguinte amostra: 25,2; 26,0: 26,4; 27,1; 28,2; 28,4. Determinar o intervalo de confiança para a média da população, sendo o nível de significância de: a) = 0,05 R = [25,76 ; 28] b) = 0,10 R = [25,84 ; 27,82] Exercícios 03) Suponha que a altura dos alunos de nossa faculdade tenham distribuição normal com = 15 cm. Foi retirada uma amostra aleatória de 100 alunos obtendo-se a média =175 cm. Construir, ao nível de confiança de 95% o intervalo para a verdadeira altura média dos alunos. R= [172,06 ; 177,94] Exercícios 04) Dados n = 10, = 110 e = 10, determinar os intervalos de confiança para aos níveis de 90% e 95%. R= [104,81 ; 115,19], [103,8 ; 116,2] 05) Feito um ensaio de corrosão com 64 peças de um lote de produção, verificou-se que o tempo que a peça suportou nesse teste apresentou uma média de 200 horas. Sabe-se que o desvio padrão populacional vale 16 horas, construir um intervalo de confiança para a média populacional com 95% de confiança. R = [1,96,08h; 203,92h] Exercícios 06) Suponha que o faturamento bruto mensal da Empresa Santos & Cia Ltda, tenha distribuição normal com desvio padrão de R$ 4.959.390.00. Para se fazer uma estimativa sobre o faturamento bruto da empresa, colheu-se uma amostra de 12 meses obtendo-seum faturamento bruto médio de R$ 15.600.000. Determine o intervalo com 95% de confiança para o verdadeiro faturamento médio. R=[12.793.960,95 ; 18.406.039,05] Exercícios 07) Suponha que o recolhimento mensal de ICMS da Empresa Santos & Cia Ltda, tenha distribuição aproximadamente normal com desvio padrão de R$ 3.406,70. Para se fazer uma estimativa sobre os tributos pagos pela empresa em u determinado período, colheu- se uma amostra de 8 meses obtendo-se um recolhimento médio de R$ 9.434,50 de ICMS. Encontre o erro da estimativa e o intervalo com 98% de confiança. R= e=2806,37 [6628,13 ; 12240,87] Erro de Estimação É a diferença entre a média da amostra e a verdadeira média da população. Como o intervalo de confiança tem centro na média da amostra, o erro máximo provável que está sendo admitido é igual à metade da amplitude do intervalo. Erro de Estimação Percebemos que quando aumentamos z ou este erro potencial aumenta. Podemos concluir também que maiores amostras (aumenta n) possuem um potencial de erro menor. Desvio Padrão Desconhecido Estimativa Pontual da Média: Desvio Padrão Desconhecido Estimativa Intervalar da Média Intervalo de Confiança α α 2 2 S S P X . μ X . 1 α n n t t S ou simplesmente I.C. μ, 1-α X t .α n2 Distribuição de Student Para pequenas amostras a distribuição normal apresenta valores menos precisos, o que nos leva a utilizar um modelo melhor. Por isso iremos conhecer a distribuição t de Student. A principal diferença entre a distribuição normal e a t de Student é que esta tem mais área nas caudas. Distribuição de Student Existe um valor de t para cada tamanho de amostra, sendo que à medida que a amostra (n) cresce, a distribuição t de Student se aproxima da distribuição normal. Para calcular o valor de t a ser usado é necessário ter: Um nível de confiança desejado: Qual o número de graus de liberdade a ser utilizado. Exemplo Sabendo-se que uma amostra tem 25 elementos, que a sua média 150 e desvio padrão igual a 10. Represente um intervalo de confiança em nível de 90%. Solução: Como a amostra é menor que 30 elementos, então iremos usar a distribuição t de Student. Se desejamos um intervalo de confiança de 90%, temos: Para trabalharmos com a tabela, encontramos o número de graus de liberdade, que é: (n-1), logo (25-1)=24. O nível de confiança desejado é (1-)=1-0,9=0,1. Conhecendo o número de graus de liberdade e o nível de confiança desejado vamos a tabela e encontramos o valor t, neste caso igual a 1,7109. Solução Exercícios 01) Em quatro leituras experimentais de um comercial de 30 segundos, um locutor levou em média 29,2 segundos com uma S2 = 5,76 segundos. Construir os limites de confiança para a média. Dado = 10% R = [26,38 ; 32,02] Exercícios 02) Em uma fábrica, colhida uma amostra de certa peça, obtiveram-se as seguintes medidas para os diâmetros: 10 11 11 11 12 12 12 12 13 13 13 13 13 13 13 13 13 13 13 13 14 14 14 14 14 15 15 15 16 16 a) Estimar a média e a variância. R = 13,13 2,05 b) Construir um intervalo de confiança para a média sendo = 5% [12,60 ; 13,66]
Compartilhar