Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 ESTIMAÇÃO Parâmetros: são as quantidades da população, em geral desconhecidas, sobre as quais existe interesse. Notação: em geral, uso de letras gregas. Estatística: é qualquer função das observações em uma amostra aleatória. Distribuição amostral: é a distribuição de probabilidades de uma estatística. Estimador: é o valor numérico de uma estatística amostral que representa o parâmetro, isto é, é uma combinação dos valores correspondentes aos elementos da amostra, construída para representar ou estimar um parâmetro de interesse na população. Notação: em geral utilizam-se letras gregas com acento circunflexo. Estimador Não Viciado ou Não Tendencioso: é um estimador que não tende a superestimar ou subestimar o valor do parâmetro, isto é, seu valor esperado coincide com o parâmetro de interesse. Estimador não tendencioso de variância mínima (ENTVM): é o estimador com a menor variância se forem considerados todos os estimadores não tendenciosos de um parâmetro. Estimador Consistente: é um estimador que à medida que o tamanho da amostra aumenta, seu valor esperado converge para o parâmetro de interesse e sua variância converge para zero. Dados dois estimadores e não viciados para um parâmetro , dizemos que é mais eficiente que se V( ) < V( ). Estimativa por Ponto: consiste em uma única estatística amostral que é usada para calcular o valor real de um parâmetro da população. 1 2 1 2 2 1 id2731640 pdfMachine by Broadgun Software - a great PDF writer! - a great PDF creator! - http://www.pdfmachine.com http://www.broadgun.com 2 Erro padrão de um estimador: é o seu desvio padrão. Se o erro padrão envolver parâmetros desconhecidos que possam ser estimados, então as substituições daqueles valores irão produzir o erro padrão estimado. Erro quadrático médio de um estimador do parâmetro : EQM( ) = E( )2 = V( ) + (tendência)2 Estimativa por Intervalo: é construído a partir da distribuição das amostras da estimativa pontual. O intervalo construído terá uma determinada confiança ou probabilidade de conter o verdadeiro valor do parâmetro da população. É comum que se refiram à semiamplitude do intervalo como erro envolvido na estimação ou precisão do estimador. O número tabelado usado na construção do intervalo de confiança é obtido de uma tabela da distribuição de probabilidades da estimativa pontual, levando-se em conta a confiança desejada no intervalo e, quando pertinente, o tamanho da amostra. Intervalo de Confiança para a média com variância populacional conhecida População infinita: I.C. = População finita: I.C. = Com n = tamanho da amostra N = tamanho da população n zX 1N nN n zX 3 Exemplo (MAGALHÃES; LIMA, 2009, p. 247): Um provedor de acesso à Internet está monitorando a duração do tempo das conexões de seus clientes, com o objetivo de dimensionar seus equipamentos. São desconhecidas a média e a distribuição de probabilidade desse tempo, mas o desvio padrão, por analogia a outros serviços, é considerado igual a minutos.Uma amostra de 500 conexões resultou num valor médio observado de 25 minutos. O que dizer da verdadeira média, com confiança de 92%? Confiança = 92% → z = 1,7507 500;50;25 nX 55,25;45,2455,025 500 507507,125.. n zXCI 50 Intervalo de Confiança para a média com variância populacional desconhecida População infinita: I.C. = População finita: I.C. = Estas fórmulas são válidas se: X ~ N ou se n ≥ 30 n stX n 1 11 N nN n stX n Exemplo (MAGALHÃES; LIMA, 2009, p. 301 modificado): A resistência à ruptura em cabos de aço é considerada uma variável Normal, com média e variância dependendo de outros fatores. Uma amostra de 12 cabos produzidos por uma empresa são levados a teste para indicar se eles podem ser usados na construção de uma ponte. Cada cabo para ser usado precisa ter carga média de ruptura de no mínimo 2500 kgf. Os resultados foram: 2518 ; 2492 ; 2450 ; 2535 ; 2547 ; 2486 ; 2455 ; 2499 ; 2522 ; 2505 ; 2469 ; 2440 a) Determine um intervalo com 95% de confiança para a resistência média à ruptura. b) Baseado no intervalo acima você concordaria que a carga média de ruptura é superior a 2500 kgf? 4 a) [2471,3 ; 2515,1] b)Não pois há valores menores ou iguais a 2500 no I.C. 201,2 4485,3470,1186 11 67,13053 12 2991861,74603 11 1 74603614;17,2493 12 2991829918 11 2 2 2 t ss XXX ii 89,2117,249312 4485,34201,217,2493.. 1 n stXCI n Exemplo (minha autoria): De um lote contendo 50 sacos de açúcar, amostrou-se 8 sacos. O peso médio dos sacos na amostra foi de 990,7 gramas com um desvio padrão amostral de 7,0 gramas. Supondo que o peso dos sacos de açúcar tem distribuição aproximadamente normal, construa um intervalo de confiança com 95% de confiança para o peso médio dos sacos de açúcar. confiança = 95% → t7 = 2,365; n = 8; N = 50 [985,28; 996,12] 0,7;7,990 sX 42,57,99049 42 8 7365,27,990 1 .. 1 N nN n stXCI n Dimensionamento da amostra para se estimar ì, com ó conhecido População infinita: População finita: Aproximar n SEMPRE para cima!!! 2 e zn 222 22 )1( zNe Nzn 5 Exemplo (dados MAGALHÃES; LIMA, 2009, p. 247): Para os dados do provedor de acesso à Internet, se este quer que sua estimativa do tempo médio das conexões tenha uma margem de no máximo ± 0,5, qual deveria ser o tamanho da amostra, utilizando- se a mesma confiança? confiança = 92% → z = 1,7507; e = 0,5 ; n = 613 conexões 99,61276,24 5,0 507507,1 2 22 x e zn Dimensionamento da amostra para se estimar ì, com ó desconhecido Se n < 30 : utilizar tentativa e erro Se n ≥ 30: População infinita: População finita: Estimar s usando amostra piloto ou pesquisa semelhante já realizada 2 e zsn 222 22 )1( szNe Nszn Exemplo (dados MAGALHÃES; LIMA, 2009, p. 301): Para os dados do exemplo de resistência à ruptura, se é desejado que a estimativa não se afaste do verdadeiro valor da resistência média de ruptura por mais de 15 kgf, com confiança de 95%, quantos cabos adicionais deverão ser testados? 6 n = 25 ; t24 = 2,064 → n = 23 ; t22 = 2,074 → n = 22 ; t21 = 2,080 → n = 23 logo deve-se adicionar 11 cabos. 1522,14 25 4485,34064,2 xe 1589,14 23 4485,34074,2 xe 1528,15 22 4485,34080,2 xe Intervalo de Confiança para a proporção População infinita: I.C. = População finita: I.C. = n ppzp )1( 1 )1( N nN n ppzp Dimensionamento da amostra para se estimar p População infinita: População finita: Estimar p usando amostra piloto, pesquisa semelhante já realizada ou utilizar 5,0 p 2 2 )1( e ppzn )1()1( )1( 22 2 ppzNe Nppzn 7 Exemplo (MONTGOMERY; RUNGER, 2009, p. 170): Uma amostra aleatória de 50 capacetes de corredores de motos e de automóveis foi sujeita a um teste de impacto, sendo observado algum dano em 18 desses capacetes. a)Encontre um intervalo de confiança 95% para a proporção verdadeira de capacetes desse tipo, que mostraria algum dano proveniente desse teste. b) Usando aestimativa de p obtida a partir da amostra preliminar de 50 capacetes, quantos capacetes devem ser testados para estarmos 95% confiantes de que o erro na estimação do valor verdadeiro de p seja menor do que 0,02? c)Quão grande terá de ser a amostra se desejarmos estar no mínimo 95% confiantes de que o erro na estimação de p seja menor do que 0,02, independente do valor verdadeiro de p? a) n = 50 ; k = 18 → confiança = 95% → z = 1,96 [0,227 ; 0,493] b) n = 2219 capacetes c) n = 2401 capacetes 36,0 50 18 p 133,036,0 50 64,036,096,136,0)1(.. x n ppzpCI 8,2218 02,0 64,036,096,1)1( 2 2 2 2 xx e ppzn 2401 02,0 5,05,096,1)1( 2 2 2 2 xx e ppzn Intervalo de Confiança para a variância Sabe-se que: se X ~ N então: 2 12 2 ~ )1( n sn 111 2 1; 2 1 2 2 2 1; 2 2 nn snsnP 2 2/1;)1( 2 2 2/;)1( 2 )1( ; )1( .. nn snsnCI 8 Exemplo (MONTGOMERY; RUNGER, 2009, p. 167): O conteúdo de açúcar na calda de pêssegos em lata é normalmente distribuído. Uma amostra aleatória de n = 10 latas resultou com um desvio padrão s = 4,8 mg. Encontre um intervalo com 95% de confiança para o desvio padrão do conteúdo de açúcar na calda. n = 10; s2 = 4,82 = 23,04 (mg)2 = [10,9005 ; 76,8000] I.C.ó = [3,30 ; 8,76] 700,2;023,19 2 %5,97;9 2 %5,2;9 700,2 04,239 ; 023,19 04,239)1( ; )1( .. 2 %5,97;)1( 2 2 %5,2;)1( 2 2 xxsnsnCI nn TESTE DE HIPÓTESE Hipótese estatística: é uma afirmação sobre um parâmetro ou forma de uma distribuição de valores observados. Teste de uma hipótese estatística: É um procedimento que permite decidir, com base em informações experimentais, pela rejeição ou não rejeição de uma hipótese estatística. Hipótese nula (H0): é a hipótese testada, a qual sempre contém um sinal de igualdade com relação ao valor do parâmetro especificado. Quando não se rejeita a hipótese nula, só é possível concluir que não existem, até o momento,evidências suficientes para garantir a sua rejeição. Valor Crítico: é o valor da estatística a partir do qual se rejeita a hipótese a ser testada. 9 Região Crítica (R.C.) de um teste: são os possíveis valores da estimativa que levam a rejeição da hipótese nula a ser testada (H0). Erro Tipo I: erro que ocorre quando a hipótese nula H0 é rejeitada quando de fato é verdadeira, devendo, portanto, não ser rejeitada. Nível de Significância : é a probabilidade de se cometer o erro tipo I. Erro Tipo II: erro que ocorre quando a hipótese nula H0 não é rejeitada quando de fato é falsa, devendo, portanto, ser rejeitada. : é a probabilidade de se cometer o erro tipo II. Poder do teste ou eficácia do teste: = (1 ), isto é, o poder do teste é a probabilidade de se rejeitar a hipótese nula quando ela é de fato falsa e deveria ser rejeitada. Situação real desconhecida Decisão tomada com base em evidências experimentais H0 verdadeira H0 falsa Não rejeitar H0 Decisão correta P(decisão correta) = 1 Erro tipo II P(erro tipo II) = Rejeitar H0 Erro tipo I P(erro tipo I) = = nível de significância Decisão correta P(decisão correta) = 1 1 = poder do teste Total 1,00 1,00 Exemplo (minha autoria): Em uma amostra de 583 medições encontrou-se um valor médio de emissão para uma variável poluente igual a 38,21 e um desvio padrão igual a 14,7780. Deseja-se testar ao nível de significância de 5% se o valor médio da variável medida é superior a 37 (valor máximo da variável segundo a legislação vigente). H0 : 37 H1 : > 37 Lembre-se que H0 sempre contém a igualdade. 10 Tem-se: R.C. = { | ≥ 38,007} 583 7780,14 37 583 7780,14 37)37/(05,0 crcr xXPxXP 007,38 583 7780,14 376449,1 cr cr xx X X Se na realidade o verdadeiro valor médio de emissão for 39, tem-se: 0526,0)62,1( 583 7780,14 39007,38 583 7780,14 39)39/007,38( ZPXPXP Tem-se: R.C. = { | ≥ 38,424}X X 583 7780,14 37)37/(01,0 crcr xZPxXP 583 7780,14 373263,2 crx 11 Se na realidade o verdadeiro valor médio de emissão for 39, tem-se: 1736,0)94,0( 583 7780,14 39424,38 583 7780,14 39)39/424,38( ZPXPXP A única forma de se diminuir e ao mesmo tempo é aumentando o tamanho da amostra. Nível Descritivo do teste (valor-P): é a probabilidade de se obter uma estatística de teste igual ou mais extrema que o resultado encontrado, a partir dos dados da amostra, dado que a hipótese nula H0, é realmente verdadeira. P = nível descritivo do teste Se P < á, rejeita-se H0 0,0239 < 0,05 → rejeita-se H0 0,0239 > 0,01 → não se rejeitaH0 0239,09761,00,1)98,1( 583 7780,14 3721,38)37/21,38( ZPZPXPP 12 DESAFIO AOS DEUSES a fascinante história do risco Peter L. Bernstein (p. 207) Sob condições de incerteza, a escolha não é entre rejeitar uma hipótese ou aceitá-la, mas entre a rejeição e a não- rejeição. Você pode decidir que a probabilidade de estar errado é tão pequena que você não deveria rejeitar a hipótese. Você pode decidir que a probabilidade de estar errado é tão grande que você deveria rejeitar a hipótese. Mas com qualquer probabilidade diferente de zero de estar errado certeza em vez de incerteza você não pode aceitar uma hipótese. Esta noção poderosa distingue a maior parte da pesquisa científica válida da tolice. Para serem válidas, as hipóteses devem estar sujeitas à falsificação ou seja, elas devem ser testáveis de modo que a alternativa entre rejeitar e não rejeitar seja clara e específica e as probabilidades sejam mensuráveis Teste de hipótese para média ì, com variância conhecida H0: = 0 H1: ≠ 0 R.C. = { Z | Z ≤ z 1- /2 ou Z ≥ z 1- /2 } Estatística de teste : Com: , para população infinita , para população finita 1 N nN nX nX X XZ 0 H0: ≤ 0 H1: > 0 R.C. = { Z | Z ≥ z 1- } H0: ≥ 0 H1: < 0 R.C. = { Z | Z ≤ z 1- } 13 Exemplo (MAGALHÃES; LIMA, 2009, p. 296): Uma fábrica de automóveis anuncia que seus carros consomem, em média, 10 litros de gasolina por 100 quilômetros, com desvio padrão de 0,8 litros. Uma revista desconfia que o consumo é maior e resolve testar essa afirmação. Para tal, analisa 35 automóveis dessa marca, obtendo como consumo médio 10,2 litros por quilômetros. a)Considerando que o consumo siga o modelo Normal, o que a revista pode concluir sobre o anúncio da fábrica, ao nível de significância de 1%? b)Qual o erro tipo II se a média for 10,6? a) H0: ì ≤ 10 (o consumo não é maior que 10 litros) H1: ì > 10 (o consumo é maior que 10 litros) ; ó = 0,8; n = 35; á = 0,01 R.C. = {Z | Z ≥ 2,3263}. Zobsv = 1,479 R.C. , logo ao n.s. de 1% não se rejeita H0 e afirma- se que o consumo médio de gasolina não é maior que 10 litrospor 100 quilômetros. 2,10X 479,1 35 8,0 102,100 X XZ b) R.C. = { | ≥ 10,315} â = P(não rejeitar H0 | H0 é falsa) = P( < 10,315 | ì = 10,6) = = P(Z < 2,11) = 0,0174 315,10 35 8,03263,210 35 8,0 103263,2 crcr X X X X X 35 8,0 6,10315,10ZP 14 Teste de hipótese para média ì, com variância desconhecida H0: = 0 H1: ≠ 0 R.C. = { T | T ≤ t n 1; /2 ou T ≥ t n 1 ; /2} Estatística de teste : Com: , para população infinita , para população finita X X T 0 n s X 1 N nN n s X H0: ≤ 0 H1: > 0 R.C. = { T | T ≥ t n 1 ; } H0: ≥ 0 H1: < 0 R.C. = { T | T ≤ t n 1 ; } Exemplo (MAGALHÃES; LIMA, 2009, p. 301 modificado): A resistência à ruptura em cabos de aço é considerada uma variável Normal, com média e variância dependendo de outros fatores. Uma amostra de 12 cabos produzidos por uma empresa é levada a teste para indicar se eles podem ser usados na construção de uma ponte. Cada cabo, para ser usado, precisa ter carga média de ruptura no mínimo igual a 2500 kgf. Os resultados foram: 2518 ; 2492 ; 2450 ; 2535 ; 2547 ; 2486 ; 2455 ; 2499 ; 2522 ; 2505 ; 2469 ; 2440 Indique a conclusão que se pode tirar, ao nível de significância de 2,5%. 15 ; s = 34,4485; n = 12; t 11; 2,5% = 2,201 H0: ì ≥ 2500 (a carga média de ruptura é no mínimo 2500 kgf) H1: ì < 2500 (a carga média de ruptura não é no mínimo 2500 kgf) R.C. = {T | T ≤ 2,201} T obsv = 0,687 R.C., logo ao n.s. de 2,5% não se rejeita H0 e afirma-se que a carga média de ruptura é no mínimo 2500 kgf. 17,2493X 687,0 12 4485,34 250017,2493 0 X XT Teste de hipótese para a proporção H0: p = p0 H1: p ≠ p0 R.C. = { Z | Z ≤ z 1- /2 ou Z ≥ z 1- /2 } Estatística de teste : Com , para população infinita , para população finita p pp Z 0 n pp p )1( 00 1 )1( 00 N nN n pp p H0: p ≤ p0 H1: p > p0 R.C. = { Z | Z ≥ z 1- } H0: p ≥ p0 H1: p < p0 R.C. = { Z | Z ≤ z 1- } 16 Exemplo (minha autoria): Em um condomínio fechado de casas de veraneio situadas no litoral, a praia é exclusiva para os proprietários e seus convidados. Nesta praia existem lixos especiais nos quais as latas para reciclagem devem ser depositadas. No final de um determinado dia, foram recolhidos os lixos para reciclagem de certa extensão da praia e contado o número de latinhas existentes. Após a contagem, as casas que ficam nesta extensão da praia foram arguidas quanto ao número de refrigerantes e cervejas em lata consumidas na praia, naquele dia. Se foram contadas 308 latas e foram declaradas o consumo de 405 latas, você concordaria que houve aderência de pelo menos 80% das residências deste condomínio ao programa de reciclagem de latas de refrigerante e cervejas? Utilize á = 0,05. n = 405; k = 308→ H0: p ≥ 0,80 (houve aderência de pelo menos 80% das residência) H1: p < 0,80 (não houve aderência de pelo menos 80% das residências) R.C. = {Z | Z ≤ 1,6449} Zobsv = 1,9876 R.C., logo ao n.s. de 5% rejeita-se H0 e afirma-se que não houve aderência de pelo menos 80% das residências deste condomínio ao programa de reciclagem de latas de refrigerante e cervejas. 7605,0 405 308 obsvp 9876,1 0199,0 0395,0 405 20,080,0 80,07605,0 )1( 00 0 x n pp pp Z Teste de hipótese para a variância Sabe-se que: H0: ó2 = ó20 H1: ó2 ≠ ó20 R.C. = { | ou } Estatística de teste : 2 2 2/1;1 2 n 2 12 2 ~ )1( n sn 2 2/;1 2 n 2 0 2 2 )1( sn 17 H0: ó2 ≤ ó20 H1: ó2 > ó20 R.C. = { | } H0: ó2 ≥ ó20 H1: ó2 < ó20 R.C. = { | } 2 2 2 1;1 2 n 2 ;1 2 n Exemplo (MONTGOMERY; RUNGER, 2009, p. 196): O conteúdo de açúcar na calda de pêssegos em lata é normalmente distribuído. Teste a hipótese de que a variância ó2 é igual a 18 (mg)2, se uma amostra aleatória de n = 10 latas resultar em um desvio padrão amostral s = 4,8 mg. Utilize á = 0,05. H0: ó2 = 18 H1: ó2 ≠ 18 R.C. = { ÷2 | ÷2 ≤ 2,700 ou ÷2 ≥ 19,023} = 11,52 R.C., logo ao n.s. de 5% não se rejeita H0 e afirma-se que a variância do conteúdo de açúcar na calda de pêssegos em lata é igual a 18 (mg)2. 700,2;023,19 2 %5,97;9 2 %5,2;9 52,11 18 8,49)1( 2 2 0 2 2 xsn 2 obsv
Compartilhar