Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIDADE 5 – NOÇÕES DE INFERÊNCIA 1. Formulação geral de um teste estatístico. 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Um dos problemas a serem resolvidos pela Inferência Estatística é o de testar uma hipótese. A hipótese estatística é uma afirmação sobre uma população, usualmente sobre um parâmetro desta, desejamos saber se os resultados de uma amostra contrariam ou não tal afirmação. Posto de outra forma, a finalidade desses testes é avaliar afirmações sobre os valores de parâmetros populacionais. 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Quando estudamos os estimadores, vimos que estatísticas amostrais como médias e proporções podem servir de estimativas pontuais dos correspondentes parâmetros populacionais. Vimos também que, em razão da variabilidade inerente à amostragem aleatória, as estatísticas amostrais tendem a aproximar, no lugar de igualar, os parâmetros da população. Daí, o ponto capital do teste de hipótese é se a diferença entre o valor alegado de um parâmetro populacional e o valor de uma estatística amostral pode ser razoavelmente atribuído à variabilidade amostral ou se a discrepância é grande demais pra ser encarada assim. 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Considere a seguinte situação: O fornecedor garante que não haverá mais de 6% de peças defeituosas em cada remessa. Inspeciona-se uma amostra de 142 peças de uma grande remessa, encontrando-se 8% defeituosas. Os testes nos ajudarão a verificar se o fornecedor está mentindo ou não. 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO O primeiro passo para isso consiste em formular duas hipóteses sobre a afirmação. Uma hipótese a ser testada é que a percentagem real de peças defeituosas em todo o lote é maior que 6%. Outra hipótese seria a de que a afirmação do fornecedor é verdadeira. Mas, se a afirmação do fornecedor é verdadeira, qual será a razão de uma amostra ter acusado 8% de defeituosas? Uma possibilidade é que a variação amostral tenha sido responsável. 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO De maneira mais formal, vamos colocar da seguinte forma: A hipótese de que a afirmação é verdadeira é chamada de hipótese nula (H0 – “H zero”). A hipótese de que a afirmação é falsa é chamada de hipótese alternativa(H1 – “H um” ou HA). 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO No exemplo, a hipótese nula é que a verdadeira percentagem de defeituosas é de 6% (pois foi o que o fornecedor disse). Podemos reescrevê-la da seguinte maneira: H0: p=6% Nossa alternativa é que a percentagem de defeituosas, p, é maior que 6%: H1 > 6% 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Se, após nossa análise, a decisão é aceitar H0, a implicação é que a diferença entre a percentagem observada de defeituosas na amostra (8%) e a percentagem alegada pelo fornecedor para todo o lote (6%) e mais provavelmente devida à variação casual na amostra. Por outro lado, a decisão de rejeitar H0 implicaria que a variação entre o valor observado e o valor alegado é grande demais para ser devida apenas ao acaso. 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO O segundo passo no processo de teste de significância consiste em identificar a distribuição amostral adequada, pois ela descreverá completamente a variação. No exemplo, como estamos lidando com proporções amostrais e com um grande tamanho de amostra (n=142), a distribuição amostral adequada é a distribuição normal com média p e desvio 𝜎𝑝 = 𝑝(1 − 𝑝) 𝑛 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Assim, se a afirmação do fornecedor é verdadeira, nossa proporção amostral de 8% provém de uma distribuição amostral com média de 6% e desvio padrão de (0,06)*(0,94)/142 = 0,02 Podemos ver que a discrepância de 2% está a um desvio padrão do valor esperado, supondo que 0,06 seja a verdadeira proporção populacional: 𝑍 = 𝑝 − 𝑝 𝜎𝑝 = 0,08 − 0,06 0,02 = +1,0 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Quando avaliamos o valor de Z=1 na distribuição normal, temos que: 0,06 0,08 Z=1 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Quando avaliamos o valor de Z=1 na distribuição normal, temos que: 0,06 (Z=0) 0,08 (Z=1) 0,1587 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Quando avaliamos o valor de Z=1 na distribuição normal, temos que: A probabilidade de se obter uma diferença superior a 8% com uma amostra de 142 extraída de uma população com proporção de 6% é de 16%. 0,06 0,08 Z=1 0,1587 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Quando avaliamos o valor de Z=1 na distribuição normal, temos que: A probabilidade de se obter uma proporção de peças defeituosas superior a 8% com uma amostra de 142 extraída de uma população com proporção de 6% é de 16%. 0,06 0,08 Z=1 0,1587 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Em outras palavras, se pegarmos 100 amostras, é possível que em 16 delas, seja possível observar 8% ou mais de peças defeituosas. Isso parece sugerir que o valor de 8% pode ter ocorrido apenas ao acaso. Assim, não temos evidência significativa para dizer que que o fornecedor estava errado. 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Por outro lado, se tivéssemos uma proporção amostral de 19% (no lugar de 8%), então 𝑍 = 𝑝 − 𝑝 𝜎𝑝 = 0,19 − 0,06 0,02 = +6,5 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Por outro lado, se tivéssemos uma proporção amostral de 19% (no lugar de 8%), então 𝑍 = 𝑝 − 𝑝 𝜎𝑝 = 0,19 − 0,06 0,02 = +6,5 0 6,5 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Por outro lado, se tivéssemos uma proporção amostral de 19% (no lugar de 8%), então 𝑍 = 𝑝 − 𝑝 𝜎𝑝 = 0,19 − 0,06 0,02 = +6,5 0 6,5 ~ 0 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Parece muito pouco provável que tal estatística amostral provenha de uma população com o parâmetro alegado de 6%. Em tal caso, estaríamos inclinados a rejeitar H0. 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO É claro que nem todas as situações são tão óbvias que podem ser tratadas “a olho” como a presente. É preciso um método mais rigoroso para abordar o problema. A questão é: onde podemos traçar a linha divisória entre o que pode ser razoavelmente considerado como variação casual e o que deve ser considerado como variação significativa? 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Para responder essa pergunta, consideremos o seguinte: Aproximadamente 5% das estatísticas amostrais produzem um Z maior que +1,65. 0 +1,65 5% 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Para responder essa pergunta, consideremos o seguinte: Aproximadamente 5% das estatísticas amostrais produzem um Z maior que +1,65. Assim, embora o valor amostral esperado seja 6%, 5% das estatísticas amostrais possíveis terão valores que excedem 𝑝 + 1,65𝜎𝑝 Logo, se aceitarmos Z=1,65 como linha divisória, há um risco de 5% de rejeitar H0, quando ela de fato é verdadeira. Outra possibilidade consistiria em usar Z=2,33 como nosso “valor crítico”, pois então haveria apenas cerca de 1% de chancede observar uma estatística amostral tão extrema quanto aquela quando H0 é verdadeira. 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Comumente, os valores críticos escolhidos para os testes de significância são os que dão os riscos de 5%, 2,5% e 1% de rejeitar H0 quando ela é verdadeira. Esses valores de 5%, 2,5% e 1% são chamados de nível de significância do teste e são designados pela letra 𝛼 (alfa). Então, o nível de significância de um teste é a probabilidade de uma hipótese nula ser rejeitada, quando verdadeira. 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO O terceiro passo num teste estatístico consiste em escolher um nível de significância aceitável. Isso indicará um valor crítico correspondente que servirá de padrão de comparação. Iremos comparar esse valor crítico ao valor de Z calculado (que vamos chamar de estatística do teste). Se o valor da estatística do teste for menor que o valor crítico, aceita-se H0. 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO A essência de um teste de significância consiste, então, em particionar uma distribuição amostral – com base na suposição de H0 ser verdadeira – em uma região de aceitação e uma região de rejeição. Escolhe-se um valor crítico com base no nível de significância, que indica a probabilidade de erro que o analista está disposto a aceitar. Calcula-se uma estatística do teste (no caso do exemplo, o Z) com base nos dados amostrais e compara-se com o valor crítico. Se o valor da estatística do teste for maior que o valor crítico, o teste sugere que H0 deve ser rejeitada (isto é, que não é só a variabilidade amostral que responde pelo alto valor encontrado). 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Distribuição amostral baseada no parâmetro alegado Região Crítica ou de Rejeição Zalfa = valor crítico Região de Aceitação 𝛼% Nível de significância 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Distribuição amostral baseada no parâmetro alegado Região Crítica ou de Rejeição Região de Aceitação 𝛼% Nível de significância Zalfa = valor crítico 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Distribuição amostral baseada no parâmetro alegado Região Crítica ou de Rejeição Região de Aceitação 𝛼% Nível de significância Zalfa = valor crítico Se você calcular Z e ele estiver neste intervalo (ou seja, Z < Zalfa), isso quer dizer que a estatística do teste está dentro da região de aceitação e podemos aceitar H0. Rejeita H0 se a estatística do teste está neste intervalo. 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Passo a passo: Passo 1: Fixe qual a hipótese nula, H0, a ser testada e qual a hipótese alternativa (H1); Passo 2: Use a teoria estatística e as informações disponíveis para decidir qual estatística será usada para julgar a hipótese (média, variância, proporção, etc.). Não se esqueça de levantar as propriedades dessa estatística. Passo 3: Fixe o nível de significância (𝛼) e use esse valor pra construir a região crítica. Passo 4: Use as informações fornecidas pela amostra para encontrar o valor da estatística do teste (Z, t, 𝜒2, etc.) que definirá a decisão. Passo 5: Se o valor da estatística do teste pertencer à região crítica (Z>Zalfa), rejeite H0; caso contrário, não rejeite. 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Voltando ao exemplo do início: O fornecedor garante que não haverá mais de 6% de peças defeituosas em cada remessa. Inspeciona-se uma amostra de 142 peças de uma grande remessa, encontrando-se 8% defeituosas. 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Passo 1: Fixe qual a hipótese nula, H0, a ser testada e qual a hipótese alternativa (H1); H0: p=0,06 H1: p>0,06 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Passo 1: Fixe qual a hipótese nula, H0, a ser testada e qual a hipótese alternativa (H1); H0: p=0,06 H1: p>0,06 Passo 2: Use a teoria estatística e as informações disponíveis para decidir qual estatística será usada para julgar a hipótese (média, variância, proporção, etc.). Não se esqueça de levantar as propriedades dessa estatística. Como estamos lidando com proporções amostrais e com um grande tamanho de amostra (n=142), a distribuição amostral adequada é a distribuição normal com média p e desvio 𝜎𝑝 = 𝑝(1 − 𝑝) 𝑛 . Logo, 𝑝~𝑁(0,06; 0,022) 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Passo 3: Fixe o nível de significância (𝛼) e use esse valor pra construir a região crítica. Usemos 𝛼=5%, então Zalfa=+1,65. Ou seja, a região crítica é dada por todos aqueles valores de Z que são maiores que Zalfa=+1,65. 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Passo 3: Fixe o nível de significância (𝛼) e use esse valor pra construir a região crítica. Usemos 𝛼=5%, então Zalfa=+1,65. Ou seja, a região crítica é dada por todos aqueles valores de Z que são maiores que Zalfa=+1,65. Passo 4: Sob H0, use as informações fornecidas pela amostra para encontrar o valor da estatística do teste (Z, t, 𝜒2, etc.) que definirá a decisão. 𝑍 = 𝑝 − 𝑝 𝜎𝑝 = 0,08 − 0,06 0,02 = +1,0 5.1 FORMULAÇÃO GERAL DE UM TESTE ESTATÍSTICO Passo 3: Fixe o nível de significância (𝛼) e use esse valor pra construir a região crítica. Usemos 𝛼=5%, então Zalfa=+1,65. Ou seja, a região crítica é dada por todos aqueles valores de Z que são maiores que Zalfa=+1,65. Passo 4: Sob H0, use as informações fornecidas pela amostra para encontrar o valor da estatística do teste (Z, t, 𝜒2, etc.) que definirá a decisão. 𝑍 = 𝑝 − 𝑝 𝜎𝑝 = 0,08 − 0,06 0,02 = +1,0 Passo 5: Se o valor da estatística do teste pertencer à região crítica (Z>Zalfa), rejeite H0; caso contrário, não rejeite. Como Z < Zalfa (+1,0 < +1,65), não podemos rejeitar H0. Assim, é possível que o fornecedor esteja certo e que o valor acima de 6% que observamos aconteceu por acaso.
Compartilhar