Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Testes de Hipóteses Profa.: Andreia A. C. Silva Texto extraído e modificado a partir do Portal Action (www.portalaction.com.br) Introdução Neste capítulo, vamos discutir as ideias fundamentais sobre testes de hipóteses. Ao ser feita determinada afirmação sobre uma população, mais especificamente sobre um parâmetro dessa população, é natural desejar saber se os resultados experimentais provenientes de uma amostra contrariam, ou não, tal afirmação. Para isso, fazemos um teste de hipóteses. Nesta seção vamos estudar o procedimento básico de teste de hipótese sobre determinado parâmetro de uma população. Vamos supor uma situação em que um fabricante quer saber se um determinado tipo de barra produzido por sua fábrica atende a exigência de ter um comprimento médio de 70 cm. Na verdade, o que o fabricante está fazendo é levantando hipóteses sobre uma característica (parâmetro), neste caso a média μ (média do comprimento), de sua produção (população) de barras. Eventualmente ele poderia fazer conjecturas a respeito da distribuição da variável comprimento de barra, ou ainda, poderia estar questionando a proporção de defeituosas, etc. Essas conjecturas ou suposições são chamadas de hipóteses estatísticas. De maneira genérica, podemos enunciar: hipótese estatística é uma afirmação ou conjectura sobre um parâmetro, ou parâmetros. Uma hipótese estatística, como a formulada acima em relação a média dos comprimentos das barras, é chamada de Hipótese Nula e será denotada por H0. O termo "Hipótese Nula" é usado para ver se alguma hipótese estabelecida inicialmente pode ser rejeitada ou não. A ideia de se estabelecer uma hipótese nula é comum mesmo em um raciocínio não-estatístico. É exatamente o que é feito em processos criminais, onde um acusado (réu) é dito ser inocente até que se prove o contrário. A pressuposição de inocência é uma hipótese nula. A hipótese que usamos como alternativa à hipótese nula, isto é, a hipótese que aceitamos quando a hipótese nula é rejeitada é chamada Hipótese Alternativa e será denotada por H1. Assim, considerando o exemplo do réu, formulamos as hipóteses: Observação: Alguns autores denotam H1 por HA. Agora voltemos ao exemplo introdutório do fabricante de barras. O tal fabricante está interessado em decidir se as barras tem uma média igual a 70 cm ou diferente de 70 cm. Nesse caso, as hipóteses seriam: Ainda com relação a esse exemplo poderíamos ter hipóteses do tipo: Em todas as situações a hipótese nula H0 é do tipo "simples", enquanto que H1 é do tipo "composta" em (1), (2), (3), e do tipo "simples" em (4). Casos como as situações (1) e (2) são chamados de testes unilaterais. Consideremos, agora, um exemplo para ilustrarmos a situação (1). Exemplo 1: Um gerente de produção está estudando a possibilidade de comprar uma nova máquina de estampar partes metálicas. Seja μ0 o número médio de partes estampadas por hora pela máquina velha e μ a média da máquina nova. O gerente não quer comprar a máquina nova a menos que ela seja mais produtiva que a máquina velha. Vamos encontrar as hipóteses. O gerente deve usar a hipótese nula μ = μ0 e a hipótese alternativa μ > μ0. Ou seja, Assim, o gerente deve optar por comprar a máquina nova somente se a hipótese nula for rejeitada. Região de Rejeição: A região de rejeição ou região crítica (RC) é o conjunto de valores assumidos pela estatística de teste para os quais a hipótese nula é rejeitada. Seu complementar é a região de aceitação (RA). No exemplo 1, tomamos o estimador para o parâmetro de interesse μ para determinarmos a regra de decisão, que é definida por: rejeitamos H0 se , no qual XC é o valor crítico para a média amostral. Se a média amostral for maior que o valor crítico XC, temos evidência para assumir que a média da população é maior que μ0. Assim, no caso do exemplo 1 temos evidência para assumir que a nova máquina apresenta uma média de produção maior que a máquina velha. A região que nos leva a rejeição da hipótese H0 , é a região de rejeição (ou região crítica). X C X X CC X X R Para cada tipo de hipótese determinamos uma região de rejeição apropriada, sempre conforme a hipótese H1. Por exemplo, para testarmos as hipóteses tomamos como região crítica Os valores XC1 e XC2 são os valores críticos para o teste. Erros cometidos nos testes de hipóteses São dois os tipos de erros que podemos cometer na realização de um teste de hipóteses: - Rejeitar a hipótese H0, quando ela é verdadeira. - Não rejeitar a hipótese H0, quando ela é falsa. A tabela a seguir resume as situações acima. Se a hipótese H0 for verdadeira e aceita, ou for falsa e rejeitada, a decisão estará correta. No entanto, se a hipótese H0 for rejeitada sendo verdadeira, ou se for aceita sendo falsa, a decisão estará errada. O primeiro destes erros é chamado de Erro do Tipo I e a probabilidade de cometê-lo é denotada pela letra grega (alfa); o segundo é chamado de Erro do Tipo II e a probabilidade de cometê-lo é denotada pela letra grega (beta). Considere um teste unilateral dado pelas hipóteses: Neste caso, a região de rejeição é determinada por , e a interpretação dos erros pode ser vista como: C X X A situação ideal é aquela em que ambas as probabilidades, e , são próximas de zero. No entanto, é fácil ver que a medida que diminuimos , aumenta. A Figura a seguir apresenta esta relação. Para um teste de hipóteses do tipo anterior, onde estamos interessados em testar a média de uma população, utilizamos a expressão que é a estatística do teste de hipóteses. A partir do Teorema Central do Limite, sabemos que, desde que tenhamos um tamanho amostral suficientemente grande, esta estatística tem Distribuição Normal Padrão, isto é, A partir dos valores de Z e da especificação do erro cometido, podemos definir a região crítica. Vamos considerar que o erro mais importante a ser evitado seja o Erro do Tipo I. A probabilidade de ocorrer o erro do tipo I () é denominada nível de significância do teste. O complementar do nível de significância (1 - ) é denominado nível de confiança. Supondo que o nível de significância seja conhecido, temos condições de determinar o(s) valor(es) crítico(s). Se considerarmos o teste bilateral: Se considerarmos o teste unilateral à direita a região crítica é representada segundo a figura abaixo. E, se considerarmos o teste unilateral à esquerda a região crítica é representada segundo a figura abaixo. Os valores -Zα e Zα nas duas últimas figuras são tais que as áreas à esquerda e à direita, respectivamente, sob a Curva Normal Padrão, valem . Agora, os valores -Zα/2 e Zα/2, na primeira figura, são tais que as áreas à esquerda e à direita, respectivamente, sob a Curva Normal Padrão, valem . 2 α Como foi dito inicialmente, o objetivo do teste de hipótese é determinar, através de uma estatística, se a hipótese nula é aceitável ou não. Essa decisão é tomada considerando a Região de Rejeição ou Região Crítica (RC). Caso o valor observado da estatística pertença à região de rejeição, rejeitamos H0; caso contrário, não rejeitamos H0. Analogamente, definimos a região de aceitação (complementar da região de rejeição): caso o valor observado pertença à região de aceitação, não rejeitamos H0; se não pertencer, rejeitamos. Se o nível de significância é 0,05, os valores críticos são -1,645 ou 1,645 para as alternativas unilaterais e -1,96 e 1,96 para a alternativa bilateral; se o nível de significância é 0,01, os valores críticos são -2,33 ou 2,33 para as alternativas unilaterais e -2,575e 2,575 para a alternativa bilateral (valores obtidos na Tabela da distribuição Normal). A tabela a seguir apresenta alguns critérios para o teste de hipótese. Exemplo 2: Um supervisor da qualidade quer testar, com base numa amostra aleatória de tamanho n = 35 e para um nível de significância α = 0,05, se a profundidade média de um furo numa determinada peça é 72,4mm. O que podemos falar se ele obteve média = 73,2mm e se sabe, de informações anteriores, que σ = 2,1mm? x 5. Conclusão: Como Zobs = 2,25 > 1,96, a hipótese nula deve ser rejeitada. Em outras palavras, a diferença entre x =73,2 e μ = 72,4 é significativa. Veja a figura abaixo Início Identificar a afirmação ou hipótese específica a ser testada e colocá-la em forma simbólica. Dar a forma simbólica que deve ser verdadeira quando a afirmação original é falsa. Das duas expressões simbólicas obtidas até agora, a hipótese nula Ho é a que contém a condição de igualdade; H1 é a outra afirmação. Escolher o nível de significância com base na gravidade de um erro tipo I. Tomar pequeno se as consequências da rejeição de uma Ho verdadeira são sérias. São muito comuns os valores 0,05 e 0,01. Método Tradicional de teste de hipóteses. 1 2 3 4 Identificar a estatística relevante para este teste e determinar sua distribuição amostral. 5 Determinar a estatística de teste, os valores críticos e a região crítica. Esboçar um gráfico e incluir a estatística de teste, o(s) valor(es) crítico(s) e a região crítica. 6 Rejeitar Ho se a estatística de teste está na região crítica. Não rejeitar Ho se a estatística de teste não está na região crítica. 7 Reformular a decisão precedente em termos simples, não técnicos. 8 Fim Exemplo 3: Funcionários de uma grande firma de contabilidade afirmam que a média dos salários dos contadores é menor que a de seu concorrente, que é de $45.000. Uma amostra de 30 dos contadores da firma tem média de salário de $43.500 com desvio padrão d $5200. Com = 0,05, teste a afirmação dos funcionários. Solução: A afirmação é: “ a média dos salários é menor que $45.000”. Então a hipótese nula e a alternativa podem ser escritas como: $45000:Ho $45000:H 1 (afirmação) Em razão de o teste ser unicaudal à esquerda e o nível de significância ser = 0,05, o valor crítico é zo = -1,645 e a região de rejeição é z < -1,645. A estatística do teste padronizada é: nσ μ - x z 1,58- 305200 45000 - 43500 O gráfico mostra a localização da região de rejeição e da estatística de teste padronizado z. Em virtude de z não estar na região de rejeição, você falha em rejeitar a hipótese nula. Interpretação: Não há evidência suficiente no nível de significância de 5% para apoiar a afirmação dos funcionários de que a média do salário é menor que $45000. Exemplo 4: O departamento de agricultura dos Estados Unidos reporta que o custo médio para se criar um filho até a idade de 2 anos na zona rural é de $10.460. Você acredita que este valor está incorreto, então você seleciona uma amostra aleatória de 900 crianças (com idade de 2 anos) e descobre que a média dos custos é $10.345 com desvio padrão de $1.540. Com = 0,05, há evidência para concluir que a média de custo é diferente de $10.460? Solução: A afirmação é: “a média de custos é diferente de $10.460”. Então a hipótese nula e a alternativa podem ser escritas como: $10.460:Ho (afirmação) $10.460:H1 Em razão de o teste ser bicaudal e o nível de significância ser = 0,05, os valores críticos são: -zo = -1,96 e zo = 1,96. As regiões de rejeição são z < -1,96 e z > 1,96. A estatística do teste padronizada é: nσ μ - x z 2,24- 9001540 10460 - 10345 O Método do Valor P para o Teste de Hipóteses Níveis observados de significância: valores p Uma maneira de reportar os resultados de um teste de hipóteses é estabelecer que a hipótese nula foi ou não foi rejeitada com um valor especificado de , ou nível de significância. Isso é chamado de teste de nível de significância fixo. Valor p O valor p é o menor nível de significância que conduz à rejeição da hipótese nula Ho, com o dados fornecidos. Início Identificar a afirmação ou hipótese específica a ser testada e colocá-la em forma simbólica. Dar a forma simbólica que deve ser verdadeira quando a afirmação original é falsa. Das duas expressões simbólicas obtidas até agora, a hipótese nula Ho é a que contém a condição de igualdade; H1 é a outra afirmação. Escolher o nível de significância com base na gravidade de um erro tipo I. Tomar pequeno se as consequências da rejeição de uma Ho verdadeira são sérias. São muito comuns os valores 0,05 e 0,01. Método do valor P para o teste de hipóteses. 1 2 3 4 Identificar a estatística relevante para este teste e determinar sua distribuição amostral. 5 Achar o valor p. 6 Reportar o valor p. Alguns estatísticos preferem usar o seguinte critério de decisão: Rejeitar a hipótese nula se o valor p é no máximo igual ao nível de significância . Não rejeitar a hipótese nula se o valor p é maior que o nível de significância . 7 Reformular a decisão precedente em termos simples, não técnicos. 8 Fim Determinação dos valores de P Exemplo (Triola, página 182) Com o auxílio de valor p, teste a afirmação de que a temperatura média dos adultos sadios é igual a 98,6º F. Utilize o nível de significância de 0,05 e os dados amostrais: n = 106, = 98,2º F , s = 0,62, distribuição em forma de sino. X Ho: = 98,6 H1: 98,6 A estatística de teste z = -6,64. Como o teste é bilateral, o valor de P é duas vezes a área à esquerda da estatística de teste z = -6,64. Na tabela, vemos que a área à esquerda de z = -6,64 é 0,0001, e assim o valor de P é 2 x 0,001 = 0,0002. Como o valor p = 0,0002 é menor do que o nível de significância = 0,05, rejeitamos a hipótese nula. Os novos operários de uma empresa são treinados a operarem uma máquina, cujo tempo X (em horas) de aprendizado é anotado. Observou-se que X segue a distribuição N(25,100). Uma nova técnica de ensino, que deve melhorar o tempo de aprendizado, foi testada em 16 novos empregados, os quais apresentaram 20,5 horas como tempo médio de aprendizado. Usando o p-valor, você diria que a nova técnica é melhor que a anterior?
Compartilhar