Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
* Aula 13 Teste de Hipóteses Parte I * amostra 1. Introdução * Os testes de hipóteses são realizados para verificar se a estatística estimada a partir da amostra deve ou não ser aceita. Agora veremos outro tipo de inferência estatística, os testes de hipóteses. * Exemplo: Um agrônomo deve decidir se realiza ou não correção do pH do solo. Para uma maior produção é necessário que no momento do plantio o pH do solo esteja básico, ou seja, maior que 7,0. Para verificar o pH do solo, foram coletadas 50 amostras. A partir destas 50 amostras o agrônomo verificou que o pH médio do solo é de 6,8 com desvio padrão igual a 0,8. Baseando-se nestas informações amostrais o agrônomo deve fazer a correção do pH do solo? * Na prática seria impossível medir o pH de cada m2 da área destinada ao plantio O agrônomo deve fazer uma estimativa a partir de uma amostra. Ao utilizar uma amostra de solo o agrônomo estará lidando com leis de probabilidades e qualquer afirmação a respeito do pH do solo de toda a área reservada para o plantio poderá estar certa ou errada. * O teste de hipóteses permite medir as probabilidades (de erro ou acerto) envolvidas na sua tomada de decisão. * Teste de hipótese: é uma regra que permite com base em informações de uma amostra, decidir pela rejeição ou não de uma hipótese 2. Conceitos Básicos * A hipótese nula é a hipótese na qual se especifica o valor do parâmetro da população ou a distribuição a testar. A hipótese nula é denotada por H0. A hipótese nula será verdadeira exceto se for obtida evidência em contrário. 2.1 Hipóteses do teste * A hipótese alternativa ou experimental é a hipótese que inclui todos os valores da população não cobertos pela hipótese nula e é denotada por H1. A hipótese alternativa será “verdadeira” se a hipótese nula for rejeitada ou falsa. * No exemplo, as hipóteses estatísticas podem ser: Ho: a propriedade apresenta pH médio do solo () igual a 7,0 HA: a propriedade apresenta pH médio do solo () menor que 7,0 A notação correta seria Ho: = 7,0 HA: < 7,0 * Não rejeitar a hipótese nula (Ho) quando ela é verdadeira é uma decisão correta. No nosso exemplo significa aceitar que o pH do solo da área para plantio é igual a 7,0 (mesmo que na amostra tenha sido igual a 6,8). O agrônomo tomará a decisão correta se resolver não fazer a correção do pH do solo. * Rejeitar a hipótese nula também pode ser uma decisão correta, no caso, significa fazer a correção do pH do solo porque não há indícios suficientes para aceitar que o pH da área seja igual a 7,0 e sim que o pH é menor que 7,0. * Quando devo rejeitar uma hipótese? Deve-se dispor de um procedimento que mostre claramente quando não rejeitar H0 e, consequentemente, rejeitar H1, ou vice-versa. * 3. Procedimento geral para testes de hipóteses a) Definir a hipótese nula e a hipótese alternativa. b) Fixar o nível de significância do teste ( ). c) Calcular a estatística do teste (t, z, , 2). d) Construir a região crítica do teste. e) Conclusão do teste. * As hipóteses do teste devem ser especificadas em termos de parâmetros populacionais, usando , > ou <. a) Definir a hipótese nula e a hipótese alternativa. Por exemplo, pode-se formular a hipótese que o pH do solo da área para plantio é, em média, menor ou igual a 7,0 Formalmente isso é escrito como: * Ou ainda, formular a hipótese que o pH do solo da área para plantio é maior que 7,0. Formalmente isso é escrito como: Ou ainda, formular a hipótese que o pH do solo da área para plantio é diferente de 7,0. Formalmente isso é escrito como: * Assim, o aluno deve aprender que em todo processo de decisão estatística, além da hipótese nula Ho existe a hipótese alternativa HA. Todo o processo decisório será feito em função de Ho, ou seja, não rejeitar ou rejeitar Ho. * Logo, só rejeitaremos HA somente se a hipótese nula, Ho, não for rejeitada. É convenção colocar na Hipótese nula Ho o sinal de igualdade, embora, via de regra, seja a negação da hipótese alternativa. Na prática veremos que os testes já têm as hipóteses formuladas. * Na maioria dos casos a hipótese nula Ho coloca-se com o expresso propósito de ser rejeitada, se for rejeitada, pode-se não rejeitar a hipótese alternativa. A hipótese alternativa H1 é a definição operacional da hipótese de pesquisa, que é a predição deduzida da teoria que está sendo testada. * Exemplo Ho: Em média, a produtividade não se altera com o treinamento. (c = s) H1: Em média, a produtividade cresce com o treinamento. (c > s) Outras hipóteses alternativas seriam H1: Em média, a produtividade decresce com o treinamento. (c < s) H1: Em média, a produtividade cresce ou decresce com o treinamento. (c s) (Bilateral) Um método de treinamento é aplicado para aumentar a produtividade dos funcionários de uma empresa. * b.1) Tipos de erro Existem dois tipos de erro ao tomarmos uma decisão em um teste de hipótese. O primeiro erro é rejeitar a hipótese nula (Ho) quando ela é verdadeira, chamado de erro de tipo I; no nosso exemplo, significa não fazer a correção do pH quando este seria o procedimento correto. b) Fixar o nível de significância do teste ( ). O erro tipo I corresponde ao nível de significância do teste () * A teoria estatística nos possibilita medir todas as probabilidades envolvidas na questão, logo podemos nos prevenir, controlando a probabilidade de cometer o erro mais grave. A probabilidade de cometer o erro de tipo I (rejeitar a hipótese nula Ho quando ela é verdadeira) é simbolizada por alfa (), também, conhecida como nível de significância. * Na prática, os valores usuais de alfa são = 0,01 (1%) = 0,05 (5%) = 0,10 (10%) Assim, = nível de significância erro de tipo I = P (Rejeitar Ho / Ho é verdadeira) 1 - = P(aceitar H0 / H0 é verdadeira) * O segundo erro é aceitar a hipótese nula (Ho) quando ela é falsa, chamado de erro de tipo II, no exemplo significa não fazer a correção sendo que o pH do solo é menor que 7,0. Neste caso o agrônomo estaria correndo um risco de não fazer a correção e ter perdas de produtividade ao final do processo de produção. * A probabilidade de cometer o erro de tipo II (aceitar a hipótese nula Ho quando ela é falsa) é simbolizada por beta (), que está relacionado com o poder do teste. = P (Aceitar Ho / Ho é falsa) erro de tipo II 1 - = P(rejeitar H0 / H1 é verdadeira) = (poder do teste) * Realidade Ho falsa Decisão correta (1- α) (1 – β) D e c i s ã o Tipos de Erros Erro tipo I (α) Decisão correta Erro tipo II (β) Ho verdadeira * No exemplo H0 indica que o pH do solo é básico e não é necessário fazer a calagem do solo. H1 indica que o pH do solo é ácido e é aconselhável fazer a calagem do solo. * * Se p < α => Rejeitar H0, aprova-se H1. Os dados mostram que há evidência estatística suficiente para aprovar H1. Se p ≥ α => Não rejeitar H0, não se aprova H1. Os dados NÃO mostram evidência estatística suficiente para aprovar H1. Cuidado com os casos de fronteira: p α. b.2) Probabilidade de significância ou valor p É a probabilidade de se cometer um erro ao rejeitar a hipótese nula * p ≥ 0,10 => Não existe evidência contra H0 p < 0,10 => Fraca evidência contra H0 p < 0,05 => Evidência significativa contra H0 p < 0,01 => Evidência altamente significativa contra H0 Algumas interpretações para o valor p * c) Calcular a estatística do teste (t, z, , 2). É o valor calculado a partir da amostra, que será usado na tomada de decisão. A decisão do teste de hipótese é tomada após comparar o valor calculado da estatística do teste com o valor da tabela estatística. * Existem testes específicos para cada estimativa que se queira validar. Assim, existe teste para a média, para variância, para a proporção... Cada teste tem uma estatística própria que pode ser a t, z, , 2 * A escolha do teste dependerá de critérios como: Número de observações Número de amostras Tipo de variáveis Relação entre os dados Tipo de distribuição * c.1) Cálculo das estatísticas z e t Escolhido o teste é só calcular o valor da estatística. Em testes de hipóteses para uma média podem ser usadas as estatísticas z ou t, conforme será ensinado mais adiante. Nesse teste essas estatísticas são calculadas por meio das expressões: * d) Construção da região crítica do teste. A região crítica é a região onde Ho é rejeitada. A área da região crítica é igual ao nível de significância (), que estabelece a probabilidade de rejeitar Ho quando ela é verdadeira. * Para construir a região crítica do teste o primeiro passo é identificar se este é unilateral ou bilateral. * d.1) Testes Unilaterais Em um teste unilateral, a hipótese alternativa (H1) diz que o parâmetro é maior (unilateral à direita) ou menor (unilateral à esquerda) que o valor estipulado na hipótese nula. * No exemplo dado o teste realizado é do tipo unilateral a hipótese alternativa (H1) diz que o parâmetro é menor (unilateral à esquerda) que o valor estipulado na hipótese nula. * d.2) Testes Bilaterais O teste bilateral é empregado quando se deseja detectar variações no parâmetro, tanto para mais quanto para menos. A hipótese alternativa (H1) diz que o parâmetro é diferente () do valor estipulado na hipótese nula. * Resumindo: Unilateral à direita: Ho: = 7,0 H1:: > 7,0 Unilateral à esquerda: Ho: : = 7,0 H1: : < 7,0 Bilateral: Ho: : = 7,0 H1:: 7,0 /2 /2 * Região de rejeição ou região crítica: é aquela em que se rejeita a hipótese nula H0. Região de aceitação: é aquela em que não se rejeita a hipótese nula H0. d.3) Região crítica * Regra de Decisão: Quando o valor da estatística do teste cair na região crítica, rejeita-se Ho. Ao rejeitar a hipótese nula (Ho) existe uma forte evidência de sua falsidade. Ao contrário, quando não rejeitamos, dizemos que não houve evidência amostral significativa no sentido de permitir a rejeição de Ho. * A decisão torna-se mais simples quando analisada graficamente. No exemplo, um teste bilateral: Os valores que delimitam a região crítica são obtidos nas tabelas associadas às estatísticas de teste calculadas (tabela z, tabela t de Student, tabela do qui-quadrado, tabela F). * d.4) Casos específicos de regiões críticas região crítica do teste unilateral à direita A figura abaixo apresenta as regiões de aceitação e rejeição da hipótese nula H0 para o nível de significância de 0,05, teste unilateral a direita, distribuição Z, sendo o raciocínio equivalente para a distribuição t * região crítica do teste unilateral à esquerda A figura abaixo apresenta as regiões de aceitação e rejeição da hipótese nula H0 para o nível de significância de 0,05, teste unilateral à esquerda ,distribuição Z, sendo o raciocínio equivalente para a distribuição t * região crítica do teste bilateral A figura abaixo apresenta as regiões de aceitação e rejeição da hipótese nula H0 para o nível de significância de 0,05, teste bilateral, distribuição Z, sendo o raciocínio equivalente para a distribuição t * Deve-se comparar os valores absolutos Zt(z da tabela) e Zc(z calculado). Se Zt<Zc ou tt<tc o valor observado está fora da área de aceitação da hipótese nula. Nesse caso, deve-se rejeitar a hipótese nula. * Aceitar Ho, implica que a hipótese nula não pode ser rejeitada! Rejeitar Ho implica que temos evidências estatísticas para rejeitá-la com um risco conhecido : . e) Conclusão do teste * 4. Classificação dos testes de hipóteses Testes Paramétricos ou Não Paramétricos Distribuição População é Conhecida Inferências Relativas a um ou vários Parâmetros Variáveis quantitativas Testes Paramétricos * Testes Não Paramétricos Distribuição População Normalmente Desconhecida Geralmente, não envolvem parâmetros Não se faz suposição sobre as medidas da variável de interesse * 5. Principais testes paramétricos Teste de hipótese para a média populacional Teste de hipótese para a variância populacional Teste de hipótese para a proporção populacional Teste de hipótese para a comparação entre duas médias Teste de hipótese para a comparação entre duas ou mais médias Teste de hipótese para a comparação entre duas proporções * *
Compartilhar