Baixe o app para aproveitar ainda mais
Prévia do material em texto
Visão Geral • Existem duas grandes áreas em Inferência Estatística: estimação de parâmetros e testes de hipóteses. • Estimação de parâmetros: – Estimação Pontual – Estimação por Intervalo (Intervalos de Confiança) Inferência Estatística Testes de HipótesesTestes de Hipóteses Visão Geral • Em estatística, uma hipótese é uma afirmativa sobre uma característica da população. • Um teste de hipóteses é um procedimento padrão para se testar uma afirmativa sobre uma característica da população. Motivação • Suponha que a distribuição do nível de colesterol para a população de homens hipertensos e fumantes nos Estados Unidos seja aproximadamente normal com uma média µ desconhecida. Motivação • No entanto, sabemos que a média do nível de colesterol para a população geral de todos os homens de 20 a 74 anos é 211 mg/100ml. • Então, ficaríamos admirados se o nível médio de colesterol da subpopulação de homens fumantes e hipertensos fosse 211 mg/100ml. Motivação • Se selecionarmos uma amostra aleatória de 25 homens desse grupo e seu nível médio de colesterol for x = 220 mg/100ml, a média da amostra é compatível com a média suposta de 211 mg/100ml? Motivação • Sabemos que certa variabilidade amostral pode ser esperada. O que acontece se a média amostral é 230 mg/100ml ou 250 mg/100ml? • Qual a distância que 211 precisa estar de x, antes de concluirmos que µ é realmente igual a algum outro valor? Exemplos • Em uma pesquisa experimental, o objetivo pode ser inicialmente o de estimar parâmetros, por exemplo, podemos estar interessados em estimar a produtividade média de uma nova linhagem de milho híbrido. • Porém, o objetivo final pode ser a utilização desta estimativa para outras inferências (considerações). Exemplos • Podemos, por exemplo, comparar esta produtividade com uma linhagem padrão e talvez recomendar que a linhagem padrão seja substituída pela nova. • Em outras situações, podemos estar interessados em verificar se um novo germicida é mais eficaz que um padrão e assim por diante. Introdução • Frequentemente, o objetivo de uma investigação não é somente estimar um parâmetro, mas decidir qual das duas afirmações contraditórias sobre o parâmetro está “correta” (há evidências amostrais para não rejeitar uma afirmação). • Os métodos de decisão compreendem a parte da inferência estatística chamada teste de hipóteses. Hipóteses Estatísticas • Assim, como em estimação assumiremos que podemos obter uma amostra aleatória de uma densidade . • Uma hipótese estatística ou simplesmente hipótese, é uma alegação ou afirmação sobre a distribuição de uma ou mais variáveis aleatórias. Hipóteses Estatísticas • Exemplos: • Se a hipótese especifica completamente a distribuição, então ela é chamada de hipótese simples. Caso contrário, ela é chamada de hipótese composta. Hipóteses Estatísticas • Em qualquer problema de teste de hipóteses, existem duas suposições contraditórias em consideração. • Exemplos: Hipóteses Nula e Alternativa • A hipótese nula, representada por H0, é a alegação inicialmente assumida como verdadeira (a suposição de afirmação de prioridade). É uma afirmativa de que o valor de um parâmetro populacional (proporção, média ou desvio padrão, por exemplo) é igual a um valor especificado. • A hipótese alternativa representada por H1 é a afirmação contraditória a H0. Hipóteses Nula e Alternativa • Estas hipóteses devem ser mutuamente exclusivas. Comentários - H0 e H1 • Há uma analogia familiar a isso em um processo criminal. • Uma alegação é a afirmação de que o acusado é inocente (suposição considerada inicialmente verdadeira). • Somente com presença de forte evidência do contrário é que o júri deve desprezar tal alegação em favor da afirmação alternativa de que o acusado é culpado. Comentários - H0 e H1 • Nesse sentido, a alegação de inocência é a hipótese favorecida ou protegida. • De maneira semelhante, no teste de hipóteses estatísticas, o problema é formulado de modo que uma das alegações seja inicialmente favorecida. Exemplo • Você observa, em uma lata de refrigerante, que o volume médio é de 354 ml. Como você não tem nenhuma informação adicional para validar esta afirmação, ela pode ser vista como uma hipótese que pode ou não estar “correta”. • Problema de teste de hipóteses!!! Exemplo • Para testá-las, deve-se efetuar uma amostra aleatória de n latas para, após a medição de seus volumes, verificar se estes dados dão sustentação ou não ao volume esperado. Testes Unilaterais e Bilaterais Ho : = 354 ml H1 : 354 ml Ho : = 354 ml H1 : < 354 ml ou Ho : = 354 ml H1 : > 354 ml BILATERAL UNILATERAL IMPORTÂNCIA NA DIFERENÇA IMPORTÂNCIA NO SINAL DA DIFERENÇA MENOR MAIOR interesse em mostrar que as latinhas contêm, em média, um volume MENOR / MAIOR que 354 ml. O que é um Teste de Hipóteses? ESTUDO DE UM FENÔMENO FORMULAÇÃO DE HIPÓTESES EVIDÊNCIA AMOSTRAL TESTE DE HIPÓTESE NÃO REJEITA REJEITA Teste de Hipóteses • Um teste de hipóteses é um procedimento ou uma regra de decisão que nos possibilita decidir por H0 ou H1, com base na informação contida na amostra. Teste de Hipóteses • A hipótese nula será rejeitada em favor da hipótese alternativa somente se a evidência da amostra sugerir que H0 seja falsa. • Se a amostra não contradisser fortemente H0, continuaremos a acreditar na hipótese nula. • As duas conclusões possíveis de um teste de hipóteses são rejeitar H0 ou não rejeitar H0. Aceitar/Não Rejeitar H0 • Não podemos aceitar nenhuma hipótese como verdadeira!!! • Devemos reconhecer que não estamos provando a hipótese nula, estamos apenas dizendo que a evidência amostral não é forte o bastante para garantir a rejeição da hipótese nula. Aceitar/Não Rejeitar H0 • Exemplo: Quando um júri não encontra evidência suficiente para condenar um suspeito, o veredito é de não culpado, não se dá um veredito de inocente. • O termo aceitar é, de alguma forma, enganoso, porque parece implicar que a hipótese nula foi provada (É enganoso afirmar que há evidência suficiente para se aceitar a hipótese nula). Aceitar/Não Rejeitar H0 • Caso a amostra coletada não contrarie a hipótese nula, a única afirmação que pode ser feita é a de que não existem evidências estatísticas suficientes para rejeitar H0. • Assim, a hipótese nula não é aceita. Ela é, tecnicamente falando, não rejeitada. Teste de Significância • Não existem evidências estatísticas suficientes para rejeitar H0 : teste estatisticamente não significativo. • Existem evidências estatísticas suficientes para rejeitar H0 : teste estatisticamente significativo. • Teste de Hipóteses ou Teste de Significância. Componentes de um Teste de Hipóteses • Uma estatística de teste é uma função da amostra (variável aleatória) na qual a decisão (rejeitar ou não H0) se baseia. • Valor da estatística de teste: uma função dos dados da amostra (número). • A região de rejeição ou região crítica é o conjunto de todos os valores da estatística de teste para os quais H0 será rejeitada. Componentes de um Teste de Hipóteses • Observação: A hipótese nula será então rejeitada se, e somente se, o valor da estatística do teste calculado ou observado cair na região de rejeição. Componentes de um Teste de Hipóteses • Nível de Significância (denotado por ): • É a probabilidade de rejeitar a hipótese nula quando ela é verdadeira. • São comuns as escolhas 0,05; 0,01 e 0,10. É tipicamente predeterminado. Nível de Significância• O procedimento de teste correspondente é chamado de teste nível (um teste nível 5%, por exemplo). Componentes de um Teste de Hipóteses • Valores Críticos: • Valor, ou valores, que separa(m) a região crítica dos valores da estatística de teste que não levam à rejeição da hipótese nula. • Por exemplo: Teste Bilateral H0: µ = 100 H1: µ 100 Significa menor ou maior que 100 Valores que são significativamente distantes de 100 é dividido igualmente entre as duas caudas da região crítica Não Rejeita H0Rejeita H0 Rejeita H0 Teste Unilateral Direito H0: µ 100 H1: µ > 100 Valores que são significativamente distantes de 100100 Pontos à direita Não rejeita H0 Rejeita H0 Teste Unilateral Esquerdo H0: µ 100 H1: µ < 100 100 Valores que são significativamente distantes de 100 Pontos à Esquerda Não rejeita H0Rejeita H0 Erros em Teste de Hipóteses Erro Tipo I: o erro de rejeitar a hipótese nula quando ela é verdadeira. Erro Tipo II: o erro de deixar de rejeitar a hipótese nula quando ela é falsa. Situação Decisões possíveis Hipótese nula é verdadeira Hipótese nula é falsa Não rejeição da hipótese nula Sem erro Erro Tipo II Rejeição da hipótese nula Erro Tipo I Sem erro Erros em Teste de Hipóteses Verdadeiro Estado da Natureza Decidimos rejeitar a hipótese nula Não rejeitamos a hipótese nula A hipótese nula é verdadeira A hipótese nula é falsa Erro tipo I (rejeição de uma H0 verdadeira) Erro tipo II (não rejeição de uma Ho falsa) Decisão correta Decisão correta Decisão Erros em Teste de Hipóteses • Notação: – : probabilidade de um erro tipo I. – : probabilidade de um erro tipo II. Controle dos Erros Tipos I e II • Dois tipos de erro podem ser cometidos num teste de hipóteses. • Seria ótimo se pudéssemos ter sempre =0 e =0, mas na realidade, isto não é possível, então devemos tentar administrar as probabilidades de erro e . • Procuramos procedimentos para o qual a probabilidade de cometer qualquer tipo de erro seja pequena. Controle dos Erros Tipos I e II • Matematicamente, pode-se mostrar que , e o tamanho amostral n estão todos relacionados, de modo que quando escolhemos ou determinamos quaisquer dois deles, o terceiro fica automaticamente determinado. • A prática usual na pesquisa e na indústria é selecionar os valores de e n de modo que o valor de fica determinado. Controle dos Erros Tipos I e II • Dependendo da gravidade do erro tipo I, tente usar o maior valor tolerável de . • Para erros tipo I com conseqüências mais sérias, selecione valores menores de . • Escolha, então, um tamanho amostral n tão grande quanto razoável, com base em considerações de tempo, custo e outros fatores relevantes. Considerações Práticas • Para qualquer fixo, um aumento no tamanho amostral n causará um decréscimo em . • Para qualquer tamanho amostral n fixo, um decréscimo em causará um aumento em . Reciprocamente, um aumento em causará um decréscimo em . • Para diminuir tanto como , aumente o tamanho da amostra. Proposição • Suponha que um experimento e o tamanho de uma amostra sejam fixos, e que seja escolhida uma estatística de teste. Então, reduzir o tamanho da região de rejeição para obter um menor valor de resulta em um valor maior de para qualquer valor de parâmetro específico consistente com H1. Comentários • Uma vez que a estatística de teste e n (tamanho da amostra) forem fixados, não há região de rejeição que tornará simultaneamente, e todos os ’s pequenos. • Uma região de rejeição deve ser escolhida para cumprir um compromisso entre e . Erros em Teste de Hipóteses • Qual dos dois tipos de erro é o mais grave e que deve ser evitado? Exemplo 1 • Façamos uma analogia com a decisão de um juiz: o que será mais grave? Condenar um inocente ou absolver um culpado? • É claro que será mais grave a condenação de um inocente. Rejeitar a hipótese nula sendo ela verdadeira equivale a condenar um inocente, logo o Erro Tipo I é o mais grave. Exemplo 2 • Estamos testando um novo medicamento (NEW) a ser utilizado no tratamento de AIDS. O tratamento já estabelecido é o AZT e a sua utilização prolonga o tempo de vida do paciente em média por k0 meses. • O laboratório que produz NEW diz que seu medicamento é melhor e coletou informações de 12 pacientes. Exemplo 2 • Note que um erro mais grave é dizer que o NEW é melhor que o AZT quando na realidade não é (e todos os pacientes mudam para um tratamento menos eficaz), do que dizer que NEW não é melhor que AZT quando na realidade ele é ( e todos os pacientes continuam com um tratamento que é comprovado). Comentários • Devido às diretrizes sugeridas para especificar H0 e H1, um erro tipo I geralmente é mais sério que um erro tipo II. • A abordagem adotada será especificar o valor maior de que pode ser tolerado e encontrar uma região de rejeição que tenha esse valor de . Isso torna o menor possível, sujeito ao limite em . Nível de Significância • O valor resultante de é denominado nível de significância do teste. • Esse é o mesmo introduzido na Unidade Estimação Intervalar, onde definimos o nível de confiança para um intervalo de confiança como a probabilidade γ= 1- . • O procedimento de teste correspondente é chamado de teste nível (um teste nível 5%, por exemplo). Nível de Significância • Os níveis tradicionais de significância são 0.10, 0.05 e 0.01, embora o nível dependa da seriedade de um erro tipo I. • Quanto mais sério for esse erro, menor deve ser o nível de significância. Poder do Teste • Usamos β para designar a probabilidade de deixarmos de rejeitar uma hipótese nula falsa (erro tipo II). • Segue que (1 − β) é a probabilidade de rejeitarmos uma hipótese nula falsa, isto é, a probabilidade de se apoiar uma hipótese alternativa verdadeira. • O poder ou potência do teste é dado por (1 − β). Poder do Teste • A probabilidade do erro tipo II (β) pode ser calculada para cada valor do parâmetro consistente com a hipótese alternativa. • Conseqüentemente, um teste de hipóteses pode ter muitos valores diferentes de poder, dependendo dos valores particulares escolhidos como alternativas à hipótese nula. Etapas de um Teste de Hipóteses • Passo 1: Indique o parâmetro de interesse e descreva-o no contexto do problema. • Passo 2: Determine o valor nulo (valor especificado) e a hipótese nula. • Passo 3: Especifique a hipótese alternativa apropriada. Etapas de um Teste de Hipóteses • Passo 4: Valor da estatística de teste - uma função dos dados da amostra na qual a decisão (rejeitar ou não a hipótese nula) se baseia. • Passo 5: Especifique a região de rejeição - conjunto de todos os valores estatísticos do teste para os quais a hipótese nula será rejeitada. A área da região de rejeição é igual ao nível de significância (), que estabelece a probabilidade de rejeitar Ho quando ela é verdadeira. Etapas de um Teste de Hipóteses • Unilateral à direita ou teste de cauda superior: Ho: = 50 H1: > 50 • Unilateral à esquerda ou teste de cauda inferior: Ho: = 50 H1: <50 • Bilateral: Ho: = 50 H1: 50 Etapas de um Teste de Hipóteses • Passo 6 : Decida se a hipótese nula deve ser rejeitada ou não e enuncie a conclusão no contexto do problema. • Critérios de Decisão: – Método Tradicional – Método do Valor P – Método do Intervalo de Confiança Intervalos de Confiança • Um intervalo de confiança de um parâmetro contém os valores prováveis daquele parâmetro.• Devemos portanto, rejeitar uma afirmativa de que o parâmetro populacional tenha um valor que não esteja incluído no intervalo de confiança. Método Tradicional A hipótese nula será então rejeitada se, e somente se, o valor estatístico do teste calculado ou observado cair na região de rejeição (o valor da estatística de teste é comparado com o valor crítico). Método do Valor P • Similar ao método tradicional. • A principal diferença é a maneira pela qual é tomada a decisão para rejeitar a hipótese nula. • O procedimento encontra a probabilidade (Valor P) de obter um resultado e deixamos a decisão para o leitor ou pesquisador. Método do Valor P • Rejeite a hipótese nula se o valor P for menor ou igual a . • Deixe de rejeitar a hipótese nula se o valor P for maior que . • Ao invés de usar um =0.05, por exemplo, simplesmente identificamos o valor P e deixamos a decisão para o leitor. Valor P • É a probabilidade de se obter um valor da estatística de teste que seja, no mínimo, tão extremo quanto aquele que representa os dados amostrais, supondo que a hipótese nula seja verdadeira. Valores P grandes Resultados amostrais não são incomuns. Não é uma diferença significante da hipótese nula. Valores P pequenos Resultados amostrais incomuns. Diferença significante da hipótese nula. InterpretaçãoValor P A estatística de teste está à direita ou à esquerda do centro ? Valor P = área à esquerda da estatística de teste Valor P = 2 vezes a área à esquerda da estatística de teste Valor P = área à direita da estatística de teste Unilateral esquerdo Unilateral direito À direitaÀ esquerda Bilateral Valor P = 2 vezes a área à direita da estatística de teste Que tipo de teste ? µ µ µ µ Valor P Valor P é duas vezes esta área Valor P Estatística de teste Estatística de teste Estatística de teste Estatística de teste Início Valor P é duas vezes esta área
Compartilhar