Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Notas de aula para o curso de Econometria I Nota 3: Estimação por intervalo e testes de hipóteses Thiago Fonseca Morello fonseca.morello@ufabc.edu.br sala 301, Bloco Delta, SBC 1 Estimação por intervalo Para estimar um parâmetro populacional pode-se tomar por base um único valor, a estimativa pontual. Mas é também possível obter um intervalo de valores que contenha o valor procurado. O termo “intervalo” deve ser, desde início, interpretado corretamente. Trata-se de dois limites que contêm, com probabilidade suficientemente alta, o parâmetro populacional. Por exemplo, pode-se construir um intervalo que contenha com 95% de probabilidade o valor efetivo da média populacional, μ. Ou seja, trata-se de tomar I1 e I2 de modo que P(I1 < μ <I2) = 0,95. Este tipo de intervalo é denominado por “intervalo de confiança” com 95% de probabilidade. Um equívoco comum de interpretação da expressão P(I1 < μ <I2) = 0,95 está em entender que 95% é a probabilidade do valor populacional da média, μ, pertencer ao intervalo I1 e I2. Porém μ não é uma variável aleatória, mas uma constante e, portanto, o conceito de probabilidade não pode ser aplicado a ela. A interpretação correta parte da percepção de que o intervalo {I1, I2} é aleatório, de modo que 95% corresponde à probabilidade deste intervalo conter o valor fixo da média populacional. Seja assumido que a amostra disponível, X1, X2,...,XN é aleatória de modo que todas as observações têm média μ e variância σ2, i.e., E[Xi] = μ e V[Xi]= σ2, i=1,...,N. Além disso, todas as observações se distribuem normalmente, i.e., Xi ~ N(μ, σ2), i=1,...,N. Nesta condições, deseja-se obter o intervalo que contém, com 95% de probabilidade, a média populacional, μ. Como limites do intervalo, i.e., I1 e I2, toma-se geralmente a estimativa pontual descontada ou acrescentada por uma margem de erro fixa, ∈, i.e., I1= θை− ∈ e I2 = θை+ ∈, em que θை é o valor observado do estimador θ ou estimativa pontual. 2 É sabido que θ = Xഥ é um estimador não viesado, consistente e eficiente para μ. Além disso, é possível demonstrar que E[Xഥ] = μ, V[Xഥ] = σ2/N e que Xഥ ~ N(μ, σ2/N). Isso quer dizer que, para estimar a média μ, pode-se tomar o intervalo [Xഥை− ∈; Xഥை+ ∈], em que Xഥை é a estimativa pontual, i.e., a média obtida para a amostra. A questão agora está em saber qual deve ser o valor de ∊. Uma vez que se deseja especificar, a priori, a probabilidade ߙ com que o intervalo contém μ, o valor de ∊ pode ser escolhido de maneira a que P(Xഥ− ∈ < μ < Xഥ+ ∈) = ߙ. Este critério para selecionar ∊ pode ser visualizado a partir do gráfico da FD N(μ, σ2/N), que segue abaixo. Por mero fim de clareza, será assumido que α = 95%. Figura 4 Intervalo de confiança para estimação da média populacional Conforme a figura acima indica, o intervalo que se deseja construir é aquele que corresponde à área hachurada sob a curva normal com massa de probabilidade equivalente a 95%. O valor de ∊, portanto, tem de ser compatível com este objetivo. A dificuldade fundamental está em que, para conhecer o valor de ∊ adequado, é necessário conhecer a FD de Xഥ, pois apenas assim pode-se saber quais valores de Xഥ contêm entre si uma massa de probabilidade de 95%. O que requer o conhecimento de μ. Chega-se, pois, a uma circularidade aparentemente intransponível: para calcular o intervalo que contém μ com 95% de probabilidade é preciso conhecer μ. 3 Há, contudo, uma saída. Existe uma variante da FD normal, denominada FD normal padrão, que se caracteriza por ter média (μ) igual a zero e desvio padrão igual à unidade. Sempre é possível, portanto, determinar o intervalo em torno da média da normal padrão (zero, no caso) que corresponde a uma massa de probabilidade desejada. E isso pois a média desta distribuição é sempre zero. Porém, a FD normal em questão não necessariamente é a normal padrão, representada por N(0,1), mas sim a FD N(μ, σ2/N). Na verdade, não se sabe, a priori, quais são os valores de seus parâmetros. A média, por exemplo, pode ser positiva, i.e., μ > 0. Mesmo assim, sempre há, felizmente, uma conexão fundamental entre uma distribuição normal padrão genérica, N(μ, σ2/N), no caso, e a distribuição normal padrão, N(0,1). Esta conexão consiste no fato de que subtraindo Xഥ o valor de sua média populacional, μ, e dividindo o resultado pelo valor populacional do desvio padrão de Xഥ, ඥσଶ ܰ⁄ , gera-se uma VA transformada que tem FD normal padrão, quaisquer que sejam os valores de μ e de σଶ ܰ⁄ , i.e., ଡ଼ ഥିஜ ඥమ ே⁄ ~ܰ(0,1). Desta maneira, pois: P ቆ Xഥ − μ ඥσଶ ܰ⁄ ≤ γቇ = P(Z ≤ γ) = ߜఊ Em que γ é um valor genérico, Z é uma VA com FD N(0,1) e δγ é a massa de probabilidade acumulada até ele. O que implica em: P ቆ−γ ≤ Xഥ − μ σ/√N ≤ γቇ = P(−γ ≤ Z ≤ γ) = 1 − 2δఊ (݅) É preciso considerar mais um fato para resolver o problema, o qual decorre da manipulação a seguir da expressão P(Xഥ− ∈ < μ < Xഥ+ ∈). (1) Subtraindo Xഥ dos dois lados das duas desigualdades: P(Xഥ− ∈ < μ < Xഥ+ ∈) = P(− ∈ < μ − Xഥ < ∈) = P(− ∈ < Xഥ − μ < ∈) (2) Dividindo os dois lados das duas desigualdades obtidas por σ/√N: P(− ∈ < Xഥ − μ < ∈) = P ቆ− ∈ σ/√N < Xഥ − μ σ/√N < ∈σ/√Nቇ Finalmente, pois, pode-se afirmar que Pቀ− ∈ /√ < ଡ଼ഥିஜ /√ < ∈/√ቁ = ߙ (݅݅). Comparando (i) e (ii), tem-se: Pቆ−γ ≤ Xഥ − μ σ/√N ≤ γቇ = P(−γ ≤ Z ≤ γ) = 1 − 2δఊ(݅) 4 Pቆ− ∈ σ/√N < Xഥ − μ σ/√N < ∈σ/√Nቇ = P(Xഥ− ∈ < μ < Xഥ+ ∈) = ߙ (݅݅) Se ߛ for tomado de maneira a que 1 − 2δఊ = ߙ, o intervalo [-ߛ; ߛ] torna-se equivalente ao intervalo [-∈/(σ/√N); ∈/(σ/√N)]. Sendo ߛα tal que P(−γఈ ≤ Z ≤ γఈ) = ߙ , resulta que ∈/(σ/√N) = ߛߙ, i.e., ∈ = ߛߙ(σ/√N). E aí temos nosso valor para a margem fixa de erro, ∈. Vale a pena assinalar que ߛߙ é o valor de Z que corresponde ao intervalo simétrico em torno da média (zero) cuja probabilidade associada é ߙ, 95%, por exemplo, ou 99%, a depender da escolha do pesquisador. De qualquer maneira, ߙ é denominado nível de confiança e o intervalo [ തܺ − γఈ √ ; തܺ + γఈ √], intervalo de confiança. Outro fato relevante a ser assinalado é o de que o intervalo de confiança tem limites aleatórios, sendo, em si, aleatório. Por isso, ele pode conter ou não o valor populacional da média de X, denotada por μ. O que o nível de confiança garante é que, com 95% de probabilidade, o intervalo aleatório contém a média populacional. Mas não há certeza quanto a isso, trata-se de um fato probabilístico. 2 Testes de hipóteses 2.1 Conceito básico: um teste intuitivo rudimentar O objetivo central de um teste de hipóteses é utilizar a evidência contida na amostra disponível para fazer uma afirmação quanto ao valor populacional de um parâmetro1. Trata-se, pois, de um procedimento de inferência uma vez que, com base no conteúdo informacional da amostra, se retira uma conclusão acerca da população. Um teste de hipóteses é sempre composto por um par de hipóteses, a principal delas é denominada hipótese nula e geralmente especifica um valor pontual para o parâmetro sob investigação. A hipótese alternativa especifica o intervalo de valores (mais provável) ao qual o parâmetro deve pertencer na situação hipotética em que a hipótese nula não é válida. A hipótese nula canônica (mais comum) é a de que o valor populacional de um dado parâmetro, θ, é zero. O que é escrito geralmente como H0: θ = 0. A hipótese alternativa mais geral possível é, claramente, a possibilidade complementar à que define a hipótese nula, i.e., H1: θ ≠ 0. Ou, de maneira equivalente, H1: θ < 0 ou θ > 0. Quando se pode dizer que a amostra contém evidências que permitam tomar uma decisão acerca da plausibilidade da hipótese nula? Uma possível resposta é encontrada em um critério grosseiro, porém esclarecedor.1 Ver Casella & Berger, “Statistical Inference”, 1990, Duxbury Press, cap.8. 5 Seja assumido que se tem por objetivo gerar uma estimativa pontual para o valor populacional θ. A estimativa obtida dos dados disponíveis é denotada por θை. Um critério suficientemente “grosseiro” é o seguinte: se for observado um valor para a estimativa pontual muito distante de zero, será afirmado que a hipótese nula é falsa. Porque este critério faz sentido? A resposta é intuitiva (ou pelo menos deveria ser). A hipótese nula afirma que o valor populacional do parâmetro é zero, i.e, θ = 0. Para a julgar, temos apenas uma amostra disponível, a qual nos permite obter apenas uma estimativa, θை. Caso este valor seja próximo de zero, a evidência disponível é favorável à hipótese nula. De maneira inversa, pois, quanto mais distante de zero for o valor estimado, menos favorável à hipótese é a evidência. Um exemplo pode tornar mais claro o critério grosseiro. Um dos problemas mais famosos em economia do trabalho é o de mensuração da contribuição da educação para a remuneração obtida no mercado de trabalho. O que pode ser exprimido em duas perguntas. Será que trabalhadores com maior nível educacional são melhor remunerados? Em que medida isso é verdade? Com nos dados da Pesquisa Nacional por Amostra de Domicílios (PNAD) é possível responder as duas perguntas. Uma maneira de fazer isso é empregar o estimador de mínimos quadrados ordinários e obter uma estimativa para o efeito educação- remuneração, ou retorno (econômico) da educação, a qual será denotada por ߚመை. O parâmetro-alvo, portanto, aquilo que os economistas do trabalho desejam conhecer, não é o valor específico do retorno da educação na amostra da PNAD, ߚመை, mas sim o valor populacional deste efeito, β. O teste de hipóteses relevante é composto pela hipótese nula H0: β = 0 e pela alternativa H1: β ≠ 0. Caso seja obtida uma estimativa pontual muito grande, por exemplo, os resultados indiquem que um ano a mais de educação aumenta a remuneração mensal do trabalhador em 100% (duplicação), a hipótese nula deve ser rejeitada. Isso pois 100% é um valor consideravelmente superior a zero - ao menos aparentemente, para fins deste exemplo de aplicação do critério grosseiro. Por outro lado, se os resultados indicarem que um ano a mais de educação aumenta o salário mínimo em 0,1%, seria precária a base em que o pesquisador se apoiaria ao procurar argumentar que a educação tem efeito relevante sobre a remuneração. E isso porque 0,1% – aparentemente, mais uma vez – é um valor próximo de zero. O critério grosseiro é o fundamento do teste de hipóteses: todo e qualquer teste de hipóteses se assenta sobre ele e, “forçando” o argumento (por motivos didáticos), é possível afirmar que os testes de hipóteses diferem sobretudo em função da medida que propõem para a distância entre o valor do parâmetro especificado pela hipótese nula (zero, geralmente) e a estimativa pontual. 6 O salto do critério grosseiro para um critério mais preciso é dado a partir da resposta a seguinte pergunta: como é possível afirmar que um valor, assumido pela estimativa pontual, é grande o bastante para se rejeitar a hipótese nula? Ou que ele é suficientemente próximo de zero para que a decisão correta seja a de não rejeitar a hipótese nula? No exemplo de economia do trabalho, um aumento do rendimento de 100% parece suficientemente grande e um aumento de 0,1% suficientemente pequeno. Mas, porém, estes são valores fictícios, empregados para fins didáticos. Segundo os resultados obtidos por Teixeira e Menezes-Filho2 a partir das PNADs de 1997 a 2007, um ano adicional de educação proporciona, em média, um aumento de 5,5% na remuneração mensal, com desvio padrão de 0,8%. Será que 5,5% é suficientemente grande? A resposta agora não é tão evidente. É preciso apelar para um critério objetivo. A possibilidade mais comum está em olhar para a FD do estimador que prevaleceria caso a hipótese nula para o retorno da educação fosse verdadeira. Assumindo que o desvio padrão da distribuição populacional é equivalente a 0,8%, a FD do retorno estimado da educação é tal como ilustrada na figura a seguir. A mera distância entre a estimativa pontual e zero não é uma medida precisa para o grau em que a evidência é favorável à hipótese nula. Uma melhor medida é a probabilidade de ocorrência da estimativa pontual. 2 Está sendo considerada a estimativa pontual gerada pelo modelo IV, conforme consta na tabela 4 de Teixeira, W. M., Menezes-filho, N.A. "Estimando o retorno à educação do Brasil considerando a legislação educacional brasileira como um instrumento". Revista de Economia Política, vol. 32, nº 3 (128), pp. 479-496, julho-setembro/2012. Disponível em http://www.scielo.br/pdf/rep/v32n3/08.pdf 7 Se for observada uma estimativa pontual cuja probabilidade de ocorrência, calculada sob a validade hipótese nula, é baixíssima, há algo de errado neste resultado. A razão para isso está em que o que ocorre com baixíssima probabilidade não deveria ocorrer. Especialmente quando o número de ocorrências observadas é pequeno; unitário, na realidade, uma vez que há apenas uma amostra e, pois, apenas uma estimativa pontual. Se é baixíssima a probabilidade do retorno de um ano adicional de educação ser de 5,5%, este não deveria ser o valor obtido como resultado. Há apenas duas possibilidades, ou a evidência está errada ou a hipótese nula é equivocada. Em pesquisa científica, não há sentido algum em tentar salvar uma teoria que não corresponde à realidade, afirmando que é a realidade que está errada. Exatamente por isso, a discrepância entre uma hipótese, geralmente proveniente da teoria, e uma evidência, é tomada como indicação de incoerência da hipótese. De fato, a probabilidade de ocorrência de um retorno percentual de 5,5% é muito baixa, de 1 x 10-11, segundo a figura acima. Isso indica que o verdadeiro valor médio populacional do retorno é superior a zero. I.e., que a verdadeira distribuição normal está “deslocada” para a direita, conforme a figura abaixo. E isso pois, quanto menor a distância entre a estimativa pontual e o verdadeiro valor populacional da média, maior é a probabilidade de ocorrência da primeira. 2.2 Duas abordagens para os testes de hipóteses O recurso à probabilidade de ocorrência da estimativa pontual não resolve completamente o problema de obtenção de uma medida objetiva para o grau em que a 8 evidência disponível é desfavorável à hipótese nula. E isso pois como saber se um dado valor para a probabilidade é suficientemente pequeno? É preciso tomar por base uma definição para o termo “suficientemente pequeno” consensualmente aceita pela comunidade científica. Para isso, é necessário que se tenha por claro que há dois erros que podem ser cometidos na tomada de decisão acerca do resultado do teste3. Em primeiro lugar, pode- se decidir por rejeitar uma hipótese que é verdadeira, equívoco este denominado por “erro do tipo I”. Em segundo lugar, é possível não rejeitar uma hipótese falsa, este o “erro do tipo II”. A tabela descreve os dois erros. Tabela X Dois tipos de erros em um teste de hipóteses Hipótese verdadeira / Decisão Rejeitar H0 Não rejeitar H0 H0 Erro tipo 1 Decisão correta H1 Decisão correta Erro tipo 2 Fonte: Casella & Berger, p.359. A probabilidade de ocorrência de cada um dos erros pode ser reduzida a um nível aceitável a partir da maneira como o teste é construído, i.e., de acordo com o critério de tomada de decisão adotado. Uma maneira de fazer isso está em tomar um valor suficientemente baixo para a probabilidade de ocorrência do erro do tipo I. A convenção em voga é a de que 5% é um valor suficientemente baixo. Há uma relação crucial entre aprobabilidade de cometer um erro do tipo I e uma medida do grau em que a evidência é favorável à hipótese nula. Retomando a ideia do teste grosseiro, H0 deve ser rejeitada sempre que a estimativa pontual se mostrar consideravelmente distante dela. É o que se tem quando a probabilidade de ocorrência de um valor da estimativa pontual mais extremo do que o observado é não superior a 5%, o que pode ser atestado de duas maneiras alternativas. Antes de passar a elas, cabe expressar as condições de um problema de teste de hipóteses de maneira mais geral. Seja assumido que a amostra disponível, X1, X2,...,XN é aleatória de modo que ela ocorre com probabilidade f(x1,...,xN|θ) = ∏ f(x|θ)ேୀଵ = f(xN|θ)...f(xN|θ), em que f(x|θ) é a FD das observações, a qual se define exclusivamente em função do parâmetro populacional θ. O objetivo da análise consiste em realizar o teste de hipóteses H0: θ = 0 vs. H1: θ ≠ 0. Trata-se de um teste “bicaudal”, pois a hipótese alternativa aponta para dois intervalos, θ < 0 e H1: θ > 0. O teste seria “unicaudal” caso a hipótese apontasse para apenas um intervalo. 3 Cabe assinalar que, por mais que tal decisão esteja fundamentada em um procedimento estatístico em número ela nunca é livre de erros. 9 Seja θ um estimador não-viesado para θ, i.e., E[θ] = θ. Este estimador recebe o nome de estatística do teste para o teste genérico que se acaba de definir. A FDA do estimador será denotada por P(θ ≤ θை |θ) = F൫θை|θ൯. Será assumido que F൫−θை|θ൯ = 1 −F൫θை|θ൯, i.e., que a FDA é simétrica em torno da média populacional θ (como é o caso das FDs Normal e t de Student). Primeira abordagem: valores críticos e região crítica do teste. Assumindo a hipótese nula como válida, i.e., tomando θ = 0, pode-se obter os valores γ1 e γ2 do estimador tais que P(γ1 ≤ θ ≤ γ2|θ=0)4 = 95%. É necessário assinalar que esta probabilidade é obtida a partir da FDA de θ para θ = 0. É desta maneira que se coloca em confronto a hipótese nula, a qual, pois, aparece como uma hipótese acerca da FD da estatística, e a evidência, esta última, no caso, a estimativa pontual. Os valores γ1 e γ2 são denominados por “valores críticos”. Se a estimativa pontual assumir um valor mais extremo do que um dos valores críticos, deve-se rejeitar a hipótese nula. A figura abaixo ilustra esta abordagem, retomando o exemplo de estimação do retorno da educação. Assume-se que a estatística do teste segue um FD normal com média zero, segundo a hipótese nula, e com desvio padrão 0,8%. Os valores críticos, indicados com linhas verticais pontilhadas de cor cinza, correspondem a γ1 = -1.645 e γ2 = 1.645. O valor da estimativa pontual, 5,55%, é mais extremo do que o valor crítico positivo. 4 Para uma distribuição simétrica em torno da média populacional, esta probabilidade é equivalente a 1 − 2F൫θை|θ൯. 10 O invervalo [γ1 ;γ2] é denominado “região de aceitação” ou “região crítica” do teste, enquanto que a união dos dois intervalos complementares, [-∞;γ1], [γ2; ∞] é denominada por “região de rejeição”. A região crítica pode ser, genericamente, indicada por RC(α,θ), em que α é o nível de significância do teste ou a probabilidade de cometer um erro do tipo I, geralmente fixada em 5% (de modo que a probabilidade de uma decisão correta seja de 95%). Segunda abordagem: p-valor do teste de hipóteses. A hipótese nula pode ser rejeitada sempre que a probabilidade de obter um valor mais extremo do que o observado para a estimativa pontual for inferior a 5%, de acordo com a FDA de θ para θ = 0. A “probabilidade de um valor mais extremo” é denominada p- valor, conceito ilustrado na figura abaixo para o exemplo de retorno da educação. O p- valor corresponde à área entre as duas linhas verticais pontilhadas em cinza na figura abaixo. Esta, mais uma vez, considera o exemplo de retorno da educação, assumindo que a estatística do teste segue um FD normal com média zero, segundo a hipótese nula, e com desvio padrão 0,8%. A área correspondente ao p-valor pode ser melhor visualizada no gráfico abaixo, o qual traz um zoom do gráfico anterior no segmento [5,4;6,5] do eixo horizontal. 11 2.3 Testes de hipóteses mais utilizados em econometria 2.3.1 Teste t O teste para a média populacional de uma variável aleatória com distribuição normal padrão foi apresentado no exemplo acima (retorno da educação). Este teste é pouco utilizado em econometria dado que pressupõe o conhecimento da variância populacional, o que não é realista. Nenhum parâmetro das funções de distribuição de probabilidade relevantes para os estudos econométricos é conhecido a priori; todos eles têm de ser estimados. Seja mantida a hipótese simplificadora de que há apenas uma característica de interesse, X. A amostra disponível, aleatória, é dada por {X1,...,XN}. De acordo com a teoria estatística convencional, a probabilidade de ocorrência da amostra é dada por uma função de distribuição de probabilidades conjunta, ܨభ,…,ಿ(ݔଵ, … , ݔே ;ߠ). Será assumida que esta função é uma normal multivariada, o que, em conjunto com a hipótese de distribuição aleatória, garante que a distribuição populacional da média da característica seja normal com média μ e variância σ2/N5. Porém, como a variância não é conhecida, o mais adequado é tomar a estatística abaixo como estatística do teste. E isso pois a FD dela é conhecida. ܶ = Xഥ − ߤ ඥܸ(Xഥ) ~ݐேିଵ 5 Vide Casella & Berger, exemplo 5.2.1, p.209. 12 Esta estatística tem uma distribuição t de Student com N – 1 graus de liberdade, em que N é o tamanho da amostra. A grandeza ߤ é o valor do parâmetro populacional especificado pela hipótese nula e V( തܺ) é a variância da média. Todos os componentes da estatística podem ser calculados a partir da amostra e ߤ é definido pelo próprio pesquisador, sendo geralmente zero. O procedimento do teste para ߤ = 0 consiste nos passos abaixo. 1. Calcular o valor da estatística do teste, ܶ; 2. Abordagem da região crítica: a. Obter os valores críticos, i.e., os valores da distribuição t que ocorrem com 5% de probabilidade, {-tc, tc} b. Se ܶ > 0, rejeitar H0 se ܶ > tc; c. Se ܶ < 0, rejeitar H0 se ܶ < − tc; 3. Abordagem do p-valor: a. Se ܶ > 0, o p-valor é dado por ̂ = P(t > ܶ). Obtê-lo; b. Se ܶ < 0, o p-valor é dado por ̂ = P(t < ܶ). Obtê-lo; c. rejeitar H0 se ̂ ≤ 5%. Retomando o exemplo de estimação do retorno da educação, a estatística do teste é dada por: ܶ = β − ߚ ටܸ(β) ~ݐேି Há uma particularidade nesta estatística, o número de graus de liberdade dela é N-K e não N-1. A razão disso está em que não se trata de um teste para a média, mas sim para um parâmetro que capta a relação entre duas variáveis. Por hora, não é preciso se preocupar em entender este detalhe, ele será esclarecido na parte III do curso. Basta saber que K é o número de variáveis explicativas que compõem o modelo de regressão linear a partir do qual se estima a relação entre nível educacional e remuneração. Segundo os resultados obtidos pelos autores, β = 5,5%, ටܸ(β) = 0,8% e β0 = 0, pois a hipótese em vista é a de que a educação tem contribuição nula para a remuneração. O valor observado da estatística é, pois, de ܶ = 6.875. O número de graus de liberdade é N - K = 1.248.998 – 50 = 1.248.948. Os valores críticos para um nível de significância bicaudal de 5% e para os graus de liberdade são {-1,645; 1,645}. Uma vez que ܶ > 1,96, a hipótese nula é rejeitada. O p-valor é de 2 x 10-11 < 5%, o que também aponta para a rejeição da hipótese nula. 13 2.3.2 Teste qui-quadrado Para testar hipótesesreferentes ao valor da variância populacional, a estatística apropriada é a variância amostral, como segue. ߯ = 1ܰ ( ܺ − Xഥ)ଶே ୀଵ ~߯ே A função de distribuição é uma qui-quadrado com N graus de liberdade. A única diferença em relação aos testes já vistos tem origem em que a distribuição qui-quadrado é assimétrica e está definida apenas para valores positivos. Desta maneira, portanto, evidências desfavoráveis à hipótese nula apenas podem ocorrer para valores muito grandes. O teste é sempre uni-lateral e seu procedimento é descrito no que segue. 1. Calcular o valor da estatística do teste, ߯̂; 2. Abordagem da região crítica: a. Obter o valor crítico, i.e., χc tal P(χ > χc) = 0,05; b. Rejeitar H0 se ߯̂ > χc; 3. Abordagem do p-valor: a. Obter o p-valor dado por ̂ = P(χ > χො); b. rejeitar H0 se ̂ ≤ 5%. O gráfico abaixo ilustra o p-valor de uma VA com distribuição qui-quadrado com 10 graus de liberdade. 14 2.3.3 Teste F Seja Y a variável que o modelo de regressão linear procura explicar. A razão entre a porção da variação amostral de Y explicada pela regressão, SQE, e a porção não explicada, SQR, denominada por coeficiente de determinação, é r2 = SQE / SQR. A FD desta estatística é a F de Snedecor com graus de liberdade K-1 e N-K, ou seja: ݎଶ = ܵܳܧ/ܭ − 1 ܴܵܳ/ܰ − ܭ~ܨିଵ,ேି Seja R2 o valor populacional de ݎଶ . O teste de hipóteses H0: R2 = 0 vs. H1: R2 > 0 (ݎଶ é sempre positivo) pode ser realizado como segue. 1. Calcular o valor da estatística do teste, ܨ; 2. Abordagem da região crítica: a. Obter o valor crítico, i.e., Fc tal P(χ > Fc) = 0,05; b. Rejeitar H0 se ܨ > Fc; 3. Abordagem do p-valor: a. Obter o p-valor dado por ̂ = P(F > F); b. rejeitar H0 se ̂ ≤ 5%. O gráfico abaixo indica o valor crítico para o teste com nível de significância de 5% para uma VA com distribuição F com 10 e 10 graus de liberdade. 15 2.4 Poder de um teste A probabilidade de não ocorrência de um erro tipo II é denominada poder de um teste, ou seja, trata-se da probabilidade de rejeitar uma hipótese falsa. Esta probabilidade pode ser representada como: P(T ∈ RC(ߙ; θ)| θ ≠ θ0), i.e., a probabilidade da estimativa pertencer à região crítica quando a hipótese nula é equivocada. Esta probabilidade depende do valor verdadeiro de θ. É intuitivo que, quanto mais distante estiver este valor do especificado pela hipótese nula, maior será a probabilidade de rejeitar a hipótese nula, i.e., maior o poder do teste. Quanto mais próximo estiver θ de θ0, mais próximo estará o poder do teste de ߙ. De fato, para θ = θ0, o poder do teste é equivalente ao nível de significância, i.e., P(T ∈ RC(ߙ; θ)| θ = θ0) = ߙ. O gráfico abaixo descreve como o poder de um teste, representado por π(θ) varia como o valor de θ. Figura X Poder de um teste
Compartilhar