Baixe o app para aproveitar ainda mais
Prévia do material em texto
VII - TESTES DE HIPÓTESES Neste capítulo estudaremos os elementos fundamentais da teoria dos testes de hipóteses e da sua aplicação à inferência paramétrica. Como veremos, existe uma dualidade entre os testes de hipóteses e a construção dos intervalos de confiança estudados no Capítulo VI anterior. A rejeição de uma hipótese unilateral lançada sobre um parâmetro, para um dado nível de significância /2, estará associada à não inclusão da estatística observada dentro de um intervalo de confiança 1 . As aplicações estudadas focalizam exclusivamente as populações normais, entendendo-se que, nas condições de aplicação do TCL (Teorema Central do Limite), estas aplicações aproximam razoavelmente bem os testes correspondentes que poderiam ser construídos para as populações originais (não normais). Naturalmente, os conceitos fundamentais da teoria dos testes e a mecânica de suas aplicações tem, ambos, um caráter geral que não se restringe à uma população em particular. Também, focalizaremos aqui apenas a construção de testes clássicos, que são sempre conclusivos, seja pela rejeição, seja pela não rejeição da hipótese testada (Hipótese Nula). Isto significa que a abordagem sequêncial, que contém regiões inconclusivas, não será estudada. 1. Conceitos Fundamentais O framework da análise é o da inferência paramétrica: Temos uma amostra simples X1,X2, . . . ,Xn de uma população X, com suporte em X , fdp fX. ;, fda FX. ;, ambas dependentes do parâmetro . Temos uma estatística TX1,X2, . . . ,Xn para , cuja distribuição de probabilidade FTt; será usada para a construção dos testes. Elementos de um Teste de Hipóstese Um teste estatístico é composto dos seguintes ingredientes: __________________________ Hugo Boff - Estatística II 2020-I 2 a) Uma hipótese a ser testada. Esta hipóstese, chamada hipóstese nula, assume o seguinte formato: H0 : 0 onde 0 é um subcojunto pré-especificado do espaço paramétrico. Como veremos à frente, o teste de H0 será construído como um teste de rejeição: A evidência amostral permite, ou não, rejeitar a hipótese H0 ? Ao ser especificada a região 0 da hipótese nula, ficará implícitamente designada a região do que se chama a hipótese alternativa: H1 : 1 onde 1 0 Frisemos que H1 não é a hipótese testada. H1 é rejeitada se H0 não for rejeitada; H1 é aceita somente se H0 for rejeitada. b) O Nível de Significância A tomada de decisão sobre o teste contempla apenas duas opções: Rejeitar ou Não Rejeitar H0. Ao fazê-lo, dois tipos de erro podem ser cometidos: Erro I : Rejeitar H0 sendo H0 verdadeira; Erro II : Não rejeitar H0 sendo H0 falsa. A implementação do teste requer a determinação prévia da probabilidade de se cometer ao menos um destes erros. Notemos para estas probabilidades: Pêrro I PRejeitar H0 H0 Verdadeira Pêrro II PNão Rejeitar H0 H1 Verdadeira As decisões e as probabilidades, segundo H0 é verdadeira (V) ou falsa (F) são resumidas na tabela abaixo: __________________________ Hugo Boff - Estatística II 2020-I 3 H0 Decisão Prob. Verdadeira Falsa Rejeita 1 Não Rejeita 1 Em testes nos quais tanto a hipótese nula como a hipótese alternativa são pontuais, ambas as probabilidades de erro podem ser calculadas. Nos testes mais usuais, nos quais as hipóteses especificam intervalos de variação para o parâmetro testado, como veremos, será a probabilidade de cometer o erro do tipo I que será pré-fixada. A probabilidade será chamada tamanho do teste ou, mais comumente, nível de significância do teste. Trata-se, na verdade, de uma cobertura para a região de rejeição do teste de H0, sendo esta hipótese verdadeira, como veremos na sequência. c) Uma Região Crítica A Região Crítica (RC) do teste de H0 é, por definição, a região de rejeição de H0. Ela pode assumir a forma de intervalos abertos à direita, do tipo RC T tc ou abertos à esquerda RC T tc ou a forma de uma união de intervalos de ambos os tipos: RC T t1 T t2. Para cada um destes formatos da RC o teste correspondente será nomeado unilateral à direita, à esquerda ou teste bilateral, respectivamente. Como mencionamos antes, T é uma estatística para , a qual será a estatística através da qual o teste é implementado. O nível crítico tc será o valor que delimitará a região crítica. Este valor será aquele que corresponde ao nível de significância que foi pré-fixado. Ou seja, a região de rejeição do teste estará completamente determinada pela escolha feita do tamanho a ser dado ao teste. Isto significa que, dado , a região crítica RC será tal que: PRC H0 1 Ou seja, o nível de significância é o grau de cobertura dado à região de rejeição de H0. __________________________ Hugo Boff - Estatística II 2020-I 4 Frequentemente notaremos RC para a região crítica de tamanho . d) Uma regra de decisão Sendo uma região de rejeição de H0, a especificação de RC define implícitamente uma regra de decisão para o teste. Seja t Tx1,x2, . . . ,xn realização amostral da estatística T. A regra de decisão especifica: Se t RC Rejeita-se H0 (a probabilidade de erro I será ) Se t RC Não rejeita-se H0, (a probabilidade de erro II será ) No primeiro caso, a rejeição de H0, torna H1 uma hipótese plausível, muito embora esta não é a hipótese testada. Dizemos neste caso que H1 é "aceita" com a ressalva acima. e) Conceitos derivados Existem dois conceitos derivados deste quadro teórico os quais são de grande utilidade. O primeiro é o conceito de p-valor (ou p-value), que estabelece um treshold amostral acima do qual todo teste de tamanho maior que o p-valor leva à rejeição de H0. O segundo é o da Função Poder (ou Power Function) a qual mede a probabilidade de rejeitar H0 quando ela é falsa. Trata-se de um indicador importante para avaliar a qualidade do teste implementado, uma vez que ele mede a capacidade do teste identificar corretamente a falsidade de H0 ao longo do intervalo de variação do parâmetro. e1. P-Valor Sendo t Tx1,x2, . . . ,xn a estatística observada do teste, o p valor, notado P, é a probabilidade que a estatística amostral leve à rejeição de H0, sendo esta hipótese verdadeira: P PT t H0 no teste unilateral à direita; __________________________ Hugo Boff - Estatística II 2020-I 5 P PT t H0 no teste unilateral à esquerda; P 2minP, P no teste bilateral; Quanto menor o p-valor P maior a evidência amostral contra H0. Ou seja, menos verossímil é H0 à luz da amostra. Um guia qualitativo do grau de evidência amostral contra H0, é proposto por R.A.Fisher (1924), com a seguinte escala de interpretação para a magnitude do p-valor: Escala de Fisher P valor 0.10 0. 05 0. 025 0. 01 0.005 0. 001 Evidência contra H0 fraca moderada substancial forte muito forte fortíssima e2. Função Poder A função poder do teste de H0 para o parâmetro , notada , define-se como a probabiliade de rejeitar H0 com razão, ou seja: PRC |H1 2 Observe que 1 onde é a probabilidade do erro do tipo II. Quanto maior o poder do teste, maior a probabilidade de se tomar uma decisão acertada rejeitando H0. Por exemplo, considere o teste de H0 : 0 contra H1 : 0 . Com base na estatistica T para , suponha que a região de rejeição de H0 seja do tipo: RC T tc A função poder ideal para este teste terá o formato abaixo: __________________________ Hugo Boff - Estatística II 2020-I 6 Como vemos no gráfico, é nula a probabilidade da região de H0 e unitária a probabilidade da região de rejeição, sob H1. Esta é uma situação ideal, para um teste perfeitamente discriminante. Vamos ilustrar os conceitos apresentados até aqui através de um exemplo analítico: Exemplo 1 (Analítico): Papéis de renda variável negociados em bolsa tem retornos anuais com distribuição Normal de média e variância 2. Aqueles que apresentam retorno médio até 0, com risco 0, são considerados de baixo retorno (B); aqueles cujoretorno médio está acima de 1, com risco 1, são considerados de alto retorno (A). Naturalmente, temos 0 1 e 0 1. Richardson está analizando os retornos anuais de uma letra imobiliária e quer saber se ela pode ser classificada como um papel do tipo A ou um papel do tipo B. Ele então seleciona ao acaso n retornos passados deste papel e, com base no retorno médio x obtido na amostra, ele implementa o seguinte teste pontual: H0 : 0 0 contra H1 : 1 1 Ou seja, ele vai testar a hipótese de que a letra imobiliária é um papel de tipo B. A estatística do teste é a média amostral X e a região crítica será do tipo: RC X xc Ou seja, Richardson implementará um teste unilateral à direita, pois se a média amostral for maior que um determinado quantil crítico xc, o ativo não poderá ser do tipo B e H0 deverá ser rejeitada. 1. Para determinar xc, Richardson admitirá um nível de significância , que é a probabilidade de ele errar classificando o papel como sendo do tipo A, quando na realidade ele é do tipo B. __________________________ Hugo Boff - Estatística II 2020-I 7 Temos então: PRC H0 PX xc H0, ou seja: PZ xc 0 0/ n Pela tabela da Normal achamos z tal que PZ z , de modo que: xc 0 0/ n z xc 0 0 n z 3 Assim, a região de rejeição de H0 será: X 0 0 n z, como mostrado na figura à seguir: Como regra de decisão: se x RC x 0 0 n z rejeita H0. Neste caso, a probabilidade de errar rejeitando é de 100%. Caso contrário, se x RC x 0 0 n z , H0 não é rejeitada. Neste caso, a probabilidade de errar aceitando Ho é . A probabilidade de cometer o erro II é calculada assim: PRCc H1 PX xc H1 PZ xc 1 1/ n Substituindo xc obtemos: xc 1 1/ n 0 0 n z 1 1/ n 0z n 1 0 1 de modo que: PZ 0z n 1 0 1 4 __________________________ Hugo Boff - Estatística II 2020-I 8 2. O p-valor é: P PX x H0 PZ x 0 0/ n . Naturalmente, o nível de significância escolhido pode ser maior ou menor que o p-valor P . Se ele for menor ou igual P, H0 não é rejeitada; se ele for maior, P, H0 é rejeitada. 3. A função poder, em testes pontuais sempre é uma constante, no caso: 1 , 1 4. Suponha que Richardson não tem razões para ser mais avesso à um tipo de erro que ao outro. Ao invés de fixar , ele deseja realizar um teste equilibrado, tal que . Qual a região crítica deste teste ? Vimos acima que PZ xc 0 0/ n e PZ xc 1 1/ n PZ 1 xc 1/ n . Logo, a região crítica do teste equilibrado será RC X xe,onde xe verifica: xe 0 0/ n 1 xe 1/ n xe 1 0 1 0 0 0 1 1 5 Como vemos, o quantil crítico do teste equilibrado é uma média ponderada dos retornos médios sob H0 e sob H1, com pesos determinados pelos riscos relativos. O quantil do teste equilibrado estará mais próximo de 0 que de 1. Neste caso, a probabilidade dos erros será dada por: PX xe H0 PX xe H1 Naturalmente, se P a hipótese H0 é rejeitada. Caso contrário, ela não é rejeitada. A figura abaixo ilustra as regiões críticas iguais,sob H0 e sob H1, do teste equilibrado. __________________________ Hugo Boff - Estatística II 2020-I 9 5. Suponha finalmente que, antes de realizar a amostragem, Richardson tenha em mente valores específicos para e que ele quer contemplar. Quantos retornos do ativo ele deve então observar ? Dada a região crítica X xc e o quantil xc dado em 3, temos: z xc 1 1 n 1z xc 1 n Usando agora o valor de xc vem: 1z 0 0 n z 1 n 0z 1 0 n 0z 1z 1 0 n Ou seja: n 0z 1z 1 0 2 6 Como o tamanho amostral deve ser um número inteiro, com o semi-colchête superior indicamos o arredondamento para cima ou seja, tomamos o primeiro inteiro superior ao número 0z 1z 1 0 2. Exemplo 1 (Numérico): Para ilustrar numericamente o exemplo analítico, tomamos os seguintes valores (em 1.000 reais/ano) H0 : 3 2 contra H1 : 5 5 __________________________ Hugo Boff - Estatística II 2020-I 10 Temos também: n 9 ; x 4.0 1. Para o teste de H0 com nível de significância 0.05 5% temos, pela tabela da Normal-padrão: z 1.65. Então, por 3, o quantil crítico é: xc 3 2 9 1.65 4.1 . A região crítica de tamanho 5% será: X 4.1 . Como x RC não se rejeita H0. Ou seja, a evidência amostral não permite rejeitar H0. Assim, há indicações de que o papel analizado é do tipo B. A aceitação de H0 está sujeita ao erro tipo II, que ocorre se H0 é de fato falsa. Calculemos então a probabilidade de ocorrência deste erro, usando 4 : PZ 21.65 9 5 3 5 PZ 0.54 o que dá, usando a tabela da Normal-padrão: 0.294. Ou seja, temos uma elevada probabilidade de errar aceitando H0. 2. O p-valor do teste é: P PX 4.0 H0 PZ 4 32/3 PZ 1.5 0.067 Ou seja, na escala de Fisher, a evidência amostral contra H0 é de fraca a moderada. Somente testes com probabilidade de erro maior que 6,7% poderão levar à rejeição de H0. 3. A função poder do teste é constante e igual à 1 , ou seja, 0.706. Esta é a probabilidade de acertar rejeitando H0. 4. Para a construção do teste equilibrado, usamos 5, e o quantil crítico é dado por: xe 52 5 3 2 2 5 5 25 7 3,571 Devido à diferença na volatilidade dos retornos, o retorno crítico é baixo. Este é o retorno acima do qual o ativo é classificado como do tipo A (retorno Alto), com probabilidade de errar com esta classificação igual à probabilidade de errar considerando-o como do tipo B (retorno Baixo). __________________________ Hugo Boff - Estatística II 2020-I 11 Devido ao baixo tamanho da amostra, esta probabilidade é elevada: PZ 3.571 3 2/ 9 PZ 0.856 0.291 PZ 3.571 5 5/ 9 PZ 0.857 0.291 5. Se antes de realizar a amostragem, Richardson deseja uma probabilidade de 5% para ambos os tipos de erro, qual deverá ser o tamanho da amostra ? Neste caso, 0.05 de modo que z 1.65 e z 1.65 Então, usando 6 obtemos: n 21.65 51.65 5 3 2 33.35 n 34 Ou seja, Richardson deverá considerar 34 retornos passados do papel em análise. 2. Testes Compostos em Uma População Normal Vamos estudar agora a construção de testes compostos, com hipóteses alternativas múltiplas, para a média e para a variância em populações normais. Em cada caso, as estatísticas que viabilizam a realização destes testes são as mesmas daquelas empregadas na construção dos Intervalos de Confiança estuados no Capítulo VI. Os testes compostos sobre um parâmetro , admitem as seguintes regras de decisão: Unilateral à direita: H0 : 0 contra H1 : 0 Unilateral à esquerda: H0 : 0 contra H1 : 0 Bilatera l H0 : 0 contra H1 : 0 Como a região crítica (RC) do teste é uma região de rejeição de H0, ela sempre assumirá o formato da hipótese alternativa. Assim, no primeiro caso acima teremos: RC T tc; no segundo caso, RC T tc. No caso do teste bilateral, a região crítica não é um intervalo, mas a união de dois intervalos disjuntos: RC T t1 T t2. __________________________ Hugo Boff - Estatística II 2020-I 12 A) Testes para a média Sabemos que a média amostral tem distribuição normal: Xn N,2/n. Deste modo: Z Xn / n N0,1 7 1. 2 conhecida Neste caso, de acôrdo com 7 a estatística do teste é a normal-padrão. Dada uma cobertura da região crítica de tamanho , consideramos o quantil z tal que: PZ z para o caso do teste unilateral à direita, PZ z para o caso do teste unilateral à esquerda. Consideramos o quantil z/2 tal que P|Z| z/2 no caso do teste bilateral. Segundo a regra de decisão, o formato dasregiões críticas será: Para H0 : 0 contra H1 : 0 RC X xc H0 xc 0 n z Para H0 : 0 contra H1 : 0, : RC X xc H0 xc 0 n z 0 n z Para o teste de H0 : 0 contra H1 : 0, teremos: RC X x1 H0 X x2 H0 x1 0 n z/2 ; x2 0 n z/2 Em cada um destes casos, rejeita-se H0, com probabilidade de erro 100%, se a média amostral observada pertence à região crítica. Ou seja, se x RC. __________________________ Hugo Boff - Estatística II 2020-I 13 Lembremos que, para o cálculo do p valor, em cada um destes casos, devemos observar as definições: P PX x H0 no teste unilateral à direita; P PX x H0 no teste unilateral à esquerda; P 2minP, P no teste bilateral. Aceitação de H0 e Intervalo de Confiança Observe que, no teste bilateral H0 : 0 contra H1 : 0, de tamanho , dizer que H0 não é rejeitada equivale dizer que o valor testado 0 pertence à um à um intervalo de confiança 1 centrado na média amostral x . Com efeito, se H0 não é rejeitada ao nível de signficância , isto significa que x RC. Ou seja, x x1 0 n z/2 e x x2 0 n z/2 . Logo, 0 n z/2 x 0 n z/2 Ora, estes limites para a média da amostra implicam nos seguintes limites para 0 : x n z/2 0 x n z/2 0 IC1. Poder dos testes unilateral e bilateral O poder do teste unilateral à direita, de tamanho , é: d PX xc H1 PZ n xc 0 Esta é a probabilidade de decidir corretamente rejeitando H0. Substituindo xc dado em 3 vem: n xc z n 0 , de modo que: d PZ z n 0 0 1 2 z n 0 e 1 2 z2dz ; 0 __________________________ Hugo Boff - Estatística II 2020-I 14 Vemos assim que é crescente com d0 e lim d 1. O diagrama abaixo, para 0.05 z 1.65, 0 3, 4, n 81 descreve o formato típico da função poder do teste unilateral à direita (linha contínua em vermelho): É fácil checar que a função poder para um teste unilateral à esquerda, de tamanho , é: e PX xc H1 PZ n xc 0 Neste caso, n xc n 0 z , de modo que: e PZ n 0 z 0 1 2 n 0z e 1 2 z2dz ; 0 No diagrama abaixo, o poder deste teste é mostrado na linha contínua em azul. 0 1 2 3 4 5 6 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 Média Populacional Poder __: Poder Testes Unilaterais; _ _ Poder Teste Bilateral No teste bilateral, a região crítica de tamanho se decompõe em uma união de duas regiões críticas com cobertura /2 cada uma: b PZ z/2 n 0 0 PZ n 0 z/2 0 __________________________ Hugo Boff - Estatística II 2020-I 15 ou seja: b 1 2 z/2 n 0 e 1 2 z2dz ; 0 1 2 n 0z/2 e 1 2 z2dz ; 0 O poder do teste bilateral é representado no diagrama acima pelas linhas pontilhadas em vermelho e azul, ainda para os valores 0.05 z/2 1.96, 0 3, 4, n 81 . Como esperado, o poder do teste bilateral é sempre menor que o poder dos testes unilaterais, pois ele distribui a mesma cobertura sobre uma região maior do que estes. Existe uma razão informacional: Nos testes unilaterais, é dado ao problema do teste mais informação para a rejeição do H0 do que é feito no teste bilateral, uma vez que uma das regiões, à esquerda ou à direita do valor testado, é excluída. A supremacia do teste unilateral sobre o teste bilateral, mostra que ele deve ser implementado sempre que há informação suficiente para excluir uma das regiões da hipótese alternativa. Ou seja, o teste bilateral somente é implementado quando não se tem informação suficiente para excluir os valores maiores ou os valores menores que o valor testado. Frisemos também que este resultado, mostrado aqui no teste da média em população Normal, é verdadeiro para o teste de qualquer outro parâmetro, de qualquer população. 2. 2 desconhecida Neste caso, como vimos no Capítulo VI, 2 deverá ser estimado, e a estatística do teste é a v.a.T Student padrão. Sendo Sn1 2 1 n 1 i1 n X i Xn2 o estimador MVU de 2, vimos em Estatística I que o quociente entre uma v.a. Normal-padrão e a raiz quadrada de uma v.a. qui-quadrado dividida pelos seus graus de liberdade, ambas independentes uma da outra, formam uma v.a. T Student. Então, Xn Sn1/ n Tn 1 8 Deste modo, a região crítica no teste unilateral à direita de H0 : 0 contra H1 : 0, terá o quantil crítico xc dado por: __________________________ Hugo Boff - Estatística II 2020-I 16 RC X xc H0 xc 0 s n t onde s é o desvio-padrão amostral e t é o percentil da v.a. Student-padrão com n 1 graus de liberdade. Comparando-se este quantil crítico com aquele do mesmo teste considerado anteriormente, quando 2 é conhecida, vemos que este apenas substitui o desvio-padrão populacional pelo desvio-padrão amostral s e, mutatis mutandis, a estatística Z (normal) pela estatística T (Student). A implementação dos testes segue a mesma lógica descrita para o caso em que 2 conhecida. A consequência de se usar o estimador da variância é visível na função poder do teste, a qual apresenta valores mais baixos que aqueles obtidos quando 2 é conhecida. Para mostrar isto, plotamos os valores da função poder para o teste de H0 : 0 contra H1 : 0, com os parâmetros: n 21 20g. l. , 0.05 t 1.725; s 4, 0 3. A linha em vermelho é a função poder do teste quando a variância é desconhecida (estatística t. A curva em é: d 1.725 21 4 3 21 2 1 2 20 2 120 1/21 120 t 2 21 2 dt ; 3 A curva em azul é a função poder do teste quando a variância é conhecida (estatística z: d 1 2 1.65 21 4 3x e 1 2 z2dz ; 3 __________________________ Hugo Boff - Estatística II 2020-I 17 1 2 3 4 5 6 7 8 0.0 0.2 0.4 0.6 0.8 1.0 média pop. poder d 1.725 21 4 3 21 2 1 2 20 2 120 1/21 120 t 2 21 2 dt Pelo gráfico vemos que o poder do teste de H0 quando 2 é conhecida domina o poder do teste de H0 quando 2 é estimada, para os valores relevantes 0 3. B) Testes para a Variância Desde o Capítulo II sabemos que: n 1Sn12 2 2n 1 9 A distribuição do estimador amostral da variância, assim como ela permite a estimação intervalar da variância da população, também permite a construção de testes de hipóteses para ela, usando-se os percentis da v.a. 2n 1. A construção de testes unilaterais ou bilaterais para a variância seguirá a mesma lógica apresentada para os testes da média. Por exemplo, antes da implantação de um programa de treinamento para os operadores de um processo produtivo na fabricação de lápis de cor, a variância do número de falhas detectadas no produto era 0 2. Com base em uma amostra aleatória realizada um ano após a implementação do programa, deseja-se avaliar estatísticamente se o treinamento melhorou a qualidade do produto reduzindo a variância do número de falhas. __________________________ Hugo Boff - Estatística II 2020-I 18 Neste caso, a hipótese adequada a ser testada deverá ser unilateral à esquerda, pois supõe-se que o treinamento não pode piorar a qualidade do produto: H0 : 2 0 2 contra H1 : 2 0 2 Ou seja, se a hipótese nula de que o treinamento não resultou em melhora for rejeitada, a hipótese alternativa de que a melhora ocorreu deverá ser aceita. Todavia, se o programa de treinamento não foi implementado e que, após um ano, se quer simplesmente saber se houve ou não learning by doing no desempenho dos operadores do processo produtivo, com redução ou aumento na variância das falhas, o teste bilateral será mais adequado: H0 : 2 0 2 contra H1 : 2 02 Para um testede tamanho , região crítica deste teste será aqui escrita em função do estimador amostral da variância, unicamente: RC Sn1 2 x1 Sn12 x2 10 Usando 9 , vamos achar na tabela da 2n 1 os percentis q1 e q2 tais que P2n 1 q1 /2 P2n 1 q2 Então, como sob H0, n 1Sn12 0 2 2n 1 podemos determinar os quantis x1 e x2 em 10 : x1 0 2 n 1 q1 e x2 0 2 n 1 q2 e a região de rejeição 10 fica: RC Sn1 2 0 2 n 1 q1 Sn1 2 0 2 n 1 q2 10 Exemplo 2: No contexto descrito vamos avaliar se houve ou não alteração na variância do número de falhas, fazendo o teste bilateral para a hipótese H0 : 2 45, que é o nível da variância antes do treinamento. Ou seja, H0 é a hipótese que o treinamento não alterou a variância do número de falhas. Para 0.05 e uma amostra de n 25 trabalhadores submetidos ao treinamento obtemos na tabela os valores de q1 12.4 e q2 39.5 indicados no gráfico abaixo: __________________________ Hugo Boff - Estatística II 2020-I 19 24g. l. fq 1 21212 q11eq/2 A estimativa amostral da variância foi: s2 23. Então, de acôrdo com 10, os limites da região crítica serão: 0 2 n 1 q1 45 24 12.40 23.5 e 0 2 n 1 q2 45 24 39.50 74.06. E a região de região de rejeição fica: RC Sn1 2 23.5 Sn12 74.06 Como s2 23 RC, rejeita-se H0. Ou seja, existe evidência amostral de que a variância da população diminuiu para um nível abaixo do nível inicial 0 2 45 .A probabilidade de errar rejeitando H0 é de 5%. 3. Testes em Duas Populações Normais Independentes Podemos efetuar testes de igualdade (ou a proporcionalidade) entre médias de duas populações normais independentes, assim como podemos também testar a igualdade (ou a proporcionalidade) entre as variâncias destas duas populações. Considere duas populações normais independentes: X N1,1 2 e Y N2,2 2. Uma amostra de tamanho n1 é tomada da população X : X1,X2, . . . ,Xn1 , da qual se extrai os estimadores MVU de 1e 1 2 : X e S1 2 1 n1 1 i1 n1 X i X2. Analogamente, uma amostra de tamanho n2 é tomada da população Y : Y1,Y2, . . . ,Yn2 , da qual se extrai os estimadores MVU de 2 e 2 2 : Y e S2 2 1 n2 1 i1 n2 Y i Y2. __________________________ Hugo Boff - Estatística II 2020-I 20 A) Testes para Comparação das Médias Estamos interessados em realizar testes comparando as médias das duas populações. Para k , os testes assumem a forma: H0 : 2 k1 0 contra H1 : 2 k1 0 Quando k 1, estaremos testando a igualdade das médias nas duas populações. Escolhemos expor a construção do teste apenas no caso bilateral, por uma questão de economia. A construção dos testes unilaterais, à direita ou à esquerda, segue o mesmo método estudado no caso de uma população. As estatísticas deste teste estarão baseadas nos seguintes resultados: Y kX N2 k1; 2 2 n2 k 2 1 2 n1 11 Para a variância, temos com efeito: VY kX VY k2VX 2kCovX,Y a qual se reduz à VY k2VX pelo fato de que, em razão da indepedência entre as populações, a covariância entre as médias amostrais é nula. O outro resultado diz respeito à distribuição das variâncias amostrais: n1 1S12 1 2 n2 1S22 2 2 2n1 n2 2 12 Este resultado é consequência da normalidade e da independência das populações. O número de graus de liberdade n1 n2 2 resulta da soma n1 1 n2 1 onde cada termo são os graus de liberdade da distribuição da variância amostral de cada população. Esta é uma propriedade reprodutiva da 2. Como usual, a região crítica do teste bilateral para a diferença das médias será: RC Y kX x1 Y kX x2 13 1. Variâncias 1 2,2 2 conhecidas Neste caso, a estatística do teste é a v.a Normal-Padrão: Z Y kX 2 k1 2 2 n2 k 2 1 2 n1 N0,1 14 __________________________ Hugo Boff - Estatística II 2020-I 21 Sob H0, a estatistica se reduz à Y kX 2 2 n2 k 2 1 2 n1 . Deste modo, para um nível de significância , a região de rejeição do teste de H0 dada em 13 será: RC Y kX 2 2 n2 k 2 1 2 n1 z/2 Y kX 2 2 n2 k 2 1 2 n1 z/2 13 Ou seja, H0 será rejeitada se a estimativa amostral y kx estiver fora do intervalo com extremidades 2 2 n2 k 2 1 2 n1 z/2. 2. Variâncias 1 2,2 2 desconhecidas mas iguais Neste caso temos 2 12 22. Sinalizamos acima que o estimador MVU da variância 2, comum às duas populações é: S2 n1 1S1 2 n2 1S22 n1 n2 2 15 e que, segundo 12, temos: n1 n2 2 S 2 2 2n1 n2 2 12 Assim, a estatística: Y kX 2 k1 1n2 k 2 1 n1 / S 2 2 Y kX 2 k1 S 1n2 k 2 1 n1 tem distribuição t Student. Ou seja: Y kX 2 k1 S 1n2 k 2 1 n1 Tn1 n2 2 16 Sob H0 esta estatística se reduz à Y kX S 1n2 k 2 1 n1 .Assim para um nível de significância , e os quantis t/2 da T Student com n1 n2 2 graus de liberdade, a região de rejeição do teste de H0 dada em 13 será: __________________________ Hugo Boff - Estatística II 2020-I 22 RC Y kX s 1n2 k 2 1 n1 t/2 Y kX s 1 n2 k 2 1 n1 t/2 13 onde s s2 é a estimativa do desvio-padrão comum às duas populações . Ou seja, à semelhança do caso anterior, H0 será rejeitada se a estimativa amostral y kx estiver fora do intervalo com extremidades s 1n2 k 2 1 n1 t/2. 3. Variâncias 1 2,2 2 desconhecidas e distintas Neste último caso, um teste aproximado apenas poderá ser construído. A estatística do teste terá distribuição aproximada pela t Student, novamente. Esta estatística será aquela dada em 14 na qual substitui-se as variâncias populacionais pelos seus estimadores amostrais. Mostra-se que, sob H0 : Y kX S2 2 n2 k 2 S1 2 n1 T 17 Os graus de liberdade são calculados pela parte inteira da seguinte expressão: s1 2 n1 s2 2 n2 2 1 n11 s1 2 n1 2 1n21 s2 2 n2 2 A hipótese nula H0 será então rejeitada se a estimativa amostral y kx estiver fora do intervalo com extremidades s2 2 n2 k 2 s1 2 n1 t/2. B) Testes para Comparação das Variâncias A igualdade ou proporcionalidade das variâncias das duas populações poderá ser inspecionada usando a v.a. F Fisher. Esta variável aleatória se define como o quociente entre duas v.a.’s qui-quadrado independentes, as quais são divididas pelos seus respectivos graus de liberdade: __________________________ Hugo Boff - Estatística II 2020-I 23 1 21/1 2 22/2 F1,2 17 Trata-se portanto de uma v.a. com dois parâmetros para os graus de liberdade: 1 para o numerador, e 2 para o denominador. Obviamente, temos a relação: F2,1 1F1,2 18 A densidade desta variável é representada abaixo para 1,2 1,10 linha preta; 5,10 linha vermelha; 10,10 linha azul; 10,5 linha verde. 0 1 2 3 4 5 6 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 F f(F) fFF;1,2 122 12 2 2 12 1 2 F 12 2 1 12 F 12 2 ; F 0 Vamos construir o teste bilateral para a hipótese: H0 : 1 2 2 2 k contra H1 : 1 2 2 2 k A estatística do teste é: S1 2/1 2 S2 2/2 2 Fn1 1,n2 1 19 Sob H0 a estatística fica: __________________________ Hugo Boff - Estatística II 2020-I 24 1 k S1 2 S2 2 Fn1 1,n2 1 19 Deste modo, para um nível de confiança , geralmente tomado a 2,5% ou 5%, determinamos na tabela da F Fisher os quantis f1 e f2 tais que: PFn1 1,n2 1 f1 /2 PFn1 1,n2 1 f2 Finalmente, a região de rejeição de H0 será: RC S1 2 S2 2 kf1n1 1,n2 1 S1 2 S2 2 kf2n1 1,n2 1 20 Obs.: As tabelas da F geralmente fixam o nível e apresentam o quantil f21,2 à direita tal que PF1,2 f21,2 /2. Para obter o quantil correpondente à área à esquerda, considere que PF1,2 f11,2 P 1 F1,2 1 f11,2 ou, usando 18 : PF1,2 f11,2 PF2,1 1f11,2 . Assim, temos 1 f11,2 f22,1 ou seja: f11,2 1f22,1 18 Aplicando este resultado, à região crítica 20 esta escreve-se agora: RC S1 2 S2 2 k f2n2 1,n1 1 S1 2 S2 2 kf2n1 1,n2 1 20 Exemplo 3: As notas obtidas pelos alunos de Estatística II nas faculdades de Economia e de Administração da UFRJ são v.a.’s Normais independentes, com média e variâncias desconhecidas. Uma amostra com 31 alunos de Economia e 41 alunos de Administração foi tomada e as estatísticas amostrais obtidas foram: x , s1 2 7.2 , 4.5 para a Economia e y , s2 2 6.1 , 5.4 para Administração. Como os programas das disciplinas são similares, e os professores praticamente os mesmos, a comparação estatística entre as médias e as variâncias fazem sentido. Usamos o nível de significância de 5%. __________________________ Hugo Boff - Estatística II 2020-I 25 Solução: 1. Para iluminar o teste das médias, vamos começar fazendo o teste da igualdade das variâncias. Para 0.5 temos pela tabela da F os quantis à 2,5% : f230,40 1.94 e f240,30 2.01 f130,40 1/f240,30 0.4975. Colocando k 1 a região crítica 20 fica: RC .05 S1 2 S2 2 0.4975 S1 2 S2 2 1.94 19 A estatística amostral é s1 2 s2 2 4.5 5.4 0.833 RC .05. Ou seja, a evidência amostral não permite rejeitar a hipótese da igualdade das variâncias. 2. Vamos agora fazer o teste de igualdade das médias, tomando as variâncias como iguais, de acôrdo com o resultado do teste anterior. A região crítica do teste é dado por 13 com k 1. O percentil crítico da v.a. t Student à 2,5%, com 70 graus de liberdade é: t .02570 1.994. Por outro lado, a estimativa do desvio-padrão populacional, de acôrdo com 15 é: s2 31 14,5 41 15.4 31 41 2 351 70 5.01 s 2.24 Temos também: 141 1 31 0.238. Então a região crítica fica: RC .05 Y kX 2.240.2381.994 Y kX 2.240.2381.994 RC .05 Y kX 1.063 Y kX 1.063. A estatística amostral do teste é: y 1x 6.1 7.2 1.1 RC. Ou seja, a hipótese da igualdade das médias é rejeitada, com probabilidade de erro de 5%. Há uma indicação amostral de que o desempenho dos alunos de Economia é melhor, a rejeição se dá no lado esquerdo da região crítica. __________________________ Hugo Boff - Estatística II 2020-I
Compartilhar