Baixe o app para aproveitar ainda mais
Prévia do material em texto
Teste de Hipótese Conceitos a serem introduzidos neste capítulo: •Procedimento de teste de hipótese •Hipótese nula e hipótese alternativa •Estatística de teste •Região de aceitação e região de rejeição •Erro I e Erro II •Probabilidades de erro: α e β •Hipótese simples e hipótese composta •Nível de significância, nível crítico ou valor-p•Nível de significância, nível crítico ou valor-p •Teste bilateral e teste unilateral •Teste de proporção •Teste t para amostras não pareadas – Variância amostral combinada •Teste t para amostras pareadas •Distribuição qui-quadrado •Teste Qui-quadrado para independência •Distribuição F de Fisher-Snedecor •Análise de Variância (ANOVA) – Comparações múltiplas Propaganda enganosa? A propaganda da Companhia de Cigarros Tabacox afirma que o teor médio de nicotina dos cigarros da marca Delicious, que ela fabrica é no máximo, de 0,7 mg. Um organismo fiscalizador analisa 16 cigarros dessa marca, obtendo um valor médio para a amostra analisada de 0,708 mg de nicotina. O organismo decide denunciar o fabricante à Justiça, que o autua por propaganda enganosa e o condena a pagar uma elevada multa. A Companhia decide recorrer. O seu advogado contrata um estatístico para saber se tem alguma chance de ganhar o recurso. O estatístico solicita os Teste de Hipótese saber se tem alguma chance de ganhar o recurso. O estatístico solicita os dados relativos às análises feitas pelo organismo fiscalizador e calcula as estatísticas adequadas. Sorrindo, diz para o advogado da Companhia: “Não tem problema não, pode apresentar o recurso.” Dias depois o recurso é deferido e a sentença inicial é revogada. A tranqüilidade do estatístico e sua confiança no julgamento positivo do recurso residem no conhecimento da teoria estatística, que, por meio de um teste de hipótese, lhe permitiram verificar que uma média amostral de 0,708 mg pode muito provavelmente ser proveniente de uma população com média 0,7. Para o advogado e para a diretoria da Companhia, ficou evidente a conveniência de se ter algum conhecimento das técnicas estatísticas, mesmo em uma área aparentemente tão distante dela como o Direito. Algumas outras situações em que a metodologia dos Testes de Hipótese pode ser utilizada para dirimir questões aparentemente controversas: � Será que o fato de a TV transmitir um debate entre os 2 únicos candidatos em uma eleição presidencial, pode alterar significativamente as chances de vitória de cada um ? Teste de Hipótese � Será que existem diferenças expressivas entre as eficácias de 5 diferentes tratamentos para combater uma determinada doença? � Será que existe relação entre o nível de estresse de um trabalhador e o tipo de atividade que ele realiza dentro da sua empresa? Suponha que o modelo matemático representado pela função de densidade f, descreve adequadamente o comportamento probabilístico de uma certa variável. Admita que f depende de um parâmetro θ, cujo valor é desconhecido. Deseja-se, através Conceitos Básicos cujo valor é desconhecido. Deseja-se, através de um experimento, envolvendo a coleta de dados reais, decidir entre duas afirmações conflitantes a respeito do valor correto de θ: a hipótese nula H0 e a hipótese alternativa H1. Sejam X1, X2, ..., Xn variáveis aleatórias iid (que representam n réplicas do mesmo experimento), todas elas obedecendo a esse mesmo modelo, que depende do parâmetro θ de valor desconhecido. Deseja-se estabelecer um critério de decisão que nos leve a : Aceitar H0 ou Conceitos Básicos(Cont.) Rejeitar H0 (em favor de H1), com base nos valores medidos de X1, X2, ..., Xn. Usualmente, a escolha desse critério passa por eleger uma função t de X1, X2, ..., Xn chamada estatística de teste e dividir o conjunto dos valores possíveis de t(X1, X2, ..., Xn) em duas partes chamadas Região de Aceitação A e Região de Rejeição R. Assim, conforme o valor de t, calculado a partir dos dados coletados, pertença a A ou pertença a R, aceita-se H0 ou rejeita-se H0 . Ocorre que há dois tipos possíveis de erro de decisão, que seria conveniente evitar : Erro I - Rejeitar H0, quando H0 é verdadeira; Conceitos Básicos(Cont.) Erro I - Rejeitar H0, quando H0 é verdadeira; Erro II - Aceitar H0, quando H0 é falsa; Com Probabilidades: αααα = P [ Erro I ] = P[ Rejeitar H0 ] , sendo H0 é verdadeira e ββββ = P [ Erro II ] = P[ Aceitar H0 ] , sendo H0 é falsa. ● População: todos os cigarros da marca Delicious produzidos pela Companhia de Cigarros Tabacox ● Propriedade da população a ser analisada: teor de nicotina, representado pela v.a. X. ● Proposição sobre a propriedade da população: O teor de nicotina destes cigarros é no máximo 0,7 mg ● Função de densidade: podemos supor distribuição Normal Exemplo: No caso da situação, sobre a suspeita de propaganda enganosa temos: Normal ● Parâmetro: teor médio de nicotina dos cigarros Delicious, µ (em mg) ● Hipótese Nula: O teor médio de nicotina da marca Delicious é no máximo igual a 0,7 mg. Simbolicamente, H0: µ ≤ 0,7 ● Hipótese Alternativa: O teor médio de nicotina da marca Delicious é maior que 0,7 mg. Simbolicamente, H1: µ > 0,7 ● Amostra aleatória X1, X2, ..., Xn: teor de nicotina em cada cigarro dessa marca selecionado para análise Como devemos especificar o que são H0 e H1? É usual que na formulação de um teste de hipótese, no momento em que se define o que serão H0 e H1, seja reservado para: H0 o papel da hipótese mais conservadora; H1 o papel da hipótese mais inovadora. 1. No caso da propaganda supostamente enganosa, consideremos que 0,7 mg de nicotina em um cigarro pode ser considerado um baixo teor e é o que o fabricante informa no rótulo da embalagem. Então, a hipótese nula; H0: µµµµ ≤≤≤≤ 0,7; pode ser entendida como “O teor de nicotina dos cigarros Delicious segue as especificações divulgadas pelo fabricante”. especificações divulgadas pelo fabricante”. Já a hipótese alternativa; H1: µµµµ > 0,7; pode ser entendida como “O teor de nicotina dos cigarros Delicious não segue as especificações divulgadas pelo fabricante”. H0 é a mais conservadora no sentido de que, se ela for verdadeira, não há nada a ser corrigido. H1 seria a mais inovadora, no sentido de que, se ela for verdadeira, provavelmente se justificaria uma medida mais drástica, porque neste caso estaria caracterizada uma propaganda enganosa. 2. No caso do debate televisado entre os dois candidatos a presidente, H0: “O debate não afetará as preferências do eleitorado” H1: “O debate alterará as preferências do eleitorado”. É claro que H0 é a mais conservadora, já que ela significa que tudo permanece inalterado, enquanto H1 é a mais inovadora porque implica em uma mudança no cenário eleitoral. 3. No caso dos 5 tratamentos para a mesma doença, H0: (conservadora) “Os 5 tratamentos são igualmente eficazes”, ou seja, “Tanto faz usar o tratamento A ou B ou C ou D ou E, porque a chance de cura é a mesma em ou C ou D ou E, porque a chance de cura é a mesma em todos os casos”. H1: (inovadora) seria “Há diferenças entre as eficácias dos 5 tratamentos”, ou seja, “As chances de cura não são as mesmas”. 4. No caso da relação entre tipo de atividade e estresse, H0: (conservadora) seria “O nível de estresse do trabalhador independdo tipo de atividade que ele exerce”, ou seja, “Todas as atividades são igualmente estressantes”. H1: (inovadora) seria “Há uma relação de dependência entre o nível de estresse do trabalhador e o tipo de atividade que ele exerce”. O que são hipótese simples e hipótese composta? Dizemos que H0 (ou H1) é uma hipótese simples se a ela corresponde um único valor do parâmetro θ. Neste caso fica também definida de forma únicaa distribuição de probabilidade comum às v.a.’s X1, X2,..., Xn . Caso contrário, trata-se de uma hipótese composta. Ou seja, a igualdade θθθθ = θθθθ0 define uma hipótese simples, enquanto as desigualdades θθθθ ≤≤≤≤ θθθθ0 , θθθθ < θθθθ0 , θθθθ ≥≥≥≥ θθθθ0 e θθθθ > θθθθ0 definem hipóteses compostas. A hipótese nula H0 vista como uma hipótese simples A hipótese H0 sempre será tratada como uma hipótese simples. Já a hipótese alternativa H1 é, em geral, uma hipótese composta, Já a hipótese alternativa H1 é, em geral, uma hipótese composta, ou seja, inclui mais de um valor de θ e, conseqüentemente, mais de uma distribuição de probabilidade. Em outras palavras, mesmo que as hipóteses sejam do tipo: H0: θθθθ ≤≤≤≤ θθθθ0 vs. H1: θθθθ > θθθθ0, ou H0: θθθθ ≥≥≥≥ θθθθ0 vs. H1: θθθθ < θθθθ0, a hipótese nula será considerada como H0: θθθθ=θθθθ0, já que em ambas as situações θθθθ0 é o valor limite entre H0 e H1 e portanto é o caso mais desfavorável a H0, além de especificar uma única distribuição de probabilidade. O que podemos dizer sobre as prob. de erro αααα e ββββ? Vimos acima que há dois tipos possíveis de erro de decisão: o Erro I, rejeitar H0 quando ela é verdadeira, tem probabilidade αααα de ocorrer o Erro II, aceitar H0 quando ela é falsa, tem probabilidade ββββ de ocorrer ● O ideal seria que ambas as probabilidades de erro, αααα e ββββ, ● O ideal seria que ambas as probabilidades de erro, αααα e ββββ, fossem tão pequenas quanto possível. ● Mas infelizmente, se o tamanho n da amostra está fixado, uma diminuição de ββββ traz como conseqüência um aumento em αααα e vice-versa. Por que? Para diminuirmos a probabilidade do Erro II, teríamos que fazer com que a região de aceitação A diminuísse. Conseqüentemente, a região de rejeição R aumentaria, o que inevitavelmente provocaria um aumento na probabilidade do Erro I. ● Assim, a única forma de fazer com que ambos, αααα e ββββ, diminuíssem, seria aumentar o tamanho n da amostra. (Ver Seção 8.6). O Erro I no centro das atenções Por definição, αααα é calculada supondo-se H0 verdadeira, ou seja, a partir da distribuição de probabilidade única postulada por H0. Por outro lado, ββββ é calculada supondo H1 verdadeira. Então, em geral há infinitos valores possíveis para ββββ, correspondentes a infinitas distribuições de probabilidade. Assim, o cálculo de ββββ é Normalmente bem mais complexo que o de αααα. O Erro I é o mais importante a ser evitado, isto é, as hipóteses são formuladas de forma a que H0 seja aquela hipótese O Erro I é o mais importante a ser evitado, isto é, as hipóteses são formuladas de forma a que H0 seja aquela hipótese cuja rejeição equivocada constitui o erro de maior importância. Costuma-se fixar um valor pequeno para αααα (digamos: 0,05 ou 0,01) e, ao mesmo tempo, procurar usar procedimentos de teste para os quais os valores de ββββ sejam os menores possíveis. A formulação adequada da hipótese H0 vem a ser, nestas circunstâncias, vital na realização de uma experiência. A questão é que o julgamento da importância de um erro de decisão pode ser bastante subjetivo. Consideremos, por exemplo, o caso da suposta propaganda enganosa. A hipótese H0, tal como foi formulada acima, atende aos interesses do fabricante, dado que para ele o erro que mais interessa evitar é o de se concluir (erradamente) que o teor médio de nicotina do seu produto é maior do que o afirmado por ele. Do ponto de vista do consumidor a situação pode ser diametralmente oposta. O erro que este quer minimizar é diametralmente oposta. O erro que este quer minimizar é que se conclua que o teor médio de nicotina é menor que 0,7 mg, se de fato ele for maior. Assim, para o consumidor, a hipótese H0 deveria ser: “O teor médio de nicotina é maior ou igual a 0,7 mg”. A nossa atenção estará normalmente voltada para o Erro I, e naturalmente admitiremos que a hipótese H0 foi corretamente formulada. Considerações sobre o Erro II serão feitas quando examinarmos com mais detalhe o conceito de poder de um teste de hipótese (Ver Exemplo 8.7). Suponha que a longitude máxima de crânios humanos de uma certa raça A da antiguidade pode ser encarada como uma variável aleatória com distribuição Normal de média 145 mm e desvio padrão 12 mm. Por outro lado, para uma segunda raça B, a longitude máxima dos crânios segue uma distribuição Normal com média 149 mm e o mesmo desvio padrão de 12 mm. Exemplo 8.2: Arqueologia – Os crânios encontrados são de que raça? 149 mm e o mesmo desvio padrão de 12 mm. Admita agora que, em uma escavação, foram encontrados 36 crânios e há dúvidas quanto à raça da população da qual eles são provenientes. Evidências adicionais encontradas nessa escavação mostram que os crânios só podem ser de uma das duas raças: A ou B. Os antropólogos consultados acreditam que a longitude máxima do crânio fornece uma boa medida para se especificar a raça. Como podemos decidir de que raça são os crânios? Formule o problema em um contexto de Teste de Hipótese. Uma hipótese será que µ = 145 (raça A), enquanto a outra será que µ = 149 (raça B), mas qual deve ser a hipótese nula e qual a alternativa? Suponha que, por razões históricas, sabe-se que o povo da raça A habitava na região onde foram encontrados os crânios. Logo, não seria surpreendente que fossem encontrados crânios dessa raça na referida região. Por outro lado, suponha que se os crânios fossem da raça B isso representaria um achado de valor científico. Nesse caso, o erro a minimizar deve ser o de rejeitar a hipótese H0, quando ela é verdadeira, ou seja, o erro de decidir Solução do exemplo 8.2: Nesse caso, o erro a minimizar deve ser o de rejeitar a hipótese H0, quando ela é verdadeira, ou seja, o erro de decidir pela raça B quando os crânios são de fato da raça A. Devemos fazer com que a probabilidade α de se cometer o Erro I tenha um valor pequeno. Portanto a hipótese nula deverá ser µ = 145 (conservadora) e a hipótese alternativa µ = 149 (inovadora), ou seja: H0: µ = 145 versus H1: µ = 149. Dizer que os crânios são da raça A equivale a dizer que suas longitudes máximas provêm de uma Normal(145; 122). Já se eles são da raça B seus comprimentos máximos obedecem a uma Normal(149; 122). Como as hipóteses são relativas à média populacional, uma boa medida para se usar na decisão entre as duas populações é a média da amostra, que será, portanto, a nossa estatística de teste. Os 36 crânios encontrados podem ser considerados como uma amostra aleatória da população de raça A ou da população de raça B. Suponha que a média amostral da longitude máxima, calculada com base nos 36 crânios Solução do exemplo 8.2: longitude máxima, calculada com base nos 36 crânios encontrados foi = 147,3 mm. Qual seria o critério de decisão a ser adotado se quisermos “amarrar” o valor de α em 0,05 ? Denotemos por o valor que serve como fronteira de decisão entre as regiões de aceitação A e de rejeição R. Esse ponto é usualmente chamado ponto de corte ou valor crítico. Então, aceitamos H0, se ≤ ; e decidimos pela rejeição de H0 obsX Cx X Cx Exemplo 8.2: Arqueologia – Os crânios encontrados são de que raça? Seja p a proporção dos profissionais formados por uma Instituição de Ensino Superior (IES) que estão bem preparados. Suponha que em um determinado país, entre as IES que oferecem cursos de graduação em Administração, há : - Cursos de Boa Qualidade, onde p = 0,80 - Cursos de Má Qualidade, onde p = 0,60 O governo decide então adotar um sistema que visa avaliar, por amostragem, o nível de ensino de Administração em Exemplo A: avaliar, por amostragem, o nível de ensino de Administração em uma dada IES (qualquer semelhança é mera coincidência!)e usa como critério de decisão o seguinte : Sorteia aleatoriamente n = 50 entre os formandos daquela IES e os submete a uma prova de conhecimento (a mesma para todas as IES). Se o número de aprovados na amostra for inferior a 35, aquele curso está descredenciado. Caso contrário, ele é autorizado a continuar funcionando. Formule o problema em um contexto de Teste de Hipótese. Admitindo que essa prova mede adequadamente o grau de preparo das pessoas, o modelo probabilístico para a situação de um formando de uma IES genérica é a distribuição de Bernoulli com parâmetro p , onde P(sucesso) = P(aprovação na prova) = p -A hipótese nula é H0 : p = 0.80 (Ensino de Boa Qualidade); Solução do Exemplo A 0 -A hipótese alternativa é H1 : p = 0.60 (Ensino de Má Qualidade); Temos então X1, X2, ..., X50 variáveis aleatórias iid, todas com distribuição de Bernoulli com parâmetro p, onde p é desconhecido. A estatística de teste é t = . O critério de decisão adotado é: Rejeitar H0 se < 35 . Caso contrário, aceitar H0. X i i 1 50 = ∑ Xi i 1 50 = ∑ Esquema do Exemplo A ...... 35 ∑ = = 50 1i ixt ERRO I As probabilidades associadas aos Erros I e II são : α = P [ Erro I ] = , sendo p = 0.80 Logo α = = = P X 35i i 1 50 = ∑ < P X 34i i 1 50 = ∑ ≤ P X 34.5 P X 34.5 50 i i 1 50 = ∑ ≤ = ≤ = = = 0.0262 (aproximando a Binomial por uma Normal) Isto significa que, mesmo que o curso da IES seja de boa qualidade, existiria uma chance de 2,62% de que, como resultado da regra estabelecida, ele erradamente viesse a ser descredenciado. i 1= 50i 1= P X 0.80 0.80x0.20 50 34.5 50 0.80 0.80x0.20 50 − ≤ − [ ]P Z 1.94≤ − ERRO II Analogamente, β = P [ Erro II ] = , sendo p = 0.60 Logo β = = = P X 35i i 1 50 = ∑ ≥ P X 35i i 1 50 = ∑ ≥ P X 34.5 P X 34.5 50 i i 1 50 = ∑ ≥ = ≥ 34.5 − = = = 0.0559 Isto significa que, mesmo que o curso da IES seja de má qualidade, existiria uma chance de 5,59% de que, como resultado da regra estabelecida, ele erradamente fosse autorizado a continuar funcionando. P X 0.60 0.60x0.40 50 34.5 50 0.60 0.60x0.40 50 − ≥ − [ ]P Z 1.59≥ Rotina para Obtenção do Critério de Decisão (1o)Escolher um valor para α = P [ Erro I ], também chamado nível de significância do teste (usualmente α = 0,01 ou α = 0,05); (2o)Eleger a estatística de teste t (X1, X2, ..., Xn), uma variável aleatória que depende de X1, X2, ..., Xn e que, supostamente, “resume toda a informação relevante” para que se decida por H0 ou por H1; (3o)Determinar a distribuição de probabilidade de t, quando H0 é verdadeira;verdadeira; (4o)Especificar a região de rejeição R, ou seja, o conjunto de valores de t que nos levarão a rejeitar H0, de tal forma que o nível de significância do teste seja igual ao α escolhido no 1o passo. Automaticamente estará também especificada a Região de Aceitação A; (5o)Coletar os dados x1, x2, ..., xn, calcular valor de t (X1, X2, ..., Xn) e decidir pela rejeição ou pela aceitação de H0, conforme o critério especificado no 4o passo; Nível Crítico ou Valor-p Vamos agora definir o conceito de nível crítico ou valor-p associado a uma determinada amostra x1, x2, ..., xn (onde xi é o valor assumido pela variável aleatória Xi em um determinado experimento da coleta de dados , i = 1, 2, ..., n) : Trata-se do menor valor de α (nível de significância do teste) para o qual, ao trabalhar com os valores observados x1, x2, ..., xn, ainda rejeitaríamos H0 . Exemplo B: Deseja-se testar a hipótese H0 de que em média os habitantes de uma certa localidade vivem pelo menos 60 anos. Para isso foi extraída uma amostra com 16 casos dos registros de óbitos da localidade, ao longo do último ano e foram registrados os tempos de vida em anos de cada um desses 16 indivíduos. A média e o desvio padrão amostrais foram, respectivamente, 50 e 20.e o desvio padrão amostrais foram, respectivamente, 50 e 20. (a) Qual seria a sua conclusão, ao nível de significância de 5% ? (b) Qual o nível crítico ? Solução do Exemplo B (a) Será que, mesmo que se viva em média pelo menos 60 anos nessa localidade, a chance de se obter, com uma amostra de 16 pessoas, uma média amostral de 50 anos ou menos, não pode ser razoavelmente grande? Se, ao contrário, ela for bem pequena, teremos evidências suficientes de que H0 é falsa. Na falta de maiores informações sobre a distribuição deNa falta de maiores informações sobre a distribuição de probabilidade do tempo de vida das pessoas, admitiremos que se trata de uma Normal com média µ (desconhecida) e desvio padrão σ (também desconhecido). Temos então 16 variáveis aleatórias iid X1, X2, ..., Xn, onde Xi ∼ N(µ, σ), para todo i. As hipóteses nula e alternativa podem ser expressas como : H0 : µµµµ ≥≥≥≥ 60 H1 : µµµµ <<<< 60 Solução do Exemplo B Vamos então seguir os passos da Rotina acima recomendada : (1o) Escolher α = 0.05 (2o) Eleger como estatística de teste a média amostral(2o) Eleger como estatística de teste a média amostral , já que estamos tentando fazer inferências sobre a média populacional µ. X X 16 i i 1 16 = = ∑ Solução do Exemplo B (3o) A distribuição de probabilidade de é uma Normal com média µ e desvio padrão . Padronizando temos que , tem distribuição N(0, 1). Quando o desvio padrão σ é também desconhecido (o que X σ σ16 4= Z X = − µ σ 4 Quando o desvio padrão σ é também desconhecido (o que é a situação mais comum), o procedimento usual é então substituir na expressão acima, o desvio padrão populacional , σ , pelo desvio padrão amostral, S. Assim, a estatística de teste passaria a ser , cuja distribuição, seja H0 verdadeira ou falsa, é uma distribuição t de Student com 16 − 1 = 15 graus de liberdade (ver Estimação por Intervalo). T X S 4 = − µ Solução do Exemplo B (4o) Para especificar a Região de Rejeição, R, do teste inicialmente observemos que quanto menor for , maiores serão as razões para se rejeitar H0. Então, um critério de decisão razoável seria : Rejeitar H0, se onde B é uma constante a ser especificada. Por outro lado, como T é uma função crescente de , este X BX < XPor outro lado, como T é uma função crescente de , este critério é equivalente a: Rejeitar H0, se T < C, onde C é uma outra constante a ser especificada no eixo da estatística t-student. O valor de C deve ser então escolhido de tal forma a que : P [ Erro I ] = P[ Rejeitar H0 ] = αααα , se H0 é verdadeira ou seja, devemos ter = 0,05, se µµµµ ≥≥≥≥ 60 . Isto implica que C = t0,05 (15) = -1,753 X [ ]P T C< Solução do Exemplo B Nosso critério de decisão passa a ser então : Rejeitar H0, se Porém, embora este valor de T dependa de e S (que são calculáveis a partir dos dados), ele depende também do próprio µ. Que valor deve ser atribuído a µ no momento de se X 1.753 4S µX T −< − = calcular o valor de T a partir dos dados, para poder decidir pela rejeição ou não da hipótese H0? Como, para H0 ser verdadeira, µ ≥ 60 , usamos aqui a situação limite , isto é, µµµµ = 60. O nosso critério de decisão é então, finalmente: Rejeitar H0, se 1.753 4S 60X T −< − = Solução do Exemplo B (5o) Uma vez coletados os dados, obtivemos = 50 e S = 20Logo, o “valor observado” de T é X = - 2.00 , que está na Região de Rejeição R . A decisão a ser tomada é então rejeitar a hipótese H0 de que nessa localidade as pessoas vivem em média pelo menos 60 anos. 50 60 20 4 − Solução do Exemplo B (b) Usando αααα = 0,05, H0 foi rejeitada à luz dos dados coletados. E se tivéssemos usado αααα = 0,01, qual seria a nossa decisão ? Reproduzindo o raciocínio acima vemos que t0,01(15) = -2,602. Isto mostra que ao nível de significância αααα = 0,01 , a decisão indicada seria aceitar H0. Então se formos reduzindo progressivamente o valor de α desdeEntão se formos reduzindo progressivamente o valor de α desde 0,05 até 0,01, vai existir um ponto em que a nossa decisão passa de rejeição para aceitação. Este é o nível crítico (p-valor) associado à nossa amostra. No caso do exemplo considerado, temos = 0,032 . OBS.: É claro que o nível crítico ( ou valor-p ), , nos fornece uma medida do “grau de veracidade” de H0: Quanto menor for o valor de , mais motivos teremos para acreditar que H0 é falsa. ɵα ɵα ɵα ɵα Figura - O nível crítico – Exemplo B tobs= −−−−2,000 -1,753-2,602 Testes Paramétricos versus Testes Não Paramétricos Em um Teste Paramétrico admite-se conhecida a família de distribuições de probabilidade das variáveis aleatórias envolvidas. Exemplo: No exemplo precedente, admitimos que os Xi ’s têm todos a distribuição Normal(µ, σ). O teste aplicado, que se baseia em uma estatística com distribuição t de Student sob H0, é um teste paramétrico. Em um Teste Não Paramétrico não é especificada a forma matemática das distribuições de probabilidade das variáveis envolvidas. Testes para Comparação das médias de duas variáveis Testes com amostras pareadas Teste t Teste de Wilcoxon Teste do Sinal Paramétrico Não Paramétricos Testes com amostras não pareadas Teste t Teste da mediana Teste de Mann-Whitney Teste de Wald-Wolfowitz Paramétrico Não Paramétricos Teste t para amostras não pareadas Sejam X1, X2, ..., Xm v.a.’s iid com distribuição comum Normal (µX, σX) e Y1, Y2, ..., Yn v.a.’s iid com distribuição comum Normal (µY, σY). Admite-se também que há independência entre os Xi’s e os Yj’s. Queremos testar H0: µX = µY contra H1: µX ≠ µY. Admitiremos válida também a premissa de que os desvios padrão σX e σY são iguais, isto é, σX = σY = σ, embora o seu valor σ seja desconhecido. Exemplo C Um analista de portfolio deseja verificar se a habilidade do seu antecessor em identificar boas oportunidades de investimento era significativamente superior a um critério aleatório de escolha de ações. São selecionadas então duas amostras de ações: • a primeira com 12 ações da carteira apontada pelo• a primeira com 12 ações da carteira apontada pelo antecessor, cujos retornos ao longo de um período fixado foram x1, x2, ..., x12; • a segunda com 15 ações sorteadas ao acaso entre todas as disponíveis, cujos retornos ao longo do mesmo período foram y1, y2, ..., y15. Se , que conclusão pode ser extraída? x 15%,s 3%,y 10%,s 2%X Y= = = = Teste a ser usado A estatística de teste a ser usada é onde: é a média amostral dos Xi’s, i = 1,..., m; T X Y S 1 m 1 n p 2 = − + =>X é a média amostral dos Yj’s, j = 1,..., n; é a variância amostral dos Xi’s, i = 1,..., m; é a variância amostral dos Yj’s, j = 1,..., n; é o estimador combinado de σ2. =>Y =>2xS =>2YS ( ) ( ) S m 1S n 1S m n 2 p 2 X 2 Y 2 = − + − + − Prova-se que se H0 é verdadeira, T tem distribuição t de Student com m + n − 2 graus de liberdade. Assim, uma vez escolhido o nível de significância α, rejeita-se H0 se Obs.: Quando a hipótese alternativa é do tipo H1: µX ≠ µY como .2)n(m t tT 2 α 1 0 −+=> − acima, diz-se que o teste é bilateral. Caso a alternativa fosse do tipo H1: µX > µY, o critério de decisão seria rejeitar H0 se Teríamos então um teste unilateral. (E se H1: µX < µY, qual seria o critério?) .2)n(m t tT 10 −+=> −α Justificativa para o procedimento Decorre das premissas que ∼ e ∼ e e são v.a.’s independentes. Então pode-se provar que ∼ Daí, padronizando, N m Xµ σ , X Y N n Yµ σ , X Y X Y− . 11 , 2 +− nm N YX σµµ − − −µ µ ∼ N (0 ; 1). Note que, ao substituir σ por sua estimativa combinada Sp (já que, sob H0, µX − µY = 0) obtemos exatamente a estatística de teste T, cuja distribuição será uma t de Student com m + n − 2 graus de liberdade. ( ) ( )X Y m n X Y− − − + µ µ σ2 1 1 Solução do Exemplo C Neste caso queremos testar H0: µX = µY contra H1: µX > µY. Por que? Aplicando o teste t, temos: ( ) ( )S 12 1 3 15 1 2 12 15 2 6,2p 2 2 2 = − × + − × + − = 15 10−Logo, Como T = 5,18 > 2,49 = t0,01(25), rejeita-se a hipótese H0 ao nível α = 0,01. Ou seja, os dados parecem indicar que o critério de escolha do administrador anterior era significativamente superior a um critério aleatório. ( )T 15 10 6,2 1 12 1 15 5,18. obs = − + = Testando a Independência entre duas variáveis Teste Qui-Quadrado para Independência Dadas duas variáveis aleatórias discretas X e Y, a idéia aqui é comparar a sua distribuição conjunta amostral com o produto das respectivas distribuições marginais amostrais (lembrando que, se X e Y são independentes, devemos ter:que, se X e Y são independentes, devemos ter: P[X=x, Y=y] = P[X=x] . P[Y=y] , para todo par (x,y) ). A estatística de teste, em um certo sentido, mede uma distância entre essas duas distribuições empíricas. Quanto menor for essa distância, mais fortes serão as razões para se supor que X e Y são independentes. Testando a Independência entre duas variáveis(Cont2.) Teste Qui-Quadrado para Independência(Cont.) Admita que X pode assumir os valores a1 , a2 , ..., aK e Y pode assumir os valores b1 , b2 , ..., bL. Queremos testar: Ho: P[X = ak , Y = bl] = P[X = ak] . P[Y = bl] , ∀ k=1, ..., K e ∀ l =1, ...,L∀ k=1, ..., K e ∀ l =1, ...,L contra H1: P[X = ak , Y = bl] ≠ P[X = ak] . P[Y = bl] , para algum par (k,l) Suponha que foram levantados experimentalmente n pares de observações independentes (xi, yi), i=1,2,...,n. Monta-se então uma Tabela de Contingência de acordo com o próximo slide: Testando a Independência entre duas variáveis(Cont.3) Valores de X Valores de Y Total b1 . . . bl . . . bL a1 n11 . . . n1l . . . n1L n1. . . . . . . . . . . . . . . . ak Nk1 . . . nkl . . . nkL nk.a N . . . n . . . n n . . . . . . . . . . . . . . . . aK nK1 . . . nKl . . . nKL nK. Total n..1 . . . n.l . . . n.L n onde nkl = # { i: 1 ≤ i ≤ n, xi = ak e yi = bl}, para todo par (k,l) nk. = nk1 + ... + nkL, ∀ k = 1,...,K n.l = n1l + ... + nKl, ∀ l = 1,...,L n = n n . n.kl lk k k l l ∑∑ ∑ ∑= = Exemplo D Será que existe alguma relação entre as quantidades de calorias e de colesterol presentes nos alimentos? A Tabela 3.4 foi obtida com base em uma amostra sistemática extraída da relação de alimentos contida na publicação “The Complete Book of Food Counts “ de 1997 e a partir desta foi construida a Tabela 3.2 no próximo slide. Como as duas variáveis aqui consideradas são ambas contínuas, para aplicar o teste do qui-quadrado para independência, ocontínuas, para aplicar o teste do qui-quadrado para independência, o primeiro passo foi discretizá-las. Assim, os 77 alimentos que compõem a amostra foram divididos em duas categorias, conforme o seu conteúdo de colesterol: - Pobre em colesterol, se elecontém menos de 1 mg de colesterol - Rico em colesterol, se ele contém no mínimo 1 mg de colesterol. Da mesma forma, esses 77 alimentos foram divididos em outras duas categorias: - Pobre em calorias, se ele contém menos de 150 cal - Rico em calorias, se ele contém, no mínimo 150 cal. Exemplo D(Cont.) Tabela 3.2 - Tabela de Contingência Calorias x Colesterol com base em uma amostra de 77 alimentos. Colesterol Calorias Total Pobre Rico Pobre 29 15 44 Rico 9 24 33Rico 9 24 33 Total 38 39 77 Trata-se portanto de uma tabela de contingência 2 x 2. Voltando à situação geral, seja , para todo par (k,l) (note que Ekl corresponde ao valor esperado de nkl, se Ho fosse verdadeira, dados nk. e n.l) Fonte: “The Complete Book of Food Counts”, C.T. Netzer, Dell Publishing, 1997 n n..n E lkkl × = Exemplo D(Cont2.) A Estatística de teste é: e pode-se provar que, se H0 é verdadeira, quando n →→→→ ∞∞∞∞ ela tem uma distribuição que tende a ( )n E E kl kl 2 kll 1 L k 1 K − == ∑∑ verdadeira, quando n →→→→ ∞∞∞∞ ela tem uma distribuição que tende a uma Qui-Quadrado com (K − 1) (L − 1) graus de liberdade. O critério de decisão é: Rejeitar H0, se o valor observado da estatística de teste for superior ao quantil 1 − αααα de uma Qui-Quadrado com (K − 1) (L − 1) g.l. Solução do Exemplo D A Tabela 3.3 contém os valores esperados em cada posição da tabela anterior, caso houvesse independência entre as variáveis. Colesterol x Calorias - Tabela com os valores esperados sob a hipótese de independência Colesterol Calorias Total Pobre Rico Pobre 21,71 22,29 44 Rico 16,29 16,71 33 Total 38 39 O valor da estatística de teste é então ( ) ( ) ( ) ( )29 2171 2171 15 2229 2229 9 16 29 16 29 24 1671 1671 977 2 2 2 2 − + − + − + − = , , , , , , , , , . Solução do Exemplo D(Cont.) Já que o número de graus de liberdade aqui é: (2 − 1) (2 − 1) = 1 , vemos da tabela de distribuição qui-quadrado que, ao nível de significância αααα = 1%, H0 deve ser rejeitada se a estatística de teste for superior a 6,635. Como 9,77 > 6,635 , rejeitamos H neste caso.Como 9,77 > 6,635 , rejeitamos H0 neste caso. Conclui-se então que os dados disponíveis trazem evidência suficiente de que há interdependência entre as quantidades de calorias e de colesterol nos alimentos. Mais ainda: com base em uma comparação entre as duas tabelas anteriores, vemos que quanto mais rico o alimento for em calorias, mais rico ele tende a ser em colesterol (e vice-versa ). Análise de Variância com 1 efeito Suponha que desejamos comparar os efeitos de m “tratamentos”, usando a variável Y como a nossa variável resposta. Cada tratamento será experimentado n vezes. Assim Yij representará a resposta obtida quando for feita a j-ésima tentativa com o i-ésimo tratamento, i=1,2,...,m e j=1,2,...,n. O modelo de Análise da Variância pressupõe que se possa representar esse fenômeno na forma:representar esse fenômeno na forma: Yij = µ + αi + eij i = 1,...,m ; j = 1,...,n onde: - µ , α1, α2, ...,αm são constantes desconhecidas e tais que - eij‘s - são v.a.’s iid com distribuição de probabilidade Normal de média 0 e desvio padrão σ, σ desconhecido. Assim, os Yij serão também v.a.’s onde E(Yij) = µ + αi e Var(Yij) = σ2, para todo i,j. 0α m 1i i =∑ = Observação Observe que, neste modelo : (a) é o valor esperado da resposta quando for aplicado o i-ésimo tratamento, . (b) os eij representam uma perturbação aleatória, isto é, a variabilidade da resposta que o modelo não explica. ii αµµ ++++==== ∀i variabilidade da resposta que o modelo não explica. Queremos testar a hipótese nula de que não há diferença entre os m tratamentos em termos do seu efeito esperado, isto é, H0: α1 = ... = αm = 0 Versus H1: αi ≠ 0, para algum i Exemplo E Deseja-se investigar a resistência à tensão de uma fibra sintética usada na fabricação de tecido para camisas masculinas. Em particular suspeita-se que essa resistência é afetada pelo percentual de algodão na composição (em termos de peso) da fibra. Foi então realizado um experimento em que, para cada umFoi então realizado um experimento em que, para cada um dos 5 seguintes níveis do percentual de algodão na fibra: 15%, 20%, 25%, 30%, 35%, foram realizados 5 replicações independentes do processo de mensuração da resistência. Os dados coletados estão na Tabela a seguir. (Prox. Slide) Tabela - Resultados do experimento referente à resistência da fibra sintética Replicações % de peso do Algodão Replicações 1 2 3 4 5 15 7 7 15 11 9 20 12 17 12 18 18 25 14 18 18 19 19 30 19 25 22 19 23 35 7 10 11 15 11 Existe diferença significativa entre os 5 níveis de percentual de algodão na fibra no que se refere ao seu efeito sobre a resistência à tensão? Existe uma identidade matemática que nos permite expressar a variabilidade total dos dados SStotal como a soma de duas parcelas: Exemplo E(Cont.1) duas parcelas: - a variabilidade entre tratamentos SSentre e - a variabilidade intra tratamentos SSintra. SStotal= SSentre+ Ssintra onde: SStotal = SSentre = SSintra = ; , ; 2 m ii n 1j ij )Y(Y i ..−∑∑ = = 2 ..i. m ii i )YY(n −∑ = 2 i. m ii n 1j ij )Y(Y i −∑∑ = = i n 1=j ij n Y =Y i ∑ i. ∀i i∑ ∑∑ nm Y =Y m 1i= n 1=j ij .. i Esta identidade é a base sobre a qual repousa a metodologia usada para testar H0 contra H1. Intuitivamente, quanto maior for SSentre quando comparado com SSintra, mais motivos teremos para rejeitar H0. A estatística de teste usual é então: Exemplo E(Cont.2) 1m SS F entre −=A estatística de teste usual é então: e é possível provar que , se H0 é verdadeira, ela tem distribuição F de Snedecor com graus de liberdade m-1 e (n-1)m. Assim, uma vez fixado o nível de significância a do teste, H0 deve ser rejeitada se (F)obs > F1-α (m−1,(n−1)m), sendo que a expressão do membro direito representa o quartil 1− α da distribuição F com graus de liberdade m-1 e (n-1)m. 1)m(n SS 1mF intra − −= Justificativa para o Procedimento Adotado Devido à forma como foram definidas SSentre e SSintra: 1. Quanto mais afastadas (resp. próximas) entre si estiverem as médias amostrais , i = 1,2,...,m; e 2. Quanto mais próximos (resp. afastadas) entre si estiverem os yij, j = 1,2,...,n, relativos a um mesmo tratamento j; iY yij, j = 1,2,...,n, relativos a um mesmo tratamento j; mais motivos teremos para rejeitar (resp. aceitar) H0. Por outro lado, se as condições 1 e 2 acima forem atendidas (resp. se valer o que está entre parênteses), o valor da estatística de teste F tende a ser grande (resp. pequeno) Solução do Exemplo E Temos aqui m = n = 5. Admitindo válidas as premissas do modelo de análise de variância no que se refere a esses dados, podemos calcular: SStotal = 636,96 ; SSentre= 475,76 ; SSintra= 161,20 47576 5 1 , ( )−Logo F = Como F0,95 (4,20) = 2,87, H0 deve ser rejeitada ao nível de significância de 0,05. Isto significa que os dados nos fornecem evidências de diferenças estatisticamente significativas entre as resistências à tensão correspondentes aos diferentes níveis do percentual de algodão na fibra. 47576 5 1 16120 5 1 5 1476 , ( ) , (( ) ) , . − − × =
Compartilhar