Baixe o app para aproveitar ainda mais
Prévia do material em texto
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS • A aplicação desses testes não exige suposições quanto à distribuição da população (em geral, distribuição Normal) da qual se tenha retirado amostras para análises. • Podem ser aplicadas a dados que se disponham simplesmente da ordem, ou mesmo para estudo de variáveis nominais. Podem ser realizados em pequenas amostras. • Para realizar um teste de hipótese não paramétrico segue-se os mesmos passos adotados nos testes paramétricos. • Praticamente todo teste paramétrico tem um teste equivalente não paramétrico. • Nas situações em que se aplica um teste paramétrico, pode-se aplicar um teste não paramétrico. O contrário não é válido • Nas situações em que se pode utilizar ambos os testes (paramétricos e não paramétricos), o teste paramétrico é mais poderoso. SOBRE TESTES NÃO PARAMÉTRICOS ALGUNS TESTES NÃO PARAMÉTRICOS • Teste de aderência do qui-quadrado • Teste de independência do qui-quadrado • Teste de Mann-Whitney para duas amostras independentes • Teste de Wilcoxon para duas amostras pareadas TESTE DE ADERÊNCIA DO QUI- QUADRADO (2) Deve ser utilizado sempre que o pesquisador tiver o interesse de verificar se a distribuição dos dados de uma amostra está de acordo com alguma teoria. Ex. 1 - A teoria postulada por Mendel (base da Genética) estabelece que a segregação na distribuição das ervilhas deve ocorrer na seguinte proporção: Amarelo-lisas (9/16); amarelo-rugosa (3/16); verde-lisa (3/16) e verde-rugosa (1/16). O pesquisador pode estar interessado em saber se o seu experimento com ervilhas segue a mesma distribuição. Ex. 2 – Um pesquisador está interessado em saber se proporção de filhotes fêmeas e machos é a mesma para uma porca submetida a melhoramento genético. PASSOS PARA REALIZAR O TESTE DE ADERÊNCIA Passo 1 – Formular as hipóteses Ho: Os dados aderem (se ajustam) a teoria estipulada. H1: Os dados não aderem (não se ajustam) a teoria estipulada. Passo 2 – Calcular a estatística de teste Determinar as frequências observadas (Oi) e esperadas (Ei) para cada classe i e calcular a estatística de teste em que r é número de classes da tabela, respectivamente. Pode-se mostrar que a estatística de teste apresenta distribuição amostral que segue uma qui-quadrado com r-1 graus de liberdade. Passo 3 – Região crítica Fixar o nível de significância ( ), determinar os graus de liberdade gl = r-1 e com auxílio da tabela do qui-quadrado determinar o qui-quadrado crítico (ou tabelado), denotado por e, consequentemente, as áreas (regiões) de aceitação (RA) e rejeição (RC). Passo 4 – Regra de decisão. Se aceitar a hipótese nula. Passo 5 – Conclusão. Exemplo É bem conhecida a teoria que recém- nascidos humanos apresentam, aproximadamente, a mesma probabilidade ao nascer de pertencer a qualquer gênero. Verificar, com 95% de confiança, se a distribuição de frequência de recém- nascidos em uma cidade é a mesma para os gêneros masculino e feminino, tendo como base uma amostra aleatória de 100 nascimentos que ocorreram no último ano, onde observou-se o nascimento de 65 meninos e 35 meninas. Passo 1 - Hipóteses: Ho- A proporção, por gênero, é a mesma H1- A proporção, por gênero, não é a mesma. Passo 2 - Cálculo da estatística de teste Montar a tabela com as frequências observadas e esperadas. Com base nos valores observados e esperados calcular a estatística de teste 2 = (35-50)2/50 + (65-50)2/50 = 4.50 + 4.50 = 9.00 Meninas Meninos Freq. Observada (O) 35 65 Freq. Esperada (E) 50 50 Passo 3 - Determinar o valor crítico (tabelado) e áreas de aceitação e rejeição Como = 5%, r = 2 e gl = 2 – 1 = 1, então, pela tabela do qui- quadrado, obtêm 2c = 3,84. Passo 4 - Regra de decisão Como 2 = 9 > 2c = 3,84, rejeita-se Ho. Valor P. Como 2 = 9, pela tabela qui-quadrado, entrando na linha de 1 graus de liberdade, teremos que o valor-P será menor que 0.005 que é menor que o nível de significância de 5% e, portanto, rejeita- se Ho. Passo 5 - Conclusão Com 95% de confiança rejeita-se a hipótese de que a proporção de nascimentos, por gênero, foi a mesma no último ano nesta cidade. TESTE DE INDEPENDÊNCIA DO QUI-QUADRADO (2) Deve ser utilizado sempre que o pesquisador tiver o interesse de verificar se duas populações têm a mesma proporção de indivíduos com determinada característica. Se isso for verdade, podemos dizer que a ocorrência de indivíduos em uma população independe da ocorrência de indivíduos da outra população. Ex. 1 - A proporção de pessoas com câncer no pulmão é a mesma entre fumantes e não fumantes, ou seja, o pesquisador está interessado em saber se a presença de câncer no pulmão independe do ato de fumar. Ex. 2 – A proporção de indivíduos, por tipo sanguíneo é a mesma entre as diferentes raças, ou seja, o pesquisador tem interesse em saber se o tipo sanguíneo independe da raça. PASSOS PARA REALIZAR O TESTE DE INDEPENDÊNCIA Passo 1 – Formular as hipóteses Ho: A proporção de ocorrências em uma população independe das ocorrências na outra população. H1: A proporção de ocorrências em uma população depende das ocorrências na outra população. Passo 2 – Calcular a estatística de teste Colocar em uma tabela de contingência de dupla entrada (matriz) os valores das frequências observadas (Oij) e esperadas (Eij) para cada classe ij da tabela (matriz) e calcular a seguinte estatística de teste em que r é o número de linhas e c é o número de colunas da tabela de contingência. OBS: O valor esperado para cada classe é obtido a partir da multiplicação das marginais dividida pelo total de indivíduos. Passo 3 – Região crítica Fixar o nível de significância ( ), determinar os graus de liberdade gl = (r - 1)×(c - 1) e com auxílio da tabela do qui-quadrado determinar o qui-quadrado crítico (ou tabelado) e, consequentemente, as áreas (regiões) de aceitação (RA) e rejeição (RC). Passo 4 – Regra de decisão. Se , então aceitar a hipótese nula de independência. Passo 5 – Conclusão Exemplo Um agrônomo quer saber se existe alguma relação entre o tipo de solo e a presença de diferentes espécies de uma planta. Os resultados obtidos pelo agrônomo são apresentados na tabela de contingência a seguir: Espécie Tipo de Solo A B C ELI 70 44 86 200 ECH 50 30 45 125 EHO 10 6 34 50 EME 20 20 85 125 150 100 250 500 Com base nos dados apresentados na tabela de contingência teste, ao nível de 5% de significância, se a distribuição de frequência das quatro espécies de planta independe do tipo de solo. Passo 1 - Hipóteses: Ho: A espécie de planta independe do tipo de solo. H1: A espécie de planta depende do tipo de solo. Passo 2 - Cálculo da estatística de teste Primeiramente, deve-se calcular os valores esperados para a estatística de teste. E11 = 200 x 150/500 = 60 E12 = 200 x 100/500 = 40 E13 = 200 x 250/500 = 100 E21 = 125 x 150/500 = 37.5 E22 = 125 x 100/500 = 25 E23 = 125 x 250/500 = 62.5 E31 = 50 x 150/500 = 15 E32 = 50 x 100/500 = 10 E33 = 50 x 250/500 = 25 E41 = 125 x 150/500 = 37.5 E42 = 125 x 100/500 = 25 E43 = 125 x 250/500 = 62.5 Espécie Tipo de Solo A B C ELI 70 44 86 200 ECH 50 30 45 125 EHO 10 6 34 50 EME 20 20 85 125 150 100 250 500 Espécie Tipo de Solo A B C ELI 60 40 100 ECH 37.5 25 62.5 EHO 15 10 25 EME 37.5 25 62.5 Valores observados Valores esperados Com base nos valores observados e esperados efetuar o cálculo da estatística de teste Passo 3 - Determinar o valor crítico (tabelado) e áreas de aceitação e rejeição Como = 5% e gl = (4 - 1)×(3 – 1) = 6, então, pela tabela do qui-quadrado, obtêm -se 2c = 12,6. Passo 4 - Regra de decisão -Como 2 = 37.88 > 2c = 12.6, rejeita-se Ho. -Valor P. Como 2 = 37.88, pela tabela qui-quadrado, entrando na linha de 6 graus de liberdade, teremos que o valor-P será menor que 0.005 que é menor que o nível de significância de 0.05 e, portanto, rejeita-se Ho. Passo 5 - Conclusão Com 95% de confiança pode-se afirmar que a espécie de planta depende do tipo de solo. Restrições de uso do teste de independência- Somente deve ser aplicado se a amostra tiver mais de 20 elementos. - O teste não deve ser usado se mais de 20% das frequências esperadas forem abaixo de 5 ou se qualquer uma delas for inferior a 1. - Em tabelas de contingência 2×2 deve-se fazer a correção de Yates. Neste caso, a estatística de teste é dada por TESTE U DE MAN-WHITNEY • É usado para testar se duas amostras independentes são provenientes da mesma população. Por exemplo, um biólogo está querendo verificar se existe diferença estatisticamente significante quanto ao número de frutos de uma mesma espécie de planta em dois tipos de solos (ácido e básico). Neste caso, as plantas de um grupo (solo ácido) não são as mesmas plantas do outro grupo (solo básico) e, portanto, tem-se duas populações independentes. Além disso, a variável “numero de frutos”, por ser uma contagem, pode não ter distribuição normal. • O teste U de Man-Whitney é uma alternativa ao teste paramétrico t de Student para igualdade de médias de populações independentes, pois o teste não exige que a variável aleatória na população tenha distribuição normal e, portanto, pode ser aplicado tanto para variáveis intervalares como ordinais. • O teste t de Student compara as médias, enquanto o teste U de Man-Whitney compara as medianas dos dois grupos. PASSOS PARA REALIZAR O TESTE U DE MAN- WHITNEY Passo 1 – Formular as hipóteses H0: Md1 = Md2 (Mediana da população do grupo 1 é igual a mediana da população do grupo 2) H1 : Md1 ≠ Md2 (Bilateral) ou Md1 > Md2 (Unilateral) ou Md1 < Md2 (Unilateral) Passo 2 – Calcular a estatística de teste A estatística de teste é baseada na ordem (posto) das observações. Primeiramente, deve-se ordenar todos os valores dos dois grupos, ou seja, o maior (ou menor) valor recebe o posto 1, o segundo maior (ou menor) valor recebe o posto 2 e, assim, sucessivamente. No caso de valores iguais, colocar o posto como se não houvesse empate e, depois, extrair o ponto médio desses postos empatados. Valores iguais, postos iguais. Uma vez atribuído os postos, efetuar a soma dos postos do grupo 1 (R1) e do grupo 2 (R2 ). PASSOS PARA REALIZAR O TESTE U DE MAN- WHITNEY Passo 2 – Calcular a estatística de teste (Continuação) Utilizar a soma dos postos do grupo 1 (R1) e do grupo 2 (R2 ) e calcular as estatísticas U1 e U2 utilizando as fórmulas abaixo em que n1 e n2 são os tamanhos das amostras 1 e 2, respectivamente. O menor valor entre U1 e U2 será denominado de estatística U . Se os tamanhos das amostras dos dois grupos forem grandes, U tem distribuição aproximadamente normal e, portanto, pode-se utilizar a seguinte estatística de teste: Passos 3 e 4: Região crítica e regra de decisão A hipótese é rejeitada se o valor observado da estatística de teste cair na área de rejeição, ou seja, em que e são os valores tabelados (quantil da distribuição normal padrão com média zero e desvio padrão igual a um, em função e do nível de significância ( ). Passo 5: Conclusões bilateraltesteumparazzo 2 ||| oH unilateraltesteumparazzo ||| 2 z z Observações sobre o teste U de Man-Whitney Para saber se os valores de U1 e U2 foram calculados corretamente basta verificar se n1n2=U1+U2. Se amostra não for suficientemente grande, ou seja, maior que 25 para cada grupo, a aproximação normal não pode ser utilizada. Neste caso deve-se consultar tabelas específicas para o teste de Man-Whitney. Para facilitar, neste curso vamos utilizar somente a aproximação normal, mesmo que tenhamos amostras inferiores a 25. Exemplo Um biólogo deseja fazer um estudo para verificar a especificidade do fungo Gigaspora gigantea com as plantas capim-marinho (Spartina sp) e quaresmeira (Tibouchina sp). Foram coletadas 10 amostras de solo em volta da Spartina sp e 12 amostras de solo em volta da Tibouchina sp e feita as contagens da quantidade de fungos presentes. As contagens de fungos no solo ao redor da Spartina sp foram: 303, 117, 116, 115, 93, 84, 78, 63, 63 e 55. As contagens de fungos no solo ao redor da Tibouchina sp foram 305, 112, 110, 110, 95, 85, 74, 62, 60, 60, 53 e 40. Esses dados apresentam evidências para indicar uma especificidade estatisticamente significante do fungo Gigaspora gigantea para as plantas Spartina sp e Tibouchina sp, com 90% de confiança? Passo 1 - Hipóteses: Ho: As contagens medianas de fungos são as mesmas para os dois tipos de plantas. Fungo não apresenta especificidade H1: As contagens medianas de fungos são diferentes para os dois tipos de plantas. Fungo apresenta especificidade Passo 2 - Cálculo da estatística de teste Observe que temos duas amostras independentes (Spartina sp e Tibouchina sp) e a variável “contagem de fungos” , por ser uma contagem, não pode ser assumida como normal. Assim, deve-se aplicar um teste não paramétrico, no caso, o teste de Man-Whitney. Para tal, o primeiro passo é atribuir os postos nos valores das contagens. Spartina Tibouchina Valores Postos Postos corrigidos Valores Postos Postos corrigidos 303 2 2 305 1 1 117 3 3 112 6 6 116 4 4 110 7* 7.5 115 5 5 110 8* 7.5 93 10 10 95 9 9 84 12 12 85 11 11 78 13 13 74 14 14 63 15 15.5** 62 17 17 63 16 15.5** 60 18*** 18.5 55 20 20 60 19*** 18.5 53 21 21 40 22 22 R1=100 R2 = 153 Calcular as estatísticas U1 e U2 Pegar o menor dos valores entre U1 e U2 e teremos U = 45. Então calcular a estatística de teste 0,05 0,05 0 0,90 Passo 3: Determinar a área de rejeição e o respectivo valor tabelado do quantil da distribuição normal Assim, o valor crítico (z tabelado) é igual a 1,64 ou 1,64. 64,164,1 Passo 4: Tomada de decisão (comparar o valor observado e valor tabelado) - Como |z| < |Ztab| , ou seja, |0,99| < |-1,64|, aceita-se Ho. ou -Como valor observado da estatística de teste está contido dentro da área de aceitação, aceita-se Ho. ou -Valor P. z=0.99, pela tabela Normal, corresponde p=0.8389. Assim, o valor-P unilateral é dado por 1-0.8389 = 0.1611. Logo, o valor-P é 0.3222 que é maior que o nível de significância de 0.05 e, portanto, aceita-se Ho. Passo 5: Conclusão Podemos concluir, com 90% de confiança, que as medianas das contagens do fungo Gigaspora gigantea são iguais para as duas plantas Spartina sp e Tibouchina sp, ou seja, o fungo não apresenta especificidade para essas duas plantas. TESTE T DE WILCOXON • O teste T de Wilcoxon é utilizado na análise de dados emparelhados em situações em que o pesquisador deseja determinar se duas condições (em geral, do tipo antes e depois) são iguais. Por exemplo, um regime de emagrecimento. Cada par, no caso, é formado pelo mesmo indivíduo com peso antes e depois de realizado o regime. • O teste T de Wicoxon é um teste alternativo ao teste t de Student para amostras pareadas quando não pode-se garantir que a variável aleatória apresenta distribuição normal. • Para aplicar o teste de Wilcoxon, a variável aleatória pode ser intervalar ou ordinal. • A lógica do teste de Wilcoxon leva em consideração a posição (posto) e a direção da diferença para cada par de observações. PASSOS PARA REALIZAR O TESTE T DE WILCOXON Passo 1 – Formular as hipóteses H0: Mdd = 0 (A mediana das diferenças entre pares é igual a zero) H1 : Mdd ≠ 0 (Bilateral) ou Mdd > 0 (Unilateral) ou Md1 < 0 (Unilateral) Passo 2 – Calcular a estatística de teste A estatística de teste é baseada na ordem (posto) das diferenças dos pares de observações. Assim, primeiramente, deve-se calcular a diferença existente em cada par de observação. Em seguida, ordenar todas as diferenças, ou seja, a maior (ou menor) diferença recebe o posto 1, a segunda maior (ou menor) valor recebe o posto 2 e, assim, sucessivamente. Neste passo, ignorar se a diferença é positiva ou negativa, ou seja, considere apenas o valor absoluto da diferença. No caso de valores iguais, colocar o posto como se não houvesse empate e, depois, extrair a média desses postos. Valores iguais, postos iguais. Uma vez atribuído os postos, efetuar a soma dos postos das diferenças positivas (R1) e negativas 2 (R2 ).PASSOS PARA REALIZAR O TESTE U DE MAN- WHITNEY Passo 2 – Calcular a estatística de teste (Continuação) O menor valor das somas R1 e R2, em módulo, será denominado de estatística T. Se as diferenças amostrais forem grandes, T tem distribuição aproximadamente normal e, portanto, pode-se utilizar a seguinte estatística de teste: em que a média e o desvio-padrão das somas dos postos são dados por: em que n é o número de diferenças. Passos 3 e 4: Região crítica e regra de decisão A hipótese é rejeitada se o valor observado da estatística de teste cair na área de rejeição, ou seja, em que e são os valores tabelados (quantil da distribuição normal padrão com média zero e desvio padrão igual a um, em função e do nível de significância ( ). Passo 4: Conclusões bilateraltesteumparazzo 2 ||| oH unilateraltesteumparazzo ||| 2 z z Observações sobre o teste T de Wicoxon Uma diferença igual a zero não é ordenada, mas sim eliminada da análise e, portanto, a amostra fica reduzida de um, para cada eliminação. Se amostra das diferenças não for suficientemente grande, ou seja, maior que 25, a aproximação normal não pode ser utilizada. Neste caso deve-se consultar tabelas apropriadas. OBS: Neste curso, vamos utilizar somente a aproximação normal, mesmo que tenhamos amostras inferiores a 25. Exemplo Um médico quer investigar o uso do medicamento amiloride como terapia para pacientes com fibrose cística. Acredita-se que este medicamento possa auxiliar na melhora do fluxo de ar nos pulmões ao atrasar a perda da função pulmonar que é frequentemente associada com a doença. Uma medida de função pulmonar é a capacidade vital forçada (FVC), ou seja, o volume de ar que uma pessoa pode expelir dos pulmões em seis segundos. O médico coletou uma amostra com 10 pacientes com fibrose cística e mediu a FVC antes do tratamento e 25 dias após o uso contínuo de amiloride. Os resultados foram os seguintes: Antes: 213, 95, 33, 440, 32, 28, 445, 178, 367, 140, 323 e 10. Depois: 224, 80, 75, 541, 74, 85, 293, 23, 525, 38, 508 e 255. Esses dados tem evidências estatisticas para indicar que o medicamento amiloride é eficaz (aumenta a FVC) no tratamento da fibrose cística, com 95% de confiança? Passo 1 - Hipóteses: Ho: A mediana das diferenças de FVC antes e depois do uso do medicamento é igual a zero. O medicamento não é efetivo. H1: A mediana das diferenças de FVC antes e depois do uso do medicamento é menor que zero. O medicamento é efetivo Passo 2 - Cálculo da estatística de teste Observe que temos duas amostras pareadas (a medida de FVC foi realizada antes e depois do tratamento no mesmo indivíduo) e não existem evidência que a variável “FVC” seja normal. Assim, deve-se aplicar um teste não paramétrico, no caso, o teste T de Wilcoxon. Para tal, deve-se calcular as diferenças entre os pares, atribuir os postos para essas diferenças e calcular as somas para os postos das diferenças positivas e negativas. Paciente FVC - Antes FVC- Depois Diferenças (D-A) Postos Postos positivos Postos negativos 1 213 224 11 1 1 2 95 80 -15 2 -2 3 33 75 42 3 3 4 440 541 101 6 6 5 32 75 43 4 4 6 28 85 57 5 5 7 445 293 -152 8 -8 8 178 23 -155 9 -9 9 367 525 158 10 10 10 140 38 -102 7 -7 11 323 508 185 11 11 12 10 255 245 12 12 R1 = 52 R2=-26 Pegando o menor dos valores entre R1 e R2, desconsiderando o sinal, teremos T = 26. Calculando a média e o desvio-padrão da soma dos postos obtemos: Calculando a estatística de teste Passos 3 e 4: Tomada de decisão (comparar o valor observado e valor tabelado) - O valor crítico tabelado com 5% de significância é dado por Zc=1.64 Como |z| < |Ztab| , ou seja, |1.02| < |1.64|, aceita-se Ho. ou -Valor P. z = 1.02, pela tabela Normal, corresponde p=0.8461. Assim, o valor-P unilateral é dado por 1-0.8461 = 0.1539. Logo, o valor-P é 0.3078 que é maior que o nível de significância de 0.05 e, portanto, aceita-se Ho. Passo 5: Conclusão Podemos concluir, com 95% de confiança, que não existe diferença entre as capacidades medianas de FVC antes e depois do uso do medicamento amiloride, ou seja, o medicamento parece não ser efetivo e, portanto, não adequado para tratar a fibrose cística “A vida requer que lhe seja dada a cada dia e, se possível, a cada hora, um novo estímulo.” Da sabedoria logosófica
Compartilhar