Baixe o app para aproveitar ainda mais
Prévia do material em texto
Teste de Wilcoxon Luisa Zanolli Moreno Médica veterinária, mestranda do curso de pós-graduação em saúde pública da Faculdade de Saúde Pública da Universidade de São Paulo André Moreno Morcillo Professor Associado do Departamento de Pediatria da Faculdade de Ciências Médicas da Universidade Estadual de Campinas Pesquisador do CIPED – Centro de Investigação em Pediatria da Universidade Estadual de Campinas Teste de Wilcoxon Campinas – São Paulo – Brasil [Dezembro de 2012] 1 O método recomendado para comparar as médias de dois grupos pareados é o teste t de Student. No entanto, muitas vezes a variável de trabalho não tem distribuição normal ou é qualitativa do tipo ordinal, casos em que não se deve usar este teste. Uma alternativa prática para resolver estas situações é o teste de Wilcoxon (Teste de Postos Sinalizados de Wilcoxon, Teste de Postos com Sinais de Wilcoxon, Wilcoxon Signed-Rank Test, Wilcoxon Paired-Sample Test), cuja exigência é de que a variável de estudo seja quantitativa ou qualitativa do tipo ordinal. No teste de Wilcoxon não comparamos as médias. O nosso interesse é comparar a distribuição dos dados nos dois instantes. Uma situação real Torres et al. (2010)1 com objetivo de descrever a evolução de um grupo de pacientes com Fibrose Cística do ponto de vista clínico e funcional pulmonar após a implantação de um ambulatório multidisciplinar, realizaram um estudo retrospectivo em que foram incluídos todos os pacientes (N=19) que tinham acompanhamento clínico regular no Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto, Universidade de São Paulo (FMRP-USP). Os pacientes do estudo foram divididos em dois grupos de acordo com a faixa etária: grupo “6-12” (n = 8) com aqueles entre 6 e 12 anos e grupo “13+” (n = 11) com os maiores de 12 anos. Os resultados obtidos nos dois grupos foram analisados em dois tempos: em 2003 (antes da implantação do ambulatório) e em 2007 (quatro anos após sua implantação). A análise estatística dos dois períodos foi realizada utilizando-se o teste de Wilcoxon para amostras pareadas, com alfa de 5%, já que a maioria dos dados não tinha distribuição normal. A seguir, são apresentadas duas tabelas com os resultados obtidos pelos autores. 1 Torres L et al. Avaliação clínica, nutricional e espirométrica de pacientes com fibrose cística após implantação de atendimento multidisciplinar. J. Bras. Pneumol. 2010; 36(6):731-737 2 Princípios do teste de Wilcoxon Tal como no teste t de Student para amostras pareadas, o objetivo é estudar as diferenças observadas em cada sujeito entre os dois momentos da pesquisa. O princípio deste teste consiste em avaliar se ocorreram modificações nos dados entre os dois momentos da avaliação. Quando as modificações ou diferenças são muito pequenas elas podem ser devidas ao acaso, porém, quando são expressivas, é pouco provável que se devam ao acaso, sendo fruto de um fator causal. No teste de Wilcoxon as diferenças observadas entre os dois momentos são transformadas em ranks, que passam a ser os objetos da nossa avaliação. Como fazer o teste de Wilcoxon 1. Calcula-se para cada elemento do grupo de estudo a diferença “d” entre a suas duas medidas, seja a primeira menos a segunda ou vice-versa. 2. Ordena-se e atribui-se ranks aos valores absolutos das diferenças “d” que sejam diferentes de zero ( d ≠ 0 ) 3. Somam-se os ranks decorrentes das diferenças positivas, que recebe o nome de T+. 4. Somam-se os ranks decorrentes das diferenças negativas, que recebe o nome de T-. 5. Seleciona-se entre “T+” e “T-“ o de menor valor, que será chamado de estatística T. 6. Chamamos de “n” o número de diferenças “d” que receberam ranks. 3 Teste de hipóteses H0 : não há diferença entre os valores observados nos dois instantes H1 : há diferença entre os valores observados nos dois instantes Nível de significância O nível de significância habitualmente adotado nas pesquisas da área biomédica é 5% (α=0,05). Tomada de decisão • Para amostras pequenas (n ≤≤≤≤ 25) Comparamos a estatística “T” com o valor “T” crítico, disponível em uma tabela específica de distribuição de “T” para o teste de Wilcoxon (Tabela 14), considerando α e “n” (número de casos em que d≠0). Sempre que T ≤ Tcrítico rejeitamos H0! • Para amostras grandes (n > 25) Quando n é maior que 25, a estatística T se ajusta à distribuição normal. Portanto, tal como se faz no teste de Mann-Whitney, calculamos o z escore de T e determinamos a probabilidade de ocorrência pela tabela da curva normal reduzida. σ µ T T T T z − = Calculando a média de T ( ) 4 1+× = nn Tµ Calculando o desvio padrão de T ( )( ) 24 2 121 Cnnn T −++ =σ Onde “C” é um fator de correção decorrente de empates entre as diferenças “d” e “n” é o número de diferenças “d≠0” que receberam ranks. 4 Uma vez determinado o valor de “zT”, desenhamos uma curva normal reduzida e marcamos as áreas de rejeição de H0 de um teste bilateral com α=5%, que correspondem aos valores de z maiores ou iguais a +1,96 na cauda direita e dos valores de z menores ou iguais a -1,96 na cauda esquerda, tal como é apresentado na Figura 1. Figura 1 – Curva normal reduzidaFigura 1 – Curva normal reduzida Sempre que 96,1−≤zT ou 96,1+≥zT rejeitamos H0, concluindo que há diferença na distribuição de valores dos dois instantes da pesquisa. Mais detalhes sobre o fator de correção “C” decorrente de empates Esse fator de correção “C” é calculado a partir do número de “d” empatados. ( )( ) 24 2 121 Cnnn T −++ =σ onde: ∑= cC i ffci −= 3 f = número de “d” empatados (valores absolutos de “d” iguais). Exemplo: considere que em uma amostra estudada haja quatro casos com d=10, seis com d=15, três com d=16 e dois casos com c=18. Há, portanto, quatro grupos com empates. Primeiro grupo: 10 ; 10 ; 10 ; 10. Neste caso f=4, pois, o d=10 repetiu 4 vezes. Portanto, 604433)10( =−=−= ffc 5 Segundo grupo: 15 ; 15 ; 15 ; 15 ; 15 ; 15. Aqui, f=6 e 2106633)15( =−=−= ffc Terceiro grupo: 16 ; 16 ; 16. Aqui, f=3 e 243333)16( =−=−= ffc Quarto grupo: 18 ; 18. Aqui, f=2 e 62233)18( =−=−= ffc Cálculo do fator de correção “C”: 30062421060 =+++==∑cC i Este fator de correção C=300 será utilizado na fórmula do desvio padrão de T. Para exemplificar o uso do teste de Wilcoxon, utilizaremos dados de frequência cardíaca, frequência respiratória e saturação de O2 de crianças com pneumonia, internadas no setor de Emergência do Hospital de Clínicas da Unicamp(2) (Tabela 3). Os pacientes tiveram seus dados avaliados imediatamente antes e após o término de uma sessão de fisioterapia respiratória. Como os pacientes foram avaliados em dois momentos consecutivos, temos uma amostra tipicamente pareada. Para comparação do efeito da fisioterapia respiratória sobre os dados vitais podemos usar o teste de Wilcoxon. Tabela 3 – Frequência cardíaca, frequência respiratória e Saturação de O2 da Hemoglobina Caso FC(1) FC(2) FR(1) FR(2) SatO2(1) SatO2(2) 1 123 94 38 36 95 94 2 146 150 36 32 93 89 3 156 127 32 40 93 91 4 156 152 54 52 91 92 5 144 156 46 47 93 93 6 156 152 44 55 93 94 7 120 123 55 56 95 93 8 112 109 40 45 94 93 9 132 161 46 42 91 95 10 170 180 50 56 96 9611 176 173 65 78 92 83 12 161 166 51 43 94 97 13 127 134 38 39 94 99 14 200 174 40 45 85 91 15 126 107 44 30 92 96 FC(1) – Frequência cardíaca pré-fisioterapia; FC(2) – Frequência cardíaca pós-fisioterapia FR(1) – Frequência respiratória pré-fisioterapia; FR(2) – Frequência respiratória pós-fisioterapia SatO2(1) – Saturação O2 pré-fisioterapia; SatO2(2) – Saturação O2 pós-fisioterapia 2 Santos CIS, Ribeiro MAGO, Ribeiro JD, Morcillo AM. Respiratory physiotherapy in children with community-acquired pneumonia. Canadian Journal of Respiratory Therapy 2009, 45(3):23-28. 6 Iniciaremos avaliando o efeito sobre a frequência cardíaca. Na Tabela 4 são apresentados os valores da média, mediana e range nos dois momentos. Na Figura 2 são apresentadas as distribuições das frequências cardíacas. Tabela 4 – Média, mediana e range da frequência cardíaca Média Mediana Range FC (1) 147,0 146,0 88,0 FC (2) 143,9 152,0 86,0 Figura 2 - Frequência card[iaca FC2FC1 Fr e qu ên ci a Ca rd ía ca 220 200 180 160 140 120 100 80 Estabelecendo as hipóteses e nível de significância H0: não há diferença na distribuição da frequência cardíaca entre os dois momentos H1: há diferença na distribuição da frequência cardíaca entre os dois momentos α = 5% Iniciamos calculando as diferenças [d=FC(1) – FC(2)] (Tabela 5) e a seguir, após ordená-las pelo seu valor absoluto, atribuímos os ranks (Tabela 6). 7 Tabela 5 – Frequência cardíaca nos dois instantes e valores de “d” Paciente FC (1) FC (2) d 1 123 94 29 2 146 150 -4 3 156 127 29 4 156 152 4 5 144 156 -12 6 156 152 4 7 120 123 -3 8 112 109 3 9 132 161 -29 10 170 180 -10 11 176 173 3 12 161 166 -5 13 127 134 -7 14 200 174 26 15 126 107 19 Tabela 6 – Valores absolutos e ranks de “d” |d| Ranks 3 2 3 2 3 2 4 5 4 5 4 5 5 7 7 8 10 9 12 10 19 11 26 12 29 14 29 14 29 14 A seguir, incluímos na Tabela 7 os valores dos ranks, tomando o cuidado de separar em colunas diferentes os ranks decorrentes de “d” positivos e negativos. 8 Tabela 7 – Frequência cardíaca, “d” e ranks Paciente FC (1) FC (2) d Ranks + Ranks - 1 123 94 29 14 2 146 150 -4 5 3 156 127 29 14 4 156 152 4 5 5 144 156 -12 10 6 156 152 4 5 7 120 123 -3 2 8 112 109 3 2 9 132 161 -29 14 10 170 180 -10 9 11 176 173 3 2 12 161 166 -5 7 13 127 134 -7 8 14 200 174 26 12 15 126 107 19 11 Agora devemos somar os ranks da coluna “Ranks+” que será o T+; somar os ranks da coluna “Ranks -” que será o T-. T+ = 78 T- = 42 Portanto, a nossa estatística T é 42! Consultando na Tabela 14 obtemos que o valor de T crítico para n = 15 e α=5% que é 25. Como T é maior que o valor de T crítico, não podemos rejeitar H0, concluindo que a fisioterapia respiratória não determinou modificação na distribuição das frequência cardíaca. A seguir, passamos a avaliar a Frequência Respiratória. Na Tabela 8 temos informações referentes à média, mediana e range da frequência respiratória e na Figura 3 os boxplots com as distribuições nos dois momentos. Tabela 8 – Média, mediana e range da frequência respiratória Média Mediana Range FR (1) 45,3 44,0 33,0 FR (2) 46,4 45,0 48,0 9 Figura 3 - Distribuição da frequência respiratória nos dos momentos FR2FR1 Fr e qu ên ci a R e sp ira tó ria 90 80 70 60 50 40 30 20 11 Estabelecendo as hipóteses e nível de significância H0: não há diferença na distribuição da frequência respiratória entre os dois momentos H1: há diferença na distribuição da frequência respiratória entre os dois momentos α = 5% Na Tabela 9 são apresentadas as diferenças “d” com os respectivos ranks. Tabela 9 – Frequência respiratória, “d” e ranks FR1 FR2 d Ranks + Ranks - 1 38 36 2 4,5 2 36 32 4 6,5 3 32 40 -8 11,5 4 54 52 2 4,5 5 46 47 -1 2 6 44 55 -11 13 7 55 56 -1 2 8 40 45 -5 8,5 9 46 42 4 6,5 10 50 56 -6 10 11 65 78 -13 14 12 51 43 8 11,5 13 38 39 -1 2 14 40 45 -5 8,5 15 44 30 14 15 10 A soma dos ranks decorrentes de diferenças “d” positivas é 48,5 enquanto a soma dos ranks das negativas é 71,5. Assim, T+ = 48,5 e T- = 71,5, portanto, T = 48,5 Consultando na Tabela 14 temos o valor de T crítico para n = 15 e α=5% que é 25. Portanto, como T é maior que T crítico não podemos rejeitar H0, concluindo que a fisioterapia respiratória não determinou modificação na distribuição da frequência respiratória. Passamos agora a avaliar as distribuições da saturação de O2 da hemoglobina. A distribuição dos dados é apresentada na Tabela 10 e Figura 4. Tabela 10 – Média, mediana e range da Saturação de O2 da Hemoglobina Média Mediana Range SatO2 (1) 92,7 93,0 11,0 SatO2 (2) 93,1 93,0 16,0 Figura 4 - Distribuição da saturação de O2 SATO2_2SATO2_1 Sa tu ra çã o de O 2 110 100 90 80 11 14 Estabelecendo as hipóteses e nível de significância H0: não há diferença na distribuição da saturação de O2 entre os dois momentos H1: há diferença na distribuição da saturação de O2 entre os dois momentos α = 5% 11 Na Tabela 11 são apresentados as diferenças “d” com os respectivos ranks. Observe que nos casos 5 e 10 “d” é igual a zero. Portanto, eles não são considerados para efeitos de atribuição dos ranks e passamos a ter n = 13. Tabela 11 – Saturação de O2 da hemoglobina, “d” e ranks SatO2_1 SatO2_2 D Ranks + Ranks - 1 95 94 1 2,5 2 93 89 4 9 3 93 91 2 5,5 4 91 92 -1 2,5 5 93 93 0 *** *** 6 93 94 -1 2,5 7 95 93 2 5,5 8 94 93 1 2,5 9 91 95 -4 9 10 96 96 0 *** *** 11 92 83 9 13 12 94 97 -3 7 13 94 99 -5 11 14 85 91 -6 12 15 92 96 -4 9 Como T+ = 38 e T- = 53, temos T = 38. Consultando na Tabela 14 obtemos o valor de T crítico para n = 13 e α=5% que é 17. Portanto, como T é maior que T crítico não podemos rejeitar H0, concluindo que a fisioterapia respiratória não determinou modificação na distribuição da saturação de O2. Como exemplo do teste aplicado a grandes amostras, utilizaremos todos os casos da pesquisa de Santos et al. (2009). Na Tabela 13 são apresentados os dados descritivos da frequência cardíaca dos 164 casos que compuseram o grupo de estudo. Na Figura 5 apresentamos a distribuição dos dados nos dois momentos. Tabela 13 – Média e mediana da frequência cardíaca N=164 Média Mediana FC (1) 137,1 133,5 FC (2) 144,4 142,0 12 Figura 5 - Distribuição da frequência cardíaca FC2FC1 Fr e qu ên ci a Ca rd ía ca 220 200 180 160 140 120 100 80 Neste caso temos que calcular o z escore de T visto que dados de T crítico para grupos com mais de 25 casos não estão disponíveis. Sabemos que T+ = 10044,5 e T- = 2835,5, portanto, T = 2835,5 e n = 164. Não ocorreram empates. Calculando a média de T ( ) 4 1+× = nn Tµ 0,6765 4 165164 = × =µT Calculando o desvio padrão de T ( )( ) 24 2 121 Cnnn T −++ =σ ( )( ) 1,609 24 116421164164 = +×+ =σ T13 Calculando o z escore de T σ µ T T T T z − = 5,6 1,609 0,67655,2835 −= − =zT A seguir, desenhamos o gráfico da curva normal reduzida (Figura 6) Figura 6 – Curva normal reduzidaFigura 6 – Curva normal reduzida Podemos verificar na Figura 6 que z=-6,5 é muito menor que o ponto de corte -1,96 caindo na zona de rejeição de H0. Desta forma, podemos concluir que a distribuição da frequência cardíaca pós-fisioterapia respiratória é estatisticamente diferente da observada no instante 1. 14 Tabela 14 - Distribuição dos valores críticos de T do teste de Wilcoxon3 Teste Bilateral α n 0,10 0,05 0,02 0,01 5 0 ***** ***** ***** 6 2 0 ***** ***** 7 3 2 0 ***** 8 5 3 1 0 9 8 5 3 1 10 10 8 5 3 11 13 10 7 5 12 17 13 9 7 13 21 17 12 9 14 25 21 15 12 15 30 25 19 15 16 35 29 23 19 17 41 34 27 23 18 47 40 32 27 19 53 46 37 32 20 60 52 43 37 21 67 58 49 42 22 75 65 55 48 23 83 73 62 54 24 91 81 69 61 25 100 89 76 68 3 Tabela modificada de Zar JH. Biostatistical Analysis. 2th ed. New Jersey, Prentice-Hall Inc., 1984. p.563 15 Bibliografia 1. Bunchaft G. Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997. 2. Callegari-Jacques SM. Bioestatística: princípios e aplicações. 1ª ed. Porto Alegre: Artmed, 2003. 3. Campos H. Estatística experimental não-paramétrica. 3ª ed. Piracicaba. Departamento de Matemática e Estatística da Escola Superior de Agricultura “Luiz de Queiroz” da Universidade de São Paulo, 1979. 4. Daniel WW. Biostatistics – A foundation for analysis in the health sciences. 6th ed., New York: John Wiley & Sons, Inc., 1995. 5. Levin J. Estatística aplicada às Ciências Humanas. São Paulo: Harper & Row do Brasil, 1987. 6. Siegel S. Estatística não-paramétrica. Rio de Janeiro: Editora McGraw-Hill, 1975. 7. Vieira S. Bioestatística: tópicos avançados. Rio de Janeiro: Editora Campus, 2003. 8. Zar JH. Biostatistical analysis. 2th ed. Englewood Cliffs: Prentice-Hall Inc., 1984. 16 O teste de Wilcoxon com o SPSS • Click em <Analyse> e <Nonprametric Tests> no menu superior, e selecione a opção <2 Related Samples> • Selecione as duas variáveis que serão comparadas • Leve as duas variáveis selecionadas para a janela <Test Pair(s) List> 17 • Click em <options ...> para selecionar as opções desejadas • Click em <Continue> e <OK> para processar os dados • Abaixo apresentamos um típico output do teste de Mann-Whitney No quadro abaixo são apresentados os dados de estatística descritiva das variáveis Descriptive Statistics 164 137,09 21,646 72 200 123,00 133,50 150,75 164 144,37 22,016 94 200 129,25 142,00 158,00 fc_1 fc_2 N Mean Std. Deviation Minimum Maximum 25th 50th (Median) 75th Percentiles No quadro <Ranks> são apresentadas a média e soma dos ranks negativos (T-) e positivos (T+) 18 Ranks 45a 63,01 2835,50 115b 87,34 10044,50 4c 164 Negative Ranks Positive Ranks Ties Total fc_2 - fc_1 N Mean Rank Sum of Ranks fc_2 < fc_1a. fc_2 > fc_1b. fc_2 = fc_1c. No quadro <Test Statistics> são apresentados os valores de z escore de T e da probabilidade a ele associada. Test Statisticsb -6,143a ,000 Z Asymp. Sig. (2-tailed) fc_2 - fc_1 Based on negative ranks.a. Wilcoxon Signed Ranks Testb.
Compartilhar