Baixe o app para aproveitar ainda mais
Prévia do material em texto
75 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA Unidade II Na unidade II, abordaremos as formas para realizarmos diferentes tipos de análise de dados, dependendo das características dos seus dados e do objetivo do seu estudo. Uma característica importante do conjunto de dados que influencia a escolha do teste estatístico corresponde à análise da distribuição dos dados, conforme veremos logo no início desta dos nossos estudos. Obviamente, o objetivo do seu estudo depende da natureza da pergunta de pesquisa, conhecida como problema de pesquisa. As possíveis respostas a essa pergunta darão origem às hipóteses do estudo. A hipótese é o que você espera encontrar como resultado quando realizar um determinado experimento. E, no intuito de avaliarmos se essas hipóteses se confirmarão ou não, é que utilizamos os testes estatísticos. Existem inúmeros testes estatísticos, mas a sua escolha deve ser pautada nas características e objetivos do seu estudo; por exemplo, o número de comparações que se deseja realizar. Assim, torna‑se possível determinar o teste estatístico mais adequado para cada situação de análise. Por exemplo, o teste t para uma amostra é utilizado quando temos como objetivo comparar as características de um único grupo com um valor de referência. Já quando desejamos comparar dois grupos de dados, alguns testes são frequentemente aplicados, dependendo, é claro, de algumas condições para que eles possam ser adequadamente empregados. Nessa situação, os testes mais comuns são o teste t pareado e o teste t para amostras independentes. Para comparações entre mais de dois conjuntos de dados, podemos utilizar o teste conhecido como Anova ou o teste de Friedman, sendo que a escolha entre um e outro dependerá de alguns pressupostos básicos que discutiremos mais adiante nesta unidade. Se o objetivo do seu estudo for correlacionar uma variável com outra, ou seja, avaliar o comportamento de uma variável em relação ao comportamento de outra, poderemos utilizar um teste de correlação. No entanto, se o objetivo for avaliar o quanto que o comportamento de uma variável depende do comportamento de outra, utilizaremos o teste de regressão linear. As aplicações desses diferentes tipos de teste serão aqui discutidas; mostraremos, inclusive, exemplos práticos da área da Educação Física que representam condições em que tais testes devem ser aplicados. Obviamente, existe um número muito grande de diferentes tipos de teste, e não temos aqui a meta de apresentar todas essas opções (até porque essa seria uma tarefa impossível). Nosso objetivo aqui é simplesmente mostrar alguns testes mais recorrentes na nossa área de atuação, ilustrando possibilidades de aplicação, que serão ou não indicadas nas situações que futuramente você poderá encontrar em um trabalho de conclusão de curso. 76 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 5 ANÁLISE NA DISTRIBUIÇÃO DOS DADOS Uma vez que nossas variáveis de análise foram adquiridas (coletadas), precisamos agora avaliar como elas se distribuem em um gráfico. Elas poderão se distribuir de forma a confirmar normalidade ou de rejeitar essa distribuição normal. A avaliação da normalidade de distribuição dos dados torna‑se extremamente importante, pois é um dos principais critérios a serem considerados para escolher qual teste estatístico utilizaremos para estabelecer a comparação proposta em nosso estudo. 5.1 Distribuição normal Muitas variáveis biológicas se distribuem de uma forma equilibrada, na qual os valores centrais são mais frequentes e os valores extremos (máximos e mínimos) são mais raros no conjunto de dados. Isso pode ser observado no exemplo na figura 41, que mostra uma série de diferentes curvas que tem como característica comum concentrarem a maior parte dos seus valores no centro da curva. Média Figura 41 – Exemplos de curvas em que a maioria dos valores se posiciona no centro, se distribuindo em torno da média A curva normal é uma linha contínua com a forma aproximada de um sino, utilizada para avaliar a normalidade de distribuição dos dados. Exatamente por esse motivo, essa forma é conhecida como linha teórica, pois mostra o modo como os dados deveriam se distribuir para terem o pressuposto de normalidade aceito. Dessa forma, essa linha teórica é conhecida como curva de distribuição normal ou curva de Gauss, a qual necessariamente apresentará menor incidência em valores baixos e altos, e maior frequência em valores centrais. 77 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA A figura 42 mostra quatro exemplos de gráficos, sendo que em dois deles temos a maioria dos valores se distribuindo em torno dos valores centrais, ou seja, essas curvas podem ser consideradas como normais (curvas correspondentes às letras c e d). Já as curvas representadas pelas letras a e b, mostram uma distribuição assimétrica: na letra a, a maioria dos valores estão deslocados à esquerda, enquanto que na letra b, a maioria dos valores encontra‑se deslocada à direita. a c b d Figura 42 – Exemplos de gráficos com distribuição de dados assimétrica (letras a e b) e com distribuição simétrica (letras c e d) Assim, a curva normal é unimodal, ou seja, apresenta apenas um valor de pico, e simétrica (idêntica em ambos os lados da média). Contudo, a curva normal pode apresentar diferentes curtoses, como veremos na figura 43. A curtose pode ser definida como o achatamento de uma curva. Dessa forma, uma curva normal pode apresentar diferentes níveis de curtoses, permitindo sua classificação como platicúrtica, leptocúrtica e mesocúrtica. A curva platicúrtica é mais achatada, enquanto que a curva leptocúrtica é mais alongada. Já a curva classificada como mesocúrtica, apresenta uma forma mais tradicional, com um achatamento intermediário (entre os formatos das curvas platicúrticas e mesocúrticas). 78 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 0Z ‑3 ‑2 ‑1 +1 +2 +3 Leptocúrtica Mesocúrtica Platicúrtica Figura 43 – Representação de três curvas normais com diferentes curtoses Observação As curvas normais podem apresentar diferentes curtoses, podendo ser classificadas como platicúrtica (mais achatada), leptocúrtica (mais longada) e mesocúrtica (forma mais tradicional). Já que nossa discussão está contextualizada na Bioestatística, torna‑se importante mencionar que a distribuição normal não ocorre apenas em pessoas sadias. Esse conceito não possui nenhuma relação com o fato ser saudável ou não, normal ou anormal, dentro de um quadro esperado de desenvolvimento. Os conceitos aqui discutidos referem‑se exclusivamente à forma como as variáveis são analisadas se distribuem em gráfico. Exatamente por não apresentar nenhuma associação com os conceitos de saúde, classificamos os dados por apresentarem uma distribuição normal ou não normal (note que não usamos o termo anormal). Dessa forma, a curva de distribuição normal se apresenta simétrica em torno da média. Se ela for perfeitamente simétrica em torno da média, conforme osexemplos apresentados anteriormente na figura 43, então poderemos afirmar que os valores referentes à média, mediana e moda coincidirão (figura 44). 79 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA Média Mediana Moda Figura 44 – Curva perfeitamente simétrica com os valores de média, mediana e moda coincidindo Nesse sentido, podemos afirmar que a média e os valores de desvio‑padrão são representativos de dados de distribuição normal. Isso ocorre, pois a curva de distribuição normal apresenta dois pontos de inflexão correspondentes à média somada e à média subtraída ao desvio‑padrão. Observe a figura 45 que mostra uma curva com distribuição normal rigorosamente simétrica, na qual a média está representada pela letra M e o desvio‑padrão pela letra s. Perceba que a área total sob a curva totaliza 100%. Já a área entre os pontos de inflexão (M – s e M + s), representa aproximadamente 68%, ou seja, dois terços de todos os valores. A área que representa a média ± 2 vezes o desvio‑padrão (M – 2s e M + 2s) corresponde a 95% dos valores. Por fim, essa curva engloba 99,73% dos valores no intervalo entre a média ± 3 vezes o desvio‑padrão (M – 3s e M + 3s). Com isso, quando os valores de desvio‑padrão são acrescentados aos valores da média, nós temos a maioria dos dados representativos da sua variável de análise. Podemos afirmar que, seguindo esse pressuposto de normalidade, o conjunto de dados pode ser adequadamente representado por meio dos valores de média e desvio‑padrão. A 68% 95% Escores de variáveis de interesse Fr eq uê nc ia d e um e sc or e ‑3s ‑2s ‑1s M +1s +2s +3s C B ponto de inflexão ponto de inflexão Figura 45 – Curva que ilustra uma distribuição normal na prática 80 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 Exemplo de aplicação A figura 46 a seguir mostra quatro exemplos de curvas com diferentes formas de distribuição dos dados. Procure determinar quais são os exemplos de curvas que podem ser consideradas normais. Aponte quais são as implicações dessa determinação. A C D B Figura 46 – Exemplos de curvas representativas de diferentes conjuntos de dados 5.2 Testes de normalidade É válido lembrar que a curva de distribuição normal é uma curva teórica, a partir da qual faremos uma tentativa de encaixar as curvas obtidas a partir de dados reais que serão parecidos ou não com essa curva normal. Dificilmente os dados apresentarão uma distribuição normal perfeita. Por isso, determina‑se a normalidade de distribuição dos dados por meio de testes de normalidade. Quando nossos dados se aproximarem dessa distribuição, poderemos confirmar que os pressupostos de normalidade foram aceitos e, portanto, testes chamados de paramétricos poderão ser utilizados posteriormente para comparação das variáveis. Testes estatísticos paramétricos são geralmente preferíveis, pois apresentam maior poder estatístico. Contudo, existem inúmeras variáveis de distribuição assimétrica ou descontínua que não apresentam curva normal de distribuição dos dados. Nessas condições, em que a distribuição dos dados é considerada não normal, deveremos optar por testes chamados de não paramétricos para realizar a comparação das variáveis. A figura 47 mostra um conjunto de dados que não apresenta normalidade de distribuição, uma vez que o formato do histograma obtido a partir desse conjunto de dados não se assemelha à curva normal, representada pela linha no gráfico. 81 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA Fr eq uê nc ia Idade 16,9 25,6 34,4 43,1 51,9 60,6 69,4 78,1 Histograma Curva normal sobreposta ao histograma indicado a distribuição que os dados deveriam apresentar para atender aos pressupostos de normalidade. Std. Dev = 18,87 Mean = 32,1 N = 79,00 50 30 10 40 20 0 Figura 47 – Gráfico do tipo histograma sendo comparado á curva normal Os testes para avaliação da normalidade de distribuição de dados são realizados a partir das medidas de assimetrias e curtoses (achatamentos) das curvas compostas pelo nosso conjunto de dados. Lembrete A avaliação da normalidade de distribuição dos dados é fundamental, pois estabelece os critérios a serem considerados para escolher qual teste estatístico utilizaremos na comparação proposta em nosso estudo. Existem diversos pacotes estatísticos que utilizam diferentes procedimentos para essa avaliação da normalidade. Os testes mais comuns são: • Teste de Shapiro‑Wilk: utilizado quando temos um conjunto de dados composto por até 50 observações. • Teste de Kolmogorov Smirnov: utilizado nas demais situações, ou seja, quando temos um conjunto de dados composto por mais de 50 observações. Lembrete Os testes mais comuns utilizados para a avaliação da normalidade são: Teste de Shapiro‑Wilk e Teste de Kolmogorov‑Smirnov. 82 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 Podemos entender como número de observações o número de variáveis que gostaríamos de comparar em um determinado estudo. Para ficar mais claro, vamos a dois exemplos práticos. Imagine que você deseja comparar a altura alcançada em 30 saltos realizados antes e após um período de treinamento. Como o número de observações é igual a 30, nesse caso, usaríamos o Teste de Shapiro‑Wilk para avaliar a distribuição dos dados. Agora, imagine outro exemplo em que você pretende comparar o desempenho de sessenta homens com o desempenho de sessenta mulheres em um teste de flexibilidade. Nesse caso, como temos sessenta observações para cada grupo avaliado, devemos utilizar o Teste de Kolmogorov‑Smirnov para avaliar a distribuição dos dados. Independente do teste a ser empregado, devemos utilizar um ponto referencial para avaliar se há ou não normalidade. Esse referencial é conhecido como nível de significância, o qual é geralmente representado pela letra p. Na área da Educação Física, o nível de significância que é mais frequentemente adotado é de 5%. Isso significa que o valor de p será de 0,05, ou seja, p=0,05. Dessa forma, se realizarmos um teste de normalidade e encontrarmos um nível de significância inferior ao estabelecido (por exemplo, p<0,05), a condição de normalidade será rejeitada. Nessa situação, poderemos afirmar que o conjunto de dados avaliados não apresenta uma distribuição normal e, portanto, um teste não paramétrico deverá ser empregado para comparar os grupos. Ao contrário, se encontrarmos um nível de significância superior ao estabelecido (por exemplo, p>0,05), a condição de normalidade será confirmada. Com isso, poderemos afirmar que o conjunto de dados avaliados mostra uma distribuição normal, o que possibilita a utilização de um teste paramétrico para comparar os grupos. Observação Ao aplicarmos testes de normalidade, se encontrarmos um nível de significância superior ao estabelecido (por exemplo, p>0,05), a condição de normalidade será confirmada. Saiba mais Consulte o capítulo 6 do livro Análise de Dados em Atividade Física, deBarros e Reis (2003), para ter mais informações sobre a avaliação da curva normal e os diferentes tipos de testes utilizados para avaliar a normalidade de distribuição de dados. 83 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA 6 FORMULAÇÃO DE HIPÓTESES Quando realizamos um estudo, estamos investigando um problema. O problema de pesquisa é o contexto que estamos analisando; nesse sentido, é fundamental enxergarmos as variáveis de análise no nosso estudo, em particular as variáveis dependentes e independentes. Portanto, estamos interessados no efeito que a variável independente pode ter sobre a variável dependente. Conforme visto anteriormente, a variável independente é a que estamos manipulando, enquanto que a variável dependente é o efeito da variável independente; é a variável que sofrerá a interferência da variável independente. Se pensarmos numa proposta de causa e efeito, a causa é a variável independente e o efeito é a variável dependente. Vejamos alguns exemplos: Figura 48 – Imagem exemplificando situação de hidratação relacionado ao problema de pesquisa intitulado Investigar a interferência da hidratação sobre o rendimento no teste de 12 minutos • Problema de pesquisa: Investigar a interferência da hidratação sobre o rendimento no teste de 12 minutos. Variável independente: hidratação. Variável dependente: resultado no teste de 12 minutos. 84 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 Figura 49 – Imagem exemplificando situação de corrida, relacionada ao problema de pesquisa intitulado Investigar como o tempo de uso afeta a capacidade de absorção de impacto do calçado • Problema de pesquisa: investigar como o tempo de uso afeta a capacidade de absorção de impacto do calçado. Variável independente: tempo de uso do calçado. Variável dependente: absorção de impacto. Figura 50 – Imagem exemplificando situação de salto vertical, relacionado ao problema de pesquisa intitulado Investigar como o aumento de força de quadríceps afeta a capacidade de salto vertical 85 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA • Problema de pesquisa: investigar como o aumento de força de quadríceps afeta a capacidade de salto vertical. Variável independente: força de quadríceps. Variável dependente: altura de salto. Figura 51 – Imagem exemplificando situação de alongamento, relacionado ao problema de pesquisa intitulado Investigar qual alongamento traz maiores ganhos em flexibilidade • Problema de pesquisa: investigar qual alongamento traz maiores ganhos em flexibilidade. Variável independente: tipos de alongamentos. Variável dependente: ganho de flexibilidade. Figura 52 – Imagem exemplificando situação de prática de exercício, relacionado ao problema de pesquisa • Problema de pesquisa: investigar índices de sedentarismo em função dos diferentes níveis de escolaridade em adultos. 86 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 Variável independente: nível de escolaridade em adultos. Variável dependente: índices de sedentarismo. Uma vez que o problema de pesquisa foi delimitado e as variáveis independente e dependente foram identificadas, precisamos formular as hipóteses. A hipótese é o resultado que esperamos obter pela nossa investigação. Geralmente, ao levantar o problema, já imaginamos o que teremos como resultado. A partir dessa ideia, teremos que formular duas hipóteses, no mínimo: hipótese de pesquisa (H1) e a hipótese nula (H0). A hipótese de pesquisa ou hipótese alternativa é o resultado esperado pelo pesquisador; geralmente surge da experiência, da dedução lógica ou de resultados de outras investigações. Já a hipótese nula, serve para avaliar a confiabilidade dos resultados; segundo ela, não há diferença entre os resultados, ou seja, não há relação entre as variáveis independente e dependente. Vejamos como as hipóteses poderiam ser formuladas nos exemplos apresentados anteriormente: • Problema de pesquisa: investigar a interferência da hidratação sobre o rendimento no teste de 12 minutos. H1: a hidratação afeta o resultado no teste de 12 minutos. H0: a hidratação não afeta o resultado no teste de 12 minutos. • Problema de pesquisa: investigar como o tempo de uso afeta a capacidade de absorção de impacto do calçado. H1: o tempo de uso afeta a capacidade de absorção de impacto do calçado. H0: o tempo de uso não afeta a capacidade de absorção de impacto do calçado. • Problema de pesquisa: investigar como o aumento de força de quadríceps afeta a capacidade de salto vertical. H1: a força do quadríceps afeta a altura de salto vertical. H0: a força do quadríceps não afeta a altura de salto vertical. • Problema de pesquisa: investigar qual alongamento traz maiores ganhos em flexibilidade. H1: os diferentes tipos de alongamentos trazem ganhos distintos na flexibilidade. H0: os diferentes tipos de alongamentos trazem ganhos semelhantes na flexibilidade. • Problema de pesquisa: investigar índices de sedentarismo em função dos diferentes níveis de escolaridade em adultos. 87 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA H1: o nível de escolaridade afeta os índices de sedentarismo. H0: o nível de escolaridade não afeta os índices de sedentarismo. Figura 53 – Imagem exemplificando situação de prática de exercício, relacionado ao problema de pesquisa intitulado Investigar índices de sedentarismo em função dos diferentes níveis de escolaridade em adultos Exemplo de aplicação Agora que já vimos diversos exemplos aplicados à nossa área de atuação, procure formular um novo problema de pesquisa relacionado à Educação Física, que ainda não tenha sido comentado nesse material. Depois, procure desenvolver também a hipótese alternativa para esse problema. Uma vez formuladas essas hipóteses, devemos proceder ao teste para verificar os resultados que teremos. Esse processo é conhecido como teste de hipótese ou teste de significância. O teste de hipóteses envolve os seguintes passos: • delimitar o problema de pesquisa; • definir as hipóteses nula e alternativa; • coletar dados em uma amostra da população; • uso de ferramentas estatísticas para testar a hipótese; • comparação dos resultados com a literatura. Uma vez que a hipótese alternativa ou de pesquisa (H1) é uma alternativa para a hipótese nula (H0), o que buscamos são evidências para rejeitar H0, ou seja, provas de que ela não seja verdadeira. Se H0 não é verdadeira, H1 passa a ser a resposta aceita. 88 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 Em situações nas quais não se sabe para qualdireção os resultados tenderão, teremos que usar um teste estatístico bicaudal. Quando já imaginamos para qual lado os resultados poderão tender, podemos usar um teste unicaudal. Vejamos um exemplo com base numa das situações apresentadas anteriormente. • Problema de pesquisa: investigar como o tempo de uso afeta a capacidade de absorção de impacto do calçado. H1: o tempo de uso afeta a capacidade de absorção de impacto do calçado. H0: o tempo de uso não afeta a capacidade de absorção de impacto do calçado. Nessa situação, a hipótese alternativa indica que a absorção de impacto será afetada pelo tempo de uso do calçado, mas não sabemos se para mais ou para menos, ou seja, pode ser que a absorção de impacto melhore ou piore. Por não saber para qual lado os resultados tenderão, deveremos usar um teste bicaudal. Por outro lado, se imaginarmos que a absorção de impacto não possa melhorar, apenas piorar, estamos imaginando para qual lado os resultados tenderão; assim, ou a absorção de impacto piorará (H1) ou não será afetada (H0). Nesse caso, um teste unicaudal deverá ser usado. Os testes estatísticos vão identificar e comparar os dados coletados com dados conhecidos de uma população ou comparar dados coletados em duas condições distintas. Por exemplo, altura de salto antes de treinamento de força em quadríceps e depois de treinamento de força em quadríceps, quilometragem percorrida no teste de 12 minutos com hidratação prévia e sem hidratação prévia, ganho em flexibilidade após 8 sessões de alongamento estático e após 8 sessões de alongamento dinâmico. A comparação que será realizada permite identificar o valor de p, que varia de 0,0 a 1,0. O p representa a probabilidade dos resultados encontrados na amostra, para as duas condições, serem idênticos. O que se procura é aceitar ou rejeitar H0, ou seja, é evidência para afirmar que os resultados das duas condições, por exemplo, são idênticos ou diferentes. Isso será feito pela determinação de um valor de corte para p, que também é conhecido como nível de significância. Geralmente, o valor crítico de p fica entre 5% (0,05) e 1% (0,01). Na comparação entre as duas distribuições de dados, quanto menor for o valor de p, maior a evidência para rejeitar a hipótese nula, ou seja, de que os dois conjuntos de dados são diferentes. O valor de p corresponde à probabilidade dos dois conjuntos de dados serem iguais; portanto, o p de 0,05 significa que há 5% de chance das distribuições dos dados nas duas condições serem iguais, ou seja, eles são diferentes. Com isso, se rejeita H0 e aceita H1. Observação Quanto mais forte tiver que ser a evidência, menor terá que ser o valor de p, por exemplo, 0,01. 89 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA Como vimos, as formulações das hipóteses alternativas (hipóteses do pesquisador) são geralmente provenientes de resultados de outras investigações. Entretanto, torna‑se fundamental que sejam utilizadas fontes científicas de qualidade, e, por isso, no tópico que segue abordaremos as formas de buscar tais referências. As fontes bibliográficas podem ser classificadas como primárias ou secundárias. Fontes primárias correspondem aos artigos científicos experimentais, ou seja, as conclusões apresentadas nesses textos são oriundas de algum trabalho realizado por pesquisadores, envolvendo um desenho experimental definido. Já as fontes secundárias, são os artigos de revisão e os livros. Esses materiais têm como objetivo sistematizar informações divulgadas principalmente por meio de outras fontes primárias. Dessa forma, o grande objetivo desse tipo de fonte não é produzir uma informação nova, mas sistematizar e organizar conteúdos para que as informações já divulgadas possam ser mais bem organizadas e entendidas. Nesse sentido, ao realizarmos uma pesquisa bibliográfica em que o objetivo primordial é formular as hipóteses do nosso estudo, devemos sempre preferir as fontes primárias, pois elas permitem uma leitura do texto diretamente a partir da escrita dos autores do trabalho original. Já as fontes secundárias, promoverão uma releitura dessas informações contidas no texto original, servindo mais especificamente para promover uma ideia geral sobre o tema abordado. 6.1 Estratégias de busca de artigos científicos Nos dias de hoje, a informação e o conhecimento são facilmente obtidos por meio da internet. No entanto, justamente devido à facilidade em acessar e em postar informação e conhecimento é que o maior desafio torna‑se a adequada seleção desse conhecimento. A escolha do conhecimento de qualidade é o grande segredo da atualidade. Hoje em dia, qualquer pessoa é capaz de criar um site, mesmo que não domine o assunto discutido. Esse é justamente o problema: não há nenhuma classificação na informação apresentada e, às vezes, sites bem elaborados podem conter conteúdos altamente questionáveis. Figura 54 – Trabalhos atraentes podem ser desenvolvidos; entretanto com conteúdo questionável 90 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 Por exemplo, pense num conteúdo que não seja de seu domínio: pintar, cozinhar, tecer ou qualquer outro. Com criatividade, um site interessante e atraente pode ser criado e atrairá muitos visitantes que usarão o seu conteúdo. Infelizmente, os visitantes do site não fazem ideia que o seu conhecimento sobre o assunto possa ser limitado. Lembre‑se de que, nesse exemplo, um conteúdo que não é do seu domínio foi escolhido. Por ser atraente e bem estruturado, muitos irão adotar os ensinamentos do site e passá‑los adiante. Perceba como isso pode ser perigoso quando se trata da saúde de uma pessoa. É necessário desenvolver um olhar crítico a tudo que nos é apresentado, independente de quão lógico a informação ou o conhecimento possa parecer. A internet é uma fonte vasta de conhecimento e informação e que se encontra ao alcance de todos. Infelizmente, junto aos sites, não aparece nenhuma indicação da confiabilidade das informações transmitidas. Por isso, cabe a nós aprender a selecionar o conhecimento mais confiável. Para tanto, é importante saber as origens dos conteúdos apresentados. Atualmente, não é difícil montar um site atraente que convide o acesso de todos, basta um projetista competente e uma “pitada” de criatividade. Entretanto, nem sempre conhecemos a pessoa que desenvolveu o conteúdo postado; em muitos casos, aparece um breve currículo do autor do conteúdo. Mesmo assim, ainda é possível que a pessoa tenha criado o conteúdo em grande parte usando conhecimento empírico, ao invés de conhecimento científico. O conhecimento empírico é obtido por um método, no qual dados são coletados com base na experiência. Não desmerecendo a experiência, vale lembrar que esta apresenta certas limitações. Por exemplo, o conhecimento pautado na experiência depende das vivências de uma pessoa e às vezes elas induzem a interpretações incorretas e a conclusões que eventualmente são válidas apenas em certas circunstancias. Contudo, o maior problema está na baixa capacidade de extrapolar a experiência a outras condições, pois a adquirimos sem controle das variáveis que poderiam interferir nos resultados e assim induzir a interpretações incorretas. Figura 55 – Momento decisivo de uma partida de futebol; momento do chute a gol Por exemplo, muitas vezes buscamos explicações para fracassos, como em uma cobrança de pênalti perdida durante uma partida de futebol. O número de variáveis que podem ter influenciadoa perda do 91 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA pênalti são inúmeros. No entanto, cada torcedor terá uma opinião e uma justificativa para o insucesso, sendo que cada um acredita ser sua a razão verdadeira do fracasso. É importante perceber que nessa situação, cada justificativa é meramente uma especulação e que pode não ser o real motivo da perda do pênalti. Gostaríamos de deixar claro que não é um desmerecimento à experiência, mas certo cuidado deve ser dado à importância que se destina a ela. Por outro lado, o conhecimento científico é uma forma mais estruturada de adquirir conhecimento e que envolve objetividade e controle das variáveis para a solução de um problema específico. Vale lembrar que ele também apresenta limitações, porém permite uma segurança maior na interpretação dos resultados pesquisa e uma garantia maior de que, em qualquer outra região do mundo, se alguém refizer o estudo nas mesmas circunstâncias, a chance é razoável em obter um resultado semelhante. Por conta dessa característica do estudo científico, é que o mais seguro é buscar conhecimento em revistas e fontes científicas. É claro que mesmo que os editores das revistas científicas submetam os artigos a revisores competentes, é possível que resultados questionáveis sejam observados. Entretanto, a segurança na informação é maior. São muitos os locais nos quais é possível se obter conhecimento científico. No quadro a seguir, há uma lista dos principais sites de busca de artigos científicos, onde se encontram materiais direcionados à área da Educação Física. Quadro 1 – Principais bases de dados nas quais é possível encontrar artigos científicos em revistas indexadas Bases de dados (referências e resumos): Pubmed www.pubmed.com • Indexa revistas significativas na área da saúde. • Indexa principalmente revistas americanas, pois é pago com dinheiro público. • Principal site de busca usado. • Principalmente resumos. • Oferece links para as revistas eletrônicas para obter artigos completos (muitos pagos). Bireme www.bireme.br • Banco de dados Latino‑Americano. • Acesso à informação científica e técnica em saúde (BVS – Biblioteca Virtual em Saúde). • Indexa diversos bancos de dados virtuais. • LILACS (Literatura Latino‑Americana e do Caribe de Informação em Ciências da Saúde). Dedalus www.dedalus.usp.br • Indexa toda a produção científica da USP. • Entrar: interface portal USP. Scielo www.scielo.br • Scientific Eletronic Library On‑line. • Indexa 114 revistas brasileiras. • Textos completos. • Maior parte da área biológica. • Suportada inicialmente pela Fapesp e, a partir de 2002, também pela Capes. 92 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 Periódicos www.periodicos.capes.gov.br • Base com textos completos. • Banco de dados de teses e dissertações. • Diversas revistas especificamente na área de EF. Elsevier http://www.elsevier.com • Oferece informação técnico‑científica sobre saúde. • Indexa diversas revistas ao redor do mundo. • Indexa 75% da produção Europeia. • Interligada com PubMed. • Principais áreas: Ciências da saúde, físicas e sociais. Google http://scholar.google.com.br • Não é especificamente científica. • Localiza revistas virtuais na internet, caso o link não esteja acessível em outros bancos de dados. • Nem sempre o artigo completo é acessível. • Busca por institutos de pesquisa; linhas de pesquisa; pesquisadores; publicações sobre o assunto. Teses e dissertações USP www.usp.br • Banco de dados da produção acadêmica da USP. • Textos completos em pdf. • Acesso em Biblioteca. Site de busca USP www.usp.br/sibi • Sistema Integrado de Bibliotecas da USP. • Busca por revistas eletrônicas. • A partir de pontos de internet ou computadores da USP, muitos artigos podem ser obtidos em versão completa. É importante lembrar que há outras formas de busca e de conseguir artigos científicos, dissertações e teses, diferentes das apresentadas anteriormente. Entretanto, o objetivo do presente texto não é determinar o caminho correto, e sim mostrar possibilidades para que o profissional ou aluno comece a se familiarizar com a leitura de artigos científicos. Nessa mesma perspectiva, observe, a seguir, um roteiro para levantamento bibliográfico sobre um assunto qualquer: Levantando referências bibliográficas 1. Pensar no assunto de interesse. 2. Pensar em palavras‑chaves. Ser criativo e persistente. 3. Busca inicial por referências em livros‑textos e nos sites de busca. 4. Montar lista relevante de artigos. 5. Tentar conseguir artigos completos. 6. Leitura inicial do artigo para fazer fichamento. 7. Usar referências bibliográficas dos artigos para conseguir mais artigos. 93 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA As revistas científicas apresentam uma classificação segundo alguns critérios predefinidos. A classificação se dá em função do Qualis da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes) e do fator de impacto. O Qualis é uma avaliação feita pela Capes e tem o objetivo de classificar revistas impressas e virtuais segundo a sua abrangência de sua circulação (local, nacional ou internacional) e segundo a qualidade (A, B, C), nas diferentes áreas de conhecimento. Os critérios para a classificação são: números de exemplares da revista lançados ou publicados por ano, número de banco de dados nos quais a revista se encontra indexada e número de instituições que publicam na revista para evitar que ela seja mantida por uma única instituição. Segundo o Qualis, as revistas podem ser classificadas como de nível A1 ou A2, que são os níveis mais altos e internacionais, níveis B1, B2, B3, B4 e B5, que englobam níveis altos e baixos de classificação e o nível C. Quanto mais alto for o nível, mais bem conceituada e procurada ela é para publicação pelos pesquisadores de todo o mundo. Por outro lado, não criteriosa ela é com relação aos métodos empregados no estudo e com a relevância do tema; por isso, mais dificil é publicar nessas revistas. O fator de impacto é outra forma de classificar as revistas que veiculam artigos científicos. É um indicador de quantas vezes um artigo científico publicado em um periódico foi citado. Esse fator reflete quanto os artigos de uma determinada revista foram lidos e seus conteúdos citados em outros artigos. Nesse sentido, quanto maior for o fator de impacto de uma revista, maior o prestígio desla, pois mais pessoas a leem e a citam. Essa forma de classificação é calculada pela relação de citações por artigos publicados em um período; reflete a relação de citações e publicações dos dois anos anteriores ao atual. Para entender melhor, vamos supor o fator de impacto de uma revista em 2010; equivale ao número de vezes em que os artigos desse periódico foram citados entre os anos 2008 e 2009. Exemplo: cinquenta artigos foram citados cem vezes, dividido pelo número total de publicações de todos os artigos de todas as revistas entre os anos 2008 e 2009. Portanto, o fator de impacto da revista será 100 dividido por 50, ou seja, 100/50 = 2, sendo que este será divulgado em 2011. Essas duas formas de classificações são tentativasde categorizar a importância que as revistas apresentam em suas áreas de atuação. Ambas apresentam falhas, mas, mesmo assim, elas ainda servem como um indicador. Vale lembrar que muitos artigos de excelência podem ser encontrados em revistas de fator de impacto e Qualis baixos. Por isso, o ideal é realmente ler os artigos encontrados e, de forma crítica, analisar o seu conteúdo. Este, mesmo que apresente falhas metodológicas, traz contribuições importantes. Como no exemplo, devemos ter ciência de que o artigo tem limitações e os resultados podem não ser completamente confiáveis. 94 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 7 TESTES ESTATÍSTICOS: TESTE T Os testes estatísticos podem ser definidos como procedimentos que, com algum nível de precisão, possibilitam avaliar se as hipóteses estatísticas podem ou não ser consideradas como verdadeiras. Como já mencionamos anteriormente, existem inúmeros tipos de testes estatísticos que são utilizados com diferentes finalidades e a partir de condições distintas de aplicação (por exemplo, a partir da condição de normalidade comprovada ou não). Nesse sentido, esses tipos distintos de testes estatísticos permitem a comparação entre as proporções e as distribuições das observações. Entre outras possíveis formas de aplicação, destacamos aqui as seguintes situações: • comparação de um conjunto de dados a uma categoria de referência; • comparação entre dois conjuntos de dados de um único grupo; • comparação entre proporções de mais de dois grupos de dados; • comparação entre as proporções de dois grupos de dados. Embora exista um número muito grande de testes estatísticos disponíveis, vamos começar a discutir aqueles que julgamos mais comuns na área da Educação Física. 7.1 Teste t para uma amostra O Teste t para uma amostra é empregado em situações em que características de um único grupo precisam ser comparadas com um valor de referência. Dessa forma, podemos afirmar que esse teste foi desenvolvido para comparar duas médias em um experimento. Entretanto, para que esse teste possa ser adequadamente utilizado, torna‑se fundamental que sejam atendidos os critérios de normalidade de distribuição de dados. Dito de outra forma, o conjunto de dados a ser comparado deve ter antecipadamente sua normalidade confirmada por meio dos testes já descritos no tópico 1.2 desta Unidade. Caso o conjunto de dados a ser testado não apresente normalidade de distribuição de dados, a opção não paramétrica para o teste de uma amostra corresponde ao Teste dos Sinais. Lembrete O Teste t para uma amostra é empregado em situações em que características de um único grupo precisam ser comparadas com um valor de referência. 95 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA Vamos a três exemplos de situações em que o Teste t para uma amostra deve ser empregado para realizar as comparações almejadas. Figura 56 – Ambiente em que testes de resistência aeróbia (testes de corrida) podem ser realizados, como relatado no exemplo 1 a seguir. Exemplo 1 Comparação entre a média de desempenho dos alunos do curso de Graduação em Educação Física no teste de resistência aeróbia, conhecido como Teste de 12 minutos, em relação ao desempenho médio nesse teste esperado para a faixa etária dessa população. Para esse exemplo, temos a formulação das seguintes hipóteses: H0 → a média dos resultados no teste de resistência aeróbia para o grupo alunos do curso de graduação em Educação Física é semelhante à média do grupo referencial estipulado. H1 → a média dos resultados no teste de resistência aeróbia para o grupo alunos do curso de graduação em Educação Física é diferente da média do grupo referencial estipulado. Figura 57 – Display de uma esteira motorizada. Outro exemplo de ambiente em que testes de resistência aeróbia (testes de corrida) podem ser realizados, como relatado no exemplo 1 a seguir 96 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 Exemplo 2 Comparação entre a média nacional de desempenho dos alunos de graduação do curso de Educação Física, com a média do desempenho dos alunos de Educação Física da Universidade Paulista (UNIP), que estejam cursando o último ano. Para esse exemplo, temos a formulação das seguintes hipóteses: H0 → A média do desempenho dos alunos de Educação Física da Universidade Paulista (UNIP) é semelhante à média nacional de desempenho dos alunos de graduação do curso de Educação Física. H1 → A média do desempenho dos alunos de Educação Física da Universidade Paulista (UNIP) é diferente da média nacional de desempenho dos alunos de graduação do curso de Educação Física. Considere, hipoteticamente, que você já tenha realizado a coleta dos seus dados e que os seguintes valores foram obtidos: • média dos alunos da UNIP (± desvio‑padrão): 9,63 ± 0,7; • média nacional (± desvio‑padrão): 6,20 ± 0,9. Nesse caso, a hipótese alternativa (H1) foi confirmada, pois, após aplicação do Teste t para uma amostra, foi verificada diferença entre a média dos alunos da UNIP e a média nacional. Foi possível observar que a média do desempenho dos alunos de Educação Física da UNIP foi estatisticamente superior à média nacional de desempenho dos alunos de graduação do curso de Educação Física. Figura 58 – Prova de corrida, conforme exemplo 3, intitulado Comparação entre a média do desempenho dos atletas do seu grupo de corrida com a média dos participantes na prova de 10 km na qual eles pretendem concorrer 97 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA Exemplo 3 Comparação entre a média do desempenho dos atletas do seu grupo de corrida com a média dos participantes na prova de 10 km na qual eles pretendem concorrer. Para esse exemplo, temos a formulação das seguintes hipóteses: H0 → A média do desempenho dos atletas do seu grupo de corrida mostra‑se semelhante à média dos participantes na prova de 10 km na qual eles pretendem concorrer. H1 → A média do desempenho dos atletas do seu grupo de corrida mostra‑se diferente da média dos participantes na prova de 10 km na qual eles pretendem concorrer. Novamente, imagine que você já tenha realizado a coleta dos seus dados e que os seguintes valores foram obtidos: • média do desempenho dos atletas do seu grupo de corrida na prova de 10 km (± desvio‑padrão): 41,3 ± 1,4 min; • média dos participantes na prova de 10 km: 41,5 ± 4,6 min. Nesse caso, a hipótese nula (H0) foi confirmada, pois, após aplicação do Teste t para uma amostra, não foi verificada diferença significativa entre a média do desempenho dos atletas do seu grupo de corrida quando comparado com a média dos participantes na referida prova de 10 km. Foi possível observar que as médias do desempenho dos dois grupos comparados foram muito semelhantes entre si. Dessa forma, o teste estatístico permitiu refutar a hipótese H1. Observação O Teste t só deve ser utilizado para uma amostra quando o conjunto de dados apresenta distribuição normal. A opção não paramétrica corresponde aoTeste dos Sinais. 7.2 Teste t pareado O Teste t pareado é utilizado em situações nas quais um mesmo grupo é avaliado em duas condições distintas, sendo que o objetivo é comparar essas duas médias entre si. Esse é um dos testes mais utilizados em Educação Física, pois frequentemente temos como objetivo avaliar o efeito de uma determinada forma de intervenção; por exemplo, uma determinada modalidade de treinamento. Dessa forma, usando o Teste t pareado conseguimos afirmar se uma variável (por exemplo, a força ou a flexibilidade) altera depois de um período ou uma sessão de treinamento. 98 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 Figura 59 – Sessão de treinamento de força, que pode ser utilizado como forma de intervenção em nossa área de atuação Esse tipo de teste também necessita atender aos critérios de normalidade de distribuição para que possa ser aplicado. Assim, apenas dados paramétricos, ou seja, que tiveram sua normalidade de distribuição de dados confirmada, podem ser comparados usando o Teste t pareado. Para situações em que a normalidade for refutada, deve‑se utilizar uma das seguintes opções não paramétricas: Teste de Wilcoxon e Teste dos Sinais. Outra condição fundamental para a aplicação do Teste t pareado é que a amostra dos dados nas duas condições a serem comparadas (antes e depois) deve ter o mesmo tamanho. Caso contrário, a relação de dependência ou pareamento será perdida. Exemplificando, se na condição pré‑treinamento foi avaliada a força de dez indivíduos, na condição pós‑treinamento a força dessas mesmas dez pessoas deverá ser avaliada novamente, para que se estabeleça corretamente uma relação causa‑efeito. Com isso, conseguiríamos afirmar, por exemplo, que o treinamento (causa) gera um aumento de força (efeito). Lembrete O Teste t pareado é utilizado nas situações em que um mesmo grupo é avaliado em duas condições distintas; por exemplo, condição pré e pós um treinamento. Para ficar mais claro, vamos a dois exemplos de aplicação do Teste t pareado na área específica da Educação Física: 99 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA Figura 60 – Trabalhadores que podem ser acometidos por dor lombar em função do seu tipo de atividade laboral Exemplo 1 Comparação da dor lombar para um grupo de trabalhadores que foi submetido a um período de ginástica laboral entre as condições pré e pós‑treinamento. Para esse exemplo, formulamos as seguintes hipóteses: H0 → A dor lombar, para o grupo de trabalhadores avaliados, mostra‑se semelhante antes e após um período de ginástica laboral. H1 → A dor lombar, para o grupo de trabalhadores avaliados, mostra‑se diferente entre as condições pré e pós um período de ginástica laboral. Nesse caso, obviamente o pesquisador procura investigar se o treinamento realizado na ginástica laboral mostra‑se efetivo para reduzir a dor lombar dos trabalhadores. O que ele espera é encontrar menores valores na condição pós‑treinamento. Dessa forma, deseja confirmar a hipótese alternativa (H1) a partir da utilização do Teste t pareado. Figura 61 – Atividades físicas realizadas em meio líquido por indivíduos idosos 100 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 Exemplo 2 Comparação do desempenho de um grupo de pessoas idosas em testes funcionais antes e depois de um período de treinamento realizado em meio líquido. A partir desse exemplo, formulam‑se as seguintes hipóteses: H0 → O desempenho dos idosos avaliados nos testes funcionais é semelhante antes e após um período de treinamento realizado em meio líquido. H1 → O desempenho dos idosos avaliados nos testes funcionais é diferente quando comparadas as condições pré e pós um período de treinamento realizado em meio líquido. Nesse caso, o pesquisador tem por intuito investigar se o treinamento realizado em meio líquido é capaz de melhorar a funcionalidade de indivíduos idosos. Para tanto, o que ele possivelmente espera encontrar são maiores valores em testes de funcionalidade na condição pós‑treinamento. Dessa forma, o Teste t pareado permitiria‑lhe confirmar a hipótese alternativa (H1). Observação Para aplicação Teste t pareado, é necessária a normalidade de distribuição nos dados e que a amostra dos dados tenha o mesmo tamanho nas condições pré e pós. 7.3 Teste t para amostras independentes O Teste t para amostras independentes deve ser utilizado em situações em que se planeja comparar uma característica comum de dois grupos que são compostos por indivíduos diferentes (grupos são independentes). Figura 62 – Imagem de uma prova de ciclismo, relacionada à pesquisa com objetivo intitulado Comparar o consumo máximo de oxigênio (VO2max.) entre um grupo de ciclistas e um grupo de corredores Dessa forma, pode‑se presumir que a condição fundamental para a aplicação desse teste é que os sujeitos de um grupo não estejam relacionados aos sujeitos de outro grupo. 101 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA Por exemplo, imagine que um pesquisador deseja comparar o consumo máximo de oxigênio (VO2max.) entre um grupo de ciclistas e um grupo de corredores. Entretanto, como um dos indivíduos avaliados é triatleta e participa dessas duas formas de treinamento, esse pesquisador decide colocar os valores de VO2max. desse sujeito nos dois grupos a serem comparados. Esse procedimento se mostra inadequado para a utilização do Teste t para amostras independentes, o que poderia conduzir o pesquisador a uma análise errônea e, consequentemente, levá‑lo a interpretações equivocadas a partir do seu conjunto de dados. Para aplicação do Teste t para amostras independentes, é necessário, também, que os dados mostrem uma distribuição normal (normalidade aceita em teste realizado previamente). As opções não paramétricas que permitem comparações semelhantes são: Teste da Soma dos Ranks de Wilcoxon e Teste t. Lembrete O Teste t para amostras independentes permite a comparação da média dos valores de um grupo com a média de valores de outro grupo compostos necessariamente por indivíduos diferentes. Vamos a dois exemplos de aplicação do teste t apara amostras independentes. Figura 63 – Imagem associada ao exemplo 1 explicitado a seguir, intitulado: Comparação da altura de salto vertical obtida por uma amostra composta por jogadores de basquete com aquela obtida por uma amostra composta por lutadores de judô Exemplo 1 Comparação da altura de salto vertical obtida por uma amostra composta por jogadores de basquete com aquela obtida por uma amostra composta por lutadores de judô. 102 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 A partir desse exemplo, formulam‑se as seguintes hipóteses: H0 → a altura de salto vertical é semelhante entre jogadores de basquete e lutadores de judô. H1 → a altura de salto verticalé diferente entre jogadores de basquete e lutadores de judô. O objetivo dessa comparação é investigar se participantes de modalidades esportivas distintas (jogadores de basquete e lutadores de judô) possuem desempenho diferente no teste que determina a altura máxima de salto vertical. Imagina‑se que, nessa condição, o pesquisador espere encontrar jogadores de basquete que atinjam uma altura de salto significativamente superior aos lutadores de judô, em função da característica específica de cada modalidade. Se isso ocorrer, a hipótese alternativa (H1) será confirmada. Figura 64 – Imagem associada ao exemplo 2 explicitado a seguir, intitulado: Comparação da força máxima do grupo muscular do quadríceps de atletas halterofilistas com atletas jogadores de futebol Exemplo 2 Comparação da força máxima do grupo muscular do quadríceps de atletas halterofilistas com atletas jogadores de futebol. Para esse exemplo, são formuladas as seguintes hipóteses: H0 → A força máxima do grupo muscular do quadríceps é semelhante entre atletas halterofilistas e atletas jogadores de futebol. H1 → A força máxima do grupo muscular do quadríceps mostra‑se diferente entre atletas halterofilistas e atletas jogadores de futebol. A finalidade desse estudo é investigar se a capacidade de produzir força máxima mostra‑se diferente entre grupos distintos de atletas: halterofilistas e jogadores de futebol. Acredita‑se que, como esses atletas utilizam tipos diferentes de força em suas modalidades, o pesquisador deve imaginar que os atletas halterofilistas produzirão maior força máxima quando comparados aos atletas jogadores de futebol. Dessa forma, a hipótese alternativa (H1) seria confirmada. 103 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA Lembrete Para aplicação do Teste t para amostras independentes é necessária normalidade de distribuição dos dados. As opções não paramétricas são: Teste da Soma dos Ranks de Wilcoxon e Teste t. 8 OUTROS TESTES ESTATÍSTICOS Basicamente, tratamos até aqui de situações em que dois grupos de dados são comparados entre si. Entretanto, como devemos proceder quando queremos comparar simultaneamente mais de dois grupos de dados entre si? E como fazemos para avaliar as proporções entre dois grupos de dados para analisar se existe alguma relação entre o comportamento desses dados? Para responder a essas questões, vamos agora discutir mais alguns tipos de testes estatísticos. 8.1 Teste de Anova O teste de análise de variância, conhecido também como Anova, deve ser empregado em uma pesquisa em que o objetivo seja estabelecer a comparação de mais de dois grupos simultaneamente. Imagine que tenhamos uma condição em que uma variável quantitativa deverá ser comparada entre quatro grupos distintos. O pesquisador poderia utilizar vários testes t entre os grupos para compará‑los dois a dois. Contudo, esse procedimento mostra‑se estatisticamente inadequado, pois aumenta o erro de se concluir inapropriadamente que existe diferença entre as médias. Isso significa que de forma errada esse pesquisador poderia concluir que existe diferença entre dois grupos quando, na verdade, não há. Por isso, o procedimento correto consiste em usar o Teste de Anova, o que possibilita comparar mais de duas médias de um experimento em um único teste. Com isso, torna‑se possível identificarmos as diferenças entre os grupos (se essas existirem), mantendo o adequado controle sobre o nível de significância do teste. O Teste de Anova permite atribuir as possíveis diferenças encontradas a causas ou fontes de variação diferentes. O número de causas de variação ou fatores dependerá dos objetivos de cada estudo. Quando esse teste apresenta apenas uma fonte de variação, ele é conhecido como Anova one‑way, ou Anova de um fator; quando o teste apresenta duas fontes de variação, ele é conhecido como Anova two‑way (ou Anova de dois fatores). A Anova de um fator apresenta apenas uma causa de variação. Já na Anova de dois fatores, as variáveis são divididas em dois blocos, sendo que cada bloco representa um conjunto de unidades experimentais homogêneas entre si. A grande vantagem desse tipo de teste é que os efeitos existentes em diferentes blocos podem ser separados entre si, ou seja, aplicando‑se apenas um teste estatístico podemos explicar efeitos de fatores diferentes. 104 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 Lembrete O teste de análise de variância (Anova) deve ser utilizado em estudos quando o objetivo é estabelecer uma comparação de mais de dois grupos simultaneamente. Um experimento pode conter um ou mais fatores com diferentes níveis. Os níveis de um fator representam as características diferentes deste. Assim, o procedimento estatístico detecta qual a influência desses fatores na variação dos grupos analisados, ou seja, identifica qual fator (ou quais fatores) são as possíveis causas de variação observada. Para ficar mais claro, vamos a um exemplo prático de aplicação dos conceitos de fatores e de níveis no teste de Anova. Figura 65 – Imagem associada ao exemplo de aplicação do teste de Anova com o objetivo de comparar a estatura de indivíduos do gênero feminino e masculino com diferentes níveis de escolaridade: Ensino Médio, graduação e pós‑graduação Imagine que você deseja comparar a estatura de indivíduos do gênero feminino e masculino com diferentes níveis de escolaridade: Ensino Médio, graduação e pós‑graduação. Nesse exemplo, o gênero é um fator com dois níveis: masculino e feminino. O nível de escolaridade pode ser considerado outro fator, com três níveis: Ensino Médio, graduação e pós‑graduação. Os dados hipotéticos desse caso são apresentados na tabela 12. 105 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA Tabela 12 – Dados correspondentes à estatura em metros de estudantes de Ensino Médio, graduação e pós‑graduação, do sexo masculino e feminino Estatura Nível de escolaridade Ensino Médio Graduação Pós-graduação Gênero Masculino 1,78 ± 0,8 m 1,8 ± 0,7 m 1,79 ± 1,0 m Feminino 1,62 ± 0,6 m 1,65 ± 0,8 m 1,64 ± 0,7 m A aplicação de um teste de Anova de dois fatores nos dados da tabela 12 permitiria verificar que os alunos do gênero masculino são estatisticamente mais altos que os alunos do sexo feminino. Todavia, possivelmente não seriam encontradas diferenças significativas em função do fator nível de escolaridade. Dessa forma, a Anova permite a comparação simultânea de dados que são influenciados por diferentes fatores, em diferentes níveis. Observação Os testes de Anova devem ser aplicados em dados de distribuição normal, e as comparações podem ser do tipo Anova one‑way (um fator) ou Anova two‑way (dois fatores). Para que o teste de Anova possa ser adequadamente empregado, torna‑se necessário cumprir alguns pressupostos, tais como: • os dados devem apresentar distribuição normal; • as variações amostrais devem ser semelhantes nas diferentes amostras dos grupos; • o tamanho das amostras dos grupos necessita ser semelhante; • considerar o fato que quanto maior a amostra, mais confiáveis serão os resultados obtidos nesse tipo de teste. Vamos a um exemplo prático de aplicação do teste de Anova de um fator. Imagine que você desejaavaliar um grupo de indivíduos que foi submetido à prática de seis meses de treinamento de pilates. De acordo com os objetivos do seu estudo, você fará avaliação da flexibilidade desses praticantes na condição inicial (antes de começar o treinamento), após dois meses, quatro meses e seis meses. 106 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 Figura 66 – Imagem associada ao exemplo de aplicação do teste de Anova com objetivo avaliar um grupo de indivíduos submetido à prática de seis meses de treinamento de pilates. Será realizada avaliação da flexibilidade desses praticantes na condição inicial (antes de começar o treinamento), após dois meses, quatro meses e seis meses Nesse exemplo, nós temos apenas um fator (prática de uma modalidade) com quatro diferentes níveis de comparação (a cada dois meses). Para esse exemplo, são formuladas as seguintes hipóteses: H0 → A flexibilidade é semelhante ao longo do tempo de prática de treinamento de pilates. H1 → A flexibilidade é diferente ao longo do tempo de prática de treinamento de pilates. Assim, o teste de Anova nos permite verificar se todas as condições foram diferentes entre si ou se as diferenças podem ser observadas apenas entre algumas das condições testadas. Hipoteticamente, aplicando o teste de Anova no exemplo anterior, poderíamos encontrar diferença nos valores de flexibilidade entre a condição inicial e após seis meses de treinamento. Contudo, poderíamos verificar que entre as demais condições testadas não foram observadas diferenças significativas. Nesse caso, a hipótese alternativa (H1) foi confirmada, mas apenas uma diferença significativa foi verificada. 107 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA 8.2 Teste de Friedman O Teste de Friedman deve ser utilizado para comparar os resultados de três ou mais amostras, quando a normalidade de distribuição de dados não for confirmada. Podemos afirmar, então, que o teste de Friedman é uma alternativa não paramétrica correspondente à Anova. Esse teste ordena os resultados para cada um dos casos e depois calcula a média das ordens para cada amostra. Assim, se não existem diferenças entre as amostras, as suas médias das ordens devem ser similares. Vamos a um exemplo prático de aplicação do teste Friedman, pressupondo que a normalidade de distribuição dos dados tenha sido previamente rejeitada nessa condição. Figura 67 – Imagem associada ao exemplo de aplicação do Teste de Friedman com o objetivo de comparar a ativação de diferentes músculos do membro inferior durante dez passadas de corrida Imagine que um pesquisador deseje comparar a ativação de diferentes músculos do membro inferior durante dez passadas de corrida. A ativação dos diferentes músculos é apresentada na figura 68. A partir dessa situação, formulam‑se as seguintes hipóteses: H0 → A ativação dos diferentes músculos é semelhante durante a corrida. H1 → A ativação dos diferentes músculos é diferente durante a corrida. 108 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 RF VL BF IC VM TA Time GL Figura 68 – Ativação de diferentes músculos do membro inferior ao longo do tempo correspondente a dez passadas: Reto Femoral (RF); Ílio costal (IC); Vasto Lateral (VL); Vasto Medial (VM); Biceps Femoral (BF); Tibial Anterior (TA); Gastrocnêmio Lateral (GL). Novamente, temos a possibilidade de encontrar diferenças entre apenas dois músculos ou diferenças entre vários músculos simultaneamente. De qualquer forma, sempre que alguma diferença for verificada, afirma‑se que a hipótese alternativa (H1) foi confirmada. Lembrete O teste de Friedman é uma alternativa não paramétrica correspondente à Anova. Esse teste também permite comparar os resultados de três ou mais amostras simultaneamente. 8.3 Teste de Correlação Muitas vezes, gostaríamos de saber quanto uma variável depende de outra, por exemplo, quanto um céu nublado serve como indicador de chuva, quanto um piso molhado indica que ele está mais escorregadio ou quanto a circunferência do braço de uma pessoa serve como indicador de força. É para estabelecer essas relações que existe a ferramenta conhecida como correlação simples. 109 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA Figura 69 – Imagem da circunferência de braço utilizada como parâmetro de análise de medidas antropométricas; geralmente essa medida é correlacionada com a força A Correlação Simples investiga em que grau se relaciona duas variáveis, ques podem ou não estar associadas. Quando duas variáveis apresentam alguma relação entre si, isso significa que a variação nessa característica afeta outra característica do sujeito. Por exemplo, quanto mais avançada for a idade de uma pessoa, maior a tendência dessa pessoa em apresentar um percentual de gordura maior. Portanto, a correlação simples analisa a interferência de uma variável (dependente) sobre outra variável (independente). Poderíamos querer saber qual o efeito do tempo de fumo (variável independente) sobre a pressão arterial, a captação máxima de oxigênio ou o percentual de gordura (variável dependente). Vela notar que esta é apenas uma tendência de resposta, não significa necessariamente que uma pessoa de 40 anos terá sempre um percentual de gordura maior que uma pessoa de 20 anos. Observação Diagrama de dispersão é um gráfico no qual os escores de cada sujeito da amostra são plotados na relação entre as duas variáveis de análise. Observe a figura 70 para mais um exemplo. Esse gráfico se chama diagrama de dispersão. Neste, duas variáveis foram registradas de uma amostra: estatura e salto em distância sem corrida. Isso significa que cada ponto no gráfico representa os valores de estatura e se salto em distância dos indivíduos da amostra. Com esses dois valores em mãos, cria‑se um gráfico posicionando os pontos representantes de cada sujeito na posição correspondente aos valores coletados de estatura e distância de salto. É possível notar uma distribuição característica nos resultados dos dados que nos indica que pode haver uma correlação entre essas duas variáveis. 110 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 Nota‑se uma tendência de distâncias maiores de salto quanto maior a estatura dos sujeitos. Essa tendência de resposta não implica em certeza. Não se pode afirmar que uma pessoa, por ter a estatura de 1,80 m, saltará mais baixo que uma de 1,90 m, mas permite criar essa expectativa. 7'0" 6'3" 5'6" 4'9" 6'9" 6'0" 5'3" 4'6" 6'6" 5'9" 5'0" 4'3" 4'0" 5'0" 5'8"5'4" 6'0"5'2" 5'10"5'6" Estrutura Sa lto e m d ist ân ci a se m c or rid a 5'1" 5'9"5'5"5'3" 5'11"5'7" Figura 70 – Relação entre estatura e salto em distância sem corrida prévia A correlação pode ser quantificadapelo coeficiente de correlação de Pearson (r), que é uma medida quantitativa, um número, que expressa a relação entre as variáveis analisadas (independentes e dependentes). A relação entre duas variáveis, portanto, pode apresentar diferentes níveis de associação. O valor do coeficiente de correlação pode variar de 0,0 (zero) a 1,0 (um). Quanto maior o valor da correlação, maior o grau de dependência entre as variáveis. Dessa forma, quando o valor do coeficiente é 1,0, isso indica uma correlação perfeita, e o valor de coeficiente de correlação igual a 0,0 (zero) indica que não existe nenhuma correlação entre as variáveis. 111 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA Observação Coeficiente de correlação → número que expressa grau de relação entre duas ou mais variáveis. Por outro lado, quanto menor for o valor da correlação (r), significa que pode existir certa associação, mas que outras variáveis também interferem na associação. O valor da correlação ser tão baixo indica que ele se aproxima de zero, apontando que não há relação entre as duas variáveis, ou seja, o aumento ou a diminuição no valor da variável. Por exemplo, a cor dos olhos de uma pessoa não apresenta nenhuma relação com o percentual de gordura do sujeito. O coeficiente de correlação ainda pode apresentar valores positivos e negativos, o que significa que ele pode apresentar de ‑1,0 a 1,0. É possível que a associação seja inversa, ou seja, o aumento no valor de uma variável pode estar associado à diminuição no valor de outra variável. Nesse sentido, o valor da correlação também é alto, mas com valores negativos, aproximando‑se de ‑1,0. Em casos de valores de correlação próximos de 1,0, classifica‑se a correlação como positiva. Já em situações nas quais são próximos de ‑1,0, considera‑se que o aumento no valor de uma variável induz à diminuição no valor de outra variável. Portanto, os valores de correlação positiva e negativa indicam que a correlação pode ser positiva ou negativa. Observação Correlação positiva → valores maiores que zero e próximos de 1,0. Sem correlação → valores próximos de zero. Correlação negativa → valores menores que zero e próximos de ‑1,0. A correlação positiva existe quando duas variáveis, por exemplo, apresentam uma relação direta, ou seja, valores de correlação maiores em uma variável induzem a valores maiores na outra variável. Nessa condição, o valor da correlação é maior que 0,0 (zero) e menor ou igual a 1,0 (um). Um coeficiente de correlação com valor igual a 1,0 indica uma correlação positiva perfeita, ou seja, uma relação perfeita de dependência entre as variáveis de análise. Uma correlação perfeita é raramente observada, pois na natureza normalmente há muitas variáveis que interferem na relação entre duas variáveis. 112 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 Figura 71 – Prática de futebol, que é correlacionada no exemplo a seguir com a densidade mineral óssea Vejamos um exemplo extraído de um artigo numa situação real (figura 72). Karlsson et al. (2001) investigaram a densidade mineral óssea de várias regiões do corpo, dentre elas a densidade óssea do colo do fêmur. A densidade óssea indica a quantidade de cristais de cálcio, em gramas, por unidade de área de osso (cm2). A figura 72 ilustra a distribuição de dados da densidade óssea em função das horas de treino de jogadores de futebol por semana. Cada ponto representa os escores de cada um dos jogadores da amostra. O coeficiente de correlação entre essas duas variáveis é de r = 0,40. Observa‑se uma tendência de maior densidade óssea do colo do fêmur com a maior quantidade de horas de treino por semana, que pode ser notada nas duas retas apresentadas entre os dados e são usadas para predizer os resultados em situações que não foram medidas ou observadas e também indicam que a relação entre as variáveis muda em função da quantidade de horas de treino por semana. As retas observadas na figura 72 são obtidas por uma ferramenta estatística conhecida como regressão linear, que será discutida mais adiante. 1,0 1,2 1,4 1,6 Densidade óssea de colo do fêmur X nível de atividadeg/cm2 horas de treino / semana Figura 72 – Coeficiente de correlação entre a densidade óssea do colo do fêmur e as horas de treinamento por semana (r = 0,40). Em bolas pretas, praticantes de futebol com volume de treino inferior a 6 horas semanais; e, em bolas brancas, superior a 6 horas 113 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 BIOESTATÍSTICA Um coeficiente de correlação positiva, por exemplo, pode apresentar vários valores diversos entre 0,0 e 1,0. Não existe um único valor que possa ser considerado como suficientemente alto para que a correlação positiva seja considerada válida. Cada variável apresenta um valor diferente para que a correlação entre elas exista. Para saber a partir de qual valor de coeficiente de correlação a relação de dependência entre as variáveis é significativa, ou seja, pode ser considerada como existente entre as variáveis, usa‑se um critério estatístico de significância, indicada pela letra p. Essa análise envolve o uso de uma tabela que leva em consideração a quantidade de valores apresentados. A partir dessa tabela, é possível saber se o valor do coeficiente de correlação é suficiente para considerar que existe correlação ou não. Como já discutido, geralmente é usado um nível de significância de 0,05 ou 0,01. Nota‑se que quanto maior o número de dados (sujeitos), menor o valor de coeficiente de correlação que pode ser considerado significativo. Ou seja, com maior número de sujeitos há mais dados que permitem tecer correlações, e, assim, um valor menor de coeficiente pode ser considerado suficiente para afirmar que há correlação positiva ou negativa entre as variáveis. Observação Significância → indica quanto os resultados obtidos são confiáveis, até que ponto se podem esperar resultados semelhantes caso a análise seja refeita. Vejamos um exemplo simplificado de como a tabela 13 pode ser usada para determinar o coeficiente mínimo para que se tenha uma significância que permita afirmar que existe correlação entre duas variáveis. Para usar a tabela, sugerimos seguir os seguintes passos: 1. Escolher um nível de significância: os níveis de significância mais usados são de 0,05 ou 0,01. Ambos são aceitos, mas 0,01 atribui maior confiança à correlação. 2. Ler a tabela de acordo com os graus de liberdade (gl) dos seus dados: o grau de liberdade, para um coeficiente de correlação, é obtido a partir do número de sujeitos ou número de pares de escores (N), por exemplo. A fórmula para os graus de liberdade é: gl = N - 2 em que: gl: graus de liberdade N: número de sujeitos 114 Unidade II Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 Para o nosso exemplo, vamos supor a situação da análise da correlação entre a estatura e o comprimento de passada na corrida para uma determinada velocidade. Primeiro, gostaríamos de deixar claro que os valores aqui apresentados são fictícios e criados
Compartilhar