bioestatistica unid 2

•

UNIP

Dennys Souza

18/04/2018

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 64 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 64 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 64 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Educação Física

265.952 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

75
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
Unidade II
Na unidade II, abordaremos as formas para realizarmos diferentes tipos de análise de dados,
dependendo das características dos seus dados e do objetivo do seu estudo. Uma característica
importante do conjunto de dados que influencia a escolha do teste estatístico corresponde à análise da
distribuição dos dados, conforme veremos logo no início desta dos nossos estudos.
Obviamente, o objetivo do seu estudo depende da natureza da pergunta de pesquisa, conhecida
como problema de pesquisa. As possíveis respostas a essa pergunta darão origem às hipóteses do
estudo. A hipótese é o que você espera encontrar como resultado quando realizar um determinado
experimento. E, no intuito de avaliarmos se essas hipóteses se confirmarão ou não, é que utilizamos os
testes estatísticos.
Existem inúmeros testes estatísticos, mas a sua escolha deve ser pautada nas características e
objetivos do seu estudo; por exemplo, o número de comparações que se deseja realizar. Assim, torna‑se
possível determinar o teste estatístico mais adequado para cada situação de análise.
Por exemplo, o teste t para uma amostra é utilizado quando temos como objetivo comparar as
características de um único grupo com um valor de referência. Já quando desejamos comparar dois
grupos de dados, alguns testes são frequentemente aplicados, dependendo, é claro, de algumas condições
para que eles possam ser adequadamente empregados.
Nessa situação, os testes mais comuns são o teste t pareado e o teste t para amostras independentes.
Para comparações entre mais de dois conjuntos de dados, podemos utilizar o teste conhecido como
Anova ou o teste de Friedman, sendo que a escolha entre um e outro dependerá de alguns pressupostos
básicos que discutiremos mais adiante nesta unidade.
Se o objetivo do seu estudo for correlacionar uma variável com outra, ou seja, avaliar o comportamento
de uma variável em relação ao comportamento de outra, poderemos utilizar um teste de correlação.
No entanto, se o objetivo for avaliar o quanto que o comportamento de uma variável depende do
comportamento de outra, utilizaremos o teste de regressão linear. As aplicações desses diferentes tipos
de teste serão aqui discutidas; mostraremos, inclusive, exemplos práticos da área da Educação Física que
representam condições em que tais testes devem ser aplicados.
Obviamente, existe um número muito grande de diferentes tipos de teste, e não temos aqui a meta
de apresentar todas essas opções (até porque essa seria uma tarefa impossível). Nosso objetivo aqui é
simplesmente mostrar alguns testes mais recorrentes na nossa área de atuação, ilustrando possibilidades
de aplicação, que serão ou não indicadas nas situações que futuramente você poderá encontrar em um
trabalho de conclusão de curso.
76
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
5 ANÁLISE NA DISTRIBUIÇÃO DOS DADOS
Uma vez que nossas variáveis de análise foram adquiridas (coletadas), precisamos agora avaliar
como elas se distribuem em um gráfico. Elas poderão se distribuir de forma a confirmar normalidade ou
de rejeitar essa distribuição normal.
A avaliação da normalidade de distribuição dos dados torna‑se extremamente importante, pois é
um dos principais critérios a serem considerados para escolher qual teste estatístico utilizaremos para
estabelecer a comparação proposta em nosso estudo.
5.1 Distribuição normal
Muitas variáveis biológicas se distribuem de uma forma equilibrada, na qual os valores centrais são
mais frequentes e os valores extremos (máximos e mínimos) são mais raros no conjunto de dados. Isso
pode ser observado no exemplo na figura 41, que mostra uma série de diferentes curvas que tem como
característica comum concentrarem a maior parte dos seus valores no centro da curva.
Média
Figura 41 – Exemplos de curvas em que a maioria dos valores se posiciona no
centro, se distribuindo em torno da média
A curva normal é uma linha contínua com a forma aproximada de um sino, utilizada para avaliar
a normalidade de distribuição dos dados. Exatamente por esse motivo, essa forma é conhecida como
linha teórica, pois mostra o modo como os dados deveriam se distribuir para terem o pressuposto de
normalidade aceito.
Dessa forma, essa linha teórica é conhecida como curva de distribuição normal ou curva de Gauss,
a qual necessariamente apresentará menor incidência em valores baixos e altos, e maior frequência em
valores centrais.
77
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
A figura 42 mostra quatro exemplos de gráficos, sendo que em dois deles temos a maioria
dos valores se distribuindo em torno dos valores centrais, ou seja, essas curvas podem ser
consideradas como normais (curvas correspondentes às letras c e d). Já as curvas representadas
pelas letras a e b, mostram uma distribuição assimétrica: na letra a, a maioria dos valores estão
deslocados à esquerda, enquanto que na letra b, a maioria dos valores encontra‑se deslocada
à direita.
a
c
b
d
Figura 42 – Exemplos de gráficos com distribuição de dados assimétrica
(letras a e b) e com distribuição simétrica (letras c e d)
Assim, a curva normal é unimodal, ou seja, apresenta apenas um valor de pico, e simétrica
(idêntica em ambos os lados da média). Contudo, a curva normal pode apresentar diferentes curtoses,
como veremos na figura 43. A curtose pode ser definida como o achatamento de uma curva. Dessa
forma, uma curva normal pode apresentar diferentes níveis de curtoses, permitindo sua classificação
como platicúrtica, leptocúrtica e mesocúrtica. A curva platicúrtica é mais achatada, enquanto que a
curva leptocúrtica é mais alongada. Já a curva classificada como mesocúrtica, apresenta uma forma
mais tradicional, com um achatamento intermediário (entre os formatos das curvas platicúrticas e
mesocúrticas).
78
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
0Z ‑3 ‑2 ‑1 +1 +2 +3
Leptocúrtica
Mesocúrtica
Platicúrtica
Figura 43 – Representação de três curvas normais com diferentes curtoses
Observação
As curvas normais podem apresentar diferentes curtoses, podendo ser
classificadas como platicúrtica (mais achatada), leptocúrtica (mais longada)
e mesocúrtica (forma mais tradicional).
Já que nossa discussão está contextualizada na Bioestatística, torna‑se importante mencionar
que a distribuição normal não ocorre apenas em pessoas sadias. Esse conceito não possui nenhuma
relação com o fato ser saudável ou não, normal ou anormal, dentro de um quadro esperado de
desenvolvimento.
Os conceitos aqui discutidos referem‑se exclusivamente à forma como as variáveis são analisadas se
distribuem em gráfico. Exatamente por não apresentar nenhuma associação com os conceitos de saúde,
classificamos os dados por apresentarem uma distribuição normal ou não normal (note que não usamos
o termo anormal).
Dessa forma, a curva de distribuição normal se apresenta simétrica em torno da média. Se ela for
perfeitamente simétrica em torno da média, conforme osexemplos apresentados anteriormente na
figura 43, então poderemos afirmar que os valores referentes à média, mediana e moda coincidirão
(figura 44).
79
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
Média
Mediana
Moda
Figura 44 – Curva perfeitamente simétrica com os
valores de média, mediana e moda coincidindo
Nesse sentido, podemos afirmar que a média e os valores de desvio‑padrão são representativos de
dados de distribuição normal. Isso ocorre, pois a curva de distribuição normal apresenta dois pontos de
inflexão correspondentes à média somada e à média subtraída ao desvio‑padrão.
Observe a figura 45 que mostra uma curva com distribuição normal rigorosamente simétrica, na
qual a média está representada pela letra M e o desvio‑padrão pela letra s. Perceba que a área total sob a
curva totaliza 100%. Já a área entre os pontos de inflexão (M – s e M + s), representa aproximadamente
68%, ou seja, dois terços de todos os valores. A área que representa a média ± 2 vezes o desvio‑padrão
(M – 2s e M + 2s) corresponde a 95% dos valores. Por fim, essa curva engloba 99,73% dos valores no
intervalo entre a média ± 3 vezes o desvio‑padrão (M – 3s e M + 3s).
Com isso, quando os valores de desvio‑padrão são acrescentados aos valores da média, nós temos
a maioria dos dados representativos da sua variável de análise. Podemos afirmar que, seguindo esse
pressuposto de normalidade, o conjunto de dados pode ser adequadamente representado por meio dos
valores de média e desvio‑padrão.
A
68%
95%
Escores de variáveis de interesse
Fr
eq
uê
nc
ia
d
e
um
e
sc
or
e
‑3s ‑2s ‑1s M +1s +2s +3s
C B
ponto de inflexão ponto de inflexão
Figura 45 – Curva que ilustra uma distribuição normal na prática
80
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
Exemplo de aplicação
A figura 46 a seguir mostra quatro exemplos de curvas com diferentes formas de distribuição dos
dados. Procure determinar quais são os exemplos de curvas que podem ser consideradas normais. Aponte
quais são as implicações dessa determinação.
A
C D
B
Figura 46 – Exemplos de curvas representativas de diferentes conjuntos de dados
5.2 Testes de normalidade
É válido lembrar que a curva de distribuição normal é uma curva teórica, a partir da qual
faremos uma tentativa de encaixar as curvas obtidas a partir de dados reais que serão parecidos
ou não com essa curva normal. Dificilmente os dados apresentarão uma distribuição normal
perfeita. Por isso, determina‑se a normalidade de distribuição dos dados por meio de testes
de normalidade.
Quando nossos dados se aproximarem dessa distribuição, poderemos confirmar que os pressupostos
de normalidade foram aceitos e, portanto, testes chamados de paramétricos poderão ser utilizados
posteriormente para comparação das variáveis. Testes estatísticos paramétricos são geralmente
preferíveis, pois apresentam maior poder estatístico.
Contudo, existem inúmeras variáveis de distribuição assimétrica ou descontínua que não apresentam
curva normal de distribuição dos dados. Nessas condições, em que a distribuição dos dados é considerada
não normal, deveremos optar por testes chamados de não paramétricos para realizar a comparação das
variáveis.
A figura 47 mostra um conjunto de dados que não apresenta normalidade de distribuição, uma vez
que o formato do histograma obtido a partir desse conjunto de dados não se assemelha à curva normal,
representada pela linha no gráfico.
81
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
Fr
eq
uê
nc
ia
Idade
16,9 25,6 34,4 43,1 51,9 60,6 69,4 78,1
Histograma
Curva normal sobreposta
ao histograma indicado a
distribuição que os dados
deveriam apresentar para
atender aos pressupostos
de normalidade.
Std. Dev = 18,87
Mean = 32,1
N = 79,00
50
30
10
40
20
0
Figura 47 – Gráfico do tipo histograma sendo comparado á curva normal
Os testes para avaliação da normalidade de distribuição de dados são realizados a partir das medidas
de assimetrias e curtoses (achatamentos) das curvas compostas pelo nosso conjunto de dados.
Lembrete
A avaliação da normalidade de distribuição dos dados é fundamental,
pois estabelece os critérios a serem considerados para escolher qual teste
estatístico utilizaremos na comparação proposta em nosso estudo.
Existem diversos pacotes estatísticos que utilizam diferentes procedimentos para essa avaliação da
normalidade. Os testes mais comuns são:
• Teste de Shapiro‑Wilk: utilizado quando temos um conjunto de dados composto por até 50 observações.
• Teste de Kolmogorov Smirnov: utilizado nas demais situações, ou seja, quando temos um conjunto
de dados composto por mais de 50 observações.
Lembrete
Os testes mais comuns utilizados para a avaliação da normalidade são:
Teste de Shapiro‑Wilk e Teste de Kolmogorov‑Smirnov.
82
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
Podemos entender como número de observações o número de variáveis que gostaríamos de comparar
em um determinado estudo. Para ficar mais claro, vamos a dois exemplos práticos.
Imagine que você deseja comparar a altura alcançada em 30 saltos realizados antes e após um
período de treinamento. Como o número de observações é igual a 30, nesse caso, usaríamos o Teste de
Shapiro‑Wilk para avaliar a distribuição dos dados.
Agora, imagine outro exemplo em que você pretende comparar o desempenho de sessenta homens
com o desempenho de sessenta mulheres em um teste de flexibilidade. Nesse caso, como temos sessenta
observações para cada grupo avaliado, devemos utilizar o Teste de Kolmogorov‑Smirnov para avaliar a
distribuição dos dados.
Independente do teste a ser empregado, devemos utilizar um ponto referencial para avaliar se há
ou não normalidade. Esse referencial é conhecido como nível de significância, o qual é geralmente
representado pela letra p.
Na área da Educação Física, o nível de significância que é mais frequentemente adotado é de 5%.
Isso significa que o valor de p será de 0,05, ou seja, p=0,05.
Dessa forma, se realizarmos um teste de normalidade e encontrarmos um nível de significância
inferior ao estabelecido (por exemplo, p<0,05), a condição de normalidade será rejeitada. Nessa
situação, poderemos afirmar que o conjunto de dados avaliados não apresenta uma distribuição normal
e, portanto, um teste não paramétrico deverá ser empregado para comparar os grupos. Ao contrário,
se encontrarmos um nível de significância superior ao estabelecido (por exemplo, p>0,05), a condição
de normalidade será confirmada. Com isso, poderemos afirmar que o conjunto de dados avaliados
mostra uma distribuição normal, o que possibilita a utilização de um teste paramétrico para comparar
os grupos.
Observação
Ao aplicarmos testes de normalidade, se encontrarmos um nível de
significância superior ao estabelecido (por exemplo, p>0,05), a condição de
normalidade será confirmada.
Saiba mais
Consulte o capítulo 6 do livro Análise de Dados em Atividade Física, deBarros e Reis (2003), para ter mais informações sobre a avaliação da curva
normal e os diferentes tipos de testes utilizados para avaliar a normalidade
de distribuição de dados.
83
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
6 FORMULAÇÃO DE HIPÓTESES
Quando realizamos um estudo, estamos investigando um problema. O problema de
pesquisa é o contexto que estamos analisando; nesse sentido, é fundamental enxergarmos as
variáveis de análise no nosso estudo, em particular as variáveis dependentes e independentes.
Portanto, estamos interessados no efeito que a variável independente pode ter sobre a variável
dependente.
Conforme visto anteriormente, a variável independente é a que estamos manipulando, enquanto
que a variável dependente é o efeito da variável independente; é a variável que sofrerá a interferência da
variável independente. Se pensarmos numa proposta de causa e efeito, a causa é a variável independente
e o efeito é a variável dependente.
Vejamos alguns exemplos:
Figura 48 – Imagem exemplificando situação de hidratação relacionado ao
problema de pesquisa intitulado Investigar a interferência da hidratação
sobre o rendimento no teste de 12 minutos
• Problema de pesquisa: Investigar a interferência da hidratação sobre o rendimento no teste de 12
minutos.
Variável independente: hidratação.
Variável dependente: resultado no teste de 12 minutos.
84
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
Figura 49 – Imagem exemplificando situação de corrida, relacionada ao
problema de pesquisa intitulado Investigar como o tempo de uso afeta a
capacidade de absorção de impacto do calçado
• Problema de pesquisa: investigar como o tempo de uso afeta a capacidade de absorção de impacto
do calçado.
Variável independente: tempo de uso do calçado.
Variável dependente: absorção de impacto.
Figura 50 – Imagem exemplificando situação de salto vertical,
relacionado ao problema de pesquisa intitulado Investigar como o
aumento de força de quadríceps afeta a capacidade de salto vertical
85
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
• Problema de pesquisa: investigar como o aumento de força de quadríceps afeta a capacidade de
salto vertical.
Variável independente: força de quadríceps.
Variável dependente: altura de salto.
Figura 51 – Imagem exemplificando situação de alongamento,
relacionado ao problema de pesquisa intitulado Investigar qual
alongamento traz maiores ganhos em flexibilidade
• Problema de pesquisa: investigar qual alongamento traz maiores ganhos em flexibilidade.
Variável independente: tipos de alongamentos.
Variável dependente: ganho de flexibilidade.
Figura 52 – Imagem exemplificando situação de prática
de exercício, relacionado ao problema de pesquisa
• Problema de pesquisa: investigar índices de sedentarismo em função dos diferentes níveis de
escolaridade em adultos.
86
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
Variável independente: nível de escolaridade em adultos.
Variável dependente: índices de sedentarismo.
Uma vez que o problema de pesquisa foi delimitado e as variáveis independente e dependente foram
identificadas, precisamos formular as hipóteses. A hipótese é o resultado que esperamos obter pela
nossa investigação. Geralmente, ao levantar o problema, já imaginamos o que teremos como resultado.
A partir dessa ideia, teremos que formular duas hipóteses, no mínimo: hipótese de pesquisa (H1) e a
hipótese nula (H0). A hipótese de pesquisa ou hipótese alternativa é o resultado esperado pelo pesquisador;
geralmente surge da experiência, da dedução lógica ou de resultados de outras investigações. Já a hipótese
nula, serve para avaliar a confiabilidade dos resultados; segundo ela, não há diferença entre os resultados,
ou seja, não há relação entre as variáveis independente e dependente. Vejamos como as hipóteses poderiam
ser formuladas nos exemplos apresentados anteriormente:
• Problema de pesquisa: investigar a interferência da hidratação sobre o rendimento no teste de 12
minutos.
H1: a hidratação afeta o resultado no teste de 12 minutos.
H0: a hidratação não afeta o resultado no teste de 12 minutos.
• Problema de pesquisa: investigar como o tempo de uso afeta a capacidade de absorção de impacto
do calçado.
H1: o tempo de uso afeta a capacidade de absorção de impacto do calçado.
H0: o tempo de uso não afeta a capacidade de absorção de impacto do calçado.
• Problema de pesquisa: investigar como o aumento de força de quadríceps afeta a capacidade de
salto vertical.
H1: a força do quadríceps afeta a altura de salto vertical.
H0: a força do quadríceps não afeta a altura de salto vertical.
• Problema de pesquisa: investigar qual alongamento traz maiores ganhos em flexibilidade.
H1: os diferentes tipos de alongamentos trazem ganhos distintos na flexibilidade.
H0: os diferentes tipos de alongamentos trazem ganhos semelhantes na flexibilidade.
• Problema de pesquisa: investigar índices de sedentarismo em função dos diferentes níveis de
escolaridade em adultos.
87
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
H1: o nível de escolaridade afeta os índices de sedentarismo.
H0: o nível de escolaridade não afeta os índices de sedentarismo.
Figura 53 – Imagem exemplificando situação de prática de exercício,
relacionado ao problema de pesquisa intitulado Investigar índices de
sedentarismo em função dos diferentes níveis de escolaridade em adultos
Exemplo de aplicação
Agora que já vimos diversos exemplos aplicados à nossa área de atuação, procure formular um
novo problema de pesquisa relacionado à Educação Física, que ainda não tenha sido comentado nesse
material. Depois, procure desenvolver também a hipótese alternativa para esse problema.
Uma vez formuladas essas hipóteses, devemos proceder ao teste para verificar os resultados que
teremos. Esse processo é conhecido como teste de hipótese ou teste de significância. O teste de hipóteses
envolve os seguintes passos:
• delimitar o problema de pesquisa;
• definir as hipóteses nula e alternativa;
• coletar dados em uma amostra da população;
• uso de ferramentas estatísticas para testar a hipótese;
• comparação dos resultados com a literatura.
Uma vez que a hipótese alternativa ou de pesquisa (H1) é uma alternativa para a hipótese nula (H0),
o que buscamos são evidências para rejeitar H0, ou seja, provas de que ela não seja verdadeira. Se H0 não
é verdadeira, H1 passa a ser a resposta aceita.
88
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
Em situações nas quais não se sabe para qualdireção os resultados tenderão, teremos que usar
um teste estatístico bicaudal. Quando já imaginamos para qual lado os resultados poderão tender,
podemos usar um teste unicaudal. Vejamos um exemplo com base numa das situações apresentadas
anteriormente.
• Problema de pesquisa: investigar como o tempo de uso afeta a capacidade de absorção de impacto
do calçado.
H1: o tempo de uso afeta a capacidade de absorção de impacto do calçado.
H0: o tempo de uso não afeta a capacidade de absorção de impacto do calçado.
Nessa situação, a hipótese alternativa indica que a absorção de impacto será afetada pelo tempo
de uso do calçado, mas não sabemos se para mais ou para menos, ou seja, pode ser que a absorção de
impacto melhore ou piore. Por não saber para qual lado os resultados tenderão, deveremos usar um
teste bicaudal. Por outro lado, se imaginarmos que a absorção de impacto não possa melhorar, apenas
piorar, estamos imaginando para qual lado os resultados tenderão; assim, ou a absorção de impacto
piorará (H1) ou não será afetada (H0). Nesse caso, um teste unicaudal deverá ser usado.
Os testes estatísticos vão identificar e comparar os dados coletados com dados conhecidos
de uma população ou comparar dados coletados em duas condições distintas. Por exemplo,
altura de salto antes de treinamento de força em quadríceps e depois de treinamento de força
em quadríceps, quilometragem percorrida no teste de 12 minutos com hidratação prévia e sem
hidratação prévia, ganho em flexibilidade após 8 sessões de alongamento estático e após 8
sessões de alongamento dinâmico.
A comparação que será realizada permite identificar o valor de p, que varia de 0,0 a 1,0. O p representa
a probabilidade dos resultados encontrados na amostra, para as duas condições, serem idênticos. O que
se procura é aceitar ou rejeitar H0, ou seja, é evidência para afirmar que os resultados das duas condições,
por exemplo, são idênticos ou diferentes. Isso será feito pela determinação de um valor de corte para p,
que também é conhecido como nível de significância.
Geralmente, o valor crítico de p fica entre 5% (0,05) e 1% (0,01). Na comparação entre as duas
distribuições de dados, quanto menor for o valor de p, maior a evidência para rejeitar a hipótese nula,
ou seja, de que os dois conjuntos de dados são diferentes. O valor de p corresponde à probabilidade
dos dois conjuntos de dados serem iguais; portanto, o p de 0,05 significa que há 5% de chance das
distribuições dos dados nas duas condições serem iguais, ou seja, eles são diferentes. Com isso, se
rejeita H0 e aceita H1.
Observação
Quanto mais forte tiver que ser a evidência, menor terá que ser o valor
de p, por exemplo, 0,01.
89
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
Como vimos, as formulações das hipóteses alternativas (hipóteses do pesquisador) são geralmente
provenientes de resultados de outras investigações. Entretanto, torna‑se fundamental que sejam utilizadas
fontes científicas de qualidade, e, por isso, no tópico que segue abordaremos as formas de buscar tais referências.
As fontes bibliográficas podem ser classificadas como primárias ou secundárias. Fontes primárias
correspondem aos artigos científicos experimentais, ou seja, as conclusões apresentadas nesses textos são
oriundas de algum trabalho realizado por pesquisadores, envolvendo um desenho experimental definido.
Já as fontes secundárias, são os artigos de revisão e os livros. Esses materiais têm como objetivo
sistematizar informações divulgadas principalmente por meio de outras fontes primárias. Dessa forma,
o grande objetivo desse tipo de fonte não é produzir uma informação nova, mas sistematizar e organizar
conteúdos para que as informações já divulgadas possam ser mais bem organizadas e entendidas.
Nesse sentido, ao realizarmos uma pesquisa bibliográfica em que o objetivo primordial é formular
as hipóteses do nosso estudo, devemos sempre preferir as fontes primárias, pois elas permitem uma
leitura do texto diretamente a partir da escrita dos autores do trabalho original. Já as fontes secundárias,
promoverão uma releitura dessas informações contidas no texto original, servindo mais especificamente
para promover uma ideia geral sobre o tema abordado.
6.1 Estratégias de busca de artigos científicos
Nos dias de hoje, a informação e o conhecimento são facilmente obtidos por meio da internet.
No entanto, justamente devido à facilidade em acessar e em postar informação e conhecimento é
que o maior desafio torna‑se a adequada seleção desse conhecimento. A escolha do conhecimento de
qualidade é o grande segredo da atualidade.
Hoje em dia, qualquer pessoa é capaz de criar um site, mesmo que não domine o assunto discutido.
Esse é justamente o problema: não há nenhuma classificação na informação apresentada e, às vezes,
sites bem elaborados podem conter conteúdos altamente questionáveis.
Figura 54 – Trabalhos atraentes podem ser desenvolvidos;
entretanto com conteúdo questionável
90
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
Por exemplo, pense num conteúdo que não seja de seu domínio: pintar, cozinhar, tecer ou qualquer
outro. Com criatividade, um site interessante e atraente pode ser criado e atrairá muitos visitantes que
usarão o seu conteúdo. Infelizmente, os visitantes do site não fazem ideia que o seu conhecimento
sobre o assunto possa ser limitado. Lembre‑se de que, nesse exemplo, um conteúdo que não é do seu
domínio foi escolhido. Por ser atraente e bem estruturado, muitos irão adotar os ensinamentos do site e
passá‑los adiante. Perceba como isso pode ser perigoso quando se trata da saúde de uma pessoa.
É necessário desenvolver um olhar crítico a tudo que nos é apresentado, independente de quão
lógico a informação ou o conhecimento possa parecer. A internet é uma fonte vasta de conhecimento e
informação e que se encontra ao alcance de todos. Infelizmente, junto aos sites, não aparece nenhuma
indicação da confiabilidade das informações transmitidas. Por isso, cabe a nós aprender a selecionar o
conhecimento mais confiável. Para tanto, é importante saber as origens dos conteúdos apresentados.
Atualmente, não é difícil montar um site atraente que convide o acesso de todos, basta um projetista
competente e uma “pitada” de criatividade. Entretanto, nem sempre conhecemos a pessoa que desenvolveu
o conteúdo postado; em muitos casos, aparece um breve currículo do autor do conteúdo. Mesmo assim,
ainda é possível que a pessoa tenha criado o conteúdo em grande parte usando conhecimento empírico,
ao invés de conhecimento científico.
O conhecimento empírico é obtido por um método, no qual dados são coletados com base na
experiência. Não desmerecendo a experiência, vale lembrar que esta apresenta certas limitações. Por
exemplo, o conhecimento pautado na experiência depende das vivências de uma pessoa e às vezes elas
induzem a interpretações incorretas e a conclusões que eventualmente são válidas apenas em certas
circunstancias.
Contudo, o maior problema está na baixa capacidade de extrapolar a experiência a outras condições,
pois a adquirimos sem controle das variáveis que poderiam interferir nos resultados e assim induzir a
interpretações incorretas.
Figura 55 – Momento decisivo de uma partida de futebol; momento do chute a gol
Por exemplo, muitas vezes buscamos explicações para fracassos, como em uma cobrança de pênalti
perdida durante uma partida de futebol. O número de variáveis que podem ter influenciadoa perda do
91
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
pênalti são inúmeros. No entanto, cada torcedor terá uma opinião e uma justificativa para o insucesso,
sendo que cada um acredita ser sua a razão verdadeira do fracasso. É importante perceber que nessa
situação, cada justificativa é meramente uma especulação e que pode não ser o real motivo da perda
do pênalti. Gostaríamos de deixar claro que não é um desmerecimento à experiência, mas certo cuidado
deve ser dado à importância que se destina a ela.
Por outro lado, o conhecimento científico é uma forma mais estruturada de adquirir conhecimento
e que envolve objetividade e controle das variáveis para a solução de um problema específico. Vale
lembrar que ele também apresenta limitações, porém permite uma segurança maior na interpretação
dos resultados pesquisa e uma garantia maior de que, em qualquer outra região do mundo, se alguém
refizer o estudo nas mesmas circunstâncias, a chance é razoável em obter um resultado semelhante.
Por conta dessa característica do estudo científico, é que o mais seguro é buscar conhecimento em
revistas e fontes científicas. É claro que mesmo que os editores das revistas científicas submetam os
artigos a revisores competentes, é possível que resultados questionáveis sejam observados. Entretanto,
a segurança na informação é maior.
São muitos os locais nos quais é possível se obter conhecimento científico. No quadro a seguir, há
uma lista dos principais sites de busca de artigos científicos, onde se encontram materiais direcionados
à área da Educação Física.
Quadro 1 – Principais bases de dados nas quais é possível
encontrar artigos científicos em revistas indexadas
Bases de dados (referências e resumos):
Pubmed
www.pubmed.com
• Indexa revistas significativas na área da saúde.
• Indexa principalmente revistas americanas, pois é pago com dinheiro público.
• Principal site de busca usado.
• Principalmente resumos.
• Oferece links para as revistas eletrônicas para obter artigos completos (muitos pagos).
Bireme
www.bireme.br
• Banco de dados Latino‑Americano.
• Acesso à informação científica e técnica em saúde (BVS – Biblioteca Virtual em Saúde).
• Indexa diversos bancos de dados virtuais.
• LILACS (Literatura Latino‑Americana e do Caribe de Informação em Ciências da Saúde).
Dedalus
www.dedalus.usp.br
• Indexa toda a produção científica da USP.
• Entrar: interface portal USP.
Scielo
www.scielo.br
• Scientific Eletronic Library On‑line.
• Indexa 114 revistas brasileiras.
• Textos completos.
• Maior parte da área biológica.
• Suportada inicialmente pela Fapesp e, a partir de 2002, também pela Capes.
92
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
Periódicos
www.periodicos.capes.gov.br
• Base com textos completos.
• Banco de dados de teses e dissertações.
• Diversas revistas especificamente na área de EF.
Elsevier
http://www.elsevier.com
• Oferece informação técnico‑científica sobre saúde.
• Indexa diversas revistas ao redor do mundo.
• Indexa 75% da produção Europeia.
• Interligada com PubMed.
• Principais áreas: Ciências da saúde, físicas e sociais.
Google
http://scholar.google.com.br
• Não é especificamente científica.
• Localiza revistas virtuais na internet, caso o link não esteja acessível em outros bancos de
dados.
• Nem sempre o artigo completo é acessível.
• Busca por institutos de pesquisa; linhas de pesquisa; pesquisadores; publicações sobre o
assunto.
Teses e dissertações USP
www.usp.br
• Banco de dados da produção acadêmica da USP.
• Textos completos em pdf.
• Acesso em Biblioteca.
Site de busca USP
www.usp.br/sibi
• Sistema Integrado de Bibliotecas da USP.
• Busca por revistas eletrônicas.
• A partir de pontos de internet ou computadores da USP, muitos artigos podem ser obtidos
em versão completa.
É importante lembrar que há outras formas de busca e de conseguir artigos científicos, dissertações
e teses, diferentes das apresentadas anteriormente. Entretanto, o objetivo do presente texto não é
determinar o caminho correto, e sim mostrar possibilidades para que o profissional ou aluno comece
a se familiarizar com a leitura de artigos científicos. Nessa mesma perspectiva, observe, a seguir, um
roteiro para levantamento bibliográfico sobre um assunto qualquer:
Levantando referências bibliográficas
1. Pensar no assunto de interesse.
2. Pensar em palavras‑chaves. Ser criativo e persistente.
3. Busca inicial por referências em livros‑textos e nos sites de busca.
4. Montar lista relevante de artigos.
5. Tentar conseguir artigos completos.
6. Leitura inicial do artigo para fazer fichamento.
7. Usar referências bibliográficas dos artigos para conseguir mais artigos.
93
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
As revistas científicas apresentam uma classificação segundo alguns critérios predefinidos. A
classificação se dá em função do Qualis da Coordenação de Aperfeiçoamento de Pessoal de Nível
Superior (Capes) e do fator de impacto. O Qualis é uma avaliação feita pela Capes e tem o objetivo de
classificar revistas impressas e virtuais segundo a sua abrangência de sua circulação (local, nacional ou
internacional) e segundo a qualidade (A, B, C), nas diferentes áreas de conhecimento.
Os critérios para a classificação são: números de exemplares da revista lançados ou publicados por
ano, número de banco de dados nos quais a revista se encontra indexada e número de instituições que
publicam na revista para evitar que ela seja mantida por uma única instituição.
Segundo o Qualis, as revistas podem ser classificadas como de nível A1 ou A2, que são os níveis mais
altos e internacionais, níveis B1, B2, B3, B4 e B5, que englobam níveis altos e baixos de classificação e
o nível C.
Quanto mais alto for o nível, mais bem conceituada e procurada ela é para publicação pelos
pesquisadores de todo o mundo. Por outro lado, não criteriosa ela é com relação aos métodos empregados
no estudo e com a relevância do tema; por isso, mais dificil é publicar nessas revistas.
O fator de impacto é outra forma de classificar as revistas que veiculam artigos científicos. É
um indicador de quantas vezes um artigo científico publicado em um periódico foi citado. Esse
fator reflete quanto os artigos de uma determinada revista foram lidos e seus conteúdos citados
em outros artigos.
Nesse sentido, quanto maior for o fator de impacto de uma revista, maior o prestígio desla, pois
mais pessoas a leem e a citam. Essa forma de classificação é calculada pela relação de citações por
artigos publicados em um período; reflete a relação de citações e publicações dos dois anos anteriores
ao atual.
Para entender melhor, vamos supor o fator de impacto de uma revista em 2010; equivale ao número
de vezes em que os artigos desse periódico foram citados entre os anos 2008 e 2009. Exemplo: cinquenta
artigos foram citados cem vezes, dividido pelo número total de publicações de todos os artigos de todas
as revistas entre os anos 2008 e 2009. Portanto, o fator de impacto da revista será 100 dividido por 50,
ou seja, 100/50 = 2, sendo que este será divulgado em 2011.
Essas duas formas de classificações são tentativasde categorizar a importância que as revistas
apresentam em suas áreas de atuação. Ambas apresentam falhas, mas, mesmo assim, elas ainda servem
como um indicador. Vale lembrar que muitos artigos de excelência podem ser encontrados em revistas
de fator de impacto e Qualis baixos.
Por isso, o ideal é realmente ler os artigos encontrados e, de forma crítica, analisar o seu conteúdo.
Este, mesmo que apresente falhas metodológicas, traz contribuições importantes. Como no exemplo,
devemos ter ciência de que o artigo tem limitações e os resultados podem não ser completamente
confiáveis.
94
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
7 TESTES ESTATÍSTICOS: TESTE T
Os testes estatísticos podem ser definidos como procedimentos que, com algum nível de precisão,
possibilitam avaliar se as hipóteses estatísticas podem ou não ser consideradas como verdadeiras.
Como já mencionamos anteriormente, existem inúmeros tipos de testes estatísticos que são
utilizados com diferentes finalidades e a partir de condições distintas de aplicação (por exemplo, a partir
da condição de normalidade comprovada ou não).
Nesse sentido, esses tipos distintos de testes estatísticos permitem a comparação entre as proporções
e as distribuições das observações. Entre outras possíveis formas de aplicação, destacamos aqui as
seguintes situações:
• comparação de um conjunto de dados a uma categoria de referência;
• comparação entre dois conjuntos de dados de um único grupo;
• comparação entre proporções de mais de dois grupos de dados;
• comparação entre as proporções de dois grupos de dados.
Embora exista um número muito grande de testes estatísticos disponíveis, vamos começar a discutir
aqueles que julgamos mais comuns na área da Educação Física.
7.1 Teste t para uma amostra
O Teste t para uma amostra é empregado em situações em que características de um único grupo
precisam ser comparadas com um valor de referência. Dessa forma, podemos afirmar que esse teste foi
desenvolvido para comparar duas médias em um experimento.
Entretanto, para que esse teste possa ser adequadamente utilizado, torna‑se fundamental que sejam
atendidos os critérios de normalidade de distribuição de dados. Dito de outra forma, o conjunto de
dados a ser comparado deve ter antecipadamente sua normalidade confirmada por meio dos testes já
descritos no tópico 1.2 desta Unidade.
Caso o conjunto de dados a ser testado não apresente normalidade de distribuição de dados, a opção
não paramétrica para o teste de uma amostra corresponde ao Teste dos Sinais.
Lembrete
O Teste t para uma amostra é empregado em situações em que
características de um único grupo precisam ser comparadas com um valor
de referência.
95
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
Vamos a três exemplos de situações em que o Teste t para uma amostra deve ser empregado para
realizar as comparações almejadas.
Figura 56 – Ambiente em que testes de resistência aeróbia
(testes de corrida) podem ser realizados, como relatado no exemplo 1 a seguir.
Exemplo 1
Comparação entre a média de desempenho dos alunos do curso de Graduação em Educação Física
no teste de resistência aeróbia, conhecido como Teste de 12 minutos, em relação ao desempenho médio
nesse teste esperado para a faixa etária dessa população.
Para esse exemplo, temos a formulação das seguintes hipóteses:
H0 → a média dos resultados no teste de resistência aeróbia para o grupo alunos do curso de
graduação em Educação Física é semelhante à média do grupo referencial estipulado.
H1 → a média dos resultados no teste de resistência aeróbia para o grupo alunos do curso de
graduação em Educação Física é diferente da média do grupo referencial estipulado.
Figura 57 – Display de uma esteira motorizada. Outro exemplo de ambiente em que
testes de resistência aeróbia (testes de corrida) podem ser realizados, como relatado no exemplo 1 a seguir
96
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
Exemplo 2
Comparação entre a média nacional de desempenho dos alunos de graduação do curso de Educação
Física, com a média do desempenho dos alunos de Educação Física da Universidade Paulista (UNIP), que
estejam cursando o último ano.
Para esse exemplo, temos a formulação das seguintes hipóteses:
H0 → A média do desempenho dos alunos de Educação Física da Universidade Paulista
(UNIP) é semelhante à média nacional de desempenho dos alunos de graduação do curso de
Educação Física.
H1 → A média do desempenho dos alunos de Educação Física da Universidade Paulista
(UNIP) é diferente da média nacional de desempenho dos alunos de graduação do curso de
Educação Física.
Considere, hipoteticamente, que você já tenha realizado a coleta dos seus dados e que os seguintes
valores foram obtidos:
• média dos alunos da UNIP (± desvio‑padrão): 9,63 ± 0,7;
• média nacional (± desvio‑padrão): 6,20 ± 0,9.
Nesse caso, a hipótese alternativa (H1) foi confirmada, pois, após aplicação do Teste t para
uma amostra, foi verificada diferença entre a média dos alunos da UNIP e a média nacional.
Foi possível observar que a média do desempenho dos alunos de Educação Física da UNIP foi
estatisticamente superior à média nacional de desempenho dos alunos de graduação do curso
de Educação Física.
Figura 58 – Prova de corrida, conforme exemplo 3, intitulado Comparação
entre a média do desempenho dos atletas do seu grupo de corrida com
a média dos participantes na prova de 10 km na qual eles pretendem concorrer
97
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
Exemplo 3
Comparação entre a média do desempenho dos atletas do seu grupo de corrida com a média dos
participantes na prova de 10 km na qual eles pretendem concorrer.
Para esse exemplo, temos a formulação das seguintes hipóteses:
H0 → A média do desempenho dos atletas do seu grupo de corrida mostra‑se semelhante à média
dos participantes na prova de 10 km na qual eles pretendem concorrer.
H1 → A média do desempenho dos atletas do seu grupo de corrida mostra‑se diferente da média dos
participantes na prova de 10 km na qual eles pretendem concorrer.
Novamente, imagine que você já tenha realizado a coleta dos seus dados e que os seguintes valores
foram obtidos:
• média do desempenho dos atletas do seu grupo de corrida na prova de 10 km (± desvio‑padrão):
41,3 ± 1,4 min;
• média dos participantes na prova de 10 km: 41,5 ± 4,6 min.
Nesse caso, a hipótese nula (H0) foi confirmada, pois, após aplicação do Teste t para uma amostra,
não foi verificada diferença significativa entre a média do desempenho dos atletas do seu grupo de
corrida quando comparado com a média dos participantes na referida prova de 10 km. Foi possível
observar que as médias do desempenho dos dois grupos comparados foram muito semelhantes entre si.
Dessa forma, o teste estatístico permitiu refutar a hipótese H1.
Observação
O Teste t só deve ser utilizado para uma amostra quando o conjunto de
dados apresenta distribuição normal. A opção não paramétrica corresponde
aoTeste dos Sinais.
7.2 Teste t pareado
O Teste t pareado é utilizado em situações nas quais um mesmo grupo é avaliado em
duas condições distintas, sendo que o objetivo é comparar essas duas médias entre si. Esse é
um dos testes mais utilizados em Educação Física, pois frequentemente temos como objetivo
avaliar o efeito de uma determinada forma de intervenção; por exemplo, uma determinada
modalidade de treinamento. Dessa forma, usando o Teste t pareado conseguimos afirmar se
uma variável (por exemplo, a força ou a flexibilidade) altera depois de um período ou uma
sessão de treinamento.
98
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
Figura 59 – Sessão de treinamento de força, que pode ser
utilizado como forma de intervenção em nossa área de atuação
Esse tipo de teste também necessita atender aos critérios de normalidade de distribuição para
que possa ser aplicado. Assim, apenas dados paramétricos, ou seja, que tiveram sua normalidade de
distribuição de dados confirmada, podem ser comparados usando o Teste t pareado. Para situações em
que a normalidade for refutada, deve‑se utilizar uma das seguintes opções não paramétricas: Teste de
Wilcoxon e Teste dos Sinais.
Outra condição fundamental para a aplicação do Teste t pareado é que a amostra dos dados nas
duas condições a serem comparadas (antes e depois) deve ter o mesmo tamanho. Caso contrário, a
relação de dependência ou pareamento será perdida.
Exemplificando, se na condição pré‑treinamento foi avaliada a força de dez indivíduos, na condição
pós‑treinamento a força dessas mesmas dez pessoas deverá ser avaliada novamente, para que se
estabeleça corretamente uma relação causa‑efeito. Com isso, conseguiríamos afirmar, por exemplo, que
o treinamento (causa) gera um aumento de força (efeito).
Lembrete
O Teste t pareado é utilizado nas situações em que um mesmo grupo é
avaliado em duas condições distintas; por exemplo, condição pré e pós um
treinamento.
Para ficar mais claro, vamos a dois exemplos de aplicação do Teste t pareado na área específica da
Educação Física:
99
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
Figura 60 – Trabalhadores que podem ser acometidos por
dor lombar em função do seu tipo de atividade laboral
Exemplo 1
Comparação da dor lombar para um grupo de trabalhadores que foi submetido a um período de
ginástica laboral entre as condições pré e pós‑treinamento.
Para esse exemplo, formulamos as seguintes hipóteses:
H0 → A dor lombar, para o grupo de trabalhadores avaliados, mostra‑se semelhante antes e após um
período de ginástica laboral.
H1 → A dor lombar, para o grupo de trabalhadores avaliados, mostra‑se diferente entre as condições
pré e pós um período de ginástica laboral.
Nesse caso, obviamente o pesquisador procura investigar se o treinamento realizado na ginástica
laboral mostra‑se efetivo para reduzir a dor lombar dos trabalhadores. O que ele espera é encontrar
menores valores na condição pós‑treinamento. Dessa forma, deseja confirmar a hipótese alternativa
(H1) a partir da utilização do Teste t pareado.
Figura 61 – Atividades físicas realizadas em meio líquido por indivíduos idosos
100
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
Exemplo 2
Comparação do desempenho de um grupo de pessoas idosas em testes funcionais antes e depois de
um período de treinamento realizado em meio líquido.
A partir desse exemplo, formulam‑se as seguintes hipóteses:
H0 → O desempenho dos idosos avaliados nos testes funcionais é semelhante antes e após um
período de treinamento realizado em meio líquido.
H1 → O desempenho dos idosos avaliados nos testes funcionais é diferente quando comparadas as
condições pré e pós um período de treinamento realizado em meio líquido.
Nesse caso, o pesquisador tem por intuito investigar se o treinamento realizado em meio líquido é
capaz de melhorar a funcionalidade de indivíduos idosos. Para tanto, o que ele possivelmente espera
encontrar são maiores valores em testes de funcionalidade na condição pós‑treinamento. Dessa forma,
o Teste t pareado permitiria‑lhe confirmar a hipótese alternativa (H1).
Observação
Para aplicação Teste t pareado, é necessária a normalidade de
distribuição nos dados e que a amostra dos dados tenha o mesmo tamanho
nas condições pré e pós.
7.3 Teste t para amostras independentes
O Teste t para amostras independentes deve ser utilizado em situações em que se planeja comparar
uma característica comum de dois grupos que são compostos por indivíduos diferentes (grupos são
independentes).
Figura 62 – Imagem de uma prova de ciclismo, relacionada à pesquisa com objetivo intitulado Comparar
o consumo máximo de oxigênio (VO2max.) entre um grupo de ciclistas e um grupo de corredores
Dessa forma, pode‑se presumir que a condição fundamental para a aplicação desse teste é que os
sujeitos de um grupo não estejam relacionados aos sujeitos de outro grupo.
101
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
Por exemplo, imagine que um pesquisador deseja comparar o consumo máximo de oxigênio
(VO2max.) entre um grupo de ciclistas e um grupo de corredores. Entretanto, como um dos indivíduos
avaliados é triatleta e participa dessas duas formas de treinamento, esse pesquisador decide colocar
os valores de VO2max. desse sujeito nos dois grupos a serem comparados. Esse procedimento se
mostra inadequado para a utilização do Teste t para amostras independentes, o que poderia conduzir
o pesquisador a uma análise errônea e, consequentemente, levá‑lo a interpretações equivocadas a
partir do seu conjunto de dados.
Para aplicação do Teste t para amostras independentes, é necessário, também, que os dados mostrem
uma distribuição normal (normalidade aceita em teste realizado previamente). As opções não paramétricas
que permitem comparações semelhantes são: Teste da Soma dos Ranks de Wilcoxon e Teste t.
Lembrete
O Teste t para amostras independentes permite a comparação da média
dos valores de um grupo com a média de valores de outro grupo compostos
necessariamente por indivíduos diferentes.
Vamos a dois exemplos de aplicação do teste t apara amostras independentes.
Figura 63 – Imagem associada ao exemplo 1 explicitado a seguir, intitulado: Comparação
da altura de salto vertical obtida por uma amostra composta por jogadores de basquete com
aquela obtida por uma amostra composta por lutadores de judô
Exemplo 1
Comparação da altura de salto vertical obtida por uma amostra composta por jogadores de basquete
com aquela obtida por uma amostra composta por lutadores de judô.
102
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
A partir desse exemplo, formulam‑se as seguintes hipóteses:
H0 → a altura de salto vertical é semelhante entre jogadores de basquete e lutadores de judô.
H1 → a altura de salto verticalé diferente entre jogadores de basquete e lutadores de judô.
O objetivo dessa comparação é investigar se participantes de modalidades esportivas distintas
(jogadores de basquete e lutadores de judô) possuem desempenho diferente no teste que determina
a altura máxima de salto vertical. Imagina‑se que, nessa condição, o pesquisador espere encontrar
jogadores de basquete que atinjam uma altura de salto significativamente superior aos lutadores de
judô, em função da característica específica de cada modalidade. Se isso ocorrer, a hipótese alternativa
(H1) será confirmada.
Figura 64 – Imagem associada ao exemplo 2 explicitado a seguir, intitulado: Comparação
da força máxima do grupo muscular do quadríceps de atletas halterofilistas com atletas jogadores de futebol
Exemplo 2
Comparação da força máxima do grupo muscular do quadríceps de atletas halterofilistas com atletas
jogadores de futebol.
Para esse exemplo, são formuladas as seguintes hipóteses:
H0 → A força máxima do grupo muscular do quadríceps é semelhante entre atletas halterofilistas e
atletas jogadores de futebol.
H1 → A força máxima do grupo muscular do quadríceps mostra‑se diferente entre atletas
halterofilistas e atletas jogadores de futebol.
A finalidade desse estudo é investigar se a capacidade de produzir força máxima mostra‑se diferente
entre grupos distintos de atletas: halterofilistas e jogadores de futebol. Acredita‑se que, como esses
atletas utilizam tipos diferentes de força em suas modalidades, o pesquisador deve imaginar que os
atletas halterofilistas produzirão maior força máxima quando comparados aos atletas jogadores de
futebol. Dessa forma, a hipótese alternativa (H1) seria confirmada.
103
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
Lembrete
Para aplicação do Teste t para amostras independentes é necessária
normalidade de distribuição dos dados. As opções não paramétricas são:
Teste da Soma dos Ranks de Wilcoxon e Teste t.
8 OUTROS TESTES ESTATÍSTICOS
Basicamente, tratamos até aqui de situações em que dois grupos de dados são comparados entre si.
Entretanto, como devemos proceder quando queremos comparar simultaneamente mais de dois grupos
de dados entre si? E como fazemos para avaliar as proporções entre dois grupos de dados para analisar
se existe alguma relação entre o comportamento desses dados?
Para responder a essas questões, vamos agora discutir mais alguns tipos de testes estatísticos.
8.1 Teste de Anova
O teste de análise de variância, conhecido também como Anova, deve ser empregado em uma
pesquisa em que o objetivo seja estabelecer a comparação de mais de dois grupos simultaneamente.
Imagine que tenhamos uma condição em que uma variável quantitativa deverá ser comparada entre
quatro grupos distintos. O pesquisador poderia utilizar vários testes t entre os grupos para compará‑los
dois a dois. Contudo, esse procedimento mostra‑se estatisticamente inadequado, pois aumenta o erro de
se concluir inapropriadamente que existe diferença entre as médias. Isso significa que de forma errada
esse pesquisador poderia concluir que existe diferença entre dois grupos quando, na verdade, não há.
Por isso, o procedimento correto consiste em usar o Teste de Anova, o que possibilita comparar
mais de duas médias de um experimento em um único teste. Com isso, torna‑se possível identificarmos
as diferenças entre os grupos (se essas existirem), mantendo o adequado controle sobre o nível de
significância do teste.
O Teste de Anova permite atribuir as possíveis diferenças encontradas a causas ou fontes de variação
diferentes. O número de causas de variação ou fatores dependerá dos objetivos de cada estudo. Quando
esse teste apresenta apenas uma fonte de variação, ele é conhecido como Anova one‑way, ou Anova de
um fator; quando o teste apresenta duas fontes de variação, ele é conhecido como Anova two‑way (ou
Anova de dois fatores).
A Anova de um fator apresenta apenas uma causa de variação. Já na Anova de dois fatores, as
variáveis são divididas em dois blocos, sendo que cada bloco representa um conjunto de unidades
experimentais homogêneas entre si. A grande vantagem desse tipo de teste é que os efeitos existentes
em diferentes blocos podem ser separados entre si, ou seja, aplicando‑se apenas um teste estatístico
podemos explicar efeitos de fatores diferentes.
104
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
Lembrete
O teste de análise de variância (Anova) deve ser utilizado em estudos
quando o objetivo é estabelecer uma comparação de mais de dois grupos
simultaneamente.
Um experimento pode conter um ou mais fatores com diferentes níveis. Os níveis de um fator
representam as características diferentes deste. Assim, o procedimento estatístico detecta qual a
influência desses fatores na variação dos grupos analisados, ou seja, identifica qual fator (ou quais
fatores) são as possíveis causas de variação observada.
Para ficar mais claro, vamos a um exemplo prático de aplicação dos conceitos de fatores e de níveis
no teste de Anova.
Figura 65 – Imagem associada ao exemplo de aplicação do
teste de Anova com o objetivo de comparar a estatura de
indivíduos do gênero feminino e masculino com diferentes
níveis de escolaridade: Ensino Médio, graduação e pós‑graduação
Imagine que você deseja comparar a estatura de indivíduos do gênero feminino e masculino com
diferentes níveis de escolaridade: Ensino Médio, graduação e pós‑graduação. Nesse exemplo, o gênero
é um fator com dois níveis: masculino e feminino. O nível de escolaridade pode ser considerado outro
fator, com três níveis: Ensino Médio, graduação e pós‑graduação. Os dados hipotéticos desse caso são
apresentados na tabela 12.
105
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
Tabela 12 – Dados correspondentes à estatura em metros de estudantes de Ensino Médio,
graduação e pós‑graduação, do sexo masculino e feminino
Estatura
Nível de escolaridade
Ensino Médio Graduação Pós-graduação
Gênero
Masculino 1,78 ± 0,8 m 1,8 ± 0,7 m 1,79 ± 1,0 m
Feminino 1,62 ± 0,6 m 1,65 ± 0,8 m 1,64 ± 0,7 m
A aplicação de um teste de Anova de dois fatores nos dados da tabela 12 permitiria verificar que os
alunos do gênero masculino são estatisticamente mais altos que os alunos do sexo feminino. Todavia,
possivelmente não seriam encontradas diferenças significativas em função do fator nível de escolaridade.
Dessa forma, a Anova permite a comparação simultânea de dados que são influenciados por
diferentes fatores, em diferentes níveis.
Observação
Os testes de Anova devem ser aplicados em dados de distribuição
normal, e as comparações podem ser do tipo Anova one‑way (um fator) ou
Anova two‑way (dois fatores).
Para que o teste de Anova possa ser adequadamente empregado, torna‑se necessário cumprir
alguns pressupostos, tais como:
• os dados devem apresentar distribuição normal;
• as variações amostrais devem ser semelhantes nas diferentes amostras dos grupos;
• o tamanho das amostras dos grupos necessita ser semelhante;
• considerar o fato que quanto maior a amostra, mais confiáveis serão os resultados obtidos nesse
tipo de teste.
Vamos a um exemplo prático de aplicação do teste de Anova de um fator. Imagine que você
desejaavaliar um grupo de indivíduos que foi submetido à prática de seis meses de treinamento
de pilates. De acordo com os objetivos do seu estudo, você fará avaliação da flexibilidade desses
praticantes na condição inicial (antes de começar o treinamento), após dois meses, quatro meses
e seis meses.
106
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
Figura 66 – Imagem associada ao exemplo de aplicação do teste de Anova
com objetivo avaliar um grupo de indivíduos submetido à prática de
seis meses de treinamento de pilates. Será realizada avaliação da flexibilidade
desses praticantes na condição inicial (antes de começar o treinamento),
após dois meses, quatro meses e seis meses
Nesse exemplo, nós temos apenas um fator (prática de uma modalidade) com quatro diferentes
níveis de comparação (a cada dois meses).
Para esse exemplo, são formuladas as seguintes hipóteses:
H0 → A flexibilidade é semelhante ao longo do tempo de prática de treinamento de pilates.
H1 → A flexibilidade é diferente ao longo do tempo de prática de treinamento de pilates.
Assim, o teste de Anova nos permite verificar se todas as condições foram diferentes entre
si ou se as diferenças podem ser observadas apenas entre algumas das condições testadas.
Hipoteticamente, aplicando o teste de Anova no exemplo anterior, poderíamos encontrar diferença
nos valores de flexibilidade entre a condição inicial e após seis meses de treinamento. Contudo,
poderíamos verificar que entre as demais condições testadas não foram observadas diferenças
significativas. Nesse caso, a hipótese alternativa (H1) foi confirmada, mas apenas uma diferença
significativa foi verificada.
107
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
8.2 Teste de Friedman
O Teste de Friedman deve ser utilizado para comparar os resultados de três ou mais amostras, quando
a normalidade de distribuição de dados não for confirmada. Podemos afirmar, então, que o teste de
Friedman é uma alternativa não paramétrica correspondente à Anova.
Esse teste ordena os resultados para cada um dos casos e depois calcula a média das ordens para
cada amostra. Assim, se não existem diferenças entre as amostras, as suas médias das ordens devem ser
similares.
Vamos a um exemplo prático de aplicação do teste Friedman, pressupondo que a normalidade de
distribuição dos dados tenha sido previamente rejeitada nessa condição.
Figura 67 – Imagem associada ao exemplo de aplicação do
Teste de Friedman com o objetivo de comparar a ativação de diferentes
músculos do membro inferior durante dez passadas de corrida
Imagine que um pesquisador deseje comparar a ativação de diferentes músculos do membro inferior
durante dez passadas de corrida. A ativação dos diferentes músculos é apresentada na figura 68.
A partir dessa situação, formulam‑se as seguintes hipóteses:
H0 → A ativação dos diferentes músculos é semelhante durante a corrida.
H1 → A ativação dos diferentes músculos é diferente durante a corrida.
108
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
RF
VL
BF
IC
VM
TA
Time
GL
Figura 68 – Ativação de diferentes músculos do membro inferior ao longo do tempo
correspondente a dez passadas: Reto Femoral (RF); Ílio costal (IC); Vasto Lateral (VL);
Vasto Medial (VM); Biceps Femoral (BF); Tibial Anterior (TA); Gastrocnêmio Lateral (GL).
Novamente, temos a possibilidade de encontrar diferenças entre apenas dois músculos ou diferenças
entre vários músculos simultaneamente. De qualquer forma, sempre que alguma diferença for verificada,
afirma‑se que a hipótese alternativa (H1) foi confirmada.
Lembrete
O teste de Friedman é uma alternativa não paramétrica correspondente
à Anova. Esse teste também permite comparar os resultados de três ou
mais amostras simultaneamente.
8.3 Teste de Correlação
Muitas vezes, gostaríamos de saber quanto uma variável depende de outra, por exemplo,
quanto um céu nublado serve como indicador de chuva, quanto um piso molhado indica que
ele está mais escorregadio ou quanto a circunferência do braço de uma pessoa serve como
indicador de força. É para estabelecer essas relações que existe a ferramenta conhecida como
correlação simples.
109
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
Figura 69 – Imagem da circunferência de braço utilizada como
parâmetro de análise de medidas antropométricas;
geralmente essa medida é correlacionada com a força
A Correlação Simples investiga em que grau se relaciona duas variáveis, ques podem ou não estar
associadas. Quando duas variáveis apresentam alguma relação entre si, isso significa que a variação
nessa característica afeta outra característica do sujeito.
Por exemplo, quanto mais avançada for a idade de uma pessoa, maior a tendência dessa pessoa em
apresentar um percentual de gordura maior. Portanto, a correlação simples analisa a interferência de
uma variável (dependente) sobre outra variável (independente).
Poderíamos querer saber qual o efeito do tempo de fumo (variável independente) sobre a pressão
arterial, a captação máxima de oxigênio ou o percentual de gordura (variável dependente). Vela notar
que esta é apenas uma tendência de resposta, não significa necessariamente que uma pessoa de 40
anos terá sempre um percentual de gordura maior que uma pessoa de 20 anos.
Observação
Diagrama de dispersão é um gráfico no qual os escores de cada sujeito
da amostra são plotados na relação entre as duas variáveis de análise.
Observe a figura 70 para mais um exemplo. Esse gráfico se chama diagrama de dispersão. Neste,
duas variáveis foram registradas de uma amostra: estatura e salto em distância sem corrida. Isso significa
que cada ponto no gráfico representa os valores de estatura e se salto em distância dos indivíduos da
amostra.
Com esses dois valores em mãos, cria‑se um gráfico posicionando os pontos representantes de cada
sujeito na posição correspondente aos valores coletados de estatura e distância de salto. É possível notar
uma distribuição característica nos resultados dos dados que nos indica que pode haver uma correlação
entre essas duas variáveis.
110
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
Nota‑se uma tendência de distâncias maiores de salto quanto maior a estatura dos sujeitos. Essa
tendência de resposta não implica em certeza. Não se pode afirmar que uma pessoa, por ter a estatura
de 1,80 m, saltará mais baixo que uma de 1,90 m, mas permite criar essa expectativa.
7'0"
6'3"
5'6"
4'9"
6'9"
6'0"
5'3"
4'6"
6'6"
5'9"
5'0"
4'3"
4'0"
5'0" 5'8"5'4" 6'0"5'2" 5'10"5'6"
Estrutura
Sa
lto
e
m
d
ist
ân
ci
a
se
m
c
or
rid
a
5'1" 5'9"5'5"5'3" 5'11"5'7"
Figura 70 – Relação entre estatura e salto em distância sem corrida prévia
A correlação pode ser quantificadapelo coeficiente de correlação de Pearson (r), que
é uma medida quantitativa, um número, que expressa a relação entre as variáveis analisadas
(independentes e dependentes). A relação entre duas variáveis, portanto, pode apresentar
diferentes níveis de associação. O valor do coeficiente de correlação pode variar de 0,0 (zero) a
1,0 (um).
Quanto maior o valor da correlação, maior o grau de dependência entre as variáveis. Dessa
forma, quando o valor do coeficiente é 1,0, isso indica uma correlação perfeita, e o valor de
coeficiente de correlação igual a 0,0 (zero) indica que não existe nenhuma correlação entre as
variáveis.
111
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
Observação
Coeficiente de correlação → número que expressa grau de relação
entre duas ou mais variáveis.
Por outro lado, quanto menor for o valor da correlação (r), significa que pode existir certa associação,
mas que outras variáveis também interferem na associação. O valor da correlação ser tão baixo indica
que ele se aproxima de zero, apontando que não há relação entre as duas variáveis, ou seja, o aumento
ou a diminuição no valor da variável. Por exemplo, a cor dos olhos de uma pessoa não apresenta
nenhuma relação com o percentual de gordura do sujeito.
O coeficiente de correlação ainda pode apresentar valores positivos e negativos, o que significa que
ele pode apresentar de ‑1,0 a 1,0.
É possível que a associação seja inversa, ou seja, o aumento no valor de uma variável pode estar
associado à diminuição no valor de outra variável. Nesse sentido, o valor da correlação também
é alto, mas com valores negativos, aproximando‑se de ‑1,0. Em casos de valores de correlação
próximos de 1,0, classifica‑se a correlação como positiva. Já em situações nas quais são próximos
de ‑1,0, considera‑se que o aumento no valor de uma variável induz à diminuição no valor de outra
variável. Portanto, os valores de correlação positiva e negativa indicam que a correlação pode ser
positiva ou negativa.
Observação
Correlação positiva → valores maiores que zero e próximos de 1,0.
Sem correlação → valores próximos de zero.
Correlação negativa → valores menores que zero e próximos de ‑1,0.
A correlação positiva existe quando duas variáveis, por exemplo, apresentam uma relação
direta, ou seja, valores de correlação maiores em uma variável induzem a valores maiores na outra
variável. Nessa condição, o valor da correlação é maior que 0,0 (zero) e menor ou igual a 1,0 (um).
Um coeficiente de correlação com valor igual a 1,0 indica uma correlação positiva perfeita, ou
seja, uma relação perfeita de dependência entre as variáveis de análise. Uma correlação perfeita é
raramente observada, pois na natureza normalmente há muitas variáveis que interferem na relação
entre duas variáveis.
112
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
Figura 71 – Prática de futebol, que é correlacionada no
exemplo a seguir com a densidade mineral óssea
Vejamos um exemplo extraído de um artigo numa situação real (figura 72). Karlsson et al. (2001) investigaram
a densidade mineral óssea de várias regiões do corpo, dentre elas a densidade óssea do colo do fêmur. A densidade
óssea indica a quantidade de cristais de cálcio, em gramas, por unidade de área de osso (cm2).
A figura 72 ilustra a distribuição de dados da densidade óssea em função das horas de treino de
jogadores de futebol por semana. Cada ponto representa os escores de cada um dos jogadores da
amostra. O coeficiente de correlação entre essas duas variáveis é de r = 0,40. Observa‑se uma tendência
de maior densidade óssea do colo do fêmur com a maior quantidade de horas de treino por semana, que
pode ser notada nas duas retas apresentadas entre os dados e são usadas para predizer os resultados
em situações que não foram medidas ou observadas e também indicam que a relação entre as variáveis
muda em função da quantidade de horas de treino por semana.
As retas observadas na figura 72 são obtidas por uma ferramenta estatística conhecida como
regressão linear, que será discutida mais adiante.
1,0
1,2
1,4
1,6
Densidade óssea de colo do fêmur X nível de atividadeg/cm2
horas de treino / semana
Figura 72 – Coeficiente de correlação entre a densidade óssea do colo do fêmur e as horas de treinamento por semana (r = 0,40). Em
bolas pretas, praticantes de futebol com volume de treino inferior a 6 horas semanais; e, em bolas brancas, superior a 6 horas
113
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
BIOESTATÍSTICA
Um coeficiente de correlação positiva, por exemplo, pode apresentar vários valores diversos entre
0,0 e 1,0. Não existe um único valor que possa ser considerado como suficientemente alto para que
a correlação positiva seja considerada válida. Cada variável apresenta um valor diferente para que a
correlação entre elas exista.
Para saber a partir de qual valor de coeficiente de correlação a relação de dependência entre as
variáveis é significativa, ou seja, pode ser considerada como existente entre as variáveis, usa‑se um
critério estatístico de significância, indicada pela letra p. Essa análise envolve o uso de uma tabela que
leva em consideração a quantidade de valores apresentados.
A partir dessa tabela, é possível saber se o valor do coeficiente de correlação é suficiente
para considerar que existe correlação ou não. Como já discutido, geralmente é usado um nível
de significância de 0,05 ou 0,01. Nota‑se que quanto maior o número de dados (sujeitos), menor
o valor de coeficiente de correlação que pode ser considerado significativo. Ou seja, com maior
número de sujeitos há mais dados que permitem tecer correlações, e, assim, um valor menor de
coeficiente pode ser considerado suficiente para afirmar que há correlação positiva ou negativa
entre as variáveis.
Observação
Significância → indica quanto os resultados obtidos são confiáveis, até
que ponto se podem esperar resultados semelhantes caso a análise seja
refeita.
Vejamos um exemplo simplificado de como a tabela 13 pode ser usada para determinar o coeficiente
mínimo para que se tenha uma significância que permita afirmar que existe correlação entre duas
variáveis. Para usar a tabela, sugerimos seguir os seguintes passos:
1. Escolher um nível de significância: os níveis de significância mais usados são de 0,05 ou 0,01.
Ambos são aceitos, mas 0,01 atribui maior confiança à correlação.
2. Ler a tabela de acordo com os graus de liberdade (gl) dos seus dados: o grau de liberdade, para um
coeficiente de correlação, é obtido a partir do número de sujeitos ou número de pares de escores
(N), por exemplo. A fórmula para os graus de liberdade é:
gl = N - 2
em que:
gl: graus de liberdade
N: número de sujeitos
114
Unidade II
Re
vi
sã
o:
C
ar
la
-
D
ia
gr
am
aç
ão
: M
ár
ci
o
-
22
/0
2/
20
13
-
||
-
2ª
R
ev
isã
o
Lu
an
e
-
co
rr
eç
ão
: F
ab
io
-
1
8/
03
/1
3
Para o nosso exemplo, vamos supor a situação da análise da correlação entre a estatura e o
comprimento de passada na corrida para uma determinada velocidade. Primeiro, gostaríamos de deixar
claro que os valores aqui apresentados são fictícios e criados