Buscar

bioestatistica unid 2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 64 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 64 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 64 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

75
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
Unidade II
Na unidade II, abordaremos as formas para realizarmos diferentes tipos de análise de dados, 
dependendo das características dos seus dados e do objetivo do seu estudo. Uma característica 
importante do conjunto de dados que influencia a escolha do teste estatístico corresponde à análise da 
distribuição dos dados, conforme veremos logo no início desta dos nossos estudos.
Obviamente, o objetivo do seu estudo depende da natureza da pergunta de pesquisa, conhecida 
como problema de pesquisa. As possíveis respostas a essa pergunta darão origem às hipóteses do 
estudo. A hipótese é o que você espera encontrar como resultado quando realizar um determinado 
experimento. E, no intuito de avaliarmos se essas hipóteses se confirmarão ou não, é que utilizamos os 
testes estatísticos.
Existem inúmeros testes estatísticos, mas a sua escolha deve ser pautada nas características e 
objetivos do seu estudo; por exemplo, o número de comparações que se deseja realizar. Assim, torna‑se 
possível determinar o teste estatístico mais adequado para cada situação de análise.
Por exemplo, o teste t para uma amostra é utilizado quando temos como objetivo comparar as 
características de um único grupo com um valor de referência. Já quando desejamos comparar dois 
grupos de dados, alguns testes são frequentemente aplicados, dependendo, é claro, de algumas condições 
para que eles possam ser adequadamente empregados.
Nessa situação, os testes mais comuns são o teste t pareado e o teste t para amostras independentes. 
Para comparações entre mais de dois conjuntos de dados, podemos utilizar o teste conhecido como 
Anova ou o teste de Friedman, sendo que a escolha entre um e outro dependerá de alguns pressupostos 
básicos que discutiremos mais adiante nesta unidade.
Se o objetivo do seu estudo for correlacionar uma variável com outra, ou seja, avaliar o comportamento 
de uma variável em relação ao comportamento de outra, poderemos utilizar um teste de correlação. 
No entanto, se o objetivo for avaliar o quanto que o comportamento de uma variável depende do 
comportamento de outra, utilizaremos o teste de regressão linear. As aplicações desses diferentes tipos 
de teste serão aqui discutidas; mostraremos, inclusive, exemplos práticos da área da Educação Física que 
representam condições em que tais testes devem ser aplicados.
Obviamente, existe um número muito grande de diferentes tipos de teste, e não temos aqui a meta 
de apresentar todas essas opções (até porque essa seria uma tarefa impossível). Nosso objetivo aqui é 
simplesmente mostrar alguns testes mais recorrentes na nossa área de atuação, ilustrando possibilidades 
de aplicação, que serão ou não indicadas nas situações que futuramente você poderá encontrar em um 
trabalho de conclusão de curso.
76
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
5 ANÁLISE NA DISTRIBUIÇÃO DOS DADOS
Uma vez que nossas variáveis de análise foram adquiridas (coletadas), precisamos agora avaliar 
como elas se distribuem em um gráfico. Elas poderão se distribuir de forma a confirmar normalidade ou 
de rejeitar essa distribuição normal.
A avaliação da normalidade de distribuição dos dados torna‑se extremamente importante, pois é 
um dos principais critérios a serem considerados para escolher qual teste estatístico utilizaremos para 
estabelecer a comparação proposta em nosso estudo.
5.1 Distribuição normal
Muitas variáveis biológicas se distribuem de uma forma equilibrada, na qual os valores centrais são 
mais frequentes e os valores extremos (máximos e mínimos) são mais raros no conjunto de dados. Isso 
pode ser observado no exemplo na figura 41, que mostra uma série de diferentes curvas que tem como 
característica comum concentrarem a maior parte dos seus valores no centro da curva.
Média
Figura 41 – Exemplos de curvas em que a maioria dos valores se posiciona no 
centro, se distribuindo em torno da média
A curva normal é uma linha contínua com a forma aproximada de um sino, utilizada para avaliar 
a normalidade de distribuição dos dados. Exatamente por esse motivo, essa forma é conhecida como 
linha teórica, pois mostra o modo como os dados deveriam se distribuir para terem o pressuposto de 
normalidade aceito.
Dessa forma, essa linha teórica é conhecida como curva de distribuição normal ou curva de Gauss, 
a qual necessariamente apresentará menor incidência em valores baixos e altos, e maior frequência em 
valores centrais.
77
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
A figura 42 mostra quatro exemplos de gráficos, sendo que em dois deles temos a maioria 
dos valores se distribuindo em torno dos valores centrais, ou seja, essas curvas podem ser 
consideradas como normais (curvas correspondentes às letras c e d). Já as curvas representadas 
pelas letras a e b, mostram uma distribuição assimétrica: na letra a, a maioria dos valores estão 
deslocados à esquerda, enquanto que na letra b, a maioria dos valores encontra‑se deslocada 
à direita.
a
c
b
d
Figura 42 – Exemplos de gráficos com distribuição de dados assimétrica 
(letras a e b) e com distribuição simétrica (letras c e d)
Assim, a curva normal é unimodal, ou seja, apresenta apenas um valor de pico, e simétrica 
(idêntica em ambos os lados da média). Contudo, a curva normal pode apresentar diferentes curtoses, 
como veremos na figura 43. A curtose pode ser definida como o achatamento de uma curva. Dessa 
forma, uma curva normal pode apresentar diferentes níveis de curtoses, permitindo sua classificação 
como platicúrtica, leptocúrtica e mesocúrtica. A curva platicúrtica é mais achatada, enquanto que a 
curva leptocúrtica é mais alongada. Já a curva classificada como mesocúrtica, apresenta uma forma 
mais tradicional, com um achatamento intermediário (entre os formatos das curvas platicúrticas e 
mesocúrticas).
78
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
0Z ‑3 ‑2 ‑1 +1 +2 +3
Leptocúrtica
Mesocúrtica
Platicúrtica
Figura 43 – Representação de três curvas normais com diferentes curtoses
 Observação
As curvas normais podem apresentar diferentes curtoses, podendo ser 
classificadas como platicúrtica (mais achatada), leptocúrtica (mais longada) 
e mesocúrtica (forma mais tradicional).
Já que nossa discussão está contextualizada na Bioestatística, torna‑se importante mencionar 
que a distribuição normal não ocorre apenas em pessoas sadias. Esse conceito não possui nenhuma 
relação com o fato ser saudável ou não, normal ou anormal, dentro de um quadro esperado de 
desenvolvimento.
Os conceitos aqui discutidos referem‑se exclusivamente à forma como as variáveis são analisadas se 
distribuem em gráfico. Exatamente por não apresentar nenhuma associação com os conceitos de saúde, 
classificamos os dados por apresentarem uma distribuição normal ou não normal (note que não usamos 
o termo anormal).
Dessa forma, a curva de distribuição normal se apresenta simétrica em torno da média. Se ela for 
perfeitamente simétrica em torno da média, conforme osexemplos apresentados anteriormente na 
figura 43, então poderemos afirmar que os valores referentes à média, mediana e moda coincidirão 
(figura 44).
79
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
Média
Mediana
Moda
Figura 44 – Curva perfeitamente simétrica com os 
valores de média, mediana e moda coincidindo
Nesse sentido, podemos afirmar que a média e os valores de desvio‑padrão são representativos de 
dados de distribuição normal. Isso ocorre, pois a curva de distribuição normal apresenta dois pontos de 
inflexão correspondentes à média somada e à média subtraída ao desvio‑padrão.
Observe a figura 45 que mostra uma curva com distribuição normal rigorosamente simétrica, na 
qual a média está representada pela letra M e o desvio‑padrão pela letra s. Perceba que a área total sob a 
curva totaliza 100%. Já a área entre os pontos de inflexão (M – s e M + s), representa aproximadamente 
68%, ou seja, dois terços de todos os valores. A área que representa a média ± 2 vezes o desvio‑padrão 
(M – 2s e M + 2s) corresponde a 95% dos valores. Por fim, essa curva engloba 99,73% dos valores no 
intervalo entre a média ± 3 vezes o desvio‑padrão (M – 3s e M + 3s).
Com isso, quando os valores de desvio‑padrão são acrescentados aos valores da média, nós temos 
a maioria dos dados representativos da sua variável de análise. Podemos afirmar que, seguindo esse 
pressuposto de normalidade, o conjunto de dados pode ser adequadamente representado por meio dos 
valores de média e desvio‑padrão.
A
68%
95%
Escores de variáveis de interesse
Fr
eq
uê
nc
ia
 d
e 
um
 e
sc
or
e
‑3s ‑2s ‑1s M +1s +2s +3s
C B
ponto de inflexão ponto de inflexão
Figura 45 – Curva que ilustra uma distribuição normal na prática
80
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
Exemplo de aplicação
A figura 46 a seguir mostra quatro exemplos de curvas com diferentes formas de distribuição dos 
dados. Procure determinar quais são os exemplos de curvas que podem ser consideradas normais. Aponte 
quais são as implicações dessa determinação.
A
C D
B
Figura 46 – Exemplos de curvas representativas de diferentes conjuntos de dados
5.2 Testes de normalidade
É válido lembrar que a curva de distribuição normal é uma curva teórica, a partir da qual 
faremos uma tentativa de encaixar as curvas obtidas a partir de dados reais que serão parecidos 
ou não com essa curva normal. Dificilmente os dados apresentarão uma distribuição normal 
perfeita. Por isso, determina‑se a normalidade de distribuição dos dados por meio de testes 
de normalidade.
Quando nossos dados se aproximarem dessa distribuição, poderemos confirmar que os pressupostos 
de normalidade foram aceitos e, portanto, testes chamados de paramétricos poderão ser utilizados 
posteriormente para comparação das variáveis. Testes estatísticos paramétricos são geralmente 
preferíveis, pois apresentam maior poder estatístico.
Contudo, existem inúmeras variáveis de distribuição assimétrica ou descontínua que não apresentam 
curva normal de distribuição dos dados. Nessas condições, em que a distribuição dos dados é considerada 
não normal, deveremos optar por testes chamados de não paramétricos para realizar a comparação das 
variáveis.
A figura 47 mostra um conjunto de dados que não apresenta normalidade de distribuição, uma vez 
que o formato do histograma obtido a partir desse conjunto de dados não se assemelha à curva normal, 
representada pela linha no gráfico.
81
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
Fr
eq
uê
nc
ia
Idade
16,9 25,6 34,4 43,1 51,9 60,6 69,4 78,1
Histograma
Curva normal sobreposta 
ao histograma indicado a 
distribuição que os dados 
deveriam apresentar para 
atender aos pressupostos 
de normalidade.
Std. Dev = 18,87
Mean = 32,1
N = 79,00
50
30
10
40
20
0
Figura 47 – Gráfico do tipo histograma sendo comparado á curva normal
Os testes para avaliação da normalidade de distribuição de dados são realizados a partir das medidas 
de assimetrias e curtoses (achatamentos) das curvas compostas pelo nosso conjunto de dados.
 Lembrete
A avaliação da normalidade de distribuição dos dados é fundamental, 
pois estabelece os critérios a serem considerados para escolher qual teste 
estatístico utilizaremos na comparação proposta em nosso estudo.
Existem diversos pacotes estatísticos que utilizam diferentes procedimentos para essa avaliação da 
normalidade. Os testes mais comuns são:
• Teste de Shapiro‑Wilk: utilizado quando temos um conjunto de dados composto por até 50 observações.
• Teste de Kolmogorov Smirnov: utilizado nas demais situações, ou seja, quando temos um conjunto 
de dados composto por mais de 50 observações.
 Lembrete
Os testes mais comuns utilizados para a avaliação da normalidade são: 
Teste de Shapiro‑Wilk e Teste de Kolmogorov‑Smirnov.
82
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
Podemos entender como número de observações o número de variáveis que gostaríamos de comparar 
em um determinado estudo. Para ficar mais claro, vamos a dois exemplos práticos.
Imagine que você deseja comparar a altura alcançada em 30 saltos realizados antes e após um 
período de treinamento. Como o número de observações é igual a 30, nesse caso, usaríamos o Teste de 
Shapiro‑Wilk para avaliar a distribuição dos dados.
Agora, imagine outro exemplo em que você pretende comparar o desempenho de sessenta homens 
com o desempenho de sessenta mulheres em um teste de flexibilidade. Nesse caso, como temos sessenta 
observações para cada grupo avaliado, devemos utilizar o Teste de Kolmogorov‑Smirnov para avaliar a 
distribuição dos dados.
Independente do teste a ser empregado, devemos utilizar um ponto referencial para avaliar se há 
ou não normalidade. Esse referencial é conhecido como nível de significância, o qual é geralmente 
representado pela letra p.
Na área da Educação Física, o nível de significância que é mais frequentemente adotado é de 5%. 
Isso significa que o valor de p será de 0,05, ou seja, p=0,05.
Dessa forma, se realizarmos um teste de normalidade e encontrarmos um nível de significância 
inferior ao estabelecido (por exemplo, p<0,05), a condição de normalidade será rejeitada. Nessa 
situação, poderemos afirmar que o conjunto de dados avaliados não apresenta uma distribuição normal 
e, portanto, um teste não paramétrico deverá ser empregado para comparar os grupos. Ao contrário, 
se encontrarmos um nível de significância superior ao estabelecido (por exemplo, p>0,05), a condição 
de normalidade será confirmada. Com isso, poderemos afirmar que o conjunto de dados avaliados 
mostra uma distribuição normal, o que possibilita a utilização de um teste paramétrico para comparar 
os grupos.
 Observação
Ao aplicarmos testes de normalidade, se encontrarmos um nível de 
significância superior ao estabelecido (por exemplo, p>0,05), a condição de 
normalidade será confirmada.
 Saiba mais
Consulte o capítulo 6 do livro Análise de Dados em Atividade Física, deBarros e Reis (2003), para ter mais informações sobre a avaliação da curva 
normal e os diferentes tipos de testes utilizados para avaliar a normalidade 
de distribuição de dados.
83
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
6 FORMULAÇÃO DE HIPÓTESES
Quando realizamos um estudo, estamos investigando um problema. O problema de 
pesquisa é o contexto que estamos analisando; nesse sentido, é fundamental enxergarmos as 
variáveis de análise no nosso estudo, em particular as variáveis dependentes e independentes. 
Portanto, estamos interessados no efeito que a variável independente pode ter sobre a variável 
dependente.
Conforme visto anteriormente, a variável independente é a que estamos manipulando, enquanto 
que a variável dependente é o efeito da variável independente; é a variável que sofrerá a interferência da 
variável independente. Se pensarmos numa proposta de causa e efeito, a causa é a variável independente 
e o efeito é a variável dependente.
Vejamos alguns exemplos:
Figura 48 – Imagem exemplificando situação de hidratação relacionado ao 
problema de pesquisa intitulado Investigar a interferência da hidratação 
sobre o rendimento no teste de 12 minutos
• Problema de pesquisa: Investigar a interferência da hidratação sobre o rendimento no teste de 12 
minutos.
Variável independente: hidratação.
Variável dependente: resultado no teste de 12 minutos.
84
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
Figura 49 – Imagem exemplificando situação de corrida, relacionada ao 
problema de pesquisa intitulado Investigar como o tempo de uso afeta a 
capacidade de absorção de impacto do calçado
• Problema de pesquisa: investigar como o tempo de uso afeta a capacidade de absorção de impacto 
do calçado.
Variável independente: tempo de uso do calçado.
Variável dependente: absorção de impacto.
Figura 50 – Imagem exemplificando situação de salto vertical, 
relacionado ao problema de pesquisa intitulado Investigar como o 
aumento de força de quadríceps afeta a capacidade de salto vertical
85
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
• Problema de pesquisa: investigar como o aumento de força de quadríceps afeta a capacidade de 
salto vertical.
Variável independente: força de quadríceps.
Variável dependente: altura de salto.
Figura 51 – Imagem exemplificando situação de alongamento, 
relacionado ao problema de pesquisa intitulado Investigar qual 
alongamento traz maiores ganhos em flexibilidade
• Problema de pesquisa: investigar qual alongamento traz maiores ganhos em flexibilidade.
Variável independente: tipos de alongamentos.
Variável dependente: ganho de flexibilidade.
Figura 52 – Imagem exemplificando situação de prática 
de exercício, relacionado ao problema de pesquisa
• Problema de pesquisa: investigar índices de sedentarismo em função dos diferentes níveis de 
escolaridade em adultos.
86
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
Variável independente: nível de escolaridade em adultos.
Variável dependente: índices de sedentarismo.
Uma vez que o problema de pesquisa foi delimitado e as variáveis independente e dependente foram 
identificadas, precisamos formular as hipóteses. A hipótese é o resultado que esperamos obter pela 
nossa investigação. Geralmente, ao levantar o problema, já imaginamos o que teremos como resultado.
A partir dessa ideia, teremos que formular duas hipóteses, no mínimo: hipótese de pesquisa (H1) e a 
hipótese nula (H0). A hipótese de pesquisa ou hipótese alternativa é o resultado esperado pelo pesquisador; 
geralmente surge da experiência, da dedução lógica ou de resultados de outras investigações. Já a hipótese 
nula, serve para avaliar a confiabilidade dos resultados; segundo ela, não há diferença entre os resultados, 
ou seja, não há relação entre as variáveis independente e dependente. Vejamos como as hipóteses poderiam 
ser formuladas nos exemplos apresentados anteriormente:
• Problema de pesquisa: investigar a interferência da hidratação sobre o rendimento no teste de 12 
minutos.
H1: a hidratação afeta o resultado no teste de 12 minutos.
H0: a hidratação não afeta o resultado no teste de 12 minutos.
• Problema de pesquisa: investigar como o tempo de uso afeta a capacidade de absorção de impacto 
do calçado.
H1: o tempo de uso afeta a capacidade de absorção de impacto do calçado.
H0: o tempo de uso não afeta a capacidade de absorção de impacto do calçado.
• Problema de pesquisa: investigar como o aumento de força de quadríceps afeta a capacidade de 
salto vertical.
H1: a força do quadríceps afeta a altura de salto vertical.
H0: a força do quadríceps não afeta a altura de salto vertical.
• Problema de pesquisa: investigar qual alongamento traz maiores ganhos em flexibilidade.
H1: os diferentes tipos de alongamentos trazem ganhos distintos na flexibilidade.
H0: os diferentes tipos de alongamentos trazem ganhos semelhantes na flexibilidade.
• Problema de pesquisa: investigar índices de sedentarismo em função dos diferentes níveis de 
escolaridade em adultos.
87
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
H1: o nível de escolaridade afeta os índices de sedentarismo.
H0: o nível de escolaridade não afeta os índices de sedentarismo.
Figura 53 – Imagem exemplificando situação de prática de exercício, 
relacionado ao problema de pesquisa intitulado Investigar índices de 
sedentarismo em função dos diferentes níveis de escolaridade em adultos
Exemplo de aplicação
Agora que já vimos diversos exemplos aplicados à nossa área de atuação, procure formular um 
novo problema de pesquisa relacionado à Educação Física, que ainda não tenha sido comentado nesse 
material. Depois, procure desenvolver também a hipótese alternativa para esse problema.
Uma vez formuladas essas hipóteses, devemos proceder ao teste para verificar os resultados que 
teremos. Esse processo é conhecido como teste de hipótese ou teste de significância. O teste de hipóteses 
envolve os seguintes passos:
• delimitar o problema de pesquisa;
• definir as hipóteses nula e alternativa;
• coletar dados em uma amostra da população;
• uso de ferramentas estatísticas para testar a hipótese;
• comparação dos resultados com a literatura.
Uma vez que a hipótese alternativa ou de pesquisa (H1) é uma alternativa para a hipótese nula (H0), 
o que buscamos são evidências para rejeitar H0, ou seja, provas de que ela não seja verdadeira. Se H0 não 
é verdadeira, H1 passa a ser a resposta aceita.
88
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
Em situações nas quais não se sabe para qualdireção os resultados tenderão, teremos que usar 
um teste estatístico bicaudal. Quando já imaginamos para qual lado os resultados poderão tender, 
podemos usar um teste unicaudal. Vejamos um exemplo com base numa das situações apresentadas 
anteriormente.
• Problema de pesquisa: investigar como o tempo de uso afeta a capacidade de absorção de impacto 
do calçado.
H1: o tempo de uso afeta a capacidade de absorção de impacto do calçado.
H0: o tempo de uso não afeta a capacidade de absorção de impacto do calçado.
Nessa situação, a hipótese alternativa indica que a absorção de impacto será afetada pelo tempo 
de uso do calçado, mas não sabemos se para mais ou para menos, ou seja, pode ser que a absorção de 
impacto melhore ou piore. Por não saber para qual lado os resultados tenderão, deveremos usar um 
teste bicaudal. Por outro lado, se imaginarmos que a absorção de impacto não possa melhorar, apenas 
piorar, estamos imaginando para qual lado os resultados tenderão; assim, ou a absorção de impacto 
piorará (H1) ou não será afetada (H0). Nesse caso, um teste unicaudal deverá ser usado.
Os testes estatísticos vão identificar e comparar os dados coletados com dados conhecidos 
de uma população ou comparar dados coletados em duas condições distintas. Por exemplo, 
altura de salto antes de treinamento de força em quadríceps e depois de treinamento de força 
em quadríceps, quilometragem percorrida no teste de 12 minutos com hidratação prévia e sem 
hidratação prévia, ganho em flexibilidade após 8 sessões de alongamento estático e após 8 
sessões de alongamento dinâmico.
A comparação que será realizada permite identificar o valor de p, que varia de 0,0 a 1,0. O p representa 
a probabilidade dos resultados encontrados na amostra, para as duas condições, serem idênticos. O que 
se procura é aceitar ou rejeitar H0, ou seja, é evidência para afirmar que os resultados das duas condições, 
por exemplo, são idênticos ou diferentes. Isso será feito pela determinação de um valor de corte para p, 
que também é conhecido como nível de significância.
Geralmente, o valor crítico de p fica entre 5% (0,05) e 1% (0,01). Na comparação entre as duas 
distribuições de dados, quanto menor for o valor de p, maior a evidência para rejeitar a hipótese nula, 
ou seja, de que os dois conjuntos de dados são diferentes. O valor de p corresponde à probabilidade 
dos dois conjuntos de dados serem iguais; portanto, o p de 0,05 significa que há 5% de chance das 
distribuições dos dados nas duas condições serem iguais, ou seja, eles são diferentes. Com isso, se 
rejeita H0 e aceita H1.
 Observação
Quanto mais forte tiver que ser a evidência, menor terá que ser o valor 
de p, por exemplo, 0,01.
89
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
Como vimos, as formulações das hipóteses alternativas (hipóteses do pesquisador) são geralmente 
provenientes de resultados de outras investigações. Entretanto, torna‑se fundamental que sejam utilizadas 
fontes científicas de qualidade, e, por isso, no tópico que segue abordaremos as formas de buscar tais referências.
As fontes bibliográficas podem ser classificadas como primárias ou secundárias. Fontes primárias 
correspondem aos artigos científicos experimentais, ou seja, as conclusões apresentadas nesses textos são 
oriundas de algum trabalho realizado por pesquisadores, envolvendo um desenho experimental definido.
Já as fontes secundárias, são os artigos de revisão e os livros. Esses materiais têm como objetivo 
sistematizar informações divulgadas principalmente por meio de outras fontes primárias. Dessa forma, 
o grande objetivo desse tipo de fonte não é produzir uma informação nova, mas sistematizar e organizar 
conteúdos para que as informações já divulgadas possam ser mais bem organizadas e entendidas.
Nesse sentido, ao realizarmos uma pesquisa bibliográfica em que o objetivo primordial é formular 
as hipóteses do nosso estudo, devemos sempre preferir as fontes primárias, pois elas permitem uma 
leitura do texto diretamente a partir da escrita dos autores do trabalho original. Já as fontes secundárias, 
promoverão uma releitura dessas informações contidas no texto original, servindo mais especificamente 
para promover uma ideia geral sobre o tema abordado.
6.1 Estratégias de busca de artigos científicos
Nos dias de hoje, a informação e o conhecimento são facilmente obtidos por meio da internet. 
No entanto, justamente devido à facilidade em acessar e em postar informação e conhecimento é 
que o maior desafio torna‑se a adequada seleção desse conhecimento. A escolha do conhecimento de 
qualidade é o grande segredo da atualidade.
Hoje em dia, qualquer pessoa é capaz de criar um site, mesmo que não domine o assunto discutido. 
Esse é justamente o problema: não há nenhuma classificação na informação apresentada e, às vezes, 
sites bem elaborados podem conter conteúdos altamente questionáveis.
Figura 54 – Trabalhos atraentes podem ser desenvolvidos; 
entretanto com conteúdo questionável
90
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
Por exemplo, pense num conteúdo que não seja de seu domínio: pintar, cozinhar, tecer ou qualquer 
outro. Com criatividade, um site interessante e atraente pode ser criado e atrairá muitos visitantes que 
usarão o seu conteúdo. Infelizmente, os visitantes do site não fazem ideia que o seu conhecimento 
sobre o assunto possa ser limitado. Lembre‑se de que, nesse exemplo, um conteúdo que não é do seu 
domínio foi escolhido. Por ser atraente e bem estruturado, muitos irão adotar os ensinamentos do site e 
passá‑los adiante. Perceba como isso pode ser perigoso quando se trata da saúde de uma pessoa.
É necessário desenvolver um olhar crítico a tudo que nos é apresentado, independente de quão 
lógico a informação ou o conhecimento possa parecer. A internet é uma fonte vasta de conhecimento e 
informação e que se encontra ao alcance de todos. Infelizmente, junto aos sites, não aparece nenhuma 
indicação da confiabilidade das informações transmitidas. Por isso, cabe a nós aprender a selecionar o 
conhecimento mais confiável. Para tanto, é importante saber as origens dos conteúdos apresentados.
Atualmente, não é difícil montar um site atraente que convide o acesso de todos, basta um projetista 
competente e uma “pitada” de criatividade. Entretanto, nem sempre conhecemos a pessoa que desenvolveu 
o conteúdo postado; em muitos casos, aparece um breve currículo do autor do conteúdo. Mesmo assim, 
ainda é possível que a pessoa tenha criado o conteúdo em grande parte usando conhecimento empírico, 
ao invés de conhecimento científico.
O conhecimento empírico é obtido por um método, no qual dados são coletados com base na 
experiência. Não desmerecendo a experiência, vale lembrar que esta apresenta certas limitações. Por 
exemplo, o conhecimento pautado na experiência depende das vivências de uma pessoa e às vezes elas 
induzem a interpretações incorretas e a conclusões que eventualmente são válidas apenas em certas 
circunstancias.
Contudo, o maior problema está na baixa capacidade de extrapolar a experiência a outras condições, 
pois a adquirimos sem controle das variáveis que poderiam interferir nos resultados e assim induzir a 
interpretações incorretas.
Figura 55 – Momento decisivo de uma partida de futebol; momento do chute a gol
Por exemplo, muitas vezes buscamos explicações para fracassos, como em uma cobrança de pênalti 
perdida durante uma partida de futebol. O número de variáveis que podem ter influenciadoa perda do 
91
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
pênalti são inúmeros. No entanto, cada torcedor terá uma opinião e uma justificativa para o insucesso, 
sendo que cada um acredita ser sua a razão verdadeira do fracasso. É importante perceber que nessa 
situação, cada justificativa é meramente uma especulação e que pode não ser o real motivo da perda 
do pênalti. Gostaríamos de deixar claro que não é um desmerecimento à experiência, mas certo cuidado 
deve ser dado à importância que se destina a ela.
Por outro lado, o conhecimento científico é uma forma mais estruturada de adquirir conhecimento 
e que envolve objetividade e controle das variáveis para a solução de um problema específico. Vale 
lembrar que ele também apresenta limitações, porém permite uma segurança maior na interpretação 
dos resultados pesquisa e uma garantia maior de que, em qualquer outra região do mundo, se alguém 
refizer o estudo nas mesmas circunstâncias, a chance é razoável em obter um resultado semelhante.
Por conta dessa característica do estudo científico, é que o mais seguro é buscar conhecimento em 
revistas e fontes científicas. É claro que mesmo que os editores das revistas científicas submetam os 
artigos a revisores competentes, é possível que resultados questionáveis sejam observados. Entretanto, 
a segurança na informação é maior.
São muitos os locais nos quais é possível se obter conhecimento científico. No quadro a seguir, há 
uma lista dos principais sites de busca de artigos científicos, onde se encontram materiais direcionados 
à área da Educação Física.
Quadro 1 – Principais bases de dados nas quais é possível 
encontrar artigos científicos em revistas indexadas
Bases de dados (referências e resumos):
Pubmed
www.pubmed.com
• Indexa revistas significativas na área da saúde.
• Indexa principalmente revistas americanas, pois é pago com dinheiro público.
• Principal site de busca usado.
• Principalmente resumos.
• Oferece links para as revistas eletrônicas para obter artigos completos (muitos pagos).
Bireme
www.bireme.br 
• Banco de dados Latino‑Americano.
• Acesso à informação científica e técnica em saúde (BVS – Biblioteca Virtual em Saúde).
• Indexa diversos bancos de dados virtuais.
• LILACS (Literatura Latino‑Americana e do Caribe de Informação em Ciências da Saúde).
Dedalus
www.dedalus.usp.br
• Indexa toda a produção científica da USP.
• Entrar: interface portal USP.
Scielo
www.scielo.br
• Scientific Eletronic Library On‑line.
• Indexa 114 revistas brasileiras.
• Textos completos.
• Maior parte da área biológica.
• Suportada inicialmente pela Fapesp e, a partir de 2002, também pela Capes.
92
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
Periódicos
www.periodicos.capes.gov.br
• Base com textos completos.
• Banco de dados de teses e dissertações.
• Diversas revistas especificamente na área de EF.
Elsevier
http://www.elsevier.com
• Oferece informação técnico‑científica sobre saúde.
• Indexa diversas revistas ao redor do mundo.
• Indexa 75% da produção Europeia.
• Interligada com PubMed.
• Principais áreas: Ciências da saúde, físicas e sociais.
Google
http://scholar.google.com.br
• Não é especificamente científica.
• Localiza revistas virtuais na internet, caso o link não esteja acessível em outros bancos de 
dados.
• Nem sempre o artigo completo é acessível.
• Busca por institutos de pesquisa; linhas de pesquisa; pesquisadores; publicações sobre o 
assunto.
Teses e dissertações USP
www.usp.br
• Banco de dados da produção acadêmica da USP.
• Textos completos em pdf.
• Acesso em Biblioteca.
Site de busca USP
www.usp.br/sibi
• Sistema Integrado de Bibliotecas da USP.
• Busca por revistas eletrônicas.
• A partir de pontos de internet ou computadores da USP, muitos artigos podem ser obtidos 
em versão completa.
É importante lembrar que há outras formas de busca e de conseguir artigos científicos, dissertações 
e teses, diferentes das apresentadas anteriormente. Entretanto, o objetivo do presente texto não é 
determinar o caminho correto, e sim mostrar possibilidades para que o profissional ou aluno comece 
a se familiarizar com a leitura de artigos científicos. Nessa mesma perspectiva, observe, a seguir, um 
roteiro para levantamento bibliográfico sobre um assunto qualquer:
Levantando referências bibliográficas
1. Pensar no assunto de interesse.
2. Pensar em palavras‑chaves. Ser criativo e persistente.
3. Busca inicial por referências em livros‑textos e nos sites de busca.
4. Montar lista relevante de artigos.
5. Tentar conseguir artigos completos.
6. Leitura inicial do artigo para fazer fichamento.
7. Usar referências bibliográficas dos artigos para conseguir mais artigos.
93
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
As revistas científicas apresentam uma classificação segundo alguns critérios predefinidos. A 
classificação se dá em função do Qualis da Coordenação de Aperfeiçoamento de Pessoal de Nível 
Superior (Capes) e do fator de impacto. O Qualis é uma avaliação feita pela Capes e tem o objetivo de 
classificar revistas impressas e virtuais segundo a sua abrangência de sua circulação (local, nacional ou 
internacional) e segundo a qualidade (A, B, C), nas diferentes áreas de conhecimento.
Os critérios para a classificação são: números de exemplares da revista lançados ou publicados por 
ano, número de banco de dados nos quais a revista se encontra indexada e número de instituições que 
publicam na revista para evitar que ela seja mantida por uma única instituição.
Segundo o Qualis, as revistas podem ser classificadas como de nível A1 ou A2, que são os níveis mais 
altos e internacionais, níveis B1, B2, B3, B4 e B5, que englobam níveis altos e baixos de classificação e 
o nível C.
Quanto mais alto for o nível, mais bem conceituada e procurada ela é para publicação pelos 
pesquisadores de todo o mundo. Por outro lado, não criteriosa ela é com relação aos métodos empregados 
no estudo e com a relevância do tema; por isso, mais dificil é publicar nessas revistas.
O fator de impacto é outra forma de classificar as revistas que veiculam artigos científicos. É 
um indicador de quantas vezes um artigo científico publicado em um periódico foi citado. Esse 
fator reflete quanto os artigos de uma determinada revista foram lidos e seus conteúdos citados 
em outros artigos.
Nesse sentido, quanto maior for o fator de impacto de uma revista, maior o prestígio desla, pois 
mais pessoas a leem e a citam. Essa forma de classificação é calculada pela relação de citações por 
artigos publicados em um período; reflete a relação de citações e publicações dos dois anos anteriores 
ao atual.
Para entender melhor, vamos supor o fator de impacto de uma revista em 2010; equivale ao número 
de vezes em que os artigos desse periódico foram citados entre os anos 2008 e 2009. Exemplo: cinquenta 
artigos foram citados cem vezes, dividido pelo número total de publicações de todos os artigos de todas 
as revistas entre os anos 2008 e 2009. Portanto, o fator de impacto da revista será 100 dividido por 50, 
ou seja, 100/50 = 2, sendo que este será divulgado em 2011.
Essas duas formas de classificações são tentativasde categorizar a importância que as revistas 
apresentam em suas áreas de atuação. Ambas apresentam falhas, mas, mesmo assim, elas ainda servem 
como um indicador. Vale lembrar que muitos artigos de excelência podem ser encontrados em revistas 
de fator de impacto e Qualis baixos.
Por isso, o ideal é realmente ler os artigos encontrados e, de forma crítica, analisar o seu conteúdo. 
Este, mesmo que apresente falhas metodológicas, traz contribuições importantes. Como no exemplo, 
devemos ter ciência de que o artigo tem limitações e os resultados podem não ser completamente 
confiáveis.
94
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
7 TESTES ESTATÍSTICOS: TESTE T
Os testes estatísticos podem ser definidos como procedimentos que, com algum nível de precisão, 
possibilitam avaliar se as hipóteses estatísticas podem ou não ser consideradas como verdadeiras.
Como já mencionamos anteriormente, existem inúmeros tipos de testes estatísticos que são 
utilizados com diferentes finalidades e a partir de condições distintas de aplicação (por exemplo, a partir 
da condição de normalidade comprovada ou não).
Nesse sentido, esses tipos distintos de testes estatísticos permitem a comparação entre as proporções 
e as distribuições das observações. Entre outras possíveis formas de aplicação, destacamos aqui as 
seguintes situações:
• comparação de um conjunto de dados a uma categoria de referência;
• comparação entre dois conjuntos de dados de um único grupo;
• comparação entre proporções de mais de dois grupos de dados;
• comparação entre as proporções de dois grupos de dados.
Embora exista um número muito grande de testes estatísticos disponíveis, vamos começar a discutir 
aqueles que julgamos mais comuns na área da Educação Física.
7.1 Teste t para uma amostra
O Teste t para uma amostra é empregado em situações em que características de um único grupo 
precisam ser comparadas com um valor de referência. Dessa forma, podemos afirmar que esse teste foi 
desenvolvido para comparar duas médias em um experimento.
Entretanto, para que esse teste possa ser adequadamente utilizado, torna‑se fundamental que sejam 
atendidos os critérios de normalidade de distribuição de dados. Dito de outra forma, o conjunto de 
dados a ser comparado deve ter antecipadamente sua normalidade confirmada por meio dos testes já 
descritos no tópico 1.2 desta Unidade.
Caso o conjunto de dados a ser testado não apresente normalidade de distribuição de dados, a opção 
não paramétrica para o teste de uma amostra corresponde ao Teste dos Sinais.
 Lembrete
O Teste t para uma amostra é empregado em situações em que 
características de um único grupo precisam ser comparadas com um valor 
de referência.
95
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
Vamos a três exemplos de situações em que o Teste t para uma amostra deve ser empregado para 
realizar as comparações almejadas.
Figura 56 – Ambiente em que testes de resistência aeróbia 
(testes de corrida) podem ser realizados, como relatado no exemplo 1 a seguir.
Exemplo 1
Comparação entre a média de desempenho dos alunos do curso de Graduação em Educação Física 
no teste de resistência aeróbia, conhecido como Teste de 12 minutos, em relação ao desempenho médio 
nesse teste esperado para a faixa etária dessa população.
Para esse exemplo, temos a formulação das seguintes hipóteses:
H0 → a média dos resultados no teste de resistência aeróbia para o grupo alunos do curso de 
graduação em Educação Física é semelhante à média do grupo referencial estipulado.
H1 → a média dos resultados no teste de resistência aeróbia para o grupo alunos do curso de 
graduação em Educação Física é diferente da média do grupo referencial estipulado.
Figura 57 – Display de uma esteira motorizada. Outro exemplo de ambiente em que 
testes de resistência aeróbia (testes de corrida) podem ser realizados, como relatado no exemplo 1 a seguir
96
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
Exemplo 2
Comparação entre a média nacional de desempenho dos alunos de graduação do curso de Educação 
Física, com a média do desempenho dos alunos de Educação Física da Universidade Paulista (UNIP), que 
estejam cursando o último ano.
Para esse exemplo, temos a formulação das seguintes hipóteses:
H0 → A média do desempenho dos alunos de Educação Física da Universidade Paulista 
(UNIP) é semelhante à média nacional de desempenho dos alunos de graduação do curso de 
Educação Física.
H1 → A média do desempenho dos alunos de Educação Física da Universidade Paulista 
(UNIP) é diferente da média nacional de desempenho dos alunos de graduação do curso de 
Educação Física.
Considere, hipoteticamente, que você já tenha realizado a coleta dos seus dados e que os seguintes 
valores foram obtidos:
• média dos alunos da UNIP (± desvio‑padrão): 9,63 ± 0,7;
• média nacional (± desvio‑padrão): 6,20 ± 0,9.
Nesse caso, a hipótese alternativa (H1) foi confirmada, pois, após aplicação do Teste t para 
uma amostra, foi verificada diferença entre a média dos alunos da UNIP e a média nacional. 
Foi possível observar que a média do desempenho dos alunos de Educação Física da UNIP foi 
estatisticamente superior à média nacional de desempenho dos alunos de graduação do curso 
de Educação Física.
Figura 58 – Prova de corrida, conforme exemplo 3, intitulado Comparação 
entre a média do desempenho dos atletas do seu grupo de corrida com 
a média dos participantes na prova de 10 km na qual eles pretendem concorrer
97
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
Exemplo 3
Comparação entre a média do desempenho dos atletas do seu grupo de corrida com a média dos 
participantes na prova de 10 km na qual eles pretendem concorrer.
Para esse exemplo, temos a formulação das seguintes hipóteses:
H0 → A média do desempenho dos atletas do seu grupo de corrida mostra‑se semelhante à média 
dos participantes na prova de 10 km na qual eles pretendem concorrer.
H1 → A média do desempenho dos atletas do seu grupo de corrida mostra‑se diferente da média dos 
participantes na prova de 10 km na qual eles pretendem concorrer.
Novamente, imagine que você já tenha realizado a coleta dos seus dados e que os seguintes valores 
foram obtidos:
• média do desempenho dos atletas do seu grupo de corrida na prova de 10 km (± desvio‑padrão): 
41,3 ± 1,4 min;
• média dos participantes na prova de 10 km: 41,5 ± 4,6 min.
Nesse caso, a hipótese nula (H0) foi confirmada, pois, após aplicação do Teste t para uma amostra, 
não foi verificada diferença significativa entre a média do desempenho dos atletas do seu grupo de 
corrida quando comparado com a média dos participantes na referida prova de 10 km. Foi possível 
observar que as médias do desempenho dos dois grupos comparados foram muito semelhantes entre si. 
Dessa forma, o teste estatístico permitiu refutar a hipótese H1.
 Observação
O Teste t só deve ser utilizado para uma amostra quando o conjunto de 
dados apresenta distribuição normal. A opção não paramétrica corresponde 
aoTeste dos Sinais.
7.2 Teste t pareado
O Teste t pareado é utilizado em situações nas quais um mesmo grupo é avaliado em 
duas condições distintas, sendo que o objetivo é comparar essas duas médias entre si. Esse é 
um dos testes mais utilizados em Educação Física, pois frequentemente temos como objetivo 
avaliar o efeito de uma determinada forma de intervenção; por exemplo, uma determinada 
modalidade de treinamento. Dessa forma, usando o Teste t pareado conseguimos afirmar se 
uma variável (por exemplo, a força ou a flexibilidade) altera depois de um período ou uma 
sessão de treinamento.
98
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
Figura 59 – Sessão de treinamento de força, que pode ser 
utilizado como forma de intervenção em nossa área de atuação
Esse tipo de teste também necessita atender aos critérios de normalidade de distribuição para 
que possa ser aplicado. Assim, apenas dados paramétricos, ou seja, que tiveram sua normalidade de 
distribuição de dados confirmada, podem ser comparados usando o Teste t pareado. Para situações em 
que a normalidade for refutada, deve‑se utilizar uma das seguintes opções não paramétricas: Teste de 
Wilcoxon e Teste dos Sinais.
Outra condição fundamental para a aplicação do Teste t pareado é que a amostra dos dados nas 
duas condições a serem comparadas (antes e depois) deve ter o mesmo tamanho. Caso contrário, a 
relação de dependência ou pareamento será perdida.
Exemplificando, se na condição pré‑treinamento foi avaliada a força de dez indivíduos, na condição 
pós‑treinamento a força dessas mesmas dez pessoas deverá ser avaliada novamente, para que se 
estabeleça corretamente uma relação causa‑efeito. Com isso, conseguiríamos afirmar, por exemplo, que 
o treinamento (causa) gera um aumento de força (efeito).
 Lembrete
O Teste t pareado é utilizado nas situações em que um mesmo grupo é 
avaliado em duas condições distintas; por exemplo, condição pré e pós um 
treinamento.
Para ficar mais claro, vamos a dois exemplos de aplicação do Teste t pareado na área específica da 
Educação Física:
99
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
Figura 60 – Trabalhadores que podem ser acometidos por 
dor lombar em função do seu tipo de atividade laboral
Exemplo 1
Comparação da dor lombar para um grupo de trabalhadores que foi submetido a um período de 
ginástica laboral entre as condições pré e pós‑treinamento.
Para esse exemplo, formulamos as seguintes hipóteses:
H0 → A dor lombar, para o grupo de trabalhadores avaliados, mostra‑se semelhante antes e após um 
período de ginástica laboral.
H1 → A dor lombar, para o grupo de trabalhadores avaliados, mostra‑se diferente entre as condições 
pré e pós um período de ginástica laboral.
Nesse caso, obviamente o pesquisador procura investigar se o treinamento realizado na ginástica 
laboral mostra‑se efetivo para reduzir a dor lombar dos trabalhadores. O que ele espera é encontrar 
menores valores na condição pós‑treinamento. Dessa forma, deseja confirmar a hipótese alternativa 
(H1) a partir da utilização do Teste t pareado.
Figura 61 – Atividades físicas realizadas em meio líquido por indivíduos idosos
100
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
Exemplo 2
Comparação do desempenho de um grupo de pessoas idosas em testes funcionais antes e depois de 
um período de treinamento realizado em meio líquido.
A partir desse exemplo, formulam‑se as seguintes hipóteses:
H0 → O desempenho dos idosos avaliados nos testes funcionais é semelhante antes e após um 
período de treinamento realizado em meio líquido.
H1 → O desempenho dos idosos avaliados nos testes funcionais é diferente quando comparadas as 
condições pré e pós um período de treinamento realizado em meio líquido.
Nesse caso, o pesquisador tem por intuito investigar se o treinamento realizado em meio líquido é 
capaz de melhorar a funcionalidade de indivíduos idosos. Para tanto, o que ele possivelmente espera 
encontrar são maiores valores em testes de funcionalidade na condição pós‑treinamento. Dessa forma, 
o Teste t pareado permitiria‑lhe confirmar a hipótese alternativa (H1).
 Observação
Para aplicação Teste t pareado, é necessária a normalidade de 
distribuição nos dados e que a amostra dos dados tenha o mesmo tamanho 
nas condições pré e pós.
7.3 Teste t para amostras independentes
O Teste t para amostras independentes deve ser utilizado em situações em que se planeja comparar 
uma característica comum de dois grupos que são compostos por indivíduos diferentes (grupos são 
independentes).
Figura 62 – Imagem de uma prova de ciclismo, relacionada à pesquisa com objetivo intitulado Comparar
o consumo máximo de oxigênio (VO2max.) entre um grupo de ciclistas e um grupo de corredores
Dessa forma, pode‑se presumir que a condição fundamental para a aplicação desse teste é que os 
sujeitos de um grupo não estejam relacionados aos sujeitos de outro grupo.
101
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
Por exemplo, imagine que um pesquisador deseja comparar o consumo máximo de oxigênio 
(VO2max.) entre um grupo de ciclistas e um grupo de corredores. Entretanto, como um dos indivíduos 
avaliados é triatleta e participa dessas duas formas de treinamento, esse pesquisador decide colocar 
os valores de VO2max. desse sujeito nos dois grupos a serem comparados. Esse procedimento se 
mostra inadequado para a utilização do Teste t para amostras independentes, o que poderia conduzir 
o pesquisador a uma análise errônea e, consequentemente, levá‑lo a interpretações equivocadas a 
partir do seu conjunto de dados.
Para aplicação do Teste t para amostras independentes, é necessário, também, que os dados mostrem 
uma distribuição normal (normalidade aceita em teste realizado previamente). As opções não paramétricas 
que permitem comparações semelhantes são: Teste da Soma dos Ranks de Wilcoxon e Teste t.
 Lembrete
O Teste t para amostras independentes permite a comparação da média 
dos valores de um grupo com a média de valores de outro grupo compostos 
necessariamente por indivíduos diferentes.
Vamos a dois exemplos de aplicação do teste t apara amostras independentes.
Figura 63 – Imagem associada ao exemplo 1 explicitado a seguir, intitulado: Comparação
da altura de salto vertical obtida por uma amostra composta por jogadores de basquete com 
aquela obtida por uma amostra composta por lutadores de judô
Exemplo 1
Comparação da altura de salto vertical obtida por uma amostra composta por jogadores de basquete 
com aquela obtida por uma amostra composta por lutadores de judô.
102
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
A partir desse exemplo, formulam‑se as seguintes hipóteses:
H0 → a altura de salto vertical é semelhante entre jogadores de basquete e lutadores de judô.
H1 → a altura de salto verticalé diferente entre jogadores de basquete e lutadores de judô.
O objetivo dessa comparação é investigar se participantes de modalidades esportivas distintas 
(jogadores de basquete e lutadores de judô) possuem desempenho diferente no teste que determina 
a altura máxima de salto vertical. Imagina‑se que, nessa condição, o pesquisador espere encontrar 
jogadores de basquete que atinjam uma altura de salto significativamente superior aos lutadores de 
judô, em função da característica específica de cada modalidade. Se isso ocorrer, a hipótese alternativa 
(H1) será confirmada.
Figura 64 – Imagem associada ao exemplo 2 explicitado a seguir, intitulado: Comparação 
da força máxima do grupo muscular do quadríceps de atletas halterofilistas com atletas jogadores de futebol
Exemplo 2
Comparação da força máxima do grupo muscular do quadríceps de atletas halterofilistas com atletas 
jogadores de futebol.
Para esse exemplo, são formuladas as seguintes hipóteses:
H0 → A força máxima do grupo muscular do quadríceps é semelhante entre atletas halterofilistas e 
atletas jogadores de futebol.
H1 → A força máxima do grupo muscular do quadríceps mostra‑se diferente entre atletas 
halterofilistas e atletas jogadores de futebol.
A finalidade desse estudo é investigar se a capacidade de produzir força máxima mostra‑se diferente 
entre grupos distintos de atletas: halterofilistas e jogadores de futebol. Acredita‑se que, como esses 
atletas utilizam tipos diferentes de força em suas modalidades, o pesquisador deve imaginar que os 
atletas halterofilistas produzirão maior força máxima quando comparados aos atletas jogadores de 
futebol. Dessa forma, a hipótese alternativa (H1) seria confirmada.
103
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
 Lembrete
Para aplicação do Teste t para amostras independentes é necessária 
normalidade de distribuição dos dados. As opções não paramétricas são: 
Teste da Soma dos Ranks de Wilcoxon e Teste t.
8 OUTROS TESTES ESTATÍSTICOS
Basicamente, tratamos até aqui de situações em que dois grupos de dados são comparados entre si. 
Entretanto, como devemos proceder quando queremos comparar simultaneamente mais de dois grupos 
de dados entre si? E como fazemos para avaliar as proporções entre dois grupos de dados para analisar 
se existe alguma relação entre o comportamento desses dados?
Para responder a essas questões, vamos agora discutir mais alguns tipos de testes estatísticos.
8.1 Teste de Anova
O teste de análise de variância, conhecido também como Anova, deve ser empregado em uma 
pesquisa em que o objetivo seja estabelecer a comparação de mais de dois grupos simultaneamente.
Imagine que tenhamos uma condição em que uma variável quantitativa deverá ser comparada entre 
quatro grupos distintos. O pesquisador poderia utilizar vários testes t entre os grupos para compará‑los 
dois a dois. Contudo, esse procedimento mostra‑se estatisticamente inadequado, pois aumenta o erro de 
se concluir inapropriadamente que existe diferença entre as médias. Isso significa que de forma errada 
esse pesquisador poderia concluir que existe diferença entre dois grupos quando, na verdade, não há.
Por isso, o procedimento correto consiste em usar o Teste de Anova, o que possibilita comparar 
mais de duas médias de um experimento em um único teste. Com isso, torna‑se possível identificarmos 
as diferenças entre os grupos (se essas existirem), mantendo o adequado controle sobre o nível de 
significância do teste.
O Teste de Anova permite atribuir as possíveis diferenças encontradas a causas ou fontes de variação 
diferentes. O número de causas de variação ou fatores dependerá dos objetivos de cada estudo. Quando 
esse teste apresenta apenas uma fonte de variação, ele é conhecido como Anova one‑way, ou Anova de 
um fator; quando o teste apresenta duas fontes de variação, ele é conhecido como Anova two‑way (ou 
Anova de dois fatores).
A Anova de um fator apresenta apenas uma causa de variação. Já na Anova de dois fatores, as 
variáveis são divididas em dois blocos, sendo que cada bloco representa um conjunto de unidades 
experimentais homogêneas entre si. A grande vantagem desse tipo de teste é que os efeitos existentes 
em diferentes blocos podem ser separados entre si, ou seja, aplicando‑se apenas um teste estatístico 
podemos explicar efeitos de fatores diferentes.
104
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
 Lembrete
O teste de análise de variância (Anova) deve ser utilizado em estudos 
quando o objetivo é estabelecer uma comparação de mais de dois grupos 
simultaneamente.
Um experimento pode conter um ou mais fatores com diferentes níveis. Os níveis de um fator 
representam as características diferentes deste. Assim, o procedimento estatístico detecta qual a 
influência desses fatores na variação dos grupos analisados, ou seja, identifica qual fator (ou quais 
fatores) são as possíveis causas de variação observada.
Para ficar mais claro, vamos a um exemplo prático de aplicação dos conceitos de fatores e de níveis 
no teste de Anova.
Figura 65 – Imagem associada ao exemplo de aplicação do 
 teste de Anova com o objetivo de comparar a estatura de 
indivíduos do gênero feminino e masculino com diferentes 
níveis de escolaridade: Ensino Médio, graduação e pós‑graduação
Imagine que você deseja comparar a estatura de indivíduos do gênero feminino e masculino com 
diferentes níveis de escolaridade: Ensino Médio, graduação e pós‑graduação. Nesse exemplo, o gênero 
é um fator com dois níveis: masculino e feminino. O nível de escolaridade pode ser considerado outro 
fator, com três níveis: Ensino Médio, graduação e pós‑graduação. Os dados hipotéticos desse caso são 
apresentados na tabela 12.
105
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
Tabela 12 – Dados correspondentes à estatura em metros de estudantes de Ensino Médio, 
graduação e pós‑graduação, do sexo masculino e feminino
Estatura
Nível de escolaridade
Ensino Médio Graduação Pós-graduação
Gênero
Masculino 1,78 ± 0,8 m 1,8 ± 0,7 m 1,79 ± 1,0 m
Feminino 1,62 ± 0,6 m 1,65 ± 0,8 m 1,64 ± 0,7 m
A aplicação de um teste de Anova de dois fatores nos dados da tabela 12 permitiria verificar que os 
alunos do gênero masculino são estatisticamente mais altos que os alunos do sexo feminino. Todavia, 
possivelmente não seriam encontradas diferenças significativas em função do fator nível de escolaridade.
Dessa forma, a Anova permite a comparação simultânea de dados que são influenciados por 
diferentes fatores, em diferentes níveis.
 Observação
Os testes de Anova devem ser aplicados em dados de distribuição 
normal, e as comparações podem ser do tipo Anova one‑way (um fator) ou 
Anova two‑way (dois fatores).
 Para que o teste de Anova possa ser adequadamente empregado, torna‑se necessário cumprir 
alguns pressupostos, tais como:
• os dados devem apresentar distribuição normal;
• as variações amostrais devem ser semelhantes nas diferentes amostras dos grupos;
• o tamanho das amostras dos grupos necessita ser semelhante;
• considerar o fato que quanto maior a amostra, mais confiáveis serão os resultados obtidos nesse 
tipo de teste.
Vamos a um exemplo prático de aplicação do teste de Anova de um fator. Imagine que você 
desejaavaliar um grupo de indivíduos que foi submetido à prática de seis meses de treinamento 
de pilates. De acordo com os objetivos do seu estudo, você fará avaliação da flexibilidade desses 
praticantes na condição inicial (antes de começar o treinamento), após dois meses, quatro meses 
e seis meses.
106
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
Figura 66 – Imagem associada ao exemplo de aplicação do teste de Anova 
com objetivo avaliar um grupo de indivíduos submetido à prática de 
seis meses de treinamento de pilates. Será realizada avaliação da flexibilidade 
desses praticantes na condição inicial (antes de começar o treinamento), 
após dois meses, quatro meses e seis meses
Nesse exemplo, nós temos apenas um fator (prática de uma modalidade) com quatro diferentes 
níveis de comparação (a cada dois meses).
Para esse exemplo, são formuladas as seguintes hipóteses:
H0 → A flexibilidade é semelhante ao longo do tempo de prática de treinamento de pilates.
H1 → A flexibilidade é diferente ao longo do tempo de prática de treinamento de pilates.
Assim, o teste de Anova nos permite verificar se todas as condições foram diferentes entre 
si ou se as diferenças podem ser observadas apenas entre algumas das condições testadas. 
Hipoteticamente, aplicando o teste de Anova no exemplo anterior, poderíamos encontrar diferença 
nos valores de flexibilidade entre a condição inicial e após seis meses de treinamento. Contudo, 
poderíamos verificar que entre as demais condições testadas não foram observadas diferenças 
significativas. Nesse caso, a hipótese alternativa (H1) foi confirmada, mas apenas uma diferença 
significativa foi verificada.
107
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
8.2 Teste de Friedman
O Teste de Friedman deve ser utilizado para comparar os resultados de três ou mais amostras, quando 
a normalidade de distribuição de dados não for confirmada. Podemos afirmar, então, que o teste de 
Friedman é uma alternativa não paramétrica correspondente à Anova.
Esse teste ordena os resultados para cada um dos casos e depois calcula a média das ordens para 
cada amostra. Assim, se não existem diferenças entre as amostras, as suas médias das ordens devem ser 
similares.
Vamos a um exemplo prático de aplicação do teste Friedman, pressupondo que a normalidade de 
distribuição dos dados tenha sido previamente rejeitada nessa condição.
Figura 67 – Imagem associada ao exemplo de aplicação do 
Teste de Friedman com o objetivo de comparar a ativação de diferentes 
músculos do membro inferior durante dez passadas de corrida
Imagine que um pesquisador deseje comparar a ativação de diferentes músculos do membro inferior 
durante dez passadas de corrida. A ativação dos diferentes músculos é apresentada na figura 68.
A partir dessa situação, formulam‑se as seguintes hipóteses:
H0 → A ativação dos diferentes músculos é semelhante durante a corrida.
H1 → A ativação dos diferentes músculos é diferente durante a corrida.
108
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
RF
VL
BF
IC
VM
TA
Time
GL
Figura 68 – Ativação de diferentes músculos do membro inferior ao longo do tempo 
correspondente a dez passadas: Reto Femoral (RF); Ílio costal (IC); Vasto Lateral (VL); 
Vasto Medial (VM); Biceps Femoral (BF); Tibial Anterior (TA); Gastrocnêmio Lateral (GL).
Novamente, temos a possibilidade de encontrar diferenças entre apenas dois músculos ou diferenças 
entre vários músculos simultaneamente. De qualquer forma, sempre que alguma diferença for verificada, 
afirma‑se que a hipótese alternativa (H1) foi confirmada.
 Lembrete
O teste de Friedman é uma alternativa não paramétrica correspondente 
à Anova. Esse teste também permite comparar os resultados de três ou 
mais amostras simultaneamente.
8.3 Teste de Correlação
Muitas vezes, gostaríamos de saber quanto uma variável depende de outra, por exemplo, 
quanto um céu nublado serve como indicador de chuva, quanto um piso molhado indica que 
ele está mais escorregadio ou quanto a circunferência do braço de uma pessoa serve como 
indicador de força. É para estabelecer essas relações que existe a ferramenta conhecida como 
correlação simples.
109
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
Figura 69 – Imagem da circunferência de braço utilizada como 
parâmetro de análise de medidas antropométricas; 
geralmente essa medida é correlacionada com a força
A Correlação Simples investiga em que grau se relaciona duas variáveis, ques podem ou não estar 
associadas. Quando duas variáveis apresentam alguma relação entre si, isso significa que a variação 
nessa característica afeta outra característica do sujeito.
Por exemplo, quanto mais avançada for a idade de uma pessoa, maior a tendência dessa pessoa em 
apresentar um percentual de gordura maior. Portanto, a correlação simples analisa a interferência de 
uma variável (dependente) sobre outra variável (independente).
Poderíamos querer saber qual o efeito do tempo de fumo (variável independente) sobre a pressão 
arterial, a captação máxima de oxigênio ou o percentual de gordura (variável dependente). Vela notar 
que esta é apenas uma tendência de resposta, não significa necessariamente que uma pessoa de 40 
anos terá sempre um percentual de gordura maior que uma pessoa de 20 anos.
 Observação
Diagrama de dispersão é um gráfico no qual os escores de cada sujeito 
da amostra são plotados na relação entre as duas variáveis de análise.
Observe a figura 70 para mais um exemplo. Esse gráfico se chama diagrama de dispersão. Neste, 
duas variáveis foram registradas de uma amostra: estatura e salto em distância sem corrida. Isso significa 
que cada ponto no gráfico representa os valores de estatura e se salto em distância dos indivíduos da 
amostra.
Com esses dois valores em mãos, cria‑se um gráfico posicionando os pontos representantes de cada 
sujeito na posição correspondente aos valores coletados de estatura e distância de salto. É possível notar 
uma distribuição característica nos resultados dos dados que nos indica que pode haver uma correlação 
entre essas duas variáveis.
110
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
Nota‑se uma tendência de distâncias maiores de salto quanto maior a estatura dos sujeitos. Essa 
tendência de resposta não implica em certeza. Não se pode afirmar que uma pessoa, por ter a estatura 
de 1,80 m, saltará mais baixo que uma de 1,90 m, mas permite criar essa expectativa.
7'0"
6'3"
5'6"
4'9"
6'9"
6'0"
5'3"
4'6"
6'6"
5'9"
5'0"
4'3"
4'0"
5'0" 5'8"5'4" 6'0"5'2" 5'10"5'6"
Estrutura
Sa
lto
 e
m
 d
ist
ân
ci
a 
se
m
 c
or
rid
a
5'1" 5'9"5'5"5'3" 5'11"5'7"
Figura 70 – Relação entre estatura e salto em distância sem corrida prévia
A correlação pode ser quantificadapelo coeficiente de correlação de Pearson (r), que 
é uma medida quantitativa, um número, que expressa a relação entre as variáveis analisadas 
(independentes e dependentes). A relação entre duas variáveis, portanto, pode apresentar 
diferentes níveis de associação. O valor do coeficiente de correlação pode variar de 0,0 (zero) a 
1,0 (um).
Quanto maior o valor da correlação, maior o grau de dependência entre as variáveis. Dessa 
forma, quando o valor do coeficiente é 1,0, isso indica uma correlação perfeita, e o valor de 
coeficiente de correlação igual a 0,0 (zero) indica que não existe nenhuma correlação entre as 
variáveis.
111
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
 Observação
Coeficiente de correlação → número que expressa grau de relação 
entre duas ou mais variáveis.
Por outro lado, quanto menor for o valor da correlação (r), significa que pode existir certa associação, 
mas que outras variáveis também interferem na associação. O valor da correlação ser tão baixo indica 
que ele se aproxima de zero, apontando que não há relação entre as duas variáveis, ou seja, o aumento 
ou a diminuição no valor da variável. Por exemplo, a cor dos olhos de uma pessoa não apresenta 
nenhuma relação com o percentual de gordura do sujeito.
O coeficiente de correlação ainda pode apresentar valores positivos e negativos, o que significa que 
ele pode apresentar de ‑1,0 a 1,0.
É possível que a associação seja inversa, ou seja, o aumento no valor de uma variável pode estar 
associado à diminuição no valor de outra variável. Nesse sentido, o valor da correlação também 
é alto, mas com valores negativos, aproximando‑se de ‑1,0. Em casos de valores de correlação 
próximos de 1,0, classifica‑se a correlação como positiva. Já em situações nas quais são próximos 
de ‑1,0, considera‑se que o aumento no valor de uma variável induz à diminuição no valor de outra 
variável. Portanto, os valores de correlação positiva e negativa indicam que a correlação pode ser 
positiva ou negativa.
 Observação
Correlação positiva → valores maiores que zero e próximos de 1,0.
Sem correlação → valores próximos de zero.
Correlação negativa → valores menores que zero e próximos de ‑1,0.
A correlação positiva existe quando duas variáveis, por exemplo, apresentam uma relação 
direta, ou seja, valores de correlação maiores em uma variável induzem a valores maiores na outra 
variável. Nessa condição, o valor da correlação é maior que 0,0 (zero) e menor ou igual a 1,0 (um). 
Um coeficiente de correlação com valor igual a 1,0 indica uma correlação positiva perfeita, ou 
seja, uma relação perfeita de dependência entre as variáveis de análise. Uma correlação perfeita é 
raramente observada, pois na natureza normalmente há muitas variáveis que interferem na relação 
entre duas variáveis.
112
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
Figura 71 – Prática de futebol, que é correlacionada no 
exemplo a seguir com a densidade mineral óssea
Vejamos um exemplo extraído de um artigo numa situação real (figura 72). Karlsson et al. (2001) investigaram 
a densidade mineral óssea de várias regiões do corpo, dentre elas a densidade óssea do colo do fêmur. A densidade 
óssea indica a quantidade de cristais de cálcio, em gramas, por unidade de área de osso (cm2).
A figura 72 ilustra a distribuição de dados da densidade óssea em função das horas de treino de 
jogadores de futebol por semana. Cada ponto representa os escores de cada um dos jogadores da 
amostra. O coeficiente de correlação entre essas duas variáveis é de r = 0,40. Observa‑se uma tendência 
de maior densidade óssea do colo do fêmur com a maior quantidade de horas de treino por semana, que 
pode ser notada nas duas retas apresentadas entre os dados e são usadas para predizer os resultados 
em situações que não foram medidas ou observadas e também indicam que a relação entre as variáveis 
muda em função da quantidade de horas de treino por semana.
As retas observadas na figura 72 são obtidas por uma ferramenta estatística conhecida como 
regressão linear, que será discutida mais adiante.
1,0
1,2
1,4
1,6
Densidade óssea de colo do fêmur X nível de atividadeg/cm2
horas de treino / semana
Figura 72 – Coeficiente de correlação entre a densidade óssea do colo do fêmur e as horas de treinamento por semana (r = 0,40). Em 
bolas pretas, praticantes de futebol com volume de treino inferior a 6 horas semanais; e, em bolas brancas, superior a 6 horas
113
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
BIOESTATÍSTICA
Um coeficiente de correlação positiva, por exemplo, pode apresentar vários valores diversos entre 
0,0 e 1,0. Não existe um único valor que possa ser considerado como suficientemente alto para que 
a correlação positiva seja considerada válida. Cada variável apresenta um valor diferente para que a 
correlação entre elas exista.
Para saber a partir de qual valor de coeficiente de correlação a relação de dependência entre as 
variáveis é significativa, ou seja, pode ser considerada como existente entre as variáveis, usa‑se um 
critério estatístico de significância, indicada pela letra p. Essa análise envolve o uso de uma tabela que 
leva em consideração a quantidade de valores apresentados.
A partir dessa tabela, é possível saber se o valor do coeficiente de correlação é suficiente 
para considerar que existe correlação ou não. Como já discutido, geralmente é usado um nível 
de significância de 0,05 ou 0,01. Nota‑se que quanto maior o número de dados (sujeitos), menor 
o valor de coeficiente de correlação que pode ser considerado significativo. Ou seja, com maior 
número de sujeitos há mais dados que permitem tecer correlações, e, assim, um valor menor de 
coeficiente pode ser considerado suficiente para afirmar que há correlação positiva ou negativa 
entre as variáveis.
 Observação
Significância → indica quanto os resultados obtidos são confiáveis, até 
que ponto se podem esperar resultados semelhantes caso a análise seja 
refeita.
Vejamos um exemplo simplificado de como a tabela 13 pode ser usada para determinar o coeficiente 
mínimo para que se tenha uma significância que permita afirmar que existe correlação entre duas 
variáveis. Para usar a tabela, sugerimos seguir os seguintes passos:
1. Escolher um nível de significância: os níveis de significância mais usados são de 0,05 ou 0,01. 
Ambos são aceitos, mas 0,01 atribui maior confiança à correlação.
2. Ler a tabela de acordo com os graus de liberdade (gl) dos seus dados: o grau de liberdade, para um 
coeficiente de correlação, é obtido a partir do número de sujeitos ou número de pares de escores 
(N), por exemplo. A fórmula para os graus de liberdade é:
gl = N - 2
em que:
gl: graus de liberdade
N: número de sujeitos
114
Unidade II
Re
vi
sã
o:
 C
ar
la
 -
 D
ia
gr
am
aç
ão
: M
ár
ci
o 
- 
22
/0
2/
20
13
 -
||
- 
2ª
 R
ev
isã
o 
Lu
an
e 
- 
co
rr
eç
ão
: F
ab
io
 -
 1
8/
03
/1
3
Para o nosso exemplo, vamos supor a situação da análise da correlação entre a estatura e o 
comprimento de passada na corrida para uma determinada velocidade. Primeiro, gostaríamos de deixar 
claro que os valores aqui apresentados são fictícios e criados

Outros materiais