Buscar

[cliqueapostilas com br]-bioestatistica-i

Prévia do material em texto

1
Unidade II
BIOESTATÍSTICA
Profa. Dra. Carina Helena Wasem Fraga.
Conteúdos desta unidade
� Análise na distribuição dos dados: 
avaliação da normalidade.
� Análise e interpretação dos resultados 
dos seguintes testes:
� Teste t para uma amostra.
� Teste t pareado.
� Teste t para amostras independentes.
� Teste de ANOVA.
� Teste de Friedman.
� Teste de correlação.
� Teste de regressão linear.
Distribuição normal (Gauss)
Características:
� distribuição característica de variáveis 
biológicas.
� distribuição normal não significa que 
ocorra apenas em pessoas sadias.
� maior frequência em valores centrais e 
menor incidência em valores baixos e 
altos
PASQUALI (2007)
Distribuição normal (Gauss)
� Indica a probabilidade de ocorrência de 
um evento numa população.
� Exemplo: qual a probabilidade de uma 
pessoa apresentar um valor de 
hemoglobina entre 14,5 e 15,5? 
� Frequência de ocorrência 24%.
CALLEGARI-JACQUES, 2003
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
2
Distribuição normal (Gauss)
Propriedades:
� apresenta o formato de um sino.
� a curva é simétrica em torno da média.
CALLEGARI-JACQUES, 2003
Distribuição normal (Gauss)
� A média, a mediana e a moda coincidem.
� A média e o DP são representativos de 
dados de distribuição normal.
� A curva apresenta 2 pontos de inflexão: 
média somada e subtraída ao DP.
Distribuição normal (Gauss)
� Área total sob a curva totaliza 100%.
� Área entre pontos de inflexão representa 
aproximadamente 68% (2/3) dos valores.
CALLEGARI-JACQUES, 2003
Distribuição normal (Gauss)
O gráfico mostra distribuição normal 
rigorosamente simétrica, que tem como 
característica englobar 99,73% das 
ocorrências no intervalo entre a média ± 3 
DP.
Fonte: UFRGS
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
3
Distribuição normal na prática
� Distribuição normal é uma curva teórica: 
tentativa de encaixar histogramas 
parecidos com a curva normal.
� Existem inúmeras variáveis de 
distribuição assimétrica ou descontínua 
que não apresentam curva normal de 
distribuição dos dados.
� Identificar se os dados apresentam uma 
distribuição normal é importante para a 
determinação dos tipos de testes 
estatísticos a serem empregados.
Distribuição normal na prática
� Distribuição normal →→→→ testes 
paramétricos (apresentam maior poder 
estatístico).
PASQUALI (2007)
Distribuição normal na prática
� Distribuição não-normal →→→→ testes 
não-paramétricos.
� Dificilmente os dados apresentarão uma 
distribuição normal perfeita, por isso 
determina-se a normalidade dos dados 
por meio dos testes de normalidade.
CALLEGARI-JACQUES, 2003
(a) Assimetria positiva ou esquerda (b) Assimetria negativa ou direita
Testes de normalidade
� Testes de normalidade averiguam a 
assimetria da curva de dados em relação 
à curva normal.
CALLEGARI-JACQUES, 2003
Curva normal 
sobreposta
ao histograma 
indicando a
distribuição que os 
dados deveriam 
apresentar para 
atender aos 
pressupostos 
de normalidade
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
4
Testes de normalidade
� Realizada a partir das medidas de 
assimetrias e curtoses (achatamentos)
� Pode-se utilizar diversos pacotes 
estatísticos.
� Teste de Shapiro – Wilk: conjunto de até 
50 observações.
� Teste de Kolmogorov Smirnov demais 
situações.
� Nível de significância é inferior ao 
estabelecido (geralmente 0,05), rejeita-se 
a normalidade.
CALLEGARI-JACQUES, 2003
Interatividade 
São exemplos de curvas normais:
a) A, B, C e D
b) Apenas C
c) Apenas A e C
d) A, B e C
e) Apenas D
Resposta
� Alternativa “d”
A curva normal é unimodal (apenas 1 pico) 
e simétrica (idêntica em ambos os lados da 
média). Mas pode ter diferentes níveis de 
curtoses: platicúrtica (A), leptocúrtica (B) e 
mesocúrtica (C).
Teste estatísticos
BARROS e REIS , 2003
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
5
Formulando hipóteses
� A hipótese é o resultado esperado.
� Ao elaborar um procedimento 
experimental para um estudo, 
geralmente há uma idéia de qual será o 
resultado.
� O resultado esperado é elaborado com 
base na revisão de literatura feita 
previamente.
� A hipótese deve ser formulada de 
maneira que possa ser aceita ou 
refutada.
Formulando hipóteses
� Duas hipóteses são formuladas: a 
hipótese alternativa (H1) e a hipótese 
nula (H0).
� A hipótese alternativa é o resultado 
esperado pelo experimento que irá ser 
conduzido.
� A hipótese nula é usada na análise 
estatística e considera que não há 
diferença entre os tratamentos ou 
relação entre as variáveis analisadas.
Teste t para uma amostra
� Situações em que características de um 
único grupo precisam ser comparadas 
com um valor de referência. 
� Desenvolvido para comparar duas 
médias em um experimento.
� Necessita atender aos critérios de 
normalidade de distribuição.
Teste t para uma amostra
Exemplo 1: Comparação entre a média de 
desempenho dos alunos do curso de 
Graduação em Educação no teste de 12 
minutos, em relação à média esperada para 
a faixa etária na população.
A hipótese estatística a ser formulada é:
� H0 →→→→ A média dos resultados no grupo 
avaliado é semelhante à média do 
referencial estipulado.
� H1 →→→→ A média dos resultados no grupo 
avaliado não é igual a média do 
referencial estipulado.
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
6
Teste t para uma amostra
Exemplo 2: Comparação entre a média 
nacional de desempenho dos alunos de 
graduação do curso de Educação Física, 
com a média de desempenho dos alunos e 
Educação Física da UNIP, que estejam 
cursando o último ano.
� Média dos alunos da UNIP: 9,63 ± 0,7.
� Média nacional: 8,20 ± 0,9.
� Neste caso, a hipótese alternativa (H1) foi 
confirmada pois após aplicação do teste 
foi verificada diferença entre a média dos 
alunos da UNIP e média nacional.
Teste t pareado
� Situações nas quais um mesmo grupo é 
avaliado em 2 condições e o objetivo é 
comparar estas 2 médias entre si.
� Necessita atender aos critérios de 
normalidade de distribuição.
� Condição fundamental: a amostra de 
dados nas duas condições (antes e 
depois) deve ter o mesmo tamanho, caso 
contrário, a relação de dependência ou 
pareamento será perdida.
Teste t pareado
� Exemplo 1: Um grupo de trabalhadores 
foi submetido a um período de 
treinamento e de ginástica laboral e 
objetiva-se analisar alguma condição 
pré- e pós-treinamento.
� Exemplo 2: Um grupo de pessoas idosas 
foi submetido a uma série de testes nos 
quais foram avaliados em sua condição 
física e posteriormente submetidos a um 
período de treinamento para melhorar as 
capacidades físicas, para depois 
novamente serem reavaliados.
Teste t pareado
� Nos 2 exemplos anteriormente citados, 
os grupos terão seus desempenhos 
comparados antes e depois do período 
de treinamento para investigar se houve 
diferença nos resultados e se essa 
diferença foi estatisticamente diferente.
� Uma forma de análise é observar 
diferença das médias pré e pós 
tratamento. Se os dois conjuntos de 
médias forem iguais, então a diferença 
(subtração das médias) será igual a zero.
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
7
Interatividade 
Um grupo de trabalhadores submetido a um 
período de exercícios de alongamento 
aumentou significativamente os valores de 
flexibilidade entre a condição pré e pós-
treinamento.
a) Pode-se concluir esse resultado 
calculando o CV;
b) O valor do DP é o mais importante para 
esse cálculo;
c) O teste de normalidade assegura o 
cálculo dessa diferença;
d) O teste mais indicado é o teste t para 
uma amostra;
e) O teste mais indicado é o teste t 
pareado;
Resposta
� Alternativa “e”.
Para comparar os valores correspondentes 
ao desempenho em teste de flexibilidade de 
um mesmo grupo antes e depois de um 
período de treinamento, o teste mais 
indicado é o teste t pareado.
Condições:
� amostra de dados nas duas situações 
(antes e depois) deve ter o mesmo 
tamanho.� distribuição de dados normal.
Teste t para amostras 
independentes
� Utilizado em situações de comparação 
de uma característica comum de dois 
grupos que são compostos por 
indivíduos diferentes (grupos são 
independentes).
� Os sujeitos de um grupo não devem 
estar relacionados aos sujeitos de outro 
grupo.
� Comparação da média dos valores de um 
grupo com a média de valores de outro 
grupo.
Teste t para amostras 
independentes
� Aplicável em grupos cuja distribuição 
dos dados seja suficientemente parecida 
a uma curva normal.
� Exemplo 1: Comparação da altura de 
salto vertical de uma amostra composta 
por jogadores de basquete com uma 
amostra composta por lutadores de judô.
� Exemplo 2: Comparação da força 
máxima do grupo muscular quadríceps 
de atletas halterofilistas com atletas 
jogadores de futebol.
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
8
Análise de Variância (ANOVA)
� Numa situação de comparação de 4 
grupos com relação a uma variável 
quantitativa, poderiam ser usados vários 
testes t entre os grupos para compará-
los dois a dois.
� Realizar este procedimento seria 
inadequado estatisticamente, pois 
aumenta o erro de se concluir 
inadequadamente que existe diferença 
entre as médias.
� Por isso, o procedimento correto 
consistiria em usar uma técnica 
chamada Análise de Variância.
Análise de Variância (ANOVA)
� Método para comparar mais de duas 
médias de um experimento em um único 
teste.
� Identifica diferenças entre os grupos, 
mantendo controle sobre o nível de 
significância do teste.
� Cada possível causa de variação é 
chamada de fator.
� Um experimento pode conter um ou mais 
fatores, com diferentes níveis.
Análise de Variância (ANOVA)
� Os níveis de um fator representam as 
características diferentes deste fator.
� O procedimento detecta qual a influência 
destes fatores na variação dos grupos 
analisados, ou seja, identifica qual ou 
quais fatores são as possíveis causas de 
variação observada.
� Ex: gênero é um fator, com dois níveis, 
masculino e feminino. Nível de 
escolaridade poderia ser outro fator, com 
três níveis, ensino médio, graduação e 
pós-graduação.
Análise de Variância (ANOVA)
� Tabela ilustrativa da estatura (metros) de 
estudantes de ensino médio, graduação 
e pós-graduação, do sexo masculino e 
feminino. Os alunos do sexo masculino 
são estatisticamente mais altos que os 
alunos do sexo feminino, mas o fator 
nível de escolaridade não mostrou 
diferenças significativas.
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
9
Considerações que permitem o uso 
da ANOVA
� Os dados devem apresentar distribuição 
normal.
� Variações amostrais semelhantes nas 
diferentes amostras dos grupos.
� Tamanho das amostras dos grupos 
necessitam ser semelhantes.
� Mais confiável com grandes amostras.
Teste de Friedman
� Utilizado para comparar os resultados de 
três ou mais amostras.
� Teste não paramétrico correspondente à 
ANOVA para medidas repetidas.
� Este teste ordena os resultados para 
cada um dos casos e depois calcula a 
média das ordens para cada amostra.
� Se não existem diferenças entre as 
amostras, as suas médias das ordens 
devem ser similares.
Interatividade 
A partir da aplicação da ANOVA os dados 
abaixo mostraram diferença entre os gêneros, 
mas não entre a escolaridade. O que isso 
significa?
a) O fator gênero foi determinante para as 
diferenças observadas;
b) A escolaridade é um nível e o gênero é um 
fator;
c) O fator gênero não é importante;
d) O fator escolaridade foi mais importante;
e) Gênero e escolaridade são níveis.
Resposta
a) o fator gênero foi determinante para as 
diferenças observadas.
b) a escolaridade e o gênero são fatores.
c) o fator gênero É importante.
d) o fator escolaridade NÃO foi mais 
importante.
e) Gênero e escolaridade são FATORES, E 
NÃO níveis.
� Alternativa “a”.
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
10
Correlação
� É usada para avaliar se existe 
associação entre duas variáveis numa 
determinada amostra.
� Se a variação no resultado de uma das 
variáveis afeta de forma específica o 
resultado da outra variável, as variáveis 
estão correlacionadas.
� Diagrama de dispersão: avalia a 
correlação entre duas variáveis. 
Correlação
� Para cada indivíduo o valor de uma 
variável é apresentado em relação ao 
valor da outra variável. 
� Exemplo 1: impulsão vertical X 
circunferência da coxa.
Correlação
� Exemplo 2: número de horas de estudo X 
nota obtida na prova.
� Pelo exemplo, o número de horas será 
apresentado no eixo de X e a nota da 
prova será apresentada no eixo de Y.
� A correlação pode ser avaliada 
quantitativamente por meio do 
coeficiente de correlação de Pearson.
� O coeficiente de correlação indica a 
intensidade de associação existente 
entre duas variáveis. O símbolo para 
representar o coeficiente é a letra r.
Correlação
� O coeficiente de correlação pode variar 
de -1 a +1.
� Valores negativos indicam uma 
correlação inversa.
� Valores positivos indicam uma 
correlação direta.
� O valor numérico do coeficiente indica 
quão forte é a correlação:
1) 1 correlação perfeita.
2) acima 0.70 indica uma forte correlação.
3) 0.30 a 0.7 indica correlação moderada.
4) 0 a 0.30 fraca correlação.
5) 0 indica correlação nula
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
11
Regressão linear simples
� Na regressão, é considerado que o 
comportamento de uma variável Y 
depende das mudanças ocorridas em 
outra variável x.
� O comportamento de dependência pode 
ser representado por uma linha chamada 
de linha de regressão.
� A linha de regressão expressa o 
comportamento esperado de uma 
variável em função de outra, e se 
encontra na menor distância possível de 
cada um dos pontos no diagrama de 
dispersão. 
Regressão linear simples
� Exemplo: numa piscina com 15 pessoas 
aleatoriamente paradas, a linha de 
regressão representaria a corda de uma 
bóia que seria arremessada na piscina à 
menor distância possível de cada 
banhista.
BARROS e REIS , 2003
Interatividade 
Em qual dos gráficos apresentados a seguir 
encontra-se uma correlação classificada como 
moderada?
a) figuras a; b b) figura e c) figura a 
d) figuras d; e e) figura d
BARROS e REIS , 2003
r = 1
r = -1 r = 0
r = 0,8 r = 0,6 r = 0
Resposta
� Alternativa “b”
a. correção perfeita direta
b. correlação perfeita inversa
c. correlação nula
d. correlação forte direta
e. correlação moderada direta
f. correlação nula 
r = 1
r = -1 r = 0
r = 0,8 r = 0,6 r = 0
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
12
ATÉ A PRÓXIMA!
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br