Prévia do material em texto
1 Unidade II BIOESTATÍSTICA Profa. Dra. Carina Helena Wasem Fraga. Conteúdos desta unidade � Análise na distribuição dos dados: avaliação da normalidade. � Análise e interpretação dos resultados dos seguintes testes: � Teste t para uma amostra. � Teste t pareado. � Teste t para amostras independentes. � Teste de ANOVA. � Teste de Friedman. � Teste de correlação. � Teste de regressão linear. Distribuição normal (Gauss) Características: � distribuição característica de variáveis biológicas. � distribuição normal não significa que ocorra apenas em pessoas sadias. � maior frequência em valores centrais e menor incidência em valores baixos e altos PASQUALI (2007) Distribuição normal (Gauss) � Indica a probabilidade de ocorrência de um evento numa população. � Exemplo: qual a probabilidade de uma pessoa apresentar um valor de hemoglobina entre 14,5 e 15,5? � Frequência de ocorrência 24%. CALLEGARI-JACQUES, 2003 www.cliqueapostilas.com.br http://www.cliqueapostilas.com.br 2 Distribuição normal (Gauss) Propriedades: � apresenta o formato de um sino. � a curva é simétrica em torno da média. CALLEGARI-JACQUES, 2003 Distribuição normal (Gauss) � A média, a mediana e a moda coincidem. � A média e o DP são representativos de dados de distribuição normal. � A curva apresenta 2 pontos de inflexão: média somada e subtraída ao DP. Distribuição normal (Gauss) � Área total sob a curva totaliza 100%. � Área entre pontos de inflexão representa aproximadamente 68% (2/3) dos valores. CALLEGARI-JACQUES, 2003 Distribuição normal (Gauss) O gráfico mostra distribuição normal rigorosamente simétrica, que tem como característica englobar 99,73% das ocorrências no intervalo entre a média ± 3 DP. Fonte: UFRGS www.cliqueapostilas.com.br http://www.cliqueapostilas.com.br 3 Distribuição normal na prática � Distribuição normal é uma curva teórica: tentativa de encaixar histogramas parecidos com a curva normal. � Existem inúmeras variáveis de distribuição assimétrica ou descontínua que não apresentam curva normal de distribuição dos dados. � Identificar se os dados apresentam uma distribuição normal é importante para a determinação dos tipos de testes estatísticos a serem empregados. Distribuição normal na prática � Distribuição normal →→→→ testes paramétricos (apresentam maior poder estatístico). PASQUALI (2007) Distribuição normal na prática � Distribuição não-normal →→→→ testes não-paramétricos. � Dificilmente os dados apresentarão uma distribuição normal perfeita, por isso determina-se a normalidade dos dados por meio dos testes de normalidade. CALLEGARI-JACQUES, 2003 (a) Assimetria positiva ou esquerda (b) Assimetria negativa ou direita Testes de normalidade � Testes de normalidade averiguam a assimetria da curva de dados em relação à curva normal. CALLEGARI-JACQUES, 2003 Curva normal sobreposta ao histograma indicando a distribuição que os dados deveriam apresentar para atender aos pressupostos de normalidade www.cliqueapostilas.com.br http://www.cliqueapostilas.com.br 4 Testes de normalidade � Realizada a partir das medidas de assimetrias e curtoses (achatamentos) � Pode-se utilizar diversos pacotes estatísticos. � Teste de Shapiro – Wilk: conjunto de até 50 observações. � Teste de Kolmogorov Smirnov demais situações. � Nível de significância é inferior ao estabelecido (geralmente 0,05), rejeita-se a normalidade. CALLEGARI-JACQUES, 2003 Interatividade São exemplos de curvas normais: a) A, B, C e D b) Apenas C c) Apenas A e C d) A, B e C e) Apenas D Resposta � Alternativa “d” A curva normal é unimodal (apenas 1 pico) e simétrica (idêntica em ambos os lados da média). Mas pode ter diferentes níveis de curtoses: platicúrtica (A), leptocúrtica (B) e mesocúrtica (C). Teste estatísticos BARROS e REIS , 2003 www.cliqueapostilas.com.br http://www.cliqueapostilas.com.br 5 Formulando hipóteses � A hipótese é o resultado esperado. � Ao elaborar um procedimento experimental para um estudo, geralmente há uma idéia de qual será o resultado. � O resultado esperado é elaborado com base na revisão de literatura feita previamente. � A hipótese deve ser formulada de maneira que possa ser aceita ou refutada. Formulando hipóteses � Duas hipóteses são formuladas: a hipótese alternativa (H1) e a hipótese nula (H0). � A hipótese alternativa é o resultado esperado pelo experimento que irá ser conduzido. � A hipótese nula é usada na análise estatística e considera que não há diferença entre os tratamentos ou relação entre as variáveis analisadas. Teste t para uma amostra � Situações em que características de um único grupo precisam ser comparadas com um valor de referência. � Desenvolvido para comparar duas médias em um experimento. � Necessita atender aos critérios de normalidade de distribuição. Teste t para uma amostra Exemplo 1: Comparação entre a média de desempenho dos alunos do curso de Graduação em Educação no teste de 12 minutos, em relação à média esperada para a faixa etária na população. A hipótese estatística a ser formulada é: � H0 →→→→ A média dos resultados no grupo avaliado é semelhante à média do referencial estipulado. � H1 →→→→ A média dos resultados no grupo avaliado não é igual a média do referencial estipulado. www.cliqueapostilas.com.br http://www.cliqueapostilas.com.br 6 Teste t para uma amostra Exemplo 2: Comparação entre a média nacional de desempenho dos alunos de graduação do curso de Educação Física, com a média de desempenho dos alunos e Educação Física da UNIP, que estejam cursando o último ano. � Média dos alunos da UNIP: 9,63 ± 0,7. � Média nacional: 8,20 ± 0,9. � Neste caso, a hipótese alternativa (H1) foi confirmada pois após aplicação do teste foi verificada diferença entre a média dos alunos da UNIP e média nacional. Teste t pareado � Situações nas quais um mesmo grupo é avaliado em 2 condições e o objetivo é comparar estas 2 médias entre si. � Necessita atender aos critérios de normalidade de distribuição. � Condição fundamental: a amostra de dados nas duas condições (antes e depois) deve ter o mesmo tamanho, caso contrário, a relação de dependência ou pareamento será perdida. Teste t pareado � Exemplo 1: Um grupo de trabalhadores foi submetido a um período de treinamento e de ginástica laboral e objetiva-se analisar alguma condição pré- e pós-treinamento. � Exemplo 2: Um grupo de pessoas idosas foi submetido a uma série de testes nos quais foram avaliados em sua condição física e posteriormente submetidos a um período de treinamento para melhorar as capacidades físicas, para depois novamente serem reavaliados. Teste t pareado � Nos 2 exemplos anteriormente citados, os grupos terão seus desempenhos comparados antes e depois do período de treinamento para investigar se houve diferença nos resultados e se essa diferença foi estatisticamente diferente. � Uma forma de análise é observar diferença das médias pré e pós tratamento. Se os dois conjuntos de médias forem iguais, então a diferença (subtração das médias) será igual a zero. www.cliqueapostilas.com.br http://www.cliqueapostilas.com.br 7 Interatividade Um grupo de trabalhadores submetido a um período de exercícios de alongamento aumentou significativamente os valores de flexibilidade entre a condição pré e pós- treinamento. a) Pode-se concluir esse resultado calculando o CV; b) O valor do DP é o mais importante para esse cálculo; c) O teste de normalidade assegura o cálculo dessa diferença; d) O teste mais indicado é o teste t para uma amostra; e) O teste mais indicado é o teste t pareado; Resposta � Alternativa “e”. Para comparar os valores correspondentes ao desempenho em teste de flexibilidade de um mesmo grupo antes e depois de um período de treinamento, o teste mais indicado é o teste t pareado. Condições: � amostra de dados nas duas situações (antes e depois) deve ter o mesmo tamanho.� distribuição de dados normal. Teste t para amostras independentes � Utilizado em situações de comparação de uma característica comum de dois grupos que são compostos por indivíduos diferentes (grupos são independentes). � Os sujeitos de um grupo não devem estar relacionados aos sujeitos de outro grupo. � Comparação da média dos valores de um grupo com a média de valores de outro grupo. Teste t para amostras independentes � Aplicável em grupos cuja distribuição dos dados seja suficientemente parecida a uma curva normal. � Exemplo 1: Comparação da altura de salto vertical de uma amostra composta por jogadores de basquete com uma amostra composta por lutadores de judô. � Exemplo 2: Comparação da força máxima do grupo muscular quadríceps de atletas halterofilistas com atletas jogadores de futebol. www.cliqueapostilas.com.br http://www.cliqueapostilas.com.br 8 Análise de Variância (ANOVA) � Numa situação de comparação de 4 grupos com relação a uma variável quantitativa, poderiam ser usados vários testes t entre os grupos para compará- los dois a dois. � Realizar este procedimento seria inadequado estatisticamente, pois aumenta o erro de se concluir inadequadamente que existe diferença entre as médias. � Por isso, o procedimento correto consistiria em usar uma técnica chamada Análise de Variância. Análise de Variância (ANOVA) � Método para comparar mais de duas médias de um experimento em um único teste. � Identifica diferenças entre os grupos, mantendo controle sobre o nível de significância do teste. � Cada possível causa de variação é chamada de fator. � Um experimento pode conter um ou mais fatores, com diferentes níveis. Análise de Variância (ANOVA) � Os níveis de um fator representam as características diferentes deste fator. � O procedimento detecta qual a influência destes fatores na variação dos grupos analisados, ou seja, identifica qual ou quais fatores são as possíveis causas de variação observada. � Ex: gênero é um fator, com dois níveis, masculino e feminino. Nível de escolaridade poderia ser outro fator, com três níveis, ensino médio, graduação e pós-graduação. Análise de Variância (ANOVA) � Tabela ilustrativa da estatura (metros) de estudantes de ensino médio, graduação e pós-graduação, do sexo masculino e feminino. Os alunos do sexo masculino são estatisticamente mais altos que os alunos do sexo feminino, mas o fator nível de escolaridade não mostrou diferenças significativas. www.cliqueapostilas.com.br http://www.cliqueapostilas.com.br 9 Considerações que permitem o uso da ANOVA � Os dados devem apresentar distribuição normal. � Variações amostrais semelhantes nas diferentes amostras dos grupos. � Tamanho das amostras dos grupos necessitam ser semelhantes. � Mais confiável com grandes amostras. Teste de Friedman � Utilizado para comparar os resultados de três ou mais amostras. � Teste não paramétrico correspondente à ANOVA para medidas repetidas. � Este teste ordena os resultados para cada um dos casos e depois calcula a média das ordens para cada amostra. � Se não existem diferenças entre as amostras, as suas médias das ordens devem ser similares. Interatividade A partir da aplicação da ANOVA os dados abaixo mostraram diferença entre os gêneros, mas não entre a escolaridade. O que isso significa? a) O fator gênero foi determinante para as diferenças observadas; b) A escolaridade é um nível e o gênero é um fator; c) O fator gênero não é importante; d) O fator escolaridade foi mais importante; e) Gênero e escolaridade são níveis. Resposta a) o fator gênero foi determinante para as diferenças observadas. b) a escolaridade e o gênero são fatores. c) o fator gênero É importante. d) o fator escolaridade NÃO foi mais importante. e) Gênero e escolaridade são FATORES, E NÃO níveis. � Alternativa “a”. www.cliqueapostilas.com.br http://www.cliqueapostilas.com.br 10 Correlação � É usada para avaliar se existe associação entre duas variáveis numa determinada amostra. � Se a variação no resultado de uma das variáveis afeta de forma específica o resultado da outra variável, as variáveis estão correlacionadas. � Diagrama de dispersão: avalia a correlação entre duas variáveis. Correlação � Para cada indivíduo o valor de uma variável é apresentado em relação ao valor da outra variável. � Exemplo 1: impulsão vertical X circunferência da coxa. Correlação � Exemplo 2: número de horas de estudo X nota obtida na prova. � Pelo exemplo, o número de horas será apresentado no eixo de X e a nota da prova será apresentada no eixo de Y. � A correlação pode ser avaliada quantitativamente por meio do coeficiente de correlação de Pearson. � O coeficiente de correlação indica a intensidade de associação existente entre duas variáveis. O símbolo para representar o coeficiente é a letra r. Correlação � O coeficiente de correlação pode variar de -1 a +1. � Valores negativos indicam uma correlação inversa. � Valores positivos indicam uma correlação direta. � O valor numérico do coeficiente indica quão forte é a correlação: 1) 1 correlação perfeita. 2) acima 0.70 indica uma forte correlação. 3) 0.30 a 0.7 indica correlação moderada. 4) 0 a 0.30 fraca correlação. 5) 0 indica correlação nula www.cliqueapostilas.com.br http://www.cliqueapostilas.com.br 11 Regressão linear simples � Na regressão, é considerado que o comportamento de uma variável Y depende das mudanças ocorridas em outra variável x. � O comportamento de dependência pode ser representado por uma linha chamada de linha de regressão. � A linha de regressão expressa o comportamento esperado de uma variável em função de outra, e se encontra na menor distância possível de cada um dos pontos no diagrama de dispersão. Regressão linear simples � Exemplo: numa piscina com 15 pessoas aleatoriamente paradas, a linha de regressão representaria a corda de uma bóia que seria arremessada na piscina à menor distância possível de cada banhista. BARROS e REIS , 2003 Interatividade Em qual dos gráficos apresentados a seguir encontra-se uma correlação classificada como moderada? a) figuras a; b b) figura e c) figura a d) figuras d; e e) figura d BARROS e REIS , 2003 r = 1 r = -1 r = 0 r = 0,8 r = 0,6 r = 0 Resposta � Alternativa “b” a. correção perfeita direta b. correlação perfeita inversa c. correlação nula d. correlação forte direta e. correlação moderada direta f. correlação nula r = 1 r = -1 r = 0 r = 0,8 r = 0,6 r = 0 www.cliqueapostilas.com.br http://www.cliqueapostilas.com.br 12 ATÉ A PRÓXIMA! www.cliqueapostilas.com.br http://www.cliqueapostilas.com.br