Baixe o app para aproveitar ainda mais
Prévia do material em texto
Unidade II BIOESTATÍSTICA Profa. Dra. Carina Helena Wasem Fraga. Conteúdos desta unidade Análise na distribuição dos dados: avaliação da normalidade. Análise e interpretação dos resultados dos seguintes testes: Teste t para uma amostra. Teste t pareado. Teste t para amostras independentes. Teste de ANOVA. Teste de Friedman. Teste de correlação. Teste de regressão linear. Distribuição normal (Gauss) Características: distribuição característica de variáveis biológicas. distribuição normal não significa que ocorra apenas em pessoas sadias. maior frequência em valores centrais e menor incidência em valores baixos e altos PASQUALI (2007) Distribuição normal (Gauss) Indica a probabilidade de ocorrência de um evento numa população. Exemplo: qual a probabilidade de uma pessoa apresentar um valor de hemoglobina entre 14,5 e 15,5? Frequência de ocorrência 24%. CALLEGARI-JACQUES, 2003 Distribuição normal (Gauss) Propriedades: apresenta o formato de um sino. a curva é simétrica em torno da média. CALLEGARI-JACQUES, 2003 Distribuição normal (Gauss) A média, a mediana e a moda coincidem. A média e o DP são representativos de dados de distribuição normal. A curva apresenta 2 pontos de inflexão: média somada e subtraída ao DP. Distribuição normal (Gauss) Área total sob a curva totaliza 100%. Área entre pontos de inflexão representa aproximadamente 68% (2/3) dos valores. CALLEGARI-JACQUES, 2003 Distribuição normal (Gauss) O gráfico mostra distribuição normal rigorosamente simétrica, que tem como característica englobar 99,73% das ocorrências no intervalo entre a média ± 3 DP. Fonte: UFRGS Distribuição normal na prática Distribuição normal é uma curva teórica: tentativa de encaixar histogramas parecidos com a curva normal. Existem inúmeras variáveis de distribuição assimétrica ou descontínua que não apresentam curva normal de distribuição dos dados. Identificar se os dados apresentam uma distribuição normal é importante para a determinação dos tipos de testes estatísticos a serem empregados. Distribuição normal na prática Distribuição normal → testes paramétricos (apresentam maior poder estatístico). PASQUALI (2007) Distribuição normal na prática Distribuição não-normal → testes não-paramétricos. Dificilmente os dados apresentarão uma distribuição normal perfeita, por isso determina-se a normalidade dos dados por meio dos testes de normalidade. CALLEGARI-JACQUES, 2003 (a) Assimetria positiva ou esquerda (b) Assimetria negativa ou direita Testes de normalidade Testes de normalidade averiguam a assimetria da curva de dados em relação à curva normal. CALLEGARI-JACQUES, 2003 Curva normal sobreposta ao histograma indicando a distribuição que os dados deveriam apresentar para atender aos pressupostos de normalidade Testes de normalidade Realizada a partir das medidas de assimetrias e curtoses (achatamentos) Pode-se utilizar diversos pacotes estatísticos. Teste de Shapiro – Wilk: conjunto de até 50 observações. Teste de Kolmogorov Smirnov demais situações. Nível de significância é inferior ao estabelecido (geralmente 0,05), rejeita-se a normalidade. CALLEGARI-JACQUES, 2003 Interatividade São exemplos de curvas normais: a) A, B, C e D b) Apenas C c) Apenas A e C d) A, B e C e) Apenas D Resposta Alternativa “d” A curva normal é unimodal (apenas 1 pico) e simétrica (idêntica em ambos os lados da média). Mas pode ter diferentes níveis de curtoses: platicúrtica (A), leptocúrtica (B) e mesocúrtica (C). Teste estatísticos BARROS e REIS , 2003 Formulando hipóteses A hipótese é o resultado esperado. Ao elaborar um procedimento experimental para um estudo, geralmente há uma idéia de qual será o resultado. O resultado esperado é elaborado com base na revisão de literatura feita previamente. A hipótese deve ser formulada de maneira que possa ser aceita ou refutada. Formulando hipóteses Duas hipóteses são formuladas: a hipótese alternativa (H1) e a hipótese nula (H0). A hipótese alternativa é o resultado esperado pelo experimento que irá ser conduzido. A hipótese nula é usada na análise estatística e considera que não há diferença entre os tratamentos ou relação entre as variáveis analisadas. Teste t para uma amostra Situações em que características de um único grupo precisam ser comparadas com um valor de referência. Desenvolvido para comparar duas médias em um experimento. Necessita atender aos critérios de normalidade de distribuição. Teste t para uma amostra Exemplo 1: Comparação entre a média de desempenho dos alunos do curso de Graduação em Educação Física no teste de 12 minutos, em relação à média esperada para a faixa etária na população. A hipótese estatística a ser formulada é: H0 → A média dos resultados no grupo avaliado é semelhante à média do referencial estipulado. H1 → A média dos resultados no grupo avaliado não é igual a média do referencial estipulado. Teste t para uma amostra Exemplo 2: Comparação entre a média nacional de desempenho dos alunos de graduação do curso de Educação Física, com a média de desempenho dos alunos de Educação Física da UNIP, que estejam cursando o último ano. Média dos alunos da UNIP: 9,63 ± 0,7. Média nacional: 8,20 ± 0,9. Neste caso, a hipótese alternativa (H1) foi confirmada pois após aplicação do teste foi verificada diferença entre a média dos alunos da UNIP e média nacional. Teste t pareado Situações nas quais um mesmo grupo é avaliado em 2 condições e o objetivo é comparar estas 2 médias entre si. Necessita atender aos critérios de normalidade de distribuição. Condição fundamental: a amostra de dados nas duas condições (antes e depois) deve ter o mesmo tamanho, caso contrário, a relação de dependência ou pareamento será perdida. Teste t pareado Exemplo 1: Um grupo de trabalhadores foi submetido a um período de treinamento e de ginástica laboral e objetiva-se analisar alguma condição pré- e pós-treinamento. Exemplo 2: Um grupo de pessoas idosas foi submetido a uma série de testes nos quais foram avaliados em sua condição física e posteriormente submetidos a um período de treinamento para melhorar as capacidades físicas, para depois novamente serem reavaliados. Teste t pareado Nos 2 exemplos anteriormente citados, os grupos terão seus desempenhos comparados antes e depois do período de treinamento para investigar se houve diferença nos resultados e se essa diferença foi estatisticamente diferente. Uma forma de análise é observar diferença das médias pré e pós tratamento. Se os dois conjuntos de médias forem iguais, então a diferença (subtração das médias) será igual a zero. Interatividade Um grupo de trabalhadores submetido a um período de exercícios de alongamento aumentou significativamente os valores de flexibilidade entre a condição pré e pós- treinamento. a) Pode-se concluir esse resultado calculandoo CV; b) O valor do DP é o mais importante para esse cálculo; c) O teste de normalidade assegura o cálculo dessa diferença; d) O teste mais indicado é o teste t para uma amostra; e) O teste mais indicado é o teste t pareado; Resposta Alternativa “e”. Para comparar os valores correspondentes ao desempenho em teste de flexibilidade de um mesmo grupo antes e depois de um período de treinamento, o teste mais indicado é o teste t pareado. Condições: amostra de dados nas duas situações (antes e depois) deve ter o mesmo tamanho. distribuição de dados normal. Teste t para amostras independentes Utilizado em situações de comparação de uma característica comum de dois grupos que são compostos por indivíduos diferentes (grupos são independentes). Os sujeitos de um grupo não devem estar relacionados aos sujeitos de outro grupo. Comparação da média dos valores de um grupo com a média de valores de outro grupo. Teste t para amostras independentes Aplicável em grupos cuja distribuição dos dados seja suficientemente parecida a uma curva normal. Exemplo 1: Comparação da altura de salto vertical de uma amostra composta por jogadores de basquete com uma amostra composta por lutadores de judô. Exemplo 2: Comparação da força máxima do grupo muscular quadríceps de atletas halterofilistas com atletas jogadores de futebol. Análise de Variância (ANOVA) Numa situação de comparação de 4 grupos com relação a uma variável quantitativa, poderiam ser usados vários testes t entre os grupos para compará- los dois a dois. Realizar este procedimento seria inadequado estatisticamente, pois aumenta o erro de se concluir inadequadamente que existe diferença entre as médias. Por isso, o procedimento correto consistiria em usar uma técnica chamada Análise de Variância. Análise de Variância (ANOVA) Método para comparar mais de duas médias de um experimento em um único teste. Identifica diferenças entre os grupos, mantendo controle sobre o nível de significância do teste. Cada possível causa de variação é chamada de fator. Um experimento pode conter um ou mais fatores, com diferentes níveis. Análise de Variância (ANOVA) Os níveis de um fator representam as características diferentes deste fator. O procedimento detecta qual a influência destes fatores na variação dos grupos analisados, ou seja, identifica qual ou quais fatores são as possíveis causas de variação observada. Ex: gênero é um fator, com dois níveis, masculino e feminino. Nível de escolaridade poderia ser outro fator, com três níveis, ensino médio, graduação e pós-graduação. Análise de Variância (ANOVA) Tabela ilustrativa da estatura (metros) de estudantes de ensino médio, graduação e pós-graduação, do sexo masculino e feminino. Os alunos do sexo masculino são estatisticamente mais altos que os alunos do sexo feminino, mas o fator nível de escolaridade não mostrou diferenças significativas. Considerações que permitem o uso da ANOVA Os dados devem apresentar distribuição normal. Variações amostrais semelhantes nas diferentes amostras dos grupos. Tamanho das amostras dos grupos necessitam ser semelhantes. Mais confiável com grandes amostras. Teste de Friedman Utilizado para comparar os resultados de três ou mais amostras. Teste não paramétrico correspondente à ANOVA para medidas repetidas. Este teste ordena os resultados para cada um dos casos e depois calcula a média das ordens para cada amostra. Se não existem diferenças entre as amostras, as suas médias das ordens devem ser similares. Interatividade A partir da aplicação da ANOVA os dados abaixo mostraram diferença entre os gêneros, mas não entre a escolaridade. O que isso significa? a) O fator gênero foi determinante para as diferenças observadas; b) A escolaridade é um nível e o gênero é um fator; c) O fator gênero não é importante; d) O fator escolaridade foi mais importante; e) Gênero e escolaridade são níveis. Resposta a) o fator gênero foi determinante para as diferenças observadas. b) a escolaridade e o gênero são fatores. c) o fator gênero É importante. d) o fator escolaridade não foi mais importante. e) Gênero e escolaridade são fatores, e não níveis. Alternativa “a”. Correlação É usada para avaliar se existe associação entre duas variáveis numa determinada amostra. Se a variação no resultado de uma das variáveis afeta de forma específica o resultado da outra variável, as variáveis estão correlacionadas. Diagrama de dispersão: avalia a correlação entre duas variáveis. Correlação Para cada indivíduo o valor de uma variável é apresentado em relação ao valor da outra variável. Exemplo 1: impulsão vertical X circunferência da coxa. Correlação Exemplo 2: número de horas de estudo X nota obtida na prova. Pelo exemplo, o número de horas será apresentado no eixo de X e a nota da prova será apresentada no eixo de Y. A correlação pode ser avaliada quantitativamente por meio do coeficiente de correlação de Pearson. O coeficiente de correlação indica a intensidade de associação existente entre duas variáveis. O símbolo para representar o coeficiente é a letra r. Correlação O coeficiente de correlação pode variar de -1 a +1. Valores negativos indicam uma correlação inversa. Valores positivos indicam uma correlação direta. O valor numérico do coeficiente indica quão forte é a correlação: 1) 1 correlação perfeita. 2) acima 0.70 indica uma forte correlação. 3) 0.30 a 0.7 indica correlação moderada. 4) 0 a 0.30 fraca correlação. 5) 0 indica correlação nula Regressão linear simples Na regressão, é considerado que o comportamento de uma variável Y depende das mudanças ocorridas em outra variável x. O comportamento de dependência pode ser representado por uma linha chamada de linha de regressão. A linha de regressão expressa o comportamento esperado de uma variável em função de outra, e se encontra na menor distância possível de cada um dos pontos no diagrama de dispersão. Regressão linear simples Exemplo: numa piscina com 15 pessoas aleatoriamente paradas, a linha de regressão representaria a corda de uma bóia que seria arremessada na piscina à menor distância possível de cada banhista. BARROS e REIS , 2003 Interatividade Em qual dos gráficos apresentados a seguir encontra-se uma correlação classificada como moderada? a) figuras a; b b) figura e c) figura a d) figuras d; e e) figura d;f BARROS e REIS , 2003 r = 1 r = -1 r = 0 r = 0,8 r = 0,6 r = 0 Resposta Alternativa “b” ( Figura e ) Correlação moderada direta r = 1 r = -1 r = 0 r = 0,8 r = 0,6 r = 0 ATÉ A PRÓXIMA! Slide Number 1 Conteúdos desta unidade Distribuição normal (Gauss) Distribuição normal (Gauss) Distribuição normal (Gauss) Distribuição normal (Gauss) Distribuição normal (Gauss) Distribuição normal (Gauss) Distribuição normal na prática Distribuição normalna prática Distribuição normal na prática Testes de normalidade Testes de normalidade Interatividade Resposta Teste estatísticos Formulando hipóteses Formulando hipóteses Teste t para uma amostra Teste t para uma amostra Teste t para uma amostra Teste t pareado Teste t pareado Teste t pareado Interatividade Resposta Teste t para amostras independentes Teste t para amostras independentes Análise de Variância (ANOVA) Análise de Variância (ANOVA) Análise de Variância (ANOVA) Análise de Variância (ANOVA) Considerações que permitem o uso da ANOVA Teste de Friedman Interatividade Resposta Correlação Correlação Correlação Correlação Regressão linear simples Regressão linear simples Interatividade Resposta Slide Number 45
Compartilhar