Baixe o app para aproveitar ainda mais
Prévia do material em texto
BIOESTATÍSTICA APLICADA A SAÚDE MATERIAL DE APOIO PROF. CLEBER RICARDO PAIVA 1 4. CORRELAÇÃO LINEAR: Em algumas ocasiões, duas os mais variáveis podem ser analisadas mutuamente de forma a indicar o(s) grau(s) de correspondência entre essas variáveis. Nesse capítulo, a análise se limitará aos casos com duas variáveis. A correlação linear será discutida com o objetivo de verificar o grau de correspondência entre as duas variáveis frente a um relacionamento linear. Entende-se por correlação: o grau de correspondência entre duas ou mais variáveis, assim, evidencia a “intensidade” com a qual os conjuntos de dados das variáveis estão relacionados mutuamente. A correlação linear verifica o quanto duas variáveis estão relacionadas entre si seguindo uma função linear (do 1º grau). O valor do coeficiente de correlação linear (r) é dado por: ))(.())(.( )()()( 2222 yiyinxixin yixiyixin r Onde: n = número de dados ou quantidade da amostra; xi = dados da variável independente; yi = dados da variável dependente; Os valores de r variam de -1 a 1, ou seja -1≤r≤1. Assim, sugere-se à seguinte classificação: r=-1,00: correlação negativa perfeita. r=-0,75: correlação negativa forte. r=-0,50: correlação negativa média. r=-0,25: correlação negativa fraca. r=0,00: correlação linear inexistente. r=+0,25: correlação positiva fraca. r=+0,50: correlação positiva média. r=+0,75: correlação positiva forte. r=+1,00: correlação positiva perfeita. Na correlação positiva, as variáveis em estudo alteram-se no mesmo sentido (por exemplo, se uma variável aumenta, a outra também aumenta). Na correlação negativa, as variáveis em estudo alteram-se em sentidos opostos (se uma variável aumenta, a outra diminui). Exercício: 1. Determinar o coeficiente de correlação linear (r) para os conjuntos de dados nas tabelas a seguir: a) xi 2 4 7 10 13 yi 2,5 3,8 8,1 9,6 14,3 b) xi 5 15 20 25 30 35 yi 48 43 34 19 11 6 BIOESTATÍSTICA APLICADA A SAÚDE MATERIAL DE APOIO PROF. CLEBER RICARDO PAIVA 2 5. REGRESSÃO LINEAR: Neste capítulo, será apresentado o processo de traduzir o comportamento conjunto de duas variáveis na forma de uma equação linear (ou equação da reta ou equação do 1º grau), denominado regressão linear. Entende-se por regressão (interpolação) como o processo de traduzir o comportamento de duas ou mais variáveis através de uma “lei” matemática. A regressão é dita linear quando o diagrama de dispersão dos dados do estudo sugere a interpolação de uma reta (reta interpoladora). Existem algumas maneiras de se determinar a reta interpoladora. Um deles é o Método dos Mínimos Quadrados, através do qual a reta é definida por: )( xKyyxiKyy Onde, x é a média dos dados xi y é a média dos dados Yi Sx Sy rKy Sy... desvio padrão para dados yi: 1 )( 2 n yyi Sy Sx... desvio padrão para dados xi: 1 )( 2 n xxi Sx Exercício: 1. Determinar a equação da reta interpoladora para os conjuntos de dados nas tabelas a seguir: a) xi 2 4 7 10 13 yi 2,5 3,8 8,1 9,6 14,3 b) xi 5 15 20 25 30 35 yi 48 43 34 19 11 6 2. A tabela a seguir mostra os pesos (em kg) e as respectivas alturas (em cm) de uma amostra de oito alunos da turma de calouros do curso de Nutrição de uma Universidade. Pede-se: a) o diagrama de dispersão. b) o coeficiente de correlação linear e a equação da reta interpoladora. c) o gráfico da equação de regressão linear. xi: peso 55 58 60 65 66 70 72 74 yi: altura 163 167 167 172 173 174 175 177 3. A tabela a seguir resume alguns dados de idade da pessoa e sua expectativa de vida, concluídos a partir de uma pesquisa realizada em certa comunidade. Pede-se: BIOESTATÍSTICA APLICADA A SAÚDE MATERIAL DE APOIO PROF. CLEBER RICARDO PAIVA 3 a) o diagrama de dispersão. b) o coeficiente de correlação linear e a equação da reta interpoladora. c) o gráfico da equação de regressão linear. Idade da pessoa (anos) 20 25 30 35 40 45 50 55 60 65 70 Expectativa de vida (anos) 51 50 45 44 28 27 23 18 9 8 10 6. DISTRIBUIÇÃO NORMAL: 6.1. DISTRIBUIÇÃO NORMAL: A distribuição normal é uma distribuição contínua de probabilidade de uma variável x. Seu gráfico é chamado de curva normal e possui as seguintes propriedades: - a média, a moda e a mediana são iguais; - a curva normal tem formato de sino e é simétrica em torno da média; - a área total sob a curva é igual a 1. - a curva normal aproxima-se mais do eixo x a medida que afasta da média, em ambos os lados, mas nunca toca o eixo x. - entre (µ - σ) e (µ + σ) o gráfico curva-se para baixo. À esquerda de (µ - σ) e à direita de (µ + σ), curva-se para cima. Os pontos de mudança de curvatura são chamados de pontos de inflexão. μ–3.σ μ–2.σ μ–σ μ μ+σ μ+2.σ μ+3.σ Os parâmetros μ (média) e σ (desvio padrão) determinam completamente o aspecto da curva normal. 6.2. CURVAS NORMAIS E PROBABILIDADE: A área de uma região sob uma curva de probabilidade é igual à probabilidade de que a variável aleatória tenha um valor no intervalo correspondente. Pontos de inflexão BIOESTATÍSTICA APLICADA A SAÚDE MATERIAL DE APOIO PROF. CLEBER RICARDO PAIVA 4 34% 34% 13,5%13,5% 1,35%1,35%6.2.1. Regra empírica: Numa distribuição normal: 68% da área está entre (µ - σ) e (µ + σ). 95% da área está entre (µ - 2.σ) e (µ + 2.σ). 97,7% da área está entre (µ - 3.σ) e (µ + 3.σ). μ–3.σ μ–2.σ μ–σ μ μ+σ μ+2.σ μ+3.σ Exemplo: As pontuações de um teste de QI em adultos são normalmente distribuídos com µ=100 e σ=15. Calcule a probabilidade de um adulto escolhido ao acaso ter QI entre 70 e 115. P(70≤x≤115) = ? QI = 70 70 = µ - 2.σ QI = 115 115 = µ + σ P(70≤x≤115) = área de (µ - 2.σ) até (µ + σ) = 13,5% + 34% + 34% = 81,5% Exercícios: 1. Considerando o exemplo acima, determinar: a) P(55≤x≤100) b) P(115≤x≤145) c) P(x≤130) d) P(x≥85) 6.2.2. A distribuição normal padrão: A distribuição normal padrão é aquela com µ=0 e σ=1. A escala horizontal (eixo x) corresponde aos escores z, que podem ser determinados da seguinte maneira: x z , onde x=variável Com o escore padrão (z) é possível via tabela a seguir determinar a probabilidade. Exercício: Considerar a altura de 351 mulheres idosas como seguindo uma distribuição normal com média 160cm e desvio padrão 6 cm. Sorteia-se uma mulher, qual a probabilidade de que ela tenha: a) altura entre 160 cm e 165 cm? b) altura maior do que 170 cm? c) altura menor do que 150 cm? BIOESTATÍSTICA APLICADA A SAÚDE MATERIAL DE APOIO PROF. CLEBER RICARDO PAIVA 5 BIOESTATÍSTICA APLICADA A SAÚDE MATERIAL DE APOIO PROF. CLEBER RICARDO PAIVA 6 7. INTERVALO DE CONFIANÇA DA MÉDIA 6.1 Construir um intervalo de X% de confiança para a média de uma população distribuída normalmente através de dados de uma amostra. Dados: - Média da amostra; - Desvio padrão da amostra S; - População normalmente distribuída; - Número de elementos da amostra n; - Porcentagem do intervalo de confiança. Resolução: - Determinar o valor de Zc: P(z) = 0,5 + ((Porcentagem do intervalo de confiança)/2) Na tabela de distribuição normal Z, determinar o valor Zc através de P(z) - Calcular E: - Construir o intervalo: 6.2 Determinar a quantidade de elementos de uma amostra para garantir um determinado intervalo de confiança: Dados: - Desvio padrão da amostra S; - População normalmente distribuída; - Porcentagem do intervalo de confiança; - Intervalo de confiança E; Resolução: - Determinar o valor de Zc: P(z) = 0,5 + ((Porcentagem do intervalo de confiança)/2) Na tabela de distribuição normal Z, determinar o valor Zc através de P(z) - Calcular n: LISTA DE EXERCÍCIOS 1. Uma amostra aleatória de 36 elementos retirados de uma população aproximadamente normal forneceu média de 15,50 e desvio padrão de 1,50. a) construir um intervalo de 95% de confiança para a média dessa população. b) para um intervalo de 0,25, determine o tamanho requerido da uma amostra para assegurar confiança de 95%. Resposta: a) 15,01 < µ < 15,99 ; n = 138. 2. Uma amostra de 40 elementos, extraída de uma população normal, forneceu média amostral de 35,56 e desvio padrão amostral de 3,50. Construa um intervalo de confiança de 99% para a média ExEx n SZc E 2 E SZc n x BIOESTATÍSTICA APLICADA A SAÚDE MATERIAL DE APOIO PROF. CLEBER RICARDO PAIVA 7 populacional. Determine o tamanho requerido de uma amostra para assegurar que, com confiança de 95%, a média amostral esteja dentro do intervalo de 1,0 da média populacional. Resposta: 34,14 < µ < 36,98 ; n = 47. 3. Uma amostra de 80 elementos, extraída de uma população aproximadamente normal cujo desvio padrão é 2,8, forneceu média de 45,8. Construir um intervalo de confiança de 95% para a média dessa população. Resposta: 45,2 < µ < 46,4 4. As alturas dos alunos do sexo masculino de uma universidade apresentam distribuição normal. Para estimar a altura média dessa população, foram observadas as alturas de 100 alunos, obtendo- se média de 170cm e desvio padrão de 20cm. Determine o intervalo de confiança de 95% para a média populacional. Resposta: 166,08 < µ < 173,92.
Compartilhar