Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE FEDERAL DE SANTA MARIA – UFSM DISCIPLINA DE BIOESTATÍSTICA REGULAÇÃO LINEAR SIMPLES E CORRELAÇÃO LINEAR SIMPLES Santa Maria – RS, Brasil 2014 REGULAÇÃO LINEAR SIMPLES A regulação linear tem por finalidade prever os resultados de uma variável dependente, com base nos resultados de uma variável independente. É uma forma de relacionar duas variáveis por meio de uma equação matemática linear. Ex: peso e idade; vendas e lucro,... A equação matemática utilizada tem como fórmula geral a seguinte expressão: 𝒀 = 𝜶𝑿 + 𝜷 + 𝜺 Onde: Y: é a variável dependente; α: coeficiente de regressão (coeficiente angular); X: variável independente; β: coeficiente linear; ε: fatores residuais. Diagrama de dispersão Tem como finalidade mostrar se uma reta descreve adequadamente ou não o conjunto de dados. A relação entre as variáveis será direta (ou positiva) quando os valores de Y variarem de forma proporcional aos de X e será inversa (ou negativa) quando os valores de Y variarem inversamente em relação aos de X. Exemplo de diagrama de dispersão: Pode-se observar que o gráfico mostra uma relação direta entre as variáveis. Método para a estimação dos parâmetros α e β Os coeficientes α e β são estimados através dos dados observados fornecidos pela amostra. O método mais usado para ajustar uma linha reta para um conjunto de pontos (x1, y1), ..., (xn,yn) é o Método de Mínimos Quadrados: É o método de computação matemática pelo qual se define a curva de regressão. O método dos mínimos quadrados consiste em adotar como estimativa dos parâmetros os valores que minimizem a soma dos quadrados dos desvios. Características do Método de Mínimos Quadrados: 1) A soma dos desvios verticais dos pontos em relação a reta é zero; 2) A soma dos quadrados desses desvios é mínima. Os valores de α e β da reta de regressão y = αx + β serão: 𝛼 = 𝑛 ∑ 𝑥𝑦𝑛𝑖=1 − ∑ 𝑥 ∑ 𝑦 𝑛 𝑖=1 𝑛 𝑖=1 𝑛 ∑ 𝑥2𝑛𝑖=1 −(∑ 𝑥 𝑛 𝑖=1 ) 2 = 𝑆xx 𝑆xy 𝛽 = y̅ − 𝛼x̅ Para cada par de valores (xi, yi) podemos estabelecer o desvio: εi = yi - �̂� = yi - (α +βx) Exemplo: Decomposição da variância total A dispersão da variação aleatória “y” pode ser medida através da soma dos quadrados dos desvios em relação a sua média �̅�. Essa soma de quadrados será denominada Soma de Quadrados Total (SQTotal). 𝑆𝑄𝑇𝑜𝑡𝑎𝑙 = ∑(𝑦𝑖 − �̅�)² 𝑛 𝑖=1 A SQTotal pode ser decomposta em ∑ 𝑛𝑖=1 (y1 - �̅�)² = ∑ 𝑛 𝑖=1 (�̂�i - �̅�)² + ∑ 𝑛 𝑖=1 (yi - �̂�)² Essa relação mostra que a variação dos valores de Y em torno de sua média pode ser dividida em duas partes: uma ∑ 𝑛𝑖=1 (�̂�i - �̅�)² que é explicada pela regressão e outra ∑ 𝑛𝑖=1 (yi - �̂�)² devido ao fato de que nem todos os pontos estão sobre a reta de regressão, que é a parte “não explicada” pela regressão ou variação residual. Assim: SQTotal = SQRegressão + SQResíduo Coeficiente de determinação (r²) Mostra a proporção ou percentagem da variação de Y que é “explicada” pela regressão. O coeficiente de determinação é definido por: 𝑟² = ∑ 𝑛𝑖=1 (�̂�i − �̅�)² ∑ (𝑦𝑖− �̅�)²𝑛𝑖=1 = 𝑆𝑄𝑟𝑒𝑔𝑟𝑒𝑠𝑠ã𝑜 𝑆𝑄𝑡𝑜𝑡𝑎𝑙 = 𝑉𝑎𝑟𝑖𝑎çã𝑜 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎 𝑉𝑎𝑟𝑖𝑎çã𝑜 𝑡𝑜𝑡𝑎𝑙 Note que 0 ≤ r² ≤ 1. CORRELAÇÃO LINEAR SIMPLES Determina a força do relacionamento entre duas observações. Indica até que ponto os valores de uma variável estão relacionados com os da outra. Exemplo: treinamento de um empregado e o número de defeitos; custos e horas de uso direto de máquinas numa produção. Coeficiente de correlação (r) O coeficiente de correlação deve ser usado como uma medida de força da relação entre as variáveis. Características do coeficiente de correlação: 1) Pode admitir valores negativos e positivos; 2) A magnitude de r indica quão próximos da "reta" estão os pontos individuais; 3) Valores de r igual ou próximos de +1 indicam forte correlação entre as variáveis, a relação é direta; 4) Valores de r igual ou próximos de -1 indicam pouca dispersão, forte correlação entre as variáveis, a relação é inversa; 5) Valores próximos de 0 (zero), significa que existe pouco relacionamento entre as variáveis, muita dispersão. Portanto: -1 ≥ r ≤ +1. Medidas de Correlação Tratamento Qualitativo (correlação momento produto): Relação entre as variáveis, mediante a observação do diagrama de dispersão. Tratamento Quantitativo: É o estabelecimento das medidas de correlação.
Compartilhar