REGULAÇÃO E CORRELAÇÃO LINEAR SIMPLES

•

UFSM

1

0

1

0

Fernanda Jardim

05/12/2014

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Bioestatística I

12.522 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

UNIVERSIDADE FEDERAL DE SANTA MARIA – UFSM 
DISCIPLINA DE BIOESTATÍSTICA 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
REGULAÇÃO LINEAR SIMPLES 
E CORRELAÇÃO LINEAR SIMPLES 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Santa Maria – RS, Brasil 
2014 
 
REGULAÇÃO LINEAR SIMPLES 
 
A regulação linear tem por finalidade prever os resultados de uma variável 
dependente, com base nos resultados de uma variável independente. 
É uma forma de relacionar duas variáveis por meio de uma equação 
matemática linear. 
Ex: peso e idade; vendas e lucro,... 
 
A equação matemática utilizada tem como fórmula geral a seguinte 
expressão: 
 
 𝒀 = 𝜶𝑿 + 𝜷 + 𝜺 
Onde: 
Y: é a variável dependente; 
α: coeficiente de regressão (coeficiente angular); 
X: variável independente; 
β: coeficiente linear; 
ε: fatores residuais. 
 
 
 
Diagrama de dispersão 
 
Tem como finalidade mostrar se uma reta descreve adequadamente ou 
não o conjunto de dados. 
A relação entre as variáveis será direta (ou positiva) quando os valores de 
Y variarem de forma proporcional aos de X e será inversa (ou negativa) quando 
os valores de Y variarem inversamente em relação aos de X. 
 Exemplo de diagrama de dispersão: 
 
Pode-se observar que o gráfico mostra uma relação direta entre as 
variáveis. 
 
Método para a estimação dos parâmetros α e β 
 
Os coeficientes α e β são estimados através dos dados observados 
fornecidos pela amostra. 
O método mais usado para ajustar uma linha reta para um conjunto de 
pontos 
(x1, y1), ..., (xn,yn) é o Método de Mínimos Quadrados: 
 
É o método de computação matemática pelo qual se define a curva de 
regressão. O método dos mínimos quadrados consiste em adotar como 
estimativa dos parâmetros os valores que minimizem a soma dos quadrados 
dos desvios. 
 
Características do Método de Mínimos Quadrados: 
1) A soma dos desvios verticais dos pontos em relação a reta é zero; 
2) A soma dos quadrados desses desvios é mínima. 
 
Os valores de α e β da reta de regressão y = αx + β serão: 
 
𝛼 =
𝑛 ∑ 𝑥𝑦𝑛𝑖=1 − ∑ 𝑥 ∑ 𝑦
𝑛
𝑖=1
𝑛
𝑖=1
𝑛 ∑ 𝑥2𝑛𝑖=1 −(∑ 𝑥
𝑛
𝑖=1 )
2 = 
𝑆xx
𝑆xy
 𝛽 = y̅ − 𝛼x̅ 
 
 
Para cada par de valores (xi, yi) podemos estabelecer o desvio: 
 
εi = yi - �̂� = yi - (α +βx) 
 
Exemplo: 
 
 
 
 
 
 
Decomposição da variância total 
 
A dispersão da variação aleatória “y” pode ser medida através da soma dos 
quadrados dos desvios em relação a sua média �̅�. Essa soma de quadrados 
será denominada Soma de Quadrados Total (SQTotal). 
𝑆𝑄𝑇𝑜𝑡𝑎𝑙 = ∑(𝑦𝑖 − �̅�)²
𝑛
𝑖=1
 
 
A SQTotal pode ser decomposta em 
 
∑ 𝑛𝑖=1 (y1 - �̅�)² = ∑ 
𝑛
𝑖=1 (�̂�i - �̅�)² + ∑ 
𝑛
𝑖=1 (yi - �̂�)² 
 
 
Essa relação mostra que a variação dos valores de Y em torno de sua 
média pode ser dividida em duas partes: uma ∑ 𝑛𝑖=1 (�̂�i - �̅�)² que é explicada 
pela regressão e outra ∑ 𝑛𝑖=1 (yi - �̂�)² devido ao fato de que nem todos os pontos 
estão sobre a reta de regressão, que é a parte “não explicada” pela regressão 
ou variação residual. 
Assim: 
SQTotal = SQRegressão + SQResíduo 
 
Coeficiente de determinação (r²) 
 
Mostra a proporção ou percentagem da variação de Y que é “explicada” 
pela regressão. O coeficiente de determinação é definido por: 
 
𝑟² =
 ∑ 𝑛𝑖=1 (�̂�i − �̅�)²
∑ (𝑦𝑖− �̅�)²𝑛𝑖=1
=
𝑆𝑄𝑟𝑒𝑔𝑟𝑒𝑠𝑠ã𝑜
𝑆𝑄𝑡𝑜𝑡𝑎𝑙
 = 
𝑉𝑎𝑟𝑖𝑎çã𝑜 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎
𝑉𝑎𝑟𝑖𝑎çã𝑜 𝑡𝑜𝑡𝑎𝑙
 
 
Note que 0 ≤ r² ≤ 1. 
 
CORRELAÇÃO LINEAR SIMPLES 
 
Determina a força do relacionamento entre duas observações. Indica até 
que ponto os valores de uma variável estão relacionados com os da outra. 
Exemplo: treinamento de um empregado e o número de defeitos; custos e 
horas de uso direto de máquinas numa produção. 
Coeficiente de correlação (r) 
 
O coeficiente de correlação deve ser usado como uma medida de força da 
relação entre as variáveis. Características do coeficiente de correlação: 
1) Pode admitir valores negativos e positivos; 
2) A magnitude de r indica quão próximos da "reta" estão os pontos 
individuais; 
3) Valores de r igual ou próximos de +1 indicam forte correlação 
entre as variáveis, a relação é direta; 
4) Valores de r igual ou próximos de -1 indicam pouca dispersão, 
forte correlação entre as variáveis, a relação é inversa; 
5) Valores próximos de 0 (zero), significa que existe pouco 
relacionamento entre as variáveis, muita dispersão. 
 
Portanto: -1 ≥ r ≤ +1. 
 
Medidas de Correlação 
 
Tratamento Qualitativo (correlação momento produto): Relação entre as 
variáveis, mediante a observação do diagrama de dispersão. 
 
Tratamento Quantitativo: É o estabelecimento das medidas de correlação.