A maior rede de estudos do Brasil

Grátis
20 pág.
Aula 13 - Análise de Correlação e Regressão Linear I

Pré-visualização | Página 1 de 2

 Correlação entre duas variáveis. 
 
 O Modelo de Regressão Linear Simples. 
 
 O Modelo de Regressão Linear Múltipla. 
 
 Aplicações. 
 
 
 
 
Análise de Correlação e Regressão Linear 
Introdução 
 
◦ A regressão e a correlação são duas técnicas 
estreitamente relacionadas que envolvem uma forma de 
estimação. 
 
◦ A diferença entre essas técnicas e o tipo de estimação 
discutido anteriormente é que aquelas técnicas 
anteriores foram utilizadas para estimar um único 
parâmetro populacional, enquanto que as técnicas 
apresentadas neste capítulo se referem à estimação de 
uma relação que possa existir na população. 
 
◦ Mais especificamente, a análise da correlação e 
regressão compreende a análise de dados amostrais 
para saber se e como duas ou mais variáveis estão 
relacionadas uma com a outra numa população. 
 
 
 
 
 
 
 
Análise de Correlação e Regressão Linear 
Introdução 
 
◦ Nosso objetivo será principalmente o estudo de 
situações de duas variáveis. 
 
◦ A análise de correlação dá um número que resume o 
grau de relacionamento entre duas variáveis; 
 
◦ A análise de regressão tem como resultado uma equação 
matemática que descreve o relacionamento. 
 
◦ A equação pode ser usada para estimar, ou predizer, 
valores futuros de uma variável quando se conhecem ou 
se supõem conhecidos valores da outra variável. 
 
 
 
 
 
Análise de Correlação e Regressão Linear 
Introdução 
 
◦ A análise de correlação é útil em trabalho exploratório, 
quando um pesquisador ou analista procura determinar 
quais variáveis são potencialmente importantes e o 
interesse está basicamente no grau ou força do 
relacionamento. 
 
 Em educação e psicologia, frequentemente se dá maior 
ênfase ao grau ou força do relacionamento. 
 
 Em outras áreas, como administração, economia, pesquisa 
médica, agricultura, focaliza-se mais a natureza do 
relacionamento (isto é, a equação de predição), e a análise 
de regressão é o instrumento principal. 
 
 
 
 
 
 
Análise de Correlação e Regressão Linear 
Introdução 
 
◦ Os dados para a análise de regressão e correlação provêm 
de observações de variáveis emparelhadas. 
 
◦ Para um problema de duas variáveis, isto significa que cada 
observação origina dois valores, um para cada variável. 
 
 Por exemplo, um estudo que envolva características físicas pode 
focalizar a idade e a altura de cada indivíduo. 
 
 As duas variáveis de interesse — idade e altura de cada pessoa 
— são então emparelhadas. 
 
◦ Para um problema de três variáveis, cada observação 
origina três valores. 
 
 Por exemplo, além da idade e altura de cada pessoa, podemos 
incluir também o peso na análise. 
 
 
 
 
 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
 
◦ objetivo do estudo correlacional é a determinação da 
força do relacionamento entre duas observações 
emparelhadas. 
 
◦ O termo “correlação” significa literalmente “co-
relacionamento”, pois indica até que ponto os valores de 
uma variável estão relacionados com os de outra. 
 
◦ Há muitos casos em que pode existir um relacionamento 
entre duas variáveis. 
 
 
 
 
 
 
 
 
 
 
 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
 
◦ Consideremos, por exemplo, questões como estas: 
 
 1. A idade e a resistência física estão correlacionadas? 
 
 2. Pessoas de maior renda tendem a apresentar melhor 
escolaridade? 
 
 3. O sucesso num emprego pode ser predito com base no 
resultado de testes? 
 
 4. A temperatura parece influenciar a taxa de criminalidade? 
 
 5. Estudantes com maior capacidade de leitura tendem a 
obter melhores resultados em cursos de matemática? 
 
 
 
 
 
 
 
 
 
 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
 
◦ Problemas como esses se prestam à análise de 
correlação. O resultado de tal análise é um coeficiente 
de correlação — um valor que quantifica o grau de 
correlação. 
 
◦ Na sequencia, aprenderemos (1) as características 
importantes dos coeficientes correlacionais, (2) 
processos computacionais, e (3) como usar tais 
coeficientes para fazer inferências sobre relações numa 
população. 
 
◦ Consideraremos três técnicas de correlação: uma para 
mensuração de dados, uma para dados por postos, e 
uma para classificações nominais. 
 
 
 
 
 
 
 
 
 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
Dados Contínuos: O Coeficiente r de Pearson 
 
◦ A forma mais comum de análise de correlação envolve 
dados contínuos. 
 
◦ O grau de relacionamento entre duas variáveis contínuas 
é sintetizado por um coeficiente de correlação conhecido 
como “r de Pearson", em homenagem ao matemático 
Karl Pearson, que desenvolveu a técnica. 
 
 
 
 
 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
Dados Contínuos: O Coeficiente r de Pearson 
 
◦ Essa técnica só é válida se pudermos levantar certas 
hipóteses um tanto rígidas. 
 
◦ As hipóteses são: 
 
 1. Tanto x como y são variáveis aleatórias contínuas. 
 
 2. A distribuição de frequência conjunta (isto é, a 
distribuição de valores dos pares x, y) é normal. 
 
 
 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
Dados Contínuos: O Coeficiente r de Pearson 
 
◦ O coeficiente de correlação tem duas propriedades que 
caracterizam a natureza de uma relação entre duas 
variáveis. 
 
◦ Uma é o seu sinal (+ ou -) e a outra é sua magnitude. 
 
◦ O sinal é o mesmo que o do coeficiente angular de uma 
reta imaginária que se “ajustasse” aos dados se fosse 
traçada num diagrama de dispersão, e a magnitude de r 
indica quão próximos da “reta” estão os pontos 
individuais. 
 
 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
Dados Contínuos: O Coeficiente r de Pearson 
 
◦ Por exemplo, valores de r próximos de -1,00 ou +1,00 
indicam que os valores estão muito próximos da reta, ou 
mesmo sobre a reta, enquanto que os valores mais 
próximos do 0 sugerem maior dispersão. 
 
◦ A Figura a seguir ilustra esses conceitos. 
 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
Dados Contínuos: O Coeficiente r de Pearson 
 
 
 
 
 
 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
Dados Contínuos: O Coeficiente r de Pearson 
 
◦ O cálculo do coeficiente r de Pearson para duas variáveis 
(x e y, com n observações) é dado pela seguinte 
equação: 
 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
Dados Contínuos: O Coeficiente r de Pearson 
 
◦ Suponha que estejamos interessados em saber se o 
desempenho do estudante na universidade está 
relacionado com seu desempenho no curso secundário. 
Parece razoável que os estudantes obtenham na 
universidade aproximadamente as mesmas notas que 
obtiveram no curso secundário. Para avaliar isto, 
imaginemos 15 universitários escolhidos aleatoriamente 
numa grande universidade, e comparemos suas médias 
na universidade e no secundário. 
 
◦ Os dados se apresentariam como os exibidos na Tabela 
a seguir. 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
Dados Contínuos: O Coeficiente r de Pearson 
 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
Dados Contínuos: O Coeficiente r de Pearson 
 
◦ É prudente construir um diagrama de dispersão dos dados sempre 
que for possível. A visualização é especialmente útil na exploração 
dos dados. 
 
 
 
 
 
 
 
 
 
 
 
◦ Não obstante, a menos que