Baixe o app para aproveitar ainda mais
Prévia do material em texto
Correlação entre duas variáveis. O Modelo de Regressão Linear Simples. O Modelo de Regressão Linear Múltipla. Aplicações. Análise de Correlação e Regressão Linear Introdução ◦ A regressão e a correlação são duas técnicas estreitamente relacionadas que envolvem uma forma de estimação. ◦ A diferença entre essas técnicas e o tipo de estimação discutido anteriormente é que aquelas técnicas anteriores foram utilizadas para estimar um único parâmetro populacional, enquanto que as técnicas apresentadas neste capítulo se referem à estimação de uma relação que possa existir na população. ◦ Mais especificamente, a análise da correlação e regressão compreende a análise de dados amostrais para saber se e como duas ou mais variáveis estão relacionadas uma com a outra numa população. Análise de Correlação e Regressão Linear Introdução ◦ Nosso objetivo será principalmente o estudo de situações de duas variáveis. ◦ A análise de correlação dá um número que resume o grau de relacionamento entre duas variáveis; ◦ A análise de regressão tem como resultado uma equação matemática que descreve o relacionamento. ◦ A equação pode ser usada para estimar, ou predizer, valores futuros de uma variável quando se conhecem ou se supõem conhecidos valores da outra variável. Análise de Correlação e Regressão Linear Introdução ◦ A análise de correlação é útil em trabalho exploratório, quando um pesquisador ou analista procura determinar quais variáveis são potencialmente importantes e o interesse está basicamente no grau ou força do relacionamento. Em educação e psicologia, frequentemente se dá maior ênfase ao grau ou força do relacionamento. Em outras áreas, como administração, economia, pesquisa médica, agricultura, focaliza-se mais a natureza do relacionamento (isto é, a equação de predição), e a análise de regressão é o instrumento principal. Análise de Correlação e Regressão Linear Introdução ◦ Os dados para a análise de regressão e correlação provêm de observações de variáveis emparelhadas. ◦ Para um problema de duas variáveis, isto significa que cada observação origina dois valores, um para cada variável. Por exemplo, um estudo que envolva características físicas pode focalizar a idade e a altura de cada indivíduo. As duas variáveis de interesse — idade e altura de cada pessoa — são então emparelhadas. ◦ Para um problema de três variáveis, cada observação origina três valores. Por exemplo, além da idade e altura de cada pessoa, podemos incluir também o peso na análise. Análise de Correlação e Regressão Linear Correlação entre duas variáveis ◦ objetivo do estudo correlacional é a determinação da força do relacionamento entre duas observações emparelhadas. ◦ O termo “correlação” significa literalmente “co- relacionamento”, pois indica até que ponto os valores de uma variável estão relacionados com os de outra. ◦ Há muitos casos em que pode existir um relacionamento entre duas variáveis. Análise de Correlação e Regressão Linear Correlação entre duas variáveis ◦ Consideremos, por exemplo, questões como estas: 1. A idade e a resistência física estão correlacionadas? 2. Pessoas de maior renda tendem a apresentar melhor escolaridade? 3. O sucesso num emprego pode ser predito com base no resultado de testes? 4. A temperatura parece influenciar a taxa de criminalidade? 5. Estudantes com maior capacidade de leitura tendem a obter melhores resultados em cursos de matemática? Análise de Correlação e Regressão Linear Correlação entre duas variáveis ◦ Problemas como esses se prestam à análise de correlação. O resultado de tal análise é um coeficiente de correlação — um valor que quantifica o grau de correlação. ◦ Na sequencia, aprenderemos (1) as características importantes dos coeficientes correlacionais, (2) processos computacionais, e (3) como usar tais coeficientes para fazer inferências sobre relações numa população. ◦ Consideraremos três técnicas de correlação: uma para mensuração de dados, uma para dados por postos, e uma para classificações nominais. Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados Contínuos: O Coeficiente r de Pearson ◦ A forma mais comum de análise de correlação envolve dados contínuos. ◦ O grau de relacionamento entre duas variáveis contínuas é sintetizado por um coeficiente de correlação conhecido como “r de Pearson", em homenagem ao matemático Karl Pearson, que desenvolveu a técnica. Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados Contínuos: O Coeficiente r de Pearson ◦ Essa técnica só é válida se pudermos levantar certas hipóteses um tanto rígidas. ◦ As hipóteses são: 1. Tanto x como y são variáveis aleatórias contínuas. 2. A distribuição de frequência conjunta (isto é, a distribuição de valores dos pares x, y) é normal. Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados Contínuos: O Coeficiente r de Pearson ◦ O coeficiente de correlação tem duas propriedades que caracterizam a natureza de uma relação entre duas variáveis. ◦ Uma é o seu sinal (+ ou -) e a outra é sua magnitude. ◦ O sinal é o mesmo que o do coeficiente angular de uma reta imaginária que se “ajustasse” aos dados se fosse traçada num diagrama de dispersão, e a magnitude de r indica quão próximos da “reta” estão os pontos individuais. Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados Contínuos: O Coeficiente r de Pearson ◦ Por exemplo, valores de r próximos de -1,00 ou +1,00 indicam que os valores estão muito próximos da reta, ou mesmo sobre a reta, enquanto que os valores mais próximos do 0 sugerem maior dispersão. ◦ A Figura a seguir ilustra esses conceitos. Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados Contínuos: O Coeficiente r de Pearson Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados Contínuos: O Coeficiente r de Pearson ◦ O cálculo do coeficiente r de Pearson para duas variáveis (x e y, com n observações) é dado pela seguinte equação: Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados Contínuos: O Coeficiente r de Pearson ◦ Suponha que estejamos interessados em saber se o desempenho do estudante na universidade está relacionado com seu desempenho no curso secundário. Parece razoável que os estudantes obtenham na universidade aproximadamente as mesmas notas que obtiveram no curso secundário. Para avaliar isto, imaginemos 15 universitários escolhidos aleatoriamente numa grande universidade, e comparemos suas médias na universidade e no secundário. ◦ Os dados se apresentariam como os exibidos na Tabela a seguir. Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados Contínuos: O Coeficiente r de Pearson Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados Contínuos: O Coeficiente r de Pearson ◦ É prudente construir um diagrama de dispersão dos dados sempre que for possível. A visualização é especialmente útil na exploração dos dados. ◦ Não obstante, a menos quehaja perfeito relacionamento entre as duas variáveis, é necessário apelar para os métodos de cálculo, a fim de obter uma estatística que sintetize o grau do relacionamento. Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados Contínuos: O Coeficiente r de Pearson Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados Contínuos: O Coeficiente r de Pearson Lista de exercícios 4ª lista de exercícios: 1ª bateria. ◦ Pag. 375/376, exercícios 01, 03, 05 e 09.
Compartilhar