Buscar

Aula 15 - Análise de Correlação e Regressão Linear III

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

 Correlação entre duas variáveis. 
 
 O Modelo de Regressão Linear Simples. 
 
 O Modelo de Regressão Linear Múltipla. 
 
 Aplicações. 
 
 
 
 
Análise de Correlação e Regressão Linear 
O Modelo de Regressão Linear Simples 
 
 
◦ A regressão linear simples constitui uma tentativa de estabelecer 
uma equação matemática linear (linha reta) que descreva o 
relacionamento entre duas variáveis. 
 
◦ Há diversas maneiras em que as equações de regressão são 
utilizadas. 
 
 Uma é em situações em que as duas variáveis medem aproximadamente 
a mesma coisa, mas uma delas é relativamente dispendiosa, ou difícil 
de lidar, enquanto que a outra não. 
 
 Por exemplo, a resistência e a dureza de um metal podem estar 
relacionadas. Conhecendo-lhe a dureza podemos estimar sua resistência. 
 
 Se o teste de resistência destrói o metal, enquanto que o teste de dureza 
não o destrói, uma pessoa interessada em estimar a resistência 
obviamente preferirá confiar nos resultados do teste de dureza para 
estimar a resistência. 
 
 A finalidade de uma equação de regressão seria então estimar valores de 
uma variável, com base em valores conhecidos da outra. 
 
Análise de Correlação e Regressão Linear 
O Modelo de Regressão Linear Simples 
 
 
◦ Outra utilização das equações de regressão é explicar valores de 
uma variável em termos da outra. 
 
◦ Isto é, podemos suspeitar de uma relação de causa e efeito entre 
duas variáveis. 
 
 Por exemplo, um economista pode tentar explicar as variações na 
procura de automóveis usados em termos de desemprego. 
 
 Um agricultor pode suspeitar que a quantidade de fertilizante por ele 
usada tenha influenciado a safra. 
 
 A distância de frenagem de um carro é influenciada por sua velocidade. 
 
◦ Deve-se notar, entretanto, que a lógica de uma relação causal 
deve provir de teorias externas ao âmbito da estatística. A análise 
de regressão apenas indica qual relacionamento matemático pode 
existir, se existir algum. Em outras palavras, nem a regressão nem 
a correlação podem mostrar que uma variável tenda a “causar” 
certos valores de outra variável. 
Análise de Correlação e Regressão Linear 
O Modelo de Regressão Linear Simples 
 
 
◦ Ainda uma terceira aplicação da regressão: predizer valores 
futuros de uma variável. 
 
 Por exemplo, costuma-se aplicar testes a empregados ou estudantes 
potenciais, para avaliar o potencial de sucesso na escola ou no 
emprego. É de se presumir que haja um relacionamento matemático 
entre o resultado do teste e o potencial futuro. 
 
◦ Embora tais relações possam assumir uma grande diversidade de 
formas, nossa discussão se limitará às equações lineares. As 
equações lineares (de uma linha reta) são importantes porque 
servem para aproximar muitas relações da vida real, e porque são 
relativamente fáceis de lidar e de interpretar. 
 
◦ Outras formas da análise de regressão, tal como regressão 
múltipla (mais de duas variáveis) envolve extensões dos mesmos 
conceitos usados na regressão linear simples. 
Análise de Correlação e Regressão Linear 
O Modelo de Regressão Linear Simples: A Equação Linear 
 
 
◦ Duas importantes características da equação linear são 
 
 o coeficiente angular da reta e 
 
 a cota da reta em determinado ponto (ou o intercepto da reta). 
 
◦ Uma equação linear tem a forma 
 
𝑦 = 𝑎 + 𝑏𝑥 
 
◦ onde a e b são valores que se determinam com base nos dados 
amostrais; a é o intercepto (a cota da reta em x = 0), 
◦ e b é o coeficiente angular. 
 
◦ A variável y é a variável que deve ser explicada ou predita (variável 
dependente), e x é o valor preditor (variável explicativa, ou 
independente). 
Análise de Correlação e Regressão Linear 
O Modelo de Regressão Linear Simples: A Equação Linear 
 
 
◦ A figura abaixo ilustra a relação entre o gráfico de uma reta e sua 
equação. A reta, com equação 𝑦 = 𝑎 + 𝑏𝑥, intercepta o eixo dos y's 
no ponto y = a. Este ponto é chamado intercepto-y. O coeficiente 
angular da reta, b, indica a variação de y por unidade de variação 
de x, ou ∆𝑦 ∆𝑥 . 
Análise de Correlação e Regressão Linear 
O Modelo de Regressão Linear Simples: Decisão por um Tipo de Relação 
 
 
◦ É importante ter em mente que nem todas as situações são bem 
aproximadas por uma equação linear. 
 
◦ Por isso, em geral é necessário desenvolver um trabalho 
preliminar para determinar se um modelo linear é adequado. 
 
◦ O processo mais simples consiste em grafar em um diagrama de 
dispersão os dados e ver se uma relação linear parece razoável. 
 
◦ Quando os dados não podem ser aproximados por um modelo 
linear, as alternativas são procurar um modelo não-linear 
conveniente, ou transformar os dados para a forma linear. 
 
Análise de Correlação e Regressão Linear 
O Modelo de Regressão Linear Simples: Decisão por um Tipo de Relação 
 
 
◦ Observe os gráficos da figura abaixo. Claramente, (a) e (d) não são 
lineares. Casos como em (a) e (d) podem ser linearizados por meio 
de transformação de variáveis. 
Análise de Correlação e Regressão Linear 
O Modelo de Regressão Linear Simples: Determinação da eq. matemática 
 
 
◦ Voltemos agora nossa atenção para a mecânica da determinação da 
equação de uma reta que melhor descreva um conjunto de 
observações. 
 
◦ Por exemplo, suponha-se que queiramos determinar se há alguma 
relação entre a quilometragem de um carro usado e seu preço de 
venda. 
 
◦ Isto é, queremos saber se o preço depende da quilometragem do 
carro. 
 
◦ Em linguagem de regressão, a quilometragem seria a variável 
independente, ou “explanatória”, e o preço de venda a variável 
dependente, ou “explicada”. É tradicional usar o símbolo x para 
representar valores da variável independente e o símbolo y para 
valores da variável dependente. 
Análise de Correlação e Regressão Linear 
O Modelo de Regressão Linear Simples: Determinação da eq. matemática 
 
 
◦ Suponha que tenhamos coligido dados de vendedores de carros da 
cidade, sobre quilometragem e preços de carros de certa marca e 
com determinado conjunto de equipamentos. Os dados amostrais, 
que poderiam se originar de uma amostra aleatória de vendedores 
da área, se apresentariam mais ou menos como os dados da tabela a 
seguir. 
Análise de Correlação e Regressão Linear 
O Modelo de Regressão Linear Simples: Determinação da eq. matemática 
 
 
◦ Os dados da tabela anterior estão grafados em um diagrama de 
dispersão (scatter plot) a fim de decidirmos se uma reta os 
descreve adequadamente. Conquanto seja evidente a 
impossibilidade de achar uma reta que passe por cada um dos 
pontos do diagrama, parece que uma relação linear é 
razoavelmente consistente com os dados amostrais. 
Análise de Correlação e Regressão Linear 
O Modelo de Regressão Linear Simples: O método dos 
mínimos quadrados 
 
 
◦ O método mais usado para ajustar uma linha reta a um 
conjunto de pontos é conhecido como técnica dos 
mínimos quadrados. 
 
◦ A reta resultante tem duas características importantes: 
 
 (1) a soma dos desvios verticais dos pontos em relação à reta 
é zero, e 
 
 (2) a soma dos quadrados desses desvios é mínima (isto é, 
nenhuma outra reta daria menor soma de quadrados de tais 
desvios). 
Análise de Correlação e Regressão Linear 
O Modelo de Regressão Linear Simples: O método dos mínimos quadrados 
 
 
◦ Simbolicamente, o valor que é minimizado é dado por: 
 
 (𝑦𝑖 − 𝑦𝑐)
2 
◦ Onde: 
 
 𝑦𝑖 = valor observado de 𝑦 para o i-ésimo elemento da amostra; 
 
 𝑦c = o valor calculado de 𝑦 utilizando-se a equação de mínimos 
quadrados com o valor de x correspondente ao i-ésimo elemento da 
amostra. 
 
Análise de Correlação eRegressão Linear 
O Modelo de Regressão Linear Simples: O método dos mínimos quadrados 
 
 
◦ Os valores de a e b para a reta 𝑦𝑐 = 𝑎 + 𝑏𝑥 que minimiza a soma dos 
quadrados dos desvios são as soluções das chamadas “equações 
normais”: 
 
 𝑦 = 𝑛𝑎 + 𝑏 𝑥 
 𝑥𝑦 = 𝑎 𝑥 + 𝑏 𝑥2 
Onde n é o número de observações 
 
Análise de Correlação e Regressão Linear 
O Modelo de Regressão Linear Simples: O método dos mínimos quadrados 
 
 
◦ Assim, obtendo-se as quantidades 𝑥, 𝑥𝑦 etc, poderíamos 
resolver essas equações simultâneas em relação a a e b. 
 
◦ Todavia, as equações podem ser resolvidas algebricamente em 
relação a a e b, e isto proporciona uma forma muito mais simples. 
 
◦ O resultado consiste em duas fórmulas, uma para a e uma para b, 
usadas para fins de cálculo: 
 
𝑏 =
𝑛( 𝑥𝑦) − 𝑥 𝑦
𝑛 𝑥2 − 𝑥2
 
 
𝑎 =
 𝑦 − 𝑏 𝑥
𝑛
 
 
 
Análise de Correlação e Regressão Linear 
O Modelo de Regressão Linear Simples: O método dos mínimos quadrados 
 
 
◦ Podemos usar o método dos mínimos quadrados para obter uma 
reta para o exemplo quilometragem versus preço de venda. 
 
◦ Das equações acima é evidente que, para determinar a equação 
linear, devemos primeiro calcular 𝑥, 𝑦, 𝑥2 e 𝑥𝑦. 
 
◦ Tais valores se determinam a partir dos dados amostrais. 
 
 
Análise de Correlação e Regressão Linear 
O Modelo de Regressão Linear Simples: O método dos mínimos quadrados 
 
 
◦ A tabela abaixo nos dá os cálculos. 
 
 
Análise de Correlação e Regressão Linear 
O Modelo de Regressão Linear Simples: O método dos mínimos quadrados 
 
 
◦ A equação de regressão resultante, 𝑦𝑐 = 𝑎 + 𝑏𝑥 , é então 𝑦𝑐 = 2,934 −
38,56𝑥 
 
◦ A equação pode ser interpretada da seguinte maneira. 
 
 O preço de venda esperado para um carro é $2.934 menos 
$38,56 para cada mil quilômetros que o carro tenha rodado. 
 
 Por exemplo, para um carro com 20.000 Km rodados, a equação 
sugere um preço de venda de $2.934-38,56(20) = $2.163. 
Análise de Correlação e Regressão Linear 
O Modelo de Regressão Linear Simples 
Lista de exercícios 
 
 
 4ª lista de exercícios: 3ª bateria. 
 
◦ Pag. 348/349, exercícios 01, 02, 04 e 05.

Continue navegando