Baixe o app para aproveitar ainda mais
Prévia do material em texto
Correlação entre duas variáveis. O Modelo de Regressão Linear Simples. O Modelo de Regressão Linear Múltipla. Aplicações. Análise de Correlação e Regressão Linear O Modelo de Regressão Linear Simples ◦ A regressão linear simples constitui uma tentativa de estabelecer uma equação matemática linear (linha reta) que descreva o relacionamento entre duas variáveis. ◦ Há diversas maneiras em que as equações de regressão são utilizadas. Uma é em situações em que as duas variáveis medem aproximadamente a mesma coisa, mas uma delas é relativamente dispendiosa, ou difícil de lidar, enquanto que a outra não. Por exemplo, a resistência e a dureza de um metal podem estar relacionadas. Conhecendo-lhe a dureza podemos estimar sua resistência. Se o teste de resistência destrói o metal, enquanto que o teste de dureza não o destrói, uma pessoa interessada em estimar a resistência obviamente preferirá confiar nos resultados do teste de dureza para estimar a resistência. A finalidade de uma equação de regressão seria então estimar valores de uma variável, com base em valores conhecidos da outra. Análise de Correlação e Regressão Linear O Modelo de Regressão Linear Simples ◦ Outra utilização das equações de regressão é explicar valores de uma variável em termos da outra. ◦ Isto é, podemos suspeitar de uma relação de causa e efeito entre duas variáveis. Por exemplo, um economista pode tentar explicar as variações na procura de automóveis usados em termos de desemprego. Um agricultor pode suspeitar que a quantidade de fertilizante por ele usada tenha influenciado a safra. A distância de frenagem de um carro é influenciada por sua velocidade. ◦ Deve-se notar, entretanto, que a lógica de uma relação causal deve provir de teorias externas ao âmbito da estatística. A análise de regressão apenas indica qual relacionamento matemático pode existir, se existir algum. Em outras palavras, nem a regressão nem a correlação podem mostrar que uma variável tenda a “causar” certos valores de outra variável. Análise de Correlação e Regressão Linear O Modelo de Regressão Linear Simples ◦ Ainda uma terceira aplicação da regressão: predizer valores futuros de uma variável. Por exemplo, costuma-se aplicar testes a empregados ou estudantes potenciais, para avaliar o potencial de sucesso na escola ou no emprego. É de se presumir que haja um relacionamento matemático entre o resultado do teste e o potencial futuro. ◦ Embora tais relações possam assumir uma grande diversidade de formas, nossa discussão se limitará às equações lineares. As equações lineares (de uma linha reta) são importantes porque servem para aproximar muitas relações da vida real, e porque são relativamente fáceis de lidar e de interpretar. ◦ Outras formas da análise de regressão, tal como regressão múltipla (mais de duas variáveis) envolve extensões dos mesmos conceitos usados na regressão linear simples. Análise de Correlação e Regressão Linear O Modelo de Regressão Linear Simples: A Equação Linear ◦ Duas importantes características da equação linear são o coeficiente angular da reta e a cota da reta em determinado ponto (ou o intercepto da reta). ◦ Uma equação linear tem a forma 𝑦 = 𝑎 + 𝑏𝑥 ◦ onde a e b são valores que se determinam com base nos dados amostrais; a é o intercepto (a cota da reta em x = 0), ◦ e b é o coeficiente angular. ◦ A variável y é a variável que deve ser explicada ou predita (variável dependente), e x é o valor preditor (variável explicativa, ou independente). Análise de Correlação e Regressão Linear O Modelo de Regressão Linear Simples: A Equação Linear ◦ A figura abaixo ilustra a relação entre o gráfico de uma reta e sua equação. A reta, com equação 𝑦 = 𝑎 + 𝑏𝑥, intercepta o eixo dos y's no ponto y = a. Este ponto é chamado intercepto-y. O coeficiente angular da reta, b, indica a variação de y por unidade de variação de x, ou ∆𝑦 ∆𝑥 . Análise de Correlação e Regressão Linear O Modelo de Regressão Linear Simples: Decisão por um Tipo de Relação ◦ É importante ter em mente que nem todas as situações são bem aproximadas por uma equação linear. ◦ Por isso, em geral é necessário desenvolver um trabalho preliminar para determinar se um modelo linear é adequado. ◦ O processo mais simples consiste em grafar em um diagrama de dispersão os dados e ver se uma relação linear parece razoável. ◦ Quando os dados não podem ser aproximados por um modelo linear, as alternativas são procurar um modelo não-linear conveniente, ou transformar os dados para a forma linear. Análise de Correlação e Regressão Linear O Modelo de Regressão Linear Simples: Decisão por um Tipo de Relação ◦ Observe os gráficos da figura abaixo. Claramente, (a) e (d) não são lineares. Casos como em (a) e (d) podem ser linearizados por meio de transformação de variáveis. Análise de Correlação e Regressão Linear O Modelo de Regressão Linear Simples: Determinação da eq. matemática ◦ Voltemos agora nossa atenção para a mecânica da determinação da equação de uma reta que melhor descreva um conjunto de observações. ◦ Por exemplo, suponha-se que queiramos determinar se há alguma relação entre a quilometragem de um carro usado e seu preço de venda. ◦ Isto é, queremos saber se o preço depende da quilometragem do carro. ◦ Em linguagem de regressão, a quilometragem seria a variável independente, ou “explanatória”, e o preço de venda a variável dependente, ou “explicada”. É tradicional usar o símbolo x para representar valores da variável independente e o símbolo y para valores da variável dependente. Análise de Correlação e Regressão Linear O Modelo de Regressão Linear Simples: Determinação da eq. matemática ◦ Suponha que tenhamos coligido dados de vendedores de carros da cidade, sobre quilometragem e preços de carros de certa marca e com determinado conjunto de equipamentos. Os dados amostrais, que poderiam se originar de uma amostra aleatória de vendedores da área, se apresentariam mais ou menos como os dados da tabela a seguir. Análise de Correlação e Regressão Linear O Modelo de Regressão Linear Simples: Determinação da eq. matemática ◦ Os dados da tabela anterior estão grafados em um diagrama de dispersão (scatter plot) a fim de decidirmos se uma reta os descreve adequadamente. Conquanto seja evidente a impossibilidade de achar uma reta que passe por cada um dos pontos do diagrama, parece que uma relação linear é razoavelmente consistente com os dados amostrais. Análise de Correlação e Regressão Linear O Modelo de Regressão Linear Simples: O método dos mínimos quadrados ◦ O método mais usado para ajustar uma linha reta a um conjunto de pontos é conhecido como técnica dos mínimos quadrados. ◦ A reta resultante tem duas características importantes: (1) a soma dos desvios verticais dos pontos em relação à reta é zero, e (2) a soma dos quadrados desses desvios é mínima (isto é, nenhuma outra reta daria menor soma de quadrados de tais desvios). Análise de Correlação e Regressão Linear O Modelo de Regressão Linear Simples: O método dos mínimos quadrados ◦ Simbolicamente, o valor que é minimizado é dado por: (𝑦𝑖 − 𝑦𝑐) 2 ◦ Onde: 𝑦𝑖 = valor observado de 𝑦 para o i-ésimo elemento da amostra; 𝑦c = o valor calculado de 𝑦 utilizando-se a equação de mínimos quadrados com o valor de x correspondente ao i-ésimo elemento da amostra. Análise de Correlação eRegressão Linear O Modelo de Regressão Linear Simples: O método dos mínimos quadrados ◦ Os valores de a e b para a reta 𝑦𝑐 = 𝑎 + 𝑏𝑥 que minimiza a soma dos quadrados dos desvios são as soluções das chamadas “equações normais”: 𝑦 = 𝑛𝑎 + 𝑏 𝑥 𝑥𝑦 = 𝑎 𝑥 + 𝑏 𝑥2 Onde n é o número de observações Análise de Correlação e Regressão Linear O Modelo de Regressão Linear Simples: O método dos mínimos quadrados ◦ Assim, obtendo-se as quantidades 𝑥, 𝑥𝑦 etc, poderíamos resolver essas equações simultâneas em relação a a e b. ◦ Todavia, as equações podem ser resolvidas algebricamente em relação a a e b, e isto proporciona uma forma muito mais simples. ◦ O resultado consiste em duas fórmulas, uma para a e uma para b, usadas para fins de cálculo: 𝑏 = 𝑛( 𝑥𝑦) − 𝑥 𝑦 𝑛 𝑥2 − 𝑥2 𝑎 = 𝑦 − 𝑏 𝑥 𝑛 Análise de Correlação e Regressão Linear O Modelo de Regressão Linear Simples: O método dos mínimos quadrados ◦ Podemos usar o método dos mínimos quadrados para obter uma reta para o exemplo quilometragem versus preço de venda. ◦ Das equações acima é evidente que, para determinar a equação linear, devemos primeiro calcular 𝑥, 𝑦, 𝑥2 e 𝑥𝑦. ◦ Tais valores se determinam a partir dos dados amostrais. Análise de Correlação e Regressão Linear O Modelo de Regressão Linear Simples: O método dos mínimos quadrados ◦ A tabela abaixo nos dá os cálculos. Análise de Correlação e Regressão Linear O Modelo de Regressão Linear Simples: O método dos mínimos quadrados ◦ A equação de regressão resultante, 𝑦𝑐 = 𝑎 + 𝑏𝑥 , é então 𝑦𝑐 = 2,934 − 38,56𝑥 ◦ A equação pode ser interpretada da seguinte maneira. O preço de venda esperado para um carro é $2.934 menos $38,56 para cada mil quilômetros que o carro tenha rodado. Por exemplo, para um carro com 20.000 Km rodados, a equação sugere um preço de venda de $2.934-38,56(20) = $2.163. Análise de Correlação e Regressão Linear O Modelo de Regressão Linear Simples Lista de exercícios 4ª lista de exercícios: 3ª bateria. ◦ Pag. 348/349, exercícios 01, 02, 04 e 05.
Compartilhar