Baixe o app para aproveitar ainda mais
Prévia do material em texto
Aula 6 – Regressão Linear Simples e Correlação Linear Olá! Seja bem-vindo à aula seis da disciplina “Métodos Quantitativos”! Nesta aula, estudaremos o conceito de regressão linear simples e correlação linear. Ao final desse encontro você deverá ser capaz de: Determinar a existência de correlação linear entre duas variáveis com níveis de mensuração intervalar; Entender e aplicar as análises de regressões lineares; Calcular medidas da qualidade da regressão obtida; Utilizar o modelo de regressão para fazer estimações e previsões. Bons estudos! Tema 1 - Correlação linear: Coeficiente de Correlação de Pearson A exploração de relações entre variáveis é normalmente um dos objetivos das pesquisas de campo. Caso exista uma associação real entre as variáveis, é possível conduzir análises, conclusões e evidenciação de descobertas da investigação. Neste tema, mostraremos uma medida de associação entre variáveis com nível de mensuração intervalar, denominado coeficiente de correlação de Pearson (MARTINS, 2010). Suponha que X represente uma variável quantitativa, a qual se supõe possuir alguma relação com outra variável quantitativa Y. Por exemplo: temperatura e tempo de uma reação química; velocidade e deslocamento de uma partícula; preço e quantidade de vendas de um determinado produto, entre outros (ROSA, 2009). Nesses casos, um indicativo que busca quantificar o quão forte é a correlação linear entre duas variáveis intervalares é calculado por meio do coeficiente de Pearson (r). Esse coeficiente nada mais é que uma medida da correlação linear independente das unidades de medida das variáveis. Ele oscila entre -1 e +1 ou, dado em porcentagens, entre -100% e +100%. Para uma relação linear forte entre as variáveis, mais próximo de seus valores extremos, +1 ou - 1, será apresentada a medida do coeficiente de correlação r (MARTINS, 2010). Porém, quanto mais a medida do coeficiente encontrar-se próxima de zero, mais fraco é o grau desta relação, tornando-se inexistente para r = 0. Caso r = -1 interpreta-se como se existisse uma correlação linear inversa, ou seja, quando o valor de uma variável aumenta, o valor de outra diminui (ROSA, 2009). Segundo Rosa (2009) para uma amostra de tamanho n, em que, para cada indivíduo i (i = 1, . . . , n) verificamos os pares de valores ( i ix y, ), o coeficiente de correlação linear entre X e Y é calculado por: n n i i i i i i n n n n i i i i i i i i x x y y x y nxy r x x y y x nx y ny 1 1 2 2 2 2 2 2 1 1 1 1 Sendo x e y as médias amostrais dos ix ’s e iy ’s, respectivamente. Segundo Martins (2010), alternativamente, pode-se definir r como: xy xx yy S r S S , Onde: xy xx n i i yy i xx y S xy S x n n y XY x y S y n 2 2 2 2 1 Visualmente podemos utilizar como ferramenta para entender a associação de duas variáveis os gráficos de dispersão, os quais mostram a relação entre duas variáveis através da dispersão de pontos desses valores, juntamente com o valor do coeficiente de correlação de Pearson. Figura 1 – Gráficos de dispersão e coeficientes de correlação associados. Fonte: Rosa (2009). Para uma aplicação prática, confira o exemplo a seguir extraído de Peinado e Graeml (2007): Exemplo 1: Uma empresa fabrica e comercializa matrizes de corte por estampagem. As matrizes, depois de prontas, são temperadas para adquirirem a dureza necessária. Recentemente a empresa recebeu reclamações e a análise demonstrou que a dureza não era suficiente para garantir o perfeito funcionamento das matrizes. Em busca de resolver o problema, a empresa levantou a temperatura da água onde as matrizes são temperadas e o grau de dureza adquirido pela matriz. Plote o diagrama de dispersão e calcule o coeficiente de correlação de Pearson de modo a verificar se existe associação entre a temperatura da água e o grau de dureza resultante no processo descrito. Clique no botão a seguir e veja os dados necessários para resolução do problema: Fonte: Peinado e Graeml (2007). Solução Organizando os dados da Tabela no software Excel e realizando os cálculos dos parâmetros necessários para a determinação do coeficiente de Pearson, os resultados podem ser vizualizados por meio da Tabela 2 e do diagrama de dispersão representado na Figura 2. Clique no botão a seguir e veja uma tabela com o Cálculo do Coeficiente de Correlação de Pearson. Cálculo do Coeficiente de Correlação de Pearson. Neste caso, fica evidenciada uma correlação linear fortemente negativa, a qual indica que à medida que a temperatura da água do tratamento térmico aumenta, a dureza das matrizes de corte por estampagem diminui de forma linear, como fica observado pelo diagrama de dispersão da Figura 2. Figura 2 – Diagrama de dispersão entre as variáveis X e Y. Para saber mais sobre o Coeficiente de Correlação de Pearson, acesse o link a seguir: https://www.youtube.com/watch?v=IsgQkmtlKmI
Compartilhar