Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 1. INTRODUÇÃO SOBRE CONCEITOS BÁSICOS E UTILIDADE DAS ANÁLISES DE CORRELAÇÃO E REGRESSÃO Para exemplificar um caso em que se pode utilizar uma análise de correlação e regressão, considere a seguinte situação: Uma determinada empresa multinacional percebeu que seus relatórios contábeis apresentaram uma evolução positiva de faturamento em todas as suas filiais, mas os gestores ainda desconhecem efetivamente, qual a principal razão de tal crescimento, já que o consumo de seu produto por cliente não tem crescido na mesma proporção, porém percebeu-se que na maioria das filiais o número de clientes vem crescendo consideravelmente. Diante do exposto acima, podem surgir as seguintes perguntas: 1) A variação na receita de faturamento ocorrida nas filiais da empresa, pode ser explicada pelo crescimento do número de clientes? 2) Existem outras variáveis que possam estar influenciando na evolução positiva do faturamento? As análises de correlação e regressão linear que veremos a seguir podem nos ajudar a sanar as dúvidas que surgiram na situação acima, pois se tratam de análises de dados amostrais para saber respectivamente, se e como duas ou mais variáveis estão relacionadas em uma determinada população. A análise de correlação nos permite verificar se existe ou não relação entre duas variáveis e a análise de regressão é utilizada para descrever essa relação através de uma equação que possa ser usada para se prever o valor de uma variável dado o valor de outra. 1.1 Etapas da Análise Formulação de uma hipótese 1) A variação na receita de faturamento está relacionada com o crescimento do número de clientes. 2) A variação na receita de faturamento não está relacionada com o crescimento do número de clientes. 2 Metodologia Coletar dados, analisar, testar a hipótese e concluir. Observação: Os dados para as análises de correlação e regressão devem ser quantitativos (ou tornados quantitativos) e provenientes de observações emparelhadas. 1.2 - Regressão x Causação Embora a análise de regressão lide com a dependência de uma variável em relação a outras, isso não implica necessariamente causação. “Uma relação estatística, por mais forte e sugestiva que seja, nunca pode estabelecer uma conexão de causa: nossas idéias de causação devem se originar fora da estatística, em última análise, de alguma teoria” (Kendall e Stuart).1 1.3 - Exemplo Motivacional Em economia, admite-se que o nível de renda de uma população afete a procura de determinado bem de consumo. Para a maior parte desses bens, uma renda mais elevada acarreta maior procura. Há alguns bens de consumo (chamados de bens inferiores) que são menos adquiridos quando a renda aumenta. Suponha que uma grande rede de pizzarias esteja interessada em analisar se a quantidade de pizzas vendidas tem alguma relação com a renda da população. Formulação da hipótese 1) A quantidade de pizzas vendidas está relacionada com a renda da população. 2) A quantidade de pizzas vendidas não está relacionada com a renda da população. 1 Kendall, M. G.; Stuart, A. The Advanced Theory of Statistics. Nova York: Charles Griffin Publishers, vol. 2, Capítulo 26, 1961, p. 279. 3 2 CORRELAÇÃO LINEAR SIMPLES A correlação entre duas variáveis quantitativas pode ser observada por meio do diagrama de dispersão e medida através do coeficiente de correlação de Pearson. 2.1 Diagrama de Dispersão O diagrama de dispersão é uma representação gráfica de duas variáveis X e Y, que possibilita identificar padrões que evidenciam ou não correlação entre as variáveis. Os dados podem ser representados por pares ordenados (x,y), em que x é a variável independente e y é a variável dependente. Correlação Linear Positiva Quando x aumenta y tende a aumentar Correlação Linear Negativa Quando x aumenta y tende a diminuir 0 5 10 0 5 10 Y X 0 5 10 0 5 10 Y X 4 Ausência de Correlação Exemplo 1) Dados coletados para o exemplo motivacional. Cidade Renda (R$ 1.000) Pizzas Vendidas (1000) 1 5 10 2 8 30 3 10 45 4 12 50 5 15 75 Construa o diagrama de dispersão para os dados coletados. Existe alguma relação entre a quantidade de pizzas vendidas e a renda da população? Interprete. Exemplo 2) Dados Amostrais Hipotéticos: Quilometragem e Preço de Venda de Carros. Construa o diagrama de dispersão para os dados abaixo e interprete-o. Quilometragem (X) (1000) Preço de Venda (Y) (mil dólares) 40 1 30 1.5 30 1.2 25 1.8 50 0.8 60 1 65 0.5 10 3 15 2.5 20 2 55 0.8 40 1.5 35 2 30 2 0 2 4 6 8 0 5 10 Y X 5 2.2 Coeficiente de Correlação de Pearson O coeficiente de correlação mede o grau de associação linear entre duas variáveis, x e y, ou seja, mede a força e a direção do relacionamento entre as duas variáveis. O estimador do coeficiente de correlação linear de Pearson é denotado por r e é dado por: em que, e O valor de r está sempre no intervalo que vai de -1 a +1, ou seja - 1 r +1. Interpretando o coeficiente de correlação: Se r = 0 ou próximo de 0 não há correlação linear. Se r = - 1 ou próximo de -1 a correlação é linear negativa (reta decrescente). Se r = 1 ou próximo de 1 a correlação é linear positiva (reta crescente). Exercício 1) Calcule o coeficiente de correlação para os exemplos 1 e 2 e compare com a conclusão obtida por meio do diagrama de dispersão. Exercício 2) Construa o diagrama de dispersão e calcule o coeficiente de correlação para os dados abaixo. Conclua sobre a correlação entre as vendas trimestrais e a população de estudantes. Dados sobre a população de estudantes e as vendas trimestrais em dez restaurantes Armand´s Pizza Parlors. População de Estudantes (em milhares) Vendas Trimestrais (milhares dólares) X Y 2 58 6 105 8 88 8 118 12 117 16 137 20 157 20 169 22 149 26 202
Compartilhar