Buscar

1. INTRODUÇÃO E CORRELAÇÃO

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

1 
 
1. INTRODUÇÃO SOBRE CONCEITOS BÁSICOS E UTILIDADE 
DAS ANÁLISES DE CORRELAÇÃO E REGRESSÃO 
 
 Para exemplificar um caso em que se pode utilizar uma análise de correlação e 
regressão, considere a seguinte situação: Uma determinada empresa multinacional 
percebeu que seus relatórios contábeis apresentaram uma evolução positiva de 
faturamento em todas as suas filiais, mas os gestores ainda desconhecem efetivamente, 
qual a principal razão de tal crescimento, já que o consumo de seu produto por cliente 
não tem crescido na mesma proporção, porém percebeu-se que na maioria das filiais o 
número de clientes vem crescendo consideravelmente. 
 
Diante do exposto acima, podem surgir as seguintes perguntas: 
1) A variação na receita de faturamento ocorrida nas filiais da empresa, pode ser 
explicada pelo crescimento do número de clientes? 
2) Existem outras variáveis que possam estar influenciando na evolução positiva do 
faturamento? 
 
 As análises de correlação e regressão linear que veremos a seguir podem nos 
ajudar a sanar as dúvidas que surgiram na situação acima, pois se tratam de análises de 
dados amostrais para saber respectivamente, se e como duas ou mais variáveis estão 
relacionadas em uma determinada população. A análise de correlação nos permite 
verificar se existe ou não relação entre duas variáveis e a análise de regressão é utilizada 
para descrever essa relação através de uma equação que possa ser usada para se prever o 
valor de uma variável dado o valor de outra. 
 
1.1 Etapas da Análise 
 
 Formulação de uma hipótese 
1) A variação na receita de faturamento está relacionada com o crescimento do 
número de clientes. 
2) A variação na receita de faturamento não está relacionada com o 
crescimento do número de clientes. 
 
2 
 
 Metodologia 
Coletar dados, analisar, testar a hipótese e concluir. 
 
Observação: Os dados para as análises de correlação e regressão devem ser 
quantitativos (ou tornados quantitativos) e provenientes de observações 
emparelhadas. 
 
1.2 - Regressão x Causação 
 Embora a análise de regressão lide com a dependência de uma variável em relação a 
outras, isso não implica necessariamente causação. 
 “Uma relação estatística, por mais forte e sugestiva que seja, nunca pode estabelecer 
uma conexão de causa: nossas idéias de causação devem se originar fora da 
estatística, em última análise, de alguma teoria” (Kendall e Stuart).1 
 
1.3 - Exemplo Motivacional 
 Em economia, admite-se que o nível de renda de uma população afete a procura 
de determinado bem de consumo. Para a maior parte desses bens, uma renda mais 
elevada acarreta maior procura. Há alguns bens de consumo (chamados de bens 
inferiores) que são menos adquiridos quando a renda aumenta. 
 Suponha que uma grande rede de pizzarias esteja interessada em analisar se a 
quantidade de pizzas vendidas tem alguma relação com a renda da população. 
 
Formulação da hipótese 
1) A quantidade de pizzas vendidas está relacionada com a renda da população. 
2) A quantidade de pizzas vendidas não está relacionada com a renda da população. 
 
 
 
 
 
 
1 Kendall, M. G.; Stuart, A. The Advanced Theory of Statistics. Nova York: Charles Griffin Publishers, vol. 2, 
Capítulo 26, 1961, p. 279. 
3 
 
2 CORRELAÇÃO LINEAR SIMPLES 
 
 A correlação entre duas variáveis quantitativas pode ser observada por meio do 
diagrama de dispersão e medida através do coeficiente de correlação de Pearson. 
 
2.1 Diagrama de Dispersão 
 
 O diagrama de dispersão é uma representação gráfica de duas variáveis X e Y, 
que possibilita identificar padrões que evidenciam ou não correlação entre as variáveis. 
Os dados podem ser representados por pares ordenados (x,y), em que x é a variável 
independente e y é a variável dependente. 
 
 Correlação Linear Positiva Quando x aumenta y tende a aumentar 
 
 
 
 Correlação Linear Negativa Quando x aumenta y tende a diminuir 
 
 
 
 
 
 
0 
5 
10 
0 5 10 
Y
 
X 
0 
5 
10 
0 5 10 
Y
 
X 
4 
 
Ausência de Correlação 
 
 
 
Exemplo 1) Dados coletados para o exemplo motivacional. 
 
Cidade Renda (R$ 1.000) Pizzas Vendidas (1000) 
1 5 10 
2 8 30 
3 10 45 
4 12 50 
5 15 75 
 
Construa o diagrama de dispersão para os dados coletados. Existe alguma relação entre 
a quantidade de pizzas vendidas e a renda da população? Interprete. 
 
Exemplo 2) Dados Amostrais Hipotéticos: Quilometragem e Preço de Venda de Carros. 
Construa o diagrama de dispersão para os dados abaixo e interprete-o. 
 
Quilometragem (X) (1000) Preço de Venda (Y) (mil dólares) 
40 1 
30 1.5 
30 1.2 
25 1.8 
50 0.8 
60 1 
65 0.5 
10 3 
15 2.5 
20 2 
55 0.8 
40 1.5 
35 2 
30 2 
 
0 
2 
4 
6 
8 
0 5 10 
Y
 
X 
5 
 
2.2 Coeficiente de Correlação de Pearson 
 
 O coeficiente de correlação mede o grau de associação linear entre duas 
variáveis, x e y, ou seja, mede a força e a direção do relacionamento entre as duas 
variáveis. O estimador do coeficiente de correlação linear de Pearson é denotado por r e 
é dado por: 
 
 
 
 
em que, 
 
 
 
 
 
 
 
 
 e 
 
 
 
 
 
 O valor de r está sempre no intervalo que vai de -1 a +1, ou seja - 1  r  +1. 
Interpretando o coeficiente de correlação: 
 Se r = 0 ou próximo de 0 não há correlação linear. 
 Se r = - 1 ou próximo de -1 a correlação é linear negativa (reta decrescente). 
 Se r = 1 ou próximo de 1 a correlação é linear positiva (reta crescente). 
 
Exercício 1) Calcule o coeficiente de correlação para os exemplos 1 e 2 e compare com 
a conclusão obtida por meio do diagrama de dispersão. 
 
Exercício 2) Construa o diagrama de dispersão e calcule o coeficiente de correlação 
para os dados abaixo. Conclua sobre a correlação entre as vendas trimestrais e a 
população de estudantes. 
 Dados sobre a população de estudantes e as vendas trimestrais em dez restaurantes 
Armand´s Pizza Parlors. 
População de Estudantes 
(em milhares) 
Vendas Trimestrais 
(milhares dólares) 
X Y 
2 58 
6 105 
8 88 
8 118 
12 117 
16 137 
20 157 
20 169 
22 149 
26 202

Outros materiais