Buscar

EE - 05 Correlação e regressão - Solução

Prévia do material em texto

Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
 Introdução a estatística
 Análise de dados
 Erros e Probabilidades
 Correlação e regressão
 Correlação
 Previsões
 Séries temporais
 Regressão
 Análise de variância
 Intervalo de confiança
 Experimentos
 Teste de hipóteses
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Correlação e regressão
Coeficiente de correlação
 É a medida da Correlação entre duas Variáveis;
 Indica a força e a direção do relacionamento linear entre
duas variáveis aleatórias;
 No uso estatístico geral, correlação se refere a medida da
relação entre duas variáveis, embora correlação não
implique causalidade;
 Mede intensidade de associação entre variável dependente e
independente;
 Assume valores entre -1 e 1, onde 1 e -1 indicam forte
correlação.
2
1
2
2
11
2
111
.
..


















































n
i
n
i
n
i
n
i
n
i
n
i
ii
YYnXXn
YXYXn
r
Atenção: correlação não necessariamente implica em causalidade
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
-1,0 +1,00
Correlação positiva 
perfeita
-0,5 +0,5
Correlação negativa 
perfeita
Sem correlação
Aumenta o grau de 
correlação negativa
Aumenta o grau de 
correlação positiva
Coeficiente de correlação
Correlação e regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
X
Y
X
Y
X
Y
Associação positiva 
(r  1)
Associação negativa 
(r  -1)
Ausência de associação
(r  0)
Coeficiente de correlação
Correlação e regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Exemplo:
r = 0,98
0
20
40
60
80
100
120
140
0 20 40 60 80 100 120 140 160 180
r = 0,07
0
20
40
60
80
100
0 20 40 60 80 100 120
Coeficiente de correlação
Correlação e regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Exercício
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Exercício I:
Vendas (k)
y
Qtd de alunos 
(k)
x
31,56 10
38,00 12
25,25 8
47,20 15
22,00 6,5
34,20 11
45,10 14,5
32,30 10,1
29,00 9,2
40,90 13,4
40,00 12,7
24,20 7,6
41,00 13,1
Uma cadeia de restaurantes fastfood deseja verificar se as vendas mensais de
refeições em seus estabelecimentos estão relacionadas ao número de alunos
matriculados em escolas situadas num raio de 2 quilômetros em torno de seus
restaurantes. Neste sentido, determine o coeficiente de correlação.
Coeficiente de correlação
Correlação e regressão
2
1
2
2
11
2
111
.
..


















































n
i
n
i
n
i
n
i
n
i
n
i
ii
YYnXXn
YXYXn
r
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Exercício I: (Solução)
Vendas (k)
y
Qtd de alunos 
(k)
x
31,56 10
38,00 12
25,25 8
47,20 15
22,00 6,5
34,20 11
45,10 14,5
32,30 10,1
29,00 9,2
40,90 13,4
40,00 12,7
24,20 7,6
41,00 13,1
Uma cadeia de restaurantes fastfood deseja verificar se as vendas mensais de refeições em seus
estabelecimentos estão relacionadas ao número de alunos matriculados em escolas situadas num
raio de 2 quilômetros em torno de seus restaurantes. Neste sentido, determine o coeficiente de
correlação.
Coeficiente de correlação
Correlação e regressão
    
       
998,0
71,45082,416.16.13.10,14337,663.1.13
71,450.10,14386,224.5.13
.
..
22
2
1
2
2
11
2
111






















































r
YYnXXn
YXYXn
r
n
i
n
i
n
i
n
i
n
i
n
i
ii
Usando Excel:
=CORREL( Vendas ; Qtd de alunos )
EE - 05a Correlações - Solução.xlsx
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
 Introdução a estatística
 Análise de dados
 Erros e Probabilidades
 Correlação e regressão
 Correlação
 Previsões
 Séries temporais
 Regressão
 Análise de variância
 Intervalo de confiança
 Experimentos
 Teste de hipóteses
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
faixa de incerteza
c/ dados detalhados
previsão
tempo
faixa de incerteza c/
agregação crescente
no tempo
Produto Previsão Real Erro
Big Mac 15.000 17.000 13%
Cheddar 9.000 7.500 17%
Quarteirão 12.000 13.000 8%
Hamburger 25.000 20.000 20%
McChicken 8.000 13.000 63%
Total 69.000 70.500 2%
} MÉDIA24%
!!!
A agregação dos 
dados reduz as 
incertezas da 
previsão
“Mandamentos das previsões”
1.Evite fazer previsões
2.Tendo que fazê-las, faça no nível mais agregado possível.
Previsões
Correlação e regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
tempo
futuropassado
Vendas reais do passado
Tendência identificada no passado
e projetada no futuro
Ciclicidade identificada no passado
e projetada no futuro
X
X
X
Previsões de curto prazo
feitas com base nas projeções
Demanda
Faixa de erro
identificada no passado
e projetada para o futuro
Previsões
Correlação e regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Efeito horizonte
(tempo)
Previsão de
demanda / erro
Erros esperados de previsão crescem com o horizonte
Hoje Horizonte futuro
F
a
ix
a
 d
e
 e
rr
o
 e
s
p
e
ra
d
o
Previsões
Correlação e regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Agregação de dados x Efeito horizonte
(tempo)
P
re
v
is
ã
o
 d
e
d
e
m
a
n
d
a
 /
 e
rr
o
Hoje Horizonte futuro
Agregação dos dados pode ser maior para decisões de longo prazo
A
g
re
g
a
ç
ã
o
 g
ra
d
u
a
lm
e
n
te
 m
a
io
r
d
o
s
 d
a
d
o
s
 fa
z
 e
rro
s
 g
ra
d
u
a
lm
e
n
te
d
im
in
u
ire
m
Erros esperados de previsão crescem com o horizonte
Previsões
Correlação e regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Erros de previsão definirão os “colchões” de recursos necessários
Jan Fev Mar Abr Maio Jun
1 Previsão 1000 1200 1000 900 1100 1200
2 Vendas 900 1350 950 1000 1250 1300
3 Desvio 100 -150 50 -100 -150 -100
4 Desvio absoluto 100 150 50 100 150 100
5 Desvio absoluto acumulado 100 250 300 400 550 650
6 Desvio absoluto médio 100 125 100 100 110 108
Previsões
Correlação e regressão
EE - 05b Erros das previsões.xlsx
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Erros frequentes
 Uma série de fatores pode afetar o desempenho de um modelo de previsão, sendo que os mais comuns são:
 A técnica de previsão pode estar sendo usada incorretamente, ou sendo mal interpretada;
 A técnica de previsão perdeu a validade devido à mudança em uma variável importante, ou devido ao aparecimento de uma nova
variável;
 Variações irregulares na demanda podem ter acontecido em função de greves, formação de estoques temporários, catástrofes
naturais, etc.
 Ações estratégicas da concorrência, afetando a demanda;
 Variações aleatórias inerentes aos dados da demanda.
Previsões
Correlação e regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Erro 1 das previsões: confundir previsões com metas e, um erro 
subseqüente, considerar as metas como se fossem previsões. 
Erro 2 das previsões: gastar tempo e esforço discutido se se "acerta" ou "erra" 
nas previsões, quando o mais relevante é discutir "o quanto" se está errando e 
as formas de alterar processos envolvidos, de forma a reduzir estes "erros". 
Erro 3 das previsões: levar em conta, nas previsões que servirão a apoiar 
decisões em operações, um número só. Previsões, para operações, devem 
sempre ser consideradas com dois "números": a previsão em si e uma 
estimativado erro desta previsão. 
Erro 4 das previsões: desistir ou não se esforçar o suficiente para melhorar os 
processos de previsão por não se conseguir "acertar" as previsões, quando, 
em operações, não se necessita ter previsões perfeitas, mas sim, previsões 
consistentemente melhores que as da concorrência. 
Previsões
Correlação e regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Coleta e análise de dados
 Alguns cuidados básicos:
 Quanto mais dados históricos forem coletados e analisados mais confiável a técnica de previsão será;
 Os dados devem buscar a caracterização da demanda real pelos produtos da empresa, que não é necessariamente igual as vendas
passadas (faltas, postergação,...);
 Variações extraordinárias da demanda (greves, promoções, ...) devem ser analisadas e substituídas por valores médios, compatíveis
com o comportamento normal da demanda;
 O tamanho do período de consolidação dos dados (semanal, mensal,...) tem influência direta na escolha da técnica de previsão
mais adequada, assim como na análise das variações extraordinárias
Previsões
Correlação e regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Técnicas de previsão
A primeira etapa consiste em definir a razão pela qual necessitamos de previsões. Que produto, ou famílias de produtos, será previsto,
com que grau de acuracidade e detalhe a previsão trabalhará, e que recursos estarão disponíveis para esta previsão.
A sofisticação e o detalhamento do modelo depende da importância relativa do produto, ou família de produtos, a ser previsto e do
horizonte ao qual a previsão se destina.
Itens pouco significativos podem ser previstos com maior margem de erro, empregando-se técnicas simples. Assim como admite-se
margem de erro maior para previsões de longo prazo, empregando-se dados agregados de famílias de produtos.
Previsões
Correlação e regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Previsões de demanda: técnicas de previsão
Existem técnicas qualitativas e quantitativas. Cada uma tendo o seu campo de ação e sua aplicabilidade. Alguns fatores merecem
destaque na escolha da técnica de previsão:
• Decidir frente ao dilema “custo-acuracidade”;
• A disponibilidade de dados históricos;
• A disponibilidade de recursos computacionais;
• A experiência passada com a aplicação de determinada técnica;
• A disponibilidade de tempo para coletar, analisar e preparar os dados e a previsão;
• O período de planejamento para o qual necessitamos da previsão.
Previsões
Correlação e regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Previsões de demanda: técnicas de previsão
Existem uma série de técnicas disponíveis, com diferenças substanciais entre elas. Porém, cabe descrever as características gerais que
normalmente estão presentes em todas as técnicas de previsão, que são:
• Supõem-se que as causas que influenciaram a demanda passada continuarão a agir no futuro;
• As previsões não são perfeitas, pois não somos capazes de prever todas as variações aleatórias que ocorrerão;
• A acuracidade das previsões diminui com o aumento do período de tempo auscultado;
• A previsão para grupos de produtos é mais precisa do que para os produtos individualmente, visto que no grupo os erros
individuais de previsão se anulam.
Previsões
Correlação e regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Previsões de demanda: técnicas de previsão
As técnicas de previsão podem ser subdivididas em dois grandes grupos:
Técnicas qualitativas
privilegiam principalmente dados subjetivos, os quais são difíceis de representar numericamente. Estão baseadas na opinião e no
julgamento de pessoas chaves, especialistas nos produtos ou nos mercados onde atuam estes produtos;
Técnicas quantitativas
envolvem a análise numérica dos dados passados, isentando-se de opiniões pessoais ou palpites. Empregam-se modelos matemáticos
para projetar a demanda futura. Podem ser subdivididas em dois grandes grupos: as técnicas baseadas em séries temporais, e as
técnicas causais (Mais conhecidos: Regressão Simples e Múltipla)
Previsões
Correlação e regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Previsões de demanda: técnicas de previsão
Técnicas Qualitativas
Pouco tempo para coleta de dados, introdução de novos produtos, cenário político/econômico instável; questões estratégicas – em
conjunto com modelos matemáticos e técnicas quantitativas
Técnicas Quantitativas
Séries Temporais – modelo matemático da demanda futura relacionando dados históricos de vendas do produto com o tempo
Causais – associar dados históricos de vendas do produto com uma ou mais variáveis relacionadas à demanda
Previsões
Correlação e regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Modelos e ferramentas
Análise
Quantitativa
Análise
Qualitativa
Informações Informações
Previsão
Balanço Usados em situações 
nebulosas ou quando dados 
inexistem ou longo prazo
• Novos produtos
• Novas tecnologias
Envolve intuição e 
experiência
previsão de vendas pela Internetprever vendas de TVs a cores
Usados quando situação é 
estável e dados existem
• Produtos existentes
• Tecnologia corrente
Envolve técnicas 
matemáticas
Modelos temporais (projeção - futuro 
similar passado)
Modelos causais (explicação -
relações do passado similares ao 
futuro)
 Júri de opiniões de 
executivos
 Composto da força de vendas
 Método Delphi
 Pesquisa de mercado
Previsões
Correlação e regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
 Introdução a estatística
 Análise de dados
 Erros e Probabilidades
 Correlação e regressão
 Correlação
 Previsões
 Séries temporais
 Regressão
 Análise de variância
 Intervalo de confiança
 Experimentos
 Teste de hipóteses
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Partem do princípio de que a demanda futura será uma projeção dos seus valores passados, não sofrendo influência de outras variáveis.
É o método mais simples e usual de previsão, e quando bem elaborado oferece bons resultados.
Para se montar o modelo de previsão, é necessário plotar os dados passados e identificar os fatores que estão por trás das
características da curva obtida (Previsão final = composição dos fatores).
Uma curva temporal de previsão pode conter tendência, sazonalidade, variações irregulares e variações randômicas (há técnicas para
tratar cada um destes aspectos).
Séries temporais
Correlação e regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Algum termos importantes
0
10
20
30
40
50
60
70
Jan. Fev. Mar. Abr. Mai. Jun. Jul. Ago. Set. Out. Nov. Dez.
D
e
m
a
n
d
a
Variação irregular
Sazonalidade Tendência
Variação randônica
Correlação e regressão
Séries temporais
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Classificação:
ST de Modelo Fixo (Fixed-Model Time-Series) – apresentam equações definidas baseadas em avaliações a priori da existência de
determinadas componentes nos dados históricos (Mais simples, séries históricas não muito grandes);
ST de Modelo Aberto (Open-Model Time-Series) – analisam as ST de modo a identificar quais componentes realmente estão presentes,
para então criar um modelo único que projete tais componentes, prevendo os valores futuros (Mais elaboradas, maior quantidade de
dados).
Existem mais de 60 métodos do tipo ST!!
Correlação e regressão
Séries temporais
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Exercício
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Exercício II:
Utilizando séries temporais, determine a previsão de vendas para o 13 mês:
a) Utilizando modelos fixos de séries temporais
b) Utilizando modelos abertos(ou combinados, customizados) de séries temporais
c) Utilizando a função "Planilha de Previsão" fornecida pelo Excel
d) Compare os resultados 
Correlação e regressão
Séries temporais
Mês
Vendas 
(Qtd)
1 80
2 130
3 270
4 96
5 156
6 324
7 130
8 210
9 430
10 180
11 300
12 620
Solução: Arquivo Excel anexo!
PCP - 05c Previsões - Solução Exercício 0 Séries temporais.xlsx
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Instruções para habilitar o modo de análise de dados:
No menu “Arquivo”, selecionar: Opções / Suplementos
Habilitando o menu “Análise de Dados” do Excel
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
 Introdução a estatística
 Análise de dados
 Erros e Probabilidades
 Correlação e regressão
 Correlação
 Previsões
 Séries temporais
 Regressão
 Análise de variância
 Intervalo de confiança
 Experimentos
 Teste de hipóteses
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Modelos causais
Regressão linear simples e múltipla
Buscam prever a demanda de determinado produto a partir da
previsão de outra variável (interna ou externa à empresa) que esteja
relacionada com o produto.
Exemplo: Pneus e Carros, Vidros planos e Construção Civil
A relação entre as variáveis é uma função linear:
Variável 
dependente
Intercepto
populacional
Variável 
independente
Erro 
aleatório
X
Y
0 1= coeficiente angular
0 1i i iY X e   
Inclinação
populacional
Correlação e regressão
Regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Regressão linear simples e múltipla
iii XY  ˆ
ˆˆ
10 
1. Inclinação (1)
Estima-se que Y aumente em média 1 unidades para cada aumento de uma unidade de X
Exemplo: vendas(Y)=1+2*propaganda(X)+erro
Se 1 = 2, estima-se que as vendas (Y) aumentem em média 2 
unidades para cada unidade a mais de propaganda (X)
2. Intercepto (0)
Valor médio de Y quando X = 0.
Nem sempre é interpretável!!
No exemplo acima, o intercepto é o valor previsto para as vendas médias se não for gasto nada em propaganda 
(X=0).
As variáveis X e Y tem realmente uma relação linear ou a 
inclinação obtida é um resultado casual?
Correlação e regressão
Regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Regressão linear simples e múltipla
O objetivo da regressão linear simples consiste em encontrar uma equação linear de previsão, do tipo Y = m X + b (onde Y é a variável
dependente a ser prevista e X a variável independente da previsão), de forma que a soma dos quadrados dos erros de previsão (b) seja a
mínima possível. Este método também é conhecido como “regressão dos mínimos quadrados”.
Correlação e regressão
Regressão
    
   22 




XXn
YXXYn
m 
 
 
n
XmY
b
 

Y = mx + b
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Resíduos
O resíduo () é a diferença entre o valor observado e o valor previsto pela regressão 
Pode-se também escrever que:
Para análises de significância estatística, os resíduos devem ser independentes e normalmente
distribuídos para que as suposições do modelo de regressão estejam satisfeitas. Veremos isto
futuramente.
iii XY  ˆ
ˆˆ
10 
Valor previsto
pela regressão
Valor
observado
Resíduo
iii YY
ˆˆ 
Valor previsto
Valor observado
Correlação e regressão
Regressão
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Exercício
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Exercício III:
Vendas (k)
y
Qtd de alunos (k)
x
31,56 10
38,00 12
25,25 8
47,20 15
22,00 6,5
34,20 11
45,10 14,5
32,30 10,1
29,00 9,2
40,90 13,4
40,00 12,7
24,20 7,6
41,00 13,1
Após uma análise de correlação, uma cadeia de fastfood verificou que as vendas mensais de refeições em suas casas
estão relacionadas ao número de alunos matriculados em escolas situadas num raio de 2 quilômetros em torno da
casa. A empresa pretende instalar uma nova casa numa região onde o número de alunos é de 13750. Qual a previsão
da demanda para esta nova casa?
Correlação e regressão
Regressão
    
   22 




XXn
YXXYn
m 
 
 
n
XmY
b
 

Y = mx + b
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
Vendas (k)
y
Qtd de alunos (k)
x
XY Y^2 X^2 
31,56 10 315,60 996,03 100,00 
38,00 12 456,00 1.444,00 144,00 
25,25 8 202,00 637,56 64,00 
47,20 15 708,00 2.227,84 225,00 
22,00 6,5 143,00 484,00 42,25 
34,20 11 376,20 1.169,64 121,00 
45,10 14,5 653,95 2.034,01 210,25 
32,30 10,1 326,23 1.043,29 102,01 
29,00 9,2 266,80 841,00 84,64 
40,90 13,4 548,06 1.672,81 179,56 
40,00 12,7 508,00 1.600,00 161,29 
24,20 7,6 183,92 585,64 57,76 
41,00 13,1 537,10 1.681,00 171,61 
450,71 143,10 5.224,86 16.416,83 1.663,37 
Correlação e regressão
Regressão
Exercício III: (Solução)
Uma cadeia de fastfood verificou que as vendas mensais de refeições em suas casas estão relacionadas ao número de
alunos matriculados em escolas situadas num raio de 2 quilômetros em torno da casa. A empresa pretende instalar
uma nova casa numa região onde o número de alunos é de 13750. Qual a previsão da demanda para esta nova casa?
    
   22 




XXn
YXXYn
m = 
 
13 5224 86 143 10 450
13 1663 143 10
2
  
 

, , ,71
,37 ,
2,99 
 
Y    1757 2 99 13 75 42 869, , , , ou seja 42869 refeições 
 
 
n
XmY
b
 
 = 
450 2 143 10
13
,71 ,99 , 
 1,76 
 
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo
 Introdução a estatística
 Análise de dados
 Erros e Probabilidades
 Correlação e regressão
 Correlação
 Previsões
 Séries temporais
 Regressão
 Análise de variância
 Intervalo de confiança
 Experimentos
 Teste de hipóteses

Continue navegando