Buscar

GUIA DE ESTUDOS - MÉTODOS E QUANTITATIVOS - AULA 5 - PARTE 2

Prévia do material em texto

AULA 5 (PARTE 02) 
REGRESÃO LINEAR 
 
 
 
 
 
 
 
 
 
 
 
 
DEPARTAMENTO DE CIÊNCIAS CONTÁBEIS 
Disciplina: MÉTODOS QUANTITATIVOS VOLTADOS PARA 
PESQUISA EM CONTABILIDADE 
 
Professor: ALAN CARTER KULLACK 
 
105 
 
REGRESSÃO LINEAR 
 
 Definição: 
 É o processo estatístico que possui a finalidade de encontrar a 
 relação linear entre as variáveis aleatórias( dependentes e 
 independentes ),se a mesmas existirem. 
 
CLASSIFICAÇÃO 
 
As regressões lineares são basicamente divididas em duas: 
 
 Regressão Linear Simples; 
 Regressão Linear Múltipla: 
 
REGRESSÃO LINEAR SIMPLES(RLS) 
 
 Definição: 
 É o processo estatístico pelo qual derivamos os parâmetros “a” 
e “b” de uma função f (X). Estes parâmetros determinam as características da 
função que relaciona ‘Y’ com ‘X’ que no caso do modelo linear se representa 
por uma reta chamada de reta de regressão. 
 
 Em outras palavras, podemos supor que X é a variável independente e 
Y é a variável dependente, então a sua relação é dada como uma 
função linear (função do primeiro grau),isto é: 
 
Sendo: X = x ∈ |R; então temos: Y = f(x) ou y = ax + b (Função 1º grau) 
 Ex: y = 2x + 3 
 
 
106 
 
OBS1: A variável X é dita como variável independente ou explicativa. 
OBS2: A variável Y é dita como variável dependente ou resposta. 
OBS3: A letra a e b na função do 1º Grau, são coeficientes numéricos. 
 
FÓRMULAS: 
 
 
DESVIO-PADRÃO de X: Sxx = ∑X2 - ( ∑X)2 
 n 
 
 
COVARIÂNCIA DE X e Y: Sxy = ∑X.Y - (∑X).(∑Y) 
 n 
 
 
PARÂMETRO a: a = Sxy 
 Sxx 
 
 
PARÂMETRO b: b = Y – a.X 
 
 
EQUAÇÃO DA RETA: y = ax + b 
 
Portanto, através das fórmulas anteriores podemos definir a equação que 
poderá satisfazer a variável dependente(y). Com isso, podemos obter os 
valores necessários para estimar uma pesquisa no tocante ao planejamento 
quantitativo de uma determinada produção. Este processo, consegue reduzir 
os custos operacionais de uma empresa, diminuindo drasticamente os seus 
prejuízos ocasionados pela diminuição ou pelo excesso de produção e todos os 
seus gastos envolvidos. 
 
107 
 
Exemplo: 
 Uma metalúrgica, gera e consegue armazenar anualmente 70 
toneladas de resíduos no seu setor de produção.O gerente administrativo 
solicitou a um pesquisador contábil, que estimula-se uma produção de 800 
toneladas ao ano. 
 Com isso, o gerente questionou o pesquisador contábil se a empresa 
precisaria passar por uma reestruturação física para comportar essa nova 
geração de resíduos quando a produção chegasse 800 toneladas de 
produção. Através do levantamento obtido e observado pelo pesquisador na 
tabela a seguir, obtenha a resposta para o gerente da metalúrgica. 
 
n Xi Yi Xi.Yi Xi2 Yi2 
1 251 22 
2 260 23 
3 263 23 
4 265 25 
5 270 24 
6 275 26 
7 300 27 
8 312 29 
9 333 29 
10 345 31 
∑ 
Média 
 
Solução: 
 
1º Passo: Preencher a tabela;sendo Xi = a quantidade(em toneladas) de 
 produtos produzidos pela metalúrgica e Yi = a quantidade de 
 resíduos gerados pela empresa em cada período de produção X 
 
108 
 
 
n Xi Yi Xi.Yi Xi2 Yi2 
1 251 22 5522 63001 484 
2 260 23 5980 67600 529 
3 263 23 6049 69169 529 
4 265 25 6625 70225 625 
5 270 24 6480 72900 576 
6 275 26 7150 75625 676 
7 300 27 8100 90000 729 
8 312 29 9048 97344 841 
9 333 29 9657 110889 841 
10 345 31 10695 119025 961 
∑ 2874 259 75306 835778 6791 
Média 287,4 25,9 
 
2º Passo: Devemos calcular o coeficiente de correlação de Pearson(r): 
 
 r = n.∑Xi.Yi – (∑Xi).(∑Yi) 
 [ n.∑Xi2 – (Xi)2] . [ n.∑Yi2 – (∑Yi)2 ] 
 
r = 10.(75306) – (2874).(259) r = 8694 
 [ 10. 835778 – ( 2874)2 ] . [ 10.679 – (259)2] 81162416 
 
r = 8694 r = 0,9650328 ou r = 0,97 
 9009,02 
 
 
3º Passo: Devemos calcular a equação de r Square, para obtermos o 
 percentual de impacto da variável X no comportamento da variável 
 Y. Portanto,este percentual indicará a relação de confiabilidade de 
 resultado em relação aos resíduos gerados pela metalúrgica. 
109 
 
 
r Square = r2 r Square = (0,9650328)2 = 0,931 
 
Portanto,temos: 0,931 x 100% = 93,1 % (Porcentagem de confiabilidade 
referente aos resíduos gerados). 
 
OBS: O restante da porcentagem, isto é, os 6,9 % são considerado outros 
 fatores que contribuem para outras variáveis. 
 
4º Passo: Usaremos todas as fórmulas necessárias para determinar a 
 Equação da Reta. (y = ax + b) 
 
 a) Sxx = ∑X2 - ( ∑X)2 Sxx = 835778 - (2874)2 Sxx = 9780,4 
 n 10 
 
 b) Sxy = ∑X.Y - (∑X).(∑Y) Sxy = 75306 - (2874).(259) Sxy= 869,4 
 n 10 
 
c) a = Sxy a = 869,4 a = 0,0888 
 Sxx 9780,4 
 
d) b = Yi – a. Xi b = 25,9 -0,0888.(287,4) b = 0,3785 
 
e) y = ax + b y = 0,0888.x + 0,3785 
 
5º Passo: Aplicaremos a equação da reta(y = 0,0888x + 0,3785) para obtenção 
 do valor da variável y, a qual esta vinculada a quantidade de 
 toneladas geradas em resíduos pela produção de 800 toneladas de 
 produtos (x). 
 
Temos então: 
110 
 
 
 y = 0,0888.x + 0,3785 
 y = 0,0888.(800) + 0,375 
 y = 71,42 toneladas de resíduos. 
 
Portanto, o pesquisador contábil orientará o gerente administrativo da 
metalúrgica a reestruturar o seu espaço físico,pois terá um excedente de 1,42 
toneladas de resíduos a mais que atualmente. 
 
REGRESSÃO LINEAR MÚLTIPLA (RLM) 
 
 Definição: 
 É um conjunto de técnicas estatísticas que servem para 
 construir modelos que descrevem de maneira razoável relações 
 entre várias variáveis explicativas ( X ) de um determinado 
 processo. 
 
Em outras palavras, na RLM, outras variáveis são analisadas, proporcionando 
uma conclusão mais precisa sobre a variável em estudo. 
 
REPRESENTAÇÃO DE RLM 
 
 y = a + b1.X1 + b2.X2 + ....+ bn.Xn + ɛ 
 
onde: 
 y = variável dependente; 
 x = variável independente; 
 a = parâmetro do modelo de equação; 
 b= valor de impacto da variável x na variável y 
 ɛ = Erro aleatório da equação. 
 
111 
 
 
OBS1: Para facilitarmos os nossos cálculos utilizaremos apenas duas 
 variáveis independentes,acima deste valores,os cálculos serão 
 realizados somentepor softwares estatísticos,pois os cálculos ficariam 
 muito trabalhosos.Com isso,temos: 
 
 
OBS2: Podemos representar a fórmula da RLM pelo modelo dos mínimos 
 quadrados, a qual é expressa da seguinte maneira: 
 
 
OBS3: Ocorre duas mudanças,sendo na representação do valor de impacto e 
no parâmetro do modelo da equação, ficando: 
b = β e a = α 
 Para facilitar o nosso entendimento, estaremos demonstrando as 
fórmulas que fazem parte da montagem de uma RLM 
 
FÓRMULAS: 
 
1ª) Sy1 = ∑(Y.X1) - ∑Y.∑X1 
 n 
 
3ª) Sy11 = ∑X12 - (∑X1)2 
 n 
 
5ª) Sx22 = ∑x22 - (∑X2)2 
 n 
 
7ª) a = Y - X1.b1 - X2.b2 
 
 
 
 y = a + b1.X1 + b2.X2 + ɛ 
 
 y = α + β1.X1 + β2.X2 + ɛ 
 
2ª) Sy2 = ∑Y.X2 - ∑Y.∑X2 
 n 
4ª) Sx12 = ∑X1.X2 - ∑X1.∑X2 
 n 
6ª) Sy1 = Sx11 .b1 + Sx12.b2 
 Sy2 = Sx12 .b1 + Sx22.b2 
8ª) y = a + b1x1 + b2.x2 
 
112 
 
OBS: Se comparar a 6º fórmula com a 1º e 2º fórmula, teremos as seguintes 
 relações: 
 
 9ª) b1 = x22. y1 - x12. y1 
 x11.x22 - x122 
 
10ª) b2 = x11.y2 - x12.y1 
 x11.x22 - x122 
Exemplo: 
 Considere os dados da tabela a seguir, como sendo das variáveis: 
 Y = Quantidade vendida de um produto, X1 = Preço do produto e 
 X2 = Gasto com a divulgação do produto. Determinar a equação de 
 regressão de Y em função de X1 e de X2 . 
 
Q(Kg) Preço (R$) Investimento(R$ Mil) 
55 100 550 
70 90 630 
90 80 720 
100 70 700 
90 70 625 
105 70 735 
80 70 560 
110 65 715 
125 60 750 
115 60 690 
130 55 715 
130 50 650 
 
 
Portanto, montando os parâmetros da regressão linear múltipla, temos: 
 
113 
 
 
Y X1 X2 Y2 X12 X22 Y.X1 Y.X2 X1.X2 
55 100 550 3025 10000 302500 5500 30250 55000 
70 90 630 4900 8100 396900 6300 44100 56700 
90 80 720 8100 6400 518400 7200 64800 57600 
100 70 700 10000 4900 490000 7000 70000 49000 
90 70 625 8100 4900 390625 6300 56250 43750 
105 70 735 11025 4900 540225 7350 77175 51450 
80 70 560 6400 4900 313600 5600 44800 39200 
110 65 715 12100 4225 511225 7150 78650 46475 
125 60 750 15625 3600 562500 7500 93750 45000 
115 60 690 13225 3600 476100 6900 79350 41400 
130 55 715 16900 3025 511225 7150 92950 39325 
130 50 650 16900 2500 422500 6500 84500 32500 
 
Y 
 
X1 
 
X2 
 
100 70 670 
 
 e X11 = 2.250 y1 = - 3.550 
 X22 = 49.000 y2 = 125,75 
 X12 = - 5.400 yy = 6300 
Onde: 
 α = Y - X1.b1 - X2.b2 
 α = 100- 70.(-1,3077) - 670(0,1125) = 116,16 
 α = 116,16 
 
 β1 = x22. y1 - x12. y1 
 x11.x22 - x122 
 
β1 = (49000). (-3550) - (-5400).(125,75) = -1,3077 ou b1 = -1,31 
 (2250).(49000) - (-5400)2 
114 
 
 
 β2 = x11.y2 - x12.y1 
 x11.x22 - x122 
 
 β2 = (2250).(125,75) - (-5400).(-3550) = 0,1125 b2 = 0,1125 
 (2250).(49000) - (-5400)2 
 
Portanto, a equação procurada é: 
y = α + β1x1 + β2.x2 
y = 116,16 – 1,31X1 + 0,11X2 
 
Conclusão: 
Desta forma, uma redução de R$10 no preço do produto, sem investimento em 
publicidade, aumentaria as vendas em aproximadamente 13 kg. Um aumento 
na publicidade de 100 mil, sem alteração no preço, aumenta as vendas em 11 
kg. 
 
GRÁFICO DE REGRESSÃO LINEAR SIMPLES 
 
Uma regressão linear simples pode ser representada por gráficos lineares, isto 
é, a função dada será representada por retas ou pela interseção delas,além 
dos pontos aleatórios que ficam em seu entorno . 
 
Exemplo: Os dados abaixo, indicam o valor y do aluguel e a idade x de 5 
 casas. 
 
 
 
 Equação de Regressão: 
 y = 6,87 – 0,261 
 
 
x 10 13 5 7 20 
y 4 3 6 5 2 
 
115 
 
Portanto, o gráfico fica: 
 
Fonte: < www.inf.ufsc.br/~ogliari/.../Analise_de_Regressao_linear_simples.pp> 
 
 OBS1: Quando temos apenas uma variável independente, obtemos uma reta 
 no gráfico; 
 OBS2 Os pontos próximo da reta, são os valores de Y ,eles indicam os erros 
 aleatório ocasiona na distribuição. 
 
 
GRÁFICO DE REGRESSÃO LINEAR MULTIPLA 
 
Um gráfico de regressão linear múltipla, isto é, o qual possui duas ou mais 
variáveis independentes, determina uma parábola em sua forma.Podemos 
chamar essa função quadrática ou função do 2º Grau. 
 
 
 
 
 
 
 y = a + b1.X1 + b2.X2 + ɛ 
 
116 
 
 
Observe o gráfico RLM 
 
 
 Fonte: < www.inf.ufsc.br/~ogliari/.../Analise_de_Regressao_linear_simples.pp> 
 
 
Esse modelo, embora não seja uma linha reta, continua sendo um modelo 
linear nos parâmetros. O método que será discutido para o modelo de 
regressão linear simples aplica-se diretamente aos demais modelos lineares 
nos parâmetros. 
 
 
 
 
 
 
 
 
 
117 
 
 
EXERCÍCIOS DE FIXAÇÃO 
 
01) Um pesquisador quis constatar a umidade relativa(UR) do ar com a 
 secagem de sementes de germinação,com isso,utilizou a relação 
 linear do 1º grau, e obteve com o experimento 4 diferentes valores 
 em porcentagem (%) para UR,obtendo os seguintes dados: 
 
% UR 20 30 40 50 
% Germinação 94 96 95 97 
 
Calcule a porcentagem (%) de germinação esperada quando UR = 45%. 
 
02) Para cada caso abaixo, estime a correspondente reta de regressão: 
a) 
n X Y XY X    20 200 300 6200 3600
2, , , , .
 
 
b) 
     .620;3100,37;72;36 2XXYYXn
 
 
03) (BACEN/2006/UFF) Uma empresa.com a finalidade de determinar a 
relação entre os gastos anuais em pesquisa e desenvolvimento (X) em 
milhares de reais e o acréscimo anula nas vendas(Y),também em milhares de 
reais,optou por utilizar o modelo linear simples Yi = α +βXi + ɛi, em que Yi é o 
acréscimo nas vendas no ano i, Xi é o Valor gasto em pesquisa e 
desenvolvimento no ano i e ɛi é o erro aleatório com respectivas hipóteses 
consideradas para RLS (α e β) são parâmetros desconhecidos. Considerou 
para o estudo as seguintes informações referente às observações nos últimos 
10 anos da empresa. 
 
∑Yi = 160 ∑Xi = 100 ∑XiYi = 1900 ∑Xi2 = 1200 ∑Yi2 = 3060 
 
 
118 
 
Utilizando a equação da reta obtida pelo método dos mínimos quadrados, 
obteve-se para um determinado gasto em pesquisa e desenvolvimento uma 
previsão de acréscimo nas vendas no valor de 19 mil reais. O valor que 
considerou para o gasto em pesquisa e desenvolvimento, foi de: 
 
a) 14 mil reais 
b) 13,25 mil reais 
c) 13 mil reais 
d) 12,4 mil reais 
e) 12 mil reais 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
119 
 
 
GABARITO: 
 
01- 95,5 % 
 
 
02- a) y = -5 + 2x b) y = 6,4 - 11,8x 
 
 
 
03- Temos: Sxx =∑X2 - ( ∑X)2 = 1200 - 1002 = 200 
 n 10 
Sxy = ∑X.Y - (∑X).(∑Y) = 1900 - 160.100 = 300n 10 
 b = Sxy a = 300 a = 1,5 
 Sxx 200 
 
 a= Y – a X b = 160 - (1,5). 100 = 1 
 10 10 
Desta maneira,obtemos a equação da reta: 
 y = a + bx y = 1 + 1,5x 
 
Sendo y = 19 mil reais, então temos: 
19 = 1,5x + 1 x = 12 mil reais. 
 
Portanto, o valor gasto em pesquisa e desenvolvimento foi de R$ 12.000,00 
(Letra E)

Outros materiais

Materiais relacionados

Perguntas relacionadas

Materiais recentes

Perguntas Recentes