Baixe o app para aproveitar ainda mais
Prévia do material em texto
AULA 5 (PARTE 02) REGRESÃO LINEAR DEPARTAMENTO DE CIÊNCIAS CONTÁBEIS Disciplina: MÉTODOS QUANTITATIVOS VOLTADOS PARA PESQUISA EM CONTABILIDADE Professor: ALAN CARTER KULLACK 105 REGRESSÃO LINEAR Definição: É o processo estatístico que possui a finalidade de encontrar a relação linear entre as variáveis aleatórias( dependentes e independentes ),se a mesmas existirem. CLASSIFICAÇÃO As regressões lineares são basicamente divididas em duas: Regressão Linear Simples; Regressão Linear Múltipla: REGRESSÃO LINEAR SIMPLES(RLS) Definição: É o processo estatístico pelo qual derivamos os parâmetros “a” e “b” de uma função f (X). Estes parâmetros determinam as características da função que relaciona ‘Y’ com ‘X’ que no caso do modelo linear se representa por uma reta chamada de reta de regressão. Em outras palavras, podemos supor que X é a variável independente e Y é a variável dependente, então a sua relação é dada como uma função linear (função do primeiro grau),isto é: Sendo: X = x ∈ |R; então temos: Y = f(x) ou y = ax + b (Função 1º grau) Ex: y = 2x + 3 106 OBS1: A variável X é dita como variável independente ou explicativa. OBS2: A variável Y é dita como variável dependente ou resposta. OBS3: A letra a e b na função do 1º Grau, são coeficientes numéricos. FÓRMULAS: DESVIO-PADRÃO de X: Sxx = ∑X2 - ( ∑X)2 n COVARIÂNCIA DE X e Y: Sxy = ∑X.Y - (∑X).(∑Y) n PARÂMETRO a: a = Sxy Sxx PARÂMETRO b: b = Y – a.X EQUAÇÃO DA RETA: y = ax + b Portanto, através das fórmulas anteriores podemos definir a equação que poderá satisfazer a variável dependente(y). Com isso, podemos obter os valores necessários para estimar uma pesquisa no tocante ao planejamento quantitativo de uma determinada produção. Este processo, consegue reduzir os custos operacionais de uma empresa, diminuindo drasticamente os seus prejuízos ocasionados pela diminuição ou pelo excesso de produção e todos os seus gastos envolvidos. 107 Exemplo: Uma metalúrgica, gera e consegue armazenar anualmente 70 toneladas de resíduos no seu setor de produção.O gerente administrativo solicitou a um pesquisador contábil, que estimula-se uma produção de 800 toneladas ao ano. Com isso, o gerente questionou o pesquisador contábil se a empresa precisaria passar por uma reestruturação física para comportar essa nova geração de resíduos quando a produção chegasse 800 toneladas de produção. Através do levantamento obtido e observado pelo pesquisador na tabela a seguir, obtenha a resposta para o gerente da metalúrgica. n Xi Yi Xi.Yi Xi2 Yi2 1 251 22 2 260 23 3 263 23 4 265 25 5 270 24 6 275 26 7 300 27 8 312 29 9 333 29 10 345 31 ∑ Média Solução: 1º Passo: Preencher a tabela;sendo Xi = a quantidade(em toneladas) de produtos produzidos pela metalúrgica e Yi = a quantidade de resíduos gerados pela empresa em cada período de produção X 108 n Xi Yi Xi.Yi Xi2 Yi2 1 251 22 5522 63001 484 2 260 23 5980 67600 529 3 263 23 6049 69169 529 4 265 25 6625 70225 625 5 270 24 6480 72900 576 6 275 26 7150 75625 676 7 300 27 8100 90000 729 8 312 29 9048 97344 841 9 333 29 9657 110889 841 10 345 31 10695 119025 961 ∑ 2874 259 75306 835778 6791 Média 287,4 25,9 2º Passo: Devemos calcular o coeficiente de correlação de Pearson(r): r = n.∑Xi.Yi – (∑Xi).(∑Yi) [ n.∑Xi2 – (Xi)2] . [ n.∑Yi2 – (∑Yi)2 ] r = 10.(75306) – (2874).(259) r = 8694 [ 10. 835778 – ( 2874)2 ] . [ 10.679 – (259)2] 81162416 r = 8694 r = 0,9650328 ou r = 0,97 9009,02 3º Passo: Devemos calcular a equação de r Square, para obtermos o percentual de impacto da variável X no comportamento da variável Y. Portanto,este percentual indicará a relação de confiabilidade de resultado em relação aos resíduos gerados pela metalúrgica. 109 r Square = r2 r Square = (0,9650328)2 = 0,931 Portanto,temos: 0,931 x 100% = 93,1 % (Porcentagem de confiabilidade referente aos resíduos gerados). OBS: O restante da porcentagem, isto é, os 6,9 % são considerado outros fatores que contribuem para outras variáveis. 4º Passo: Usaremos todas as fórmulas necessárias para determinar a Equação da Reta. (y = ax + b) a) Sxx = ∑X2 - ( ∑X)2 Sxx = 835778 - (2874)2 Sxx = 9780,4 n 10 b) Sxy = ∑X.Y - (∑X).(∑Y) Sxy = 75306 - (2874).(259) Sxy= 869,4 n 10 c) a = Sxy a = 869,4 a = 0,0888 Sxx 9780,4 d) b = Yi – a. Xi b = 25,9 -0,0888.(287,4) b = 0,3785 e) y = ax + b y = 0,0888.x + 0,3785 5º Passo: Aplicaremos a equação da reta(y = 0,0888x + 0,3785) para obtenção do valor da variável y, a qual esta vinculada a quantidade de toneladas geradas em resíduos pela produção de 800 toneladas de produtos (x). Temos então: 110 y = 0,0888.x + 0,3785 y = 0,0888.(800) + 0,375 y = 71,42 toneladas de resíduos. Portanto, o pesquisador contábil orientará o gerente administrativo da metalúrgica a reestruturar o seu espaço físico,pois terá um excedente de 1,42 toneladas de resíduos a mais que atualmente. REGRESSÃO LINEAR MÚLTIPLA (RLM) Definição: É um conjunto de técnicas estatísticas que servem para construir modelos que descrevem de maneira razoável relações entre várias variáveis explicativas ( X ) de um determinado processo. Em outras palavras, na RLM, outras variáveis são analisadas, proporcionando uma conclusão mais precisa sobre a variável em estudo. REPRESENTAÇÃO DE RLM y = a + b1.X1 + b2.X2 + ....+ bn.Xn + ɛ onde: y = variável dependente; x = variável independente; a = parâmetro do modelo de equação; b= valor de impacto da variável x na variável y ɛ = Erro aleatório da equação. 111 OBS1: Para facilitarmos os nossos cálculos utilizaremos apenas duas variáveis independentes,acima deste valores,os cálculos serão realizados somentepor softwares estatísticos,pois os cálculos ficariam muito trabalhosos.Com isso,temos: OBS2: Podemos representar a fórmula da RLM pelo modelo dos mínimos quadrados, a qual é expressa da seguinte maneira: OBS3: Ocorre duas mudanças,sendo na representação do valor de impacto e no parâmetro do modelo da equação, ficando: b = β e a = α Para facilitar o nosso entendimento, estaremos demonstrando as fórmulas que fazem parte da montagem de uma RLM FÓRMULAS: 1ª) Sy1 = ∑(Y.X1) - ∑Y.∑X1 n 3ª) Sy11 = ∑X12 - (∑X1)2 n 5ª) Sx22 = ∑x22 - (∑X2)2 n 7ª) a = Y - X1.b1 - X2.b2 y = a + b1.X1 + b2.X2 + ɛ y = α + β1.X1 + β2.X2 + ɛ 2ª) Sy2 = ∑Y.X2 - ∑Y.∑X2 n 4ª) Sx12 = ∑X1.X2 - ∑X1.∑X2 n 6ª) Sy1 = Sx11 .b1 + Sx12.b2 Sy2 = Sx12 .b1 + Sx22.b2 8ª) y = a + b1x1 + b2.x2 112 OBS: Se comparar a 6º fórmula com a 1º e 2º fórmula, teremos as seguintes relações: 9ª) b1 = x22. y1 - x12. y1 x11.x22 - x122 10ª) b2 = x11.y2 - x12.y1 x11.x22 - x122 Exemplo: Considere os dados da tabela a seguir, como sendo das variáveis: Y = Quantidade vendida de um produto, X1 = Preço do produto e X2 = Gasto com a divulgação do produto. Determinar a equação de regressão de Y em função de X1 e de X2 . Q(Kg) Preço (R$) Investimento(R$ Mil) 55 100 550 70 90 630 90 80 720 100 70 700 90 70 625 105 70 735 80 70 560 110 65 715 125 60 750 115 60 690 130 55 715 130 50 650 Portanto, montando os parâmetros da regressão linear múltipla, temos: 113 Y X1 X2 Y2 X12 X22 Y.X1 Y.X2 X1.X2 55 100 550 3025 10000 302500 5500 30250 55000 70 90 630 4900 8100 396900 6300 44100 56700 90 80 720 8100 6400 518400 7200 64800 57600 100 70 700 10000 4900 490000 7000 70000 49000 90 70 625 8100 4900 390625 6300 56250 43750 105 70 735 11025 4900 540225 7350 77175 51450 80 70 560 6400 4900 313600 5600 44800 39200 110 65 715 12100 4225 511225 7150 78650 46475 125 60 750 15625 3600 562500 7500 93750 45000 115 60 690 13225 3600 476100 6900 79350 41400 130 55 715 16900 3025 511225 7150 92950 39325 130 50 650 16900 2500 422500 6500 84500 32500 Y X1 X2 100 70 670 e X11 = 2.250 y1 = - 3.550 X22 = 49.000 y2 = 125,75 X12 = - 5.400 yy = 6300 Onde: α = Y - X1.b1 - X2.b2 α = 100- 70.(-1,3077) - 670(0,1125) = 116,16 α = 116,16 β1 = x22. y1 - x12. y1 x11.x22 - x122 β1 = (49000). (-3550) - (-5400).(125,75) = -1,3077 ou b1 = -1,31 (2250).(49000) - (-5400)2 114 β2 = x11.y2 - x12.y1 x11.x22 - x122 β2 = (2250).(125,75) - (-5400).(-3550) = 0,1125 b2 = 0,1125 (2250).(49000) - (-5400)2 Portanto, a equação procurada é: y = α + β1x1 + β2.x2 y = 116,16 – 1,31X1 + 0,11X2 Conclusão: Desta forma, uma redução de R$10 no preço do produto, sem investimento em publicidade, aumentaria as vendas em aproximadamente 13 kg. Um aumento na publicidade de 100 mil, sem alteração no preço, aumenta as vendas em 11 kg. GRÁFICO DE REGRESSÃO LINEAR SIMPLES Uma regressão linear simples pode ser representada por gráficos lineares, isto é, a função dada será representada por retas ou pela interseção delas,além dos pontos aleatórios que ficam em seu entorno . Exemplo: Os dados abaixo, indicam o valor y do aluguel e a idade x de 5 casas. Equação de Regressão: y = 6,87 – 0,261 x 10 13 5 7 20 y 4 3 6 5 2 115 Portanto, o gráfico fica: Fonte: < www.inf.ufsc.br/~ogliari/.../Analise_de_Regressao_linear_simples.pp> OBS1: Quando temos apenas uma variável independente, obtemos uma reta no gráfico; OBS2 Os pontos próximo da reta, são os valores de Y ,eles indicam os erros aleatório ocasiona na distribuição. GRÁFICO DE REGRESSÃO LINEAR MULTIPLA Um gráfico de regressão linear múltipla, isto é, o qual possui duas ou mais variáveis independentes, determina uma parábola em sua forma.Podemos chamar essa função quadrática ou função do 2º Grau. y = a + b1.X1 + b2.X2 + ɛ 116 Observe o gráfico RLM Fonte: < www.inf.ufsc.br/~ogliari/.../Analise_de_Regressao_linear_simples.pp> Esse modelo, embora não seja uma linha reta, continua sendo um modelo linear nos parâmetros. O método que será discutido para o modelo de regressão linear simples aplica-se diretamente aos demais modelos lineares nos parâmetros. 117 EXERCÍCIOS DE FIXAÇÃO 01) Um pesquisador quis constatar a umidade relativa(UR) do ar com a secagem de sementes de germinação,com isso,utilizou a relação linear do 1º grau, e obteve com o experimento 4 diferentes valores em porcentagem (%) para UR,obtendo os seguintes dados: % UR 20 30 40 50 % Germinação 94 96 95 97 Calcule a porcentagem (%) de germinação esperada quando UR = 45%. 02) Para cada caso abaixo, estime a correspondente reta de regressão: a) n X Y XY X 20 200 300 6200 3600 2, , , , . b) .620;3100,37;72;36 2XXYYXn 03) (BACEN/2006/UFF) Uma empresa.com a finalidade de determinar a relação entre os gastos anuais em pesquisa e desenvolvimento (X) em milhares de reais e o acréscimo anula nas vendas(Y),também em milhares de reais,optou por utilizar o modelo linear simples Yi = α +βXi + ɛi, em que Yi é o acréscimo nas vendas no ano i, Xi é o Valor gasto em pesquisa e desenvolvimento no ano i e ɛi é o erro aleatório com respectivas hipóteses consideradas para RLS (α e β) são parâmetros desconhecidos. Considerou para o estudo as seguintes informações referente às observações nos últimos 10 anos da empresa. ∑Yi = 160 ∑Xi = 100 ∑XiYi = 1900 ∑Xi2 = 1200 ∑Yi2 = 3060 118 Utilizando a equação da reta obtida pelo método dos mínimos quadrados, obteve-se para um determinado gasto em pesquisa e desenvolvimento uma previsão de acréscimo nas vendas no valor de 19 mil reais. O valor que considerou para o gasto em pesquisa e desenvolvimento, foi de: a) 14 mil reais b) 13,25 mil reais c) 13 mil reais d) 12,4 mil reais e) 12 mil reais 119 GABARITO: 01- 95,5 % 02- a) y = -5 + 2x b) y = 6,4 - 11,8x 03- Temos: Sxx =∑X2 - ( ∑X)2 = 1200 - 1002 = 200 n 10 Sxy = ∑X.Y - (∑X).(∑Y) = 1900 - 160.100 = 300n 10 b = Sxy a = 300 a = 1,5 Sxx 200 a= Y – a X b = 160 - (1,5). 100 = 1 10 10 Desta maneira,obtemos a equação da reta: y = a + bx y = 1 + 1,5x Sendo y = 19 mil reais, então temos: 19 = 1,5x + 1 x = 12 mil reais. Portanto, o valor gasto em pesquisa e desenvolvimento foi de R$ 12.000,00 (Letra E)
Compartilhar