Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA APLICADA ÀS ANÁLISES CONTÁBEIS AULA 6 Prof. Aline Purcote 2 CONVERSA INICIAL Quando analisamos situações do dia a dia, podemos estar interessados em conhecer como uma variável impacta no comportamento de outra. Assim, surge a correlação, que está ligada ao grau de relação existente entre duas ou mais variáveis. A força dessa relação pode ser calculada pelo coeficiente de correlação linear de Pearson indicando se há uma relação positiva, negativa ou nula. A relação existente entre variáveis orienta análises e ajuda na tomada de decisões em várias situações do cotidiano. Outra análise que podemos realizar é a análise de regressão, que tem como objetivo determinar o modelo que expressa a relação entre as variáveis, encontrando uma equação que descreve esse relacionamento. Quando o problema envolve apenas duas variáveis, temos uma regressão simples e mais de duas trabalhamos com uma regressão múltipla. Portanto, a correlação fornece um número que indica o grau de relacionamento entre as variáveis, já a regressão apresenta como resultado uma equação matemática que descreve esse relacionamento. CONTEXTUALIZANDO Em algumas situações, trabalhamos com diferentes variáveis e precisamos entender como elas se relacionam. Podemos estar interessados em saber se há alguma relação entre o volume de vendas e o preço de um produto, se o clima altera o consumo de uma determinada mercadoria, se o número de peças produzidas interfere no número de peças defeituosas, se a média de tempo de atraso de pagamento tem relação com o número de erros de fatura, se a venda de uma empresa se relaciona com os gastos promocionais ou se há relação entre a demanda de um determinado produto com o seu preço. Logo, pensamos em várias situações em que o estudo da correlação e regressão pode auxiliar na tomada de decisão. Trabalhamos com diferentes variáveis e podemos encontrar a relação e o grau desse relacionamento, podendo aplicar e estudar as variáveis em diferentes situações e áreas do conhecimento, por exemplo, a relação entre a idade e altura das crianças, tempo de prática de esportes e ritmo cardíaco, tempo de estudo e a nota na prova, taxa de desemprego e a taxa de analfabetismo. 3 Para entender como ocorrem essas análises, veremos os conceitos referentes à correlação, cálculo e interpretação do coeficiente de correlação de Pearson, regressão linear e regressão múltipla. TEMA 1 – CORRELAÇÃO O problema da correlação está ligado ao grau de relação existente entre duas ou mais variáveis e desejamos determinar até que ponto essa relação pode ser considerada. A representação gráfica de duas variáveis é chamada de Diagrama de Dispersão, que indica a forma da relação entre as variáveis estudadas. Segundo Castanheira (2016), por intermédio da análise, inicialmente visual, do diagrama, podemos imediatamente constatar se existe alguma relação entre as variáveis envolvidas e, em caso positivo, se pode ser tratada como aproximadamente linear. Quando os valores das duas variáveis estão próximos a uma reta, temos uma correlação linear. Os aspectos da correlação linear podem ser analisados pelo diagrama de dispersão que ilustra as variações, podendo ocorrer uma correlação linear positiva e perfeita, negativa e perfeita, positiva, negativa ou nula. Correlação linear positiva e perfeita: valor alto em uma variável corresponde a valor alto na outra variável, ou seja, se uma variável aumenta, a outra também aumenta. É considerada perfeita sempre que os pontos estiverem perfeitamente alinhados. Correlação linear negativa e perfeita: valor alto em uma variável corresponde a valor baixo na outra variável, ou seja, se uma variável aumenta, a outra diminui. É considerada perfeita sempre que os pontos estiverem perfeitamente alinhados. 4 Correlação linear positiva: quando as variáveis crescem no mesmo sentido, ou seja, se uma variável aumenta, a outra também aumenta. Correlação linear negativa: quando as variáveis crescem em sentido contrário, ou seja, se uma variável aumenta, a outra diminui. Correlação linear nula: não existe correlação, ou seja, os valores estão totalmente dispersos. 5 TEMA 2 – COEFICIENTE DE CORRELAÇÃO DE PEARSON Vimos que a correlação pode ser avaliada pelo Diagrama de Dispersão, mas, além da forma gráfica, também existem outras formas de verificar se a correlação entre variáveis é forte ou não. Uma delas é o cálculo do coeficiente de correlação linear de Pearson, que indica a força da relação entre duas variáveis. Esse coeficiente varia entre -1 e 1 e quanto mais próximo estiver destes valores, melhor é o grau de correlação linear entre as variáveis. Quando o coeficiente de correlação se aproxima de 1, há uma relação linear positiva e quando se aproxima de -1 temos a correlação negativa. O coeficiente igual a 1 ou -1, indica correlação linear positiva perfeita e negativa perfeita. Um coeficiente igual a zero demonstra que não há relação entre as duas variáveis, ou seja, a correlação linear é nula. Figura 1 – Coeficiente de relação Fonte: Elaborado pela autora. O coeficiente de correlação de Pearson (r) e é dado pela fórmula: Exemplo: uma empresa realizou uma pesquisa para estudar como varia a procura de determinado produto em função do preço de venda, obtendo os seguintes resultados. Calcule o coeficiente de correlação linear. 6 Tabela 1 – Variação de um determinado produto (1) Fonte: Elaborado pela autora. O primeiro passo será multiplicar os valores (X.Y), encontrar as potências X² e Y² para depois somar X, Y, X.Y, X² e Y². Faremos as operações diretas na tabela, conforme abaixo: Para a primeira linha temos: X. Y = 162 . 248 = 40.176 X² = 162² = 26.244 Y² = 248² = 61.504 Seguimos o mesmo processo para as demais linhas e, após, somamos cada valor, ou seja, cada coluna: Tabela 2 – Variação de um determinado produto (2) Fonte: Elaborado pela autora. Com os dados aplicamos a fórmula, sendo que o n é igual à quantidade de dados fornecidos, ou seja, n = 5. Preço de Venda Venda Mensal 162 248 167 242 173 215 176 220 180 205 Preço de Venda Venda Mensal X.Y X² Y² 162 248 40.176 26.244 61.504 167 242 40.414 27.889 58.564 173 215 37.195 29.929 46.225 176 220 38.720 30.976 48.400 180 205 36.900 32.400 42.025 858 1130 193.405 147.438 256.718 7 22 1130256718.5.858147438.5 )1130.858()193405.5( r 12769001283590.736164737190 969540967025 r 6690.1026 2515 r 6863940 2515 r 91221,2619 2515 r 95996,0r Obtemos um coeficiente igual a -0,95996, assim temos uma correlação linear negativa, conforme observamos no gráfico de dispersão: Figura 2 – Gráfico de dispersão Fonte: Elaborado pela autora. TEMA 3 – REGRESSÃO O objetivo da regressão está em determinar a função que exprime a relação entre duas ou mais variáveis e tem como resultado uma equação que descreve o relacionamento entre elas. Quando estudamos apenas duas variáveis, temos uma regressão simples e mais de uma regressão múltipla. 0 50 100 150 200 250 300 160 165 170 175 180 185 Venda Mensal 8 Na regressão, y é chamado de variável dependente ou variável não controlada, já o x é a variávelindependente, que é a variável que pode ser controlada em um experimento. Segundo Castanheira (2016), em termos da complexidade das funções ajustantes, a regressão é chamada de linear quando o ajustamento é feito por uma função do primeiro grau, ou seja, pela equação de uma reta e não linear quando o ajustamento é feito por uma função de grau superior a um, ou seja, por uma função exponencial, geométrica, parabólica etc. Para que a regressão possa ser útil, é necessário saber construir um modelo, estimar seus parâmetros com base nos dados relativos às variáveis e interpretar os resultados. TEMA 4 – REGRESSÃO LINEAR Uma regressão é dita linear quando o ajustamento dos dados é feito por uma função do primeiro grau, tendo como representação uma reta. O nosso principal objetivo será aproximar por uma linha reta um conjunto de valores, determinando a equação de regressão linear simples que melhor se ajuste aos dados, ou seja, precisamos encontrar os coeficientes da equação da reta: y = a + bx Um dos métodos utilizados para encontrar as estimativas de a e b é o Método dos Mínimos Quadrados, que consiste em tomar como estimativas os valores que minimizam a soma dos quadrados dos desvios. O coeficiente a é chamado de coeficiente angular e b de coeficiente linear, cujos valores serão calculados utilizando as seguintes fórmulas: 22 .. xxn yxyxn b n x b n y a ou xbya Exemplo: Considere a seguinte tabela, que indica as quantidades produzidas de determinado produto e seus respectivos custos totais de produção. Pela análise de regressão, encontre a reta que melhor se ajuste ao conjunto de dados. 9 Tabela 3 – Relação entre a quantidade e custo de um produto (1) Fonte: Elaborado pela autora. Para encontrar a reta de regressão, precisamos primeiro encontrar: x.y, x² e os somatórios, cálculos que apresentamos diretamente na tabela. Para a primeira linha temos: x.y = 10 . 150 = 1500 x² = 10² = 100 Seguir o mesmo processo para as demais linhas e, após, somar cada coluna: Tabela 4 – Relação entre a quantidade e custo de um produto (2) Fonte: Elaborado pela autora. Com os cálculos realizados aplicamos as fórmulas para encontrar os coeficientes a e b onde n é igual a 5, que é a quantidade de dados fornecidos: 22 .. xxn yxyxn b 225517725.5 2720.255183950.5 b Quantidades Produzidas Custo Total (R$) 10 150 25 290 50 540 80 840 90 900 Quantidades Produzidas Custo Total (R$) x.y x² 10 150 1.500 100 25 290 7.250 625 50 540 27.000 2.500 80 840 67.200 6.400 90 900 81.000 8.100 255 2.720 183.950 17.725 10 6502588625 693600919750 b 5826,9 23600 226150 b n x b n y a 5 255 5826,9 5 2720 a 515826,9544 a 2874,557126,488544 a Utilizando os coeficientes a e b, encontramos a equação da reta de regressão: y = a + bx y = 55,2874 + 9,5826 x O diagrama de dispersão mostra os pontos e a reta de regressão obtida: Figura 3 – Diagrama de dispersão (2) Fonte: Elaborado pela autora. 0 100 200 300 400 500 600 700 800 900 1000 0 20 40 60 80 100 Custo Total (R$) 11 Segundo Castanheira (2016), a regressão linear simples é normalmente utilizada para estudar a relação existente entre variáveis, com o propósito de fazer previsões com base nos resultados obtidos nelas. Considerando o exemplo, qual seria o valor estimado do custo para uma produção de 180 unidades? Utilizaremos a equação encontrada para prever qual será o custo na produção de 180 unidades, ou seja, substituímos o x da equação por 180: y = 55,2874 + 9,5826 x y = 55,2874 + 9,5826 . 180 y = 55,1874 + 1724,8680 y = 1780,0554 = 1.780 Assim, para produzir 180 unidades, temos um custo previsto de R$ 1.780. TEMA 5 – REGRESSÃO LINEAR MÚLTIPLA Determinadas aplicações exigem modelos mais complexos do que o utilizado na regressão linear simples. Nas aplicações que precisamos trabalhar com mais de uma variável independente, utilizamos a regressão linear múltipla, proporcionando uma conclusão mais precisa sobre a variável em estudo. Por exemplo, queremos verificar o consumo de determinado produto levando em consideração a renda dos clientes e preço do produto, logo temos duas variáveis independentes: a renda e o preço. De acordo com Castanheira (2016), quando uma variável dependente está simultaneamente correlacionada a mais de uma variável independente, a análise será efetuada pela fórmula: onde: y = variável dependente M1,2,...n = coeficientes de regressão x1,2,...,n = variáveis independentes B = múltiplo intercepto Quando temos duas variáveis, os parâmetros são determinados utilizando as seguintes fórmulas: 12 onde: Exemplo: a seguinte tabela relaciona o consumo de matéria-prima (em toneladas) para produção de dois produtos A e B, sendo x1 e x2 as quantidades produzidas de cada produto respectivamente. Determine a equação de regressão linear múltipla. 13 Tabela 5 – Consumo de matéria-prima (1) Fonte: Elaborado pela autora. Para aplicação da fórmula, precisamos encontrar alguns dados que calculamos direto na tabela: Tabela 6 – Consumo de matéria-prima (1) Fonte: Elaborado pela autora. Com os dados calculados aplicamos as fórmulas, considerando n = 7 que é o número de dados que temos: 7 122.5,41 2,7801 yS 914286,56285714,7232,780 7 5063 2,7801 yS Consumo X1 X2 3,5 10 8 4 12 9 5,4 15 11 6,1 17 13 7 20 15 7,5 23 16 8 25 18 Consumo X1 X2 Y.X1 Y.X2 X1.X2 X1² X2² 3,5 10 8 35 28 80 100 64 4 12 9 48 36 108 144 81 5,4 15 11 81 59,4 165 225 121 6,1 17 13 103,7 79,3 221 289 169 7 20 15 140 105 300 400 225 7,5 23 16 172,5 120 368 529 256 8 25 18 200 144 450 625 324 41,5 122 90 780,2 571,7 1.692 2.312 1.240 14 7 90.5,41 7,5712 yS 128571,38571429,5337,571 7 3735 7,5712 yS 7 90.122 169212 S 428571,123571429,15681692 7 10980 169212 S 7 122 2312 2 11 S 714286,185285714,21262312 7 14884 231211 S 7 90 1240 2 22 S 857143,82142857,11571240 7 8100 124022 S 15 714286,185 428571,123 428571,123 857143,82 714286,185 914286,56 428571,123 128571,38 2 M 664615,0671296,0 306462,0308912,0 2 M 366712,0 006681,0 002450,0 2 M 366712,0. 428571,123 857143,82 428571,123 128571,38 1 M 366712,0.671296,0308912,01 M 06274,0246172,0308912,01 M 7 90 .366712,0 7 122 .06274,0 7 5,41 B 85714286,12.366712,042857143,17.06274,0928571429,5 B 120234285,0714868572,4093468572,1928571429,5 B A equação procurada é: BxMxMy 2211 .. 120234285,0.366712,0.06274,0 21 xxy Segundo Castanheira (2016), a regressão linear múltiplanos fornece dados mais precisos que a regressão linear simples, no entanto exige o conhecimento de funções mais complexas e, consequentemente, mais trabalhosas. Sua aplicação, na prática, requer que recorremos a computadores. 16 TROCANDO IDEIAS Vimos que a correlação e a regressão são duas técnicas relacionadas. A correlação fornece um número que resume o grau de relacionamento entre as variáveis, e a regressão tem como resultado uma equação que descreve esse relacionamento. Você se recorda de alguma situação em que podemos aplicar a correlação e a regressão? Qual situação do nosso dia a dia poderia aplicar o estudo de correlação? NA PRÁTICA A correlação e a regressão estudam a relação existente entre variáveis e, com base nos resultados obtidos, podemos tomar decisões. Vamos verificar alguns exemplos onde podemos aplicar os assuntos estudados. Saiba mais 1. POR QUE é importante entender correlação entre variáveis. Escola EDTI, 8 set. 2016. Disponível em: <https://www.escolaedti.com.br/entender-correlacao-entre-variaveis>. Acesso em: 11 out. 2019. 2. O USO da regressão linear na logística reversa no Brasil. Kroton – Portal Stricto Sensu, S.d. Disponível em: <https://pgsskroton.com.br/>. Acesso em: 11 out. 2019. 3. OLIVEIRA FILHO, M. L. A utilização da regressão linear como ferramenta estratégica para a projeção dos custos de produção. IX Congresso Brasileiro de Custos. São Paulo, 13 a 15 out. 2002. Disponível em: <https://anaiscbc.emnuvens.com.br/anais/article/viewFile/2762/2762>. Acesso em: 11 out. 2019. 4. ELIAS, Z. S. et al. Rateio dos custos indiretos: aplicação da análise de correlação e de regressão. Revista de Contabilidade do Mestrado em Ciências Contábeis da UERJ, Rio de Janeiro, v. 14, n. 2, p. 50 - p. 66, maio/ago, 2009. Disponível em: <http://atena.org.br/revista/ojs-2.2.3- 08/index.php/UERJ/article/viewFile/597/593>. Acesso em: 11 out. 2019. 17 FINALIZANDO Nesta aula, estudamos os principais conceitos de correlação e regressão além da análise dos resultados obtidos. Vimos a aplicação do coeficiente de correlação de Pearson e a diferença entre a regressão linear simples e múltipla. 18 REFERÊNCIAS CASTANHEIRA, N. P. Cálculo aplicado à gestão e aos negócios. Curitiba: InterSaberes, 2016.
Compartilhar