Baixe o app para aproveitar ainda mais
Prévia do material em texto
86 Unidade III Unidade III Regressão e correlação: objetivos do módulo Podemos eleger para a palavra correlação significados tais como: relação mútua entre dois termos; qualidade de correlativo; correspondência. Em estatística, é um parâmetro que indica o grau de correspondência entre duas variáveis, ou seja, a correlação mostra a intensidade com a qual dois conjuntos de dados estão relacionados mutuamente. Eventualmente, duas variáveis interagem, ou seja, uma variável está correlacionada a outra, de maneira mais ou menos intensa, provocando questões do seguinte tipo: • O salário de um trabalhador está relacionado com sua escolaridade, ou seja, em que grau a variável salário médio de um trabalhador está ligada com a variável escolaridade do trabalhador? • A quantidade de livros que uma pessoa já leu está relacionada com sua escolaridade? • Em que grau o peso de uma pessoa está relacionado com sua altura? • A estatura de uma pessoa está relacionada com sua alimentação? • A lucratividade de uma empresa está relacionada com o grau de escolaridade de seus executivos? • A capacidade de aprender estatística está relacionada com o sexo do aluno? Responder matematicamente a essas questões é o objetivo do estudo estatístico das correlações. Considerando que exista uma correlação entre duas variáveis, muitas vezes, desejamos saber qual é a lei matemática que as relaciona. Isso nos remete ao estudo das funções regressão. Neste momento, tanto para correlação como para regressão, iremos nos circunscrever aos relacionamentos lineares, quer dizer, àqueles que utilizam uma equação de primeiro grau. Existem outros casos, mas não serão objeto de nosso estudo. 87 ESTATÍSTICA APLICADA Saiba mais A estatística aparece em alguns filmes de Hollywood mostrando seu uso na tomada de decisões, na observação de dados e nas correlações de causa e efeito. Quatro dos melhores filmes, todos eles dignos de serem assistidos são: O HOMEM que mudou o jogo. Dir. Bennett Miller. EUA: Columbia Pictures, 2011. 133 minutos. O JOGO da imitação. Dir. Morten Tyldum. EUA: Black Bear Pictures. 2015. 115 minutos. UMA MENTE brilhante. Dir. Ron Howard. EUA: Universal Pictures, 2001. 135 minutos. QUEBRANDO a banca. Dir. Robert Luketic. EUA: Columbia Pictures, 2008. 123 minutos. 7 CORRELAÇÃO LINEAR Volte às questões citadas. Parece que algumas respostas são verdadeiras, por exemplo, um trabalhador deve ganhar mais se tiver maior escolaridade; uma pessoa mais alta deve pesar mais, mas outras respostas parecem ser falsas, como, por exemplo, relacionar o sexo com facilidade de aprendizado. Como determinar a veracidade de uma relação de causa e efeito? Perceba que as questões mencionadas podem ser resumidas a duas variáveis, nomeadas rotineiramente por variável independente (xi) e variável dependente (yi). É lógico supor que a produtividade de um processo químico (variável dependente) depende em boa parte da qualidade da matéria-prima utilizada (variável independente). Qual é o nível dessa dependência? Saiba mais Um dos maiores riscos quando tratamos de correlações são as chamadas correlações espúrias, aquelas que parecem correlações, mas no fundo são absurdas. Há um site que mostra como fatos que não têm nada em comum podem ter picos e quedas de ocorrência ao mesmo tempo. Uma lição para cientistas de que nem sempre coisas que acontecem simultaneamente formam relação de causa e consequência. Acesse-o em: <www.tylervigen.com>. 88 Unidade III A maneira estatística de se determinar a verdade ou a falsidade de uma relação de causa e efeito, e o nível dessa eventual relação, é calcular o coeficiente de correlação que existe entre as variáveis. O mais usado entre essas medidas é o linear, chamado de coeficiente de correlação linear de Pearson. Existem coeficientes não lineares, mas não serão tratados neste material. O coeficiente de correlação de Pearson é dado pela expressão: ( ) ( ) ( )( ) i i i i 22 2 2 i i i i n. x .y x . y r n. x x .(n. y ( y ) ) ∑ − ∑ ∑ = ∑ − ∑ ∑ − ∑ Onde xi é a chamada variável independente e yi é a variável dependente, ou seja, que está correlacionada (ou não) à variável dependente. O número de pares ordenados (x;y) considerados no estudo é n. E os valores são todos decorrentes de somatórios. Observação Quando temos vários números para uma mesma variável, usamos o índice i para diferenciá-los. Assim, a variável independente é simbolizada por xi e assume diversos valores diferentes simbolizados por x1; x2; x3 etc. Essa correlação pode existir ou não e ser mais ou menos intensa, conforme o valor do coeficiente de Pearson: • r = -1,00: correlação negativa perfeita; • r = -0,75: correlação negativa forte; • r = -0,50: correlação negativa média; • r = -0,25: correlação negativa fraca; • r = 0,00: correlação linear inexistente; • r = +0,25: correlação positiva fraca; • r = +0,50: correlação positiva média; • r = +0,75: correlação positiva forte; • r = +1,00: correlação positiva perfeita. 89 ESTATÍSTICA APLICADA Correlação linear positiva significa que, se uma variável aumenta, a outra variável também sobe, ou então se uma variável diminui, a outra também cai. Por exemplo, considerando-se que os ganhos de uma pessoa estejam relacionados à sua escolaridade, teremos uma correlação positiva. Aumentando a escolaridade (variável independente), subirão os ganhos (variável dependente). Dizemos que causa e efeito são diretamente proporcionais. Correlação linear negativa significa que, se uma variável aumenta, a outra variável diminui, ou então, se uma variável diminui, a outra aumenta. Os preços de carros usados são exemplos de correlação negativa, à medida que o automóvel envelhece (aumenta a variável independente, anos de uso), cai o seu valor de mercado (variável dependente). O cálculo do coeficiente de correlação não apresenta grandes dificuldades conceituais, sendo mais um trabalho braçal. O exemplo a seguir mostra, passo a passo, como esse cálculo é feito e a que conclusões podemos chegar. Observação Muito do trabalho braçal necessário para a resolução de problemas de correlação e regressão linear é facilitado com o uso de planilhas eletrônicas, como é o caso do Excel©. No entanto, deve-se ter em mente os conceitos envolvidos para que os resultados obtidos eletronicamente não sejam ilusoriamente falsos. As “caixas-pretas” que essas planilhas mostram podem nos conduzir a percepções equivocadas. Exemplo 1: suponha que uma empresa de confecções queira avaliar se suas despesas com publicidade estão repercutindo favoravelmente em suas vendas. Para tanto levantou, os gastos de publicidade e as vendas em cinco meses diferentes, os quais estão relacionados na tabela a seguir. Calcule a resposta para a empresa. Tabela 13 Gastos com publicidade (em milhares de reais) (xi) 31 45 83 118 156 Vendas (em milhões de reais) (yi) 6 18 19 32 35 A resposta a essa questão é o cálculo do coeficiente de correlação linear. Em tese, as vendas da empresa estão relacionadas com os gastos de publicidade. Aumentando-se os gastos com publicidade (variável independente) deverão subir, por lógica, os valores vendidos (variável dependente). Nesse cenário, o coeficiente será positivo e poderemos afirmar que os gastos com publicidade realmente repercutem de modo favorável nas vendas; caso contrário, a resposta será negativa. Caso o coeficiente seja positivo, quanto mais próximo de 1, maior será a repercussão da publicidade nas vendas. 90 Unidade III Para fazermos esse cálculo, iremos montar a seguinte tabela, na qual serão determinados os somatórios necessários para a utilização da fórmula: Tabela 14 Número par ordenado Variável independente Variável dependente Variável independente ao quadrado Variável dependente ao quadrado Multiplicação das duas variáveis n xi yi xi 2 yi 2 xi.yi 1 31 6 961 36 186 2 45 18 2025 324 810 3 83 19 6889 361 1577 4 118 32 13924 1024 3776 5 156 35 24336 1225 5460 Somatórios 433 110 481352970 11809 Da tabela, tiramos as informações necessárias para o cálculo do coeficiente: n = 5; Σxi = 433; Σyi = 110; Σxi 2 = 48135; Σyi 2=2970 e Σxi.yi = 11809 ( ) ( ) ( )( ) i i i i 22 2 2 i i i i n. x .y x . y r n. x x .(n. y ( y ) ) ∑ − ∑ ∑ = ∑ − ∑ ∑ − ∑ ( ) ( ) ( )( ) ( )( )2 2 5.11809 433 . 110 r 5.48135 433 . 5.2970 110 − = − − ( ) ( ) 59045 47630 r 240675 187489 . 14850 12100 −= − − ( ) ( ) 11415 r 53186 . 2750 = 11415 11415 r r 0,944 12094146261500 = = → = Existe, portanto, entre as duas variáveis uma correlação positiva forte, ou seja, do ponto de vista prático, é fortemente interessante, para essa empresa, investir em publicidade. 91 ESTATÍSTICA APLICADA Exemplo 2: o gerente de produção de uma empresa têxtil argumenta, visando aumentar suas verbas para treinamento, que o índice de 2ª qualidade dos produtos está fortemente relacionado com o tempo de treinamento dado aos funcionários. Para justificar sua tese, ele fez um levantamento com 8 funcionários relacionando as semanas de treinamento aplicadas a cada um com o índice de defeitos que eles faziam. Os dados estão resumidos na tabela a seguir. O gerente tem razão na sua exposição? Tabela 15 Quantidade de semanas de treinamento 9 4 8 7 5 11 10 6 Índice de defeitos (%) 1,60% 2,50% 2,00% 2,20% 2,40% 1,20% 1,40% 2,60% O gerente, evidentemente, espera que o coeficiente de correlação obtido seja um número negativo e próximo de 1. Isso provaria a argumentação dele, já que aumentando o número de semanas de treinamento diminuiria o índice de defeitos. Ou seja, o gerente deseja uma correlação linear negativa. Para fazermos esse cálculo, utilizaremos uma tabela semelhante à do exemplo anterior, observando que as porcentagens devem ser transformadas em valores decimais. Lembrete Nunca se deve fazer operações aritméticas ou matemáticas com porcentagens. É necessário usar frações ordinárias ou decimais em seu lugar. Tabela 16 Número par ordenado Variável independente Variável dependente Variável independente ao quadrado Variável dependente ao quadrado Multiplicação das duas variáveis n xi yi xi 2 yi 2 xi.yi 1 9 0,016 81 0,000256 0,144 2 4 0,025 16 0,000625 0,100 3 8 0,020 64 0,000400 0,160 4 7 0,022 49 0,000484 0,154 5 5 0,024 25 0,000576 0,120 6 11 0,012 121 0,000144 0,132 7 10 0,014 100 0,000196 0,140 8 6 0,026 36 0,000676 0,156 Somatórios 60 0,159 492 0,003357 1,106 92 Unidade III Da tabela tiramos as informações necessárias para o cálculo do coeficiente: n = 8; Σxi = 60; Σyi = 0,159; Σxi 2 = 492; Σyi 2=0,003357 e Σxi.yi = 1,106 ( ) ( ) ( )( ) i i i i 22 2 2 i i i i n. x .y x . y r n. x x .(n. y ( y ) ) ∑ − ∑ ∑ = ∑ − ∑ ∑ − ∑ ( ) ( ) ( )( ) ( )( )2 2 8.1,106 60 . 0,159 r 8.492 60 . 8.0,003357 0,159 − = − − ( ) ( ) 8,848 9,5400 r 3936 3600 . 0,0269 0,0253 −= − − ( ) ( ) 0,6920 r 336 . 0,0016 −= 0,6920 0,6920 r r 0,954 0,73320,5376 − −= = → = − Existe, portanto, entre as duas variáveis uma correlação negativa forte, ou seja, o ponto de vista do gerente de produção é respaldado pela avaliação estatística. 8 REGRESSÃO LINEAR No exemplo 1 foi determinado que para a empresa em pauta os gastos com publicidade tinham correlação direta e forte com as vendas obtidas. Mas e se quiséssemos ir além e estimar quanto seria vendido caso os gastos com publicidade fossem de R$ 180.000,00? Para se responder a esta questão, é necessário estabelecer um relacionamento matemático entre as duas variáveis. Isso é feito através dos conceitos de regressão linear, que se valem do método dos mínimos quadrados. Trata-se do processo de traduzir o comportamento conjunto de duas variáveis na forma de uma lei matemática denominada equação de regressão. Assim sendo, os conceitos de correlação e regressão são indissociáveis. A regressão é linear quando essa lei matemática mencionada é uma reta – portanto, uma equação de 1º grau. 93 ESTATÍSTICA APLICADA 0 1 2 3 4 5 6 0 5 10 15 20 Correlação perfeita Correlação forte 16 14 12 10 8 6 4 2 0 14 12 10 8 6 4 2 0 Figura 22 Como na prática se trabalha com diversos pontos experimentais, existem inúmeras retas possíveis para um determinado conjunto de dados. No entanto, o critério normalmente utilizado para a definição desta reta é o chamado método dos mínimos quadrados. Esse método pesquisa a reta de melhor aderência ao conjunto de pontos experimentais considerados. É sabido que a equação de uma reta é dada pela fórmula geral: y ax b= + Onde a e b são os chamados coeficientes da reta, que caracterizam e particularizam cada situação prática considerada. Esses coeficientes estabelecem a inclinação da reta, se ela é crescente ou decrescente e a posição vertical no plano ortogonal. O método dos mínimos quadrados define tais coeficientes de modo a determinar uma reta interpoladora, ou seja, a reta de melhor aderência ao conjunto de dados. O coeficiente angular a (aquele que define o ângulo da reta e se ela é crescente ou decrescente) é dado por: y y x S a K r S = = ⋅ Onde: • Ky = coeficiente angular. • r = coeficiente de correlação de Pearson. • Sy = desvio padrão da variável dependente. • Sx = desvio padrão da variável independente. 94 Unidade III O coeficiente b (chamado de termo independente e que caracteriza a “altura” da reta no plano ortogonal) é dado por: yb y K x= − ⋅ Onde: • Ky = coeficiente angular. • y = média da variável dependente. • x = média da variável independente. Dessa forma, a equação da reta interpoladora é dada por: ( )y yy K y Kx x= + − ⋅ Onde, evidentemente, y é a variável dependente e x a variável independente. Lembrete O cálculo da média e do desvio padrão das variáveis estudadas é feito de acordo com o já aprendido, ou seja, utilizando-se as fórmulas: ( )2ii x xxx e S n n 1 ∑ −∑= = − O cálculo da reta procurada depende do cálculo anterior da média e dos desvios padrões de ambas as variáveis (x e y), além do coeficiente de correlação entre elas. Observação No presente livro-texto trabalhamos apenas com a correlação e a regressão lineares, que é a situação mais comum que iremos encontrar na vida profissional. Existe, porém, outros modelos matemáticos que correlacionam duas variáveis, tais com: funções quadráticas, logarítmicas, exponenciais, entre outras. Matematicamente são funções mais complexas e na prática menos utilizadas, mas os conceitos básicos são os mesmos e a operacionalização parecida. 95 ESTATÍSTICA APLICADA Um exemplo de aplicação deixa mais claro o processo de cálculo, utilizando-se de um passo a passo. Exemplo 1: a tabela a seguir mostra a evolução de duas variáveis possivelmente correlacionadas. Determine a equação de regressão linear decorrente. Tabela 17 Variável independente (x) 3 5 7 9 10 14 16 Variável dependente (y) 1 2 3 5 7 10 13 Resolução: 1º passo: Cálculo do coeficiente de correlação linear: Tabela 18 n xi yi xi 2 yi 2 xi.yi 1 3 1 9 1 3 2 5 2 25 4 10 3 7 3 49 9 21 4 9 5 81 25 45 5 10 7 100 49 70 6 14 10 196 100 140 7 16 13 256 169 208 Somatórios 64 41 716 357 497 ( ) ( ) ( )( ) i i i i 22 2 2 i i i i n. x .y x . y r n. x x .(n. y ( y ) ) ∑ − ∑ ∑ = ∑ − ∑ ∑ − ∑ ( ) ( ) ( )( ) ( )( )2 2 7 497 64 41 r r 0,988 7 716 64 . 7 357 41 ⋅ − ⋅ = → = ⋅ − ⋅ − 96 Unidade III 2º passo: Cálculo da média e do desvio padrão da variável x: Tabela 19 n xi di = xi - x di 2 1 3 3 - 9,1429 = -6,1429 37,7352 2 5 5 - 9,1429 = -4,1429 17,1636 3 7 7 - 9,1429 = -2,1429 4,5920 4 9 9 - 9,1429 = -0,1429 0,0204 5 10 10 - 9,1429 = 0,8571 0,7346 6 14 14 - 9,1429 = 4,8571 23,5914 7 16 16 - 9,1429 = 6,8571 47,0198 Somatórios 64 130,857 ( )2ii x xx 64 130,857x 9,1429 e S 4,670 n 7 n 1 7 1 ∑ −∑= = = = = = − − 3º passo: Cálculo da média e do desvio padrão da variável y: Tabela 20 n yi di = yi - y di 2 1 1 1 – 5,8571= -4,8571 23,5914 2 2 2 – 5,8571 = -3,8571 14,8772 3 3 3 – 5,8571 = -2,8571 8,1630 4 5 5 – 5,8571 = -0,8571 0,7346 5 7 7 – 5,8571 = 1,1429 1,3062 6 10 10 – 5,8571 = 4,1429 17,1636 7 13 13 – 5,8571 = 7,1429 51,0210 Somatórios 41 116,8570 ( )2ii y yy 41 116,857y 5,8571 e S 4,4132 n 7 n 1 7 1 ∑ −∑= = = = = = − − 4º passo: Cálculo do coeficiente Ky: y y y x S 4,4132 K r K 0,988 0,93 S 4,6701 = ⋅ → = ⋅ = 97 ESTATÍSTICA APLICADA 5º passo: Definição da equação da reta procurada: ( )y yy K y Kx x= + − ⋅ ( )y 0,93x 5,8571 0,93 9,1429= + − ⋅ y 0,93x 2,64= − A partir da determinação da função linear podemos prever valores de y para um dado valor de x, com os devidos cuidados que previsões estatísticas devem considerar. Vamos supor, por exemplo, que queiramos saber qual o valor da variável dependente (y) quando a variável independente (x) assume o valor 18. y 0,93x 2,64 y 0,93 18 2,64 y 14,1= − → = ⋅ − → = Uma visão dessa situação é mostrada no gráfico a seguir. 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Regressão linear Ponto estimado Pontos conhecidos Reta interpoladora Y X 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 + Figura 23 Exemplo 2: uma fábrica de cervejas acredita que o volume de vendas dos seus produtos está diretamente relacionado com a temperatura média do período considerado. Para comprovar ou refutar essa crença, um analista levantou os dados necessários resumidos a seguir. Tabela 21 Temperatura (°C) 32 28 33 27 26 36 34 30 31 29 Volume de vendas (em mil unidades) 83 78 80 75 71 92 85 81 83 79 98 Unidade III A partir destes dados, pergunta-se: A) Existe realmente correlação entre volume de vendas e temperatura média do período? B) Qual a expressão matemática que relaciona essas duas variáveis? C) Caso haja correlação entre as variáveis, qual seria o volume de vendas caso a temperatura média do período fosse de 35 ºC? D) Qual a temperatura média que produziria um volume de vendas de 90 mil unidades, se houver correlação entre as variáveis mencionadas? Resolução: Item A: para responder a esse item, devemos calcular o coeficiente de correlação de Pearson, utilizando a tabela: Tabela 22 Número par ordenado Variável independente (temperatura) Variável dependente (volume vendas) Variável independente ao quadrado Variável dependente ao quadrado Multiplicação das duas variáveis n xi yi xi 2 yi 2 xi.yi 1 32 83 1024 6889 2656 2 28 78 784 6084 2184 3 33 80 1089 6400 2640 4 27 75 729 5625 2025 5 26 71 676 5041 1846 6 36 92 1296 8464 3312 7 34 85 1156 7225 2890 8 30 81 900 6561 2430 9 31 83 961 6889 2573 10 29 79 841 6241 2291 Somatórios 306 807 9456 65419 24847 Da tabela tiramos as informações necessárias para o cálculo do coeficiente: n = 10; Σxi = 306; Σyi = 807; Σxi 2 = 9456; Σyi 2=65419 e Σxi.yi = 24847 ( ) ( ) ( )( ) i i i i 22 2 2 i i i i n. x .y x . y r n. x x .(n. y ( y ) ) ∑ − ∑ ∑ = ∑ − ∑ ∑ − ∑ 99 ESTATÍSTICA APLICADA ( ) ( ) ( )( ) ( )( )2 2 10.24847 306 . 807 r 10.9456 306 . 10.65419 807 − = − − ( ) ( ) 248470 246942 r 94560 93636 . 654190 651249 −= − − ( ) ( ) 1528 r 924 . 2941 = 1528 1528 r r 0,927 16482717484 = = → = Existe, portanto, uma correlação forte entre vendas e temperaturas médias dos períodos considerados. Item B: a expressão que relaciona as duas variáveis é a função de regressão linear. Para defini-la, precisamos das médias e dos desvios padrões de ambas as variáveis, conforme a tabela anterior e a que se segue. Cálculo da média e do desvio padrão da variável x: Tabela 23 n xi di 2 1 32 1,96 2 28 6,76 3 33 5,76 4 27 12,96 5 26 21,16 6 36 29,16 7 34 11,56 8 30 0,36 9 31 0,16 10 29 2,56 Somatórios 306 92,4 ( )2ii x xx 306 92,4x 30,6 e S 3,2 n 10 n 1 10 1 ∑ −∑= = = = = = − − 100 Unidade III Cálculo da média e do desvio padrão da variável y: Tabela 24 n yi di 2 1 83 5,29 2 78 7,29 3 80 0,49 4 75 32,49 5 71 94,09 6 92 127,69 7 85 18,49 8 81 0,09 9 83 5,29 10 79 2,89 Somatórios 807 294,1 ( )2ii y yy 807 294,1y 80,7 e S 5,7 n 10 n 1 10 1 ∑ −∑= = = = = = − − Cálculo do coeficiente Ky: y y y x S 5,7 K r K 0,927 1,65 S 3,2 = ⋅ → = ⋅ = Definição da equação da reta procurada: ( )y yy K y Kx x= + − ⋅ ( )y 1,65x 80,7 1,65 30,6= + − ⋅ y 1,65x 30,1= + Item C: para 35º, o volume de vendas estimado seria de: ( )y 1,65x 30,1 y 1,65 35 30,1 y 87,9 mil unidades= + → = + → = 101 ESTATÍSTICA APLICADA Item D: para um volume de vendas de 90 mil unidades, a temperatura estimada seria de: ( ) 90 30,1y 1,65x 30,1 90 1,65x 30,1 1,65x 90 30,1 x x 36,3 º C 1,65 −= + → = + → = − → = → = Graficamente teríamos: Pontos amostrados Temperatura Volume de vendas 100 95 90 85 80 75 70 87,9 36,3 25 27 29 31 33 35 37 39 y X Reta interpoladora Figura 24 Exemplo 3: uma emissora de televisão deseja saber se existe correlação entre a idade dos seus telespectadores e a quantidade de minutos que permanecem assistindo aos seus programas. Para tanto, acompanhou oito telespectadores de diferentes idades, chegando aos dados a seguir. Ela pode afirmar que essa correlação existe? Tabela 25 Idade (em anos) 32 17 26 36 34 53 31 29 Minutos assistidos 85 84 36 82 77 70 52 95 Resolução: Conforme vimos anteriormente, devemos calcular o coeficiente de correlação de Pearson para responder a essa questão 102 Unidade III Tabela 26 Número par ordenado Variável independente (idade) Variável dependente (minutos assistidos) Variável independente ao quadrado Variável dependente ao quadrado Multiplicação das duas variáveis n xi yi xi 2 yi 2 xi.yi 1 32 85 2720 7225 2720 2 17 84 1428 7056 1428 3 26 36 936 1296 936 4 36 82 2952 6724 2952 5 34 77 2618 5929 2618 6 53 70 3710 4900 3710 7 31 52 1612 2704 1612 8 29 95 2755 9025 2755 Somatórios 258 581 18731 44859 18731 Da tabela tiramos as informações necessárias para o cálculo do coeficiente: n = 8; Σxi = 258; Σyi = 581; Σxi 2 = 18731; Σyi 2=44859 e Σxi.yi = 18.731 ( ) ( ) ( )( ) i i i i 22 2 2 i i i i n. x .y x . y r n. x x .(n. y ( y ) ) ∑ − ∑ ∑ = ∑ − ∑ ∑ − ∑ ( ) ( ) ( )( ) ( )( )2 2 8.18731 258 . 581 r 8.18731 258 . 8.44859 581 − = − − ( ) ( ) 149848 149898 r 149848 66564 . 358872 337561 −= − − ( ) ( ) 50 r 83284 . 21311 −= 50 50 r r 0,001 421291774865324 − −= = → = − O número é praticamente igual a zero, o que indica não existir correlação entre essas duas variáveis, ou seja, baseando-se nele não é possível afirmar que a quantidade de minutos que alguém fique assistindo à televisão tenha algo a ver com sua idade. 103 ESTATÍSTICA APLICADA Exemplo 4: uma empresa deseja ter expressão matemática que exprima a relação entre preço de seu produto e unidades vendidas, para estimar as vendas em função do preço do produto. Para tanto, levantou cinco ocorrências reais relacionadas a seguir. Quais seriam a expressão procurada e os valores de vendas estimadas para preços do produto iguais a R$ 200,00 e a R$ 150,00? Represente a situação graficamente. Tabela 27 Quantidade de unidades vendidas Preço unitário de venda 250 163 275 159 300 175 225 180 247 165 Resolução: Cálculo do coeficiente de correlação: Tabela 28 Número par ordenado Variável independente (preço) Variável dependente (unidades vendidas) Variável independente ao quadrado Variável dependente ao quadrado Multiplicação das duas variáveis n xi yi xi 2 yi 2 xi.yi 1 163 250 26569 62500 40750 2 159 275 25281 75625 43725 3 175 300 30625 90000 52500 4 180 225 32400 50625 40500 5 165 247 27225 61009 40755 Somatórios 842 1297 142100 339759 218230 Da tabela tiramos as informações necessárias para o cálculo do coeficiente: n = 5; Σxi = 842; Σyi = 1297; Σxi 2 = 142100; Σyi 2=339759 e Σxi.yi = 218230 ( ) ( )( )( ) i i i i 22 2 2 i i i i n. x .y x . y r n. x x .(n. y ( y ) ) ∑ − ∑ ∑ = ∑ − ∑ ∑ − ∑ ( ) ( ) ( )( ) ( )( )2 2 5.218230 842 . 1297 r 5.142100 842 . 5.339759 1297 − = − − 104 Unidade III ( ) ( ) 1091150 1092074 r 710500 708964 . 1698795 1682209 −= − − ( ) ( ) 924 r 1 536 . 16586 −= 924 924 r r 0,183 504725476096 − −= = → = − Cálculo da função linear de regressão: Cálculo da média e do desvio padrão da variável x: Tabela 29 n xi di 2 1 163 29,16 2 159 88,36 3 175 43,56 4 180 134,56 5 165 11,56 Somatórios 842 307,20 ( )2ii x xx 842 307,20x 168,4 e S 8,8 n 5 n 1 5 1 ∑ −∑= = = = = = − − Cálculo da média e do desvio padrão da variável y: Tabela 30 n yi di 2 1 250 88,36 2 275 243,36 3 300 1648,36 4 225 1183,36 5 247 153,76 Somatórios 1297 3317,20 ( )2ii y yy 1297 3317,20y 259,4 e S 28,8 n 5 n 1 5 1 ∑ −∑= = = = = = − − 105 ESTATÍSTICA APLICADA Cálculo do coeficiente Ky: y y y x S 28,8 K r K 0,183 0,6 S 8,8 = ⋅ → = − ⋅ = − Definição da equação da reta procurada: ( )y yy K x y K x= + − ⋅ ( )( )y 0,6x 259,4 0,6 168,4= − + − − ⋅ y 0,6x 360,4= − + Assim sendo, para os preços fixados teríamos os correspondentes valores: ( )Preço de $200,00 y 0,6x 360,4 y 0,6 200 360,4 volume 240 unidades→ = − + → = − + → = ( )Preço de $150,00 y 0,6x 360,4 y 0,6 150 360,4 volume 270 unidades→ = − + → = − + → = Graficamente: 310 300 290 280 270 260 250 240 230 220 140 150 160 170 180 190 200 210 Figura 25 106 Unidade III Resumo Nessa unidade vimos que, por diversas vezes em nossa vida pessoal ou profissional, somos levados a acreditar em relações entre causa e efeito que são no mínimo estranhas. Grande parte das correlações simplesmente não procede, não tem sentido. Outras analogias até têm alguma procedência, mas são tão remotas e fracas que não mereceriam maior consideração no nosso processo cognitivo. Calcular objetivamente se existe uma relação de causa e efeito entre duas variáveis e qual é a força dessa relação pode ser vital para o processo decisório. Por outro lado, considerando que exista correspondência entre duas variáveis, pode ser muito interessante saber qual o valor que uma delas assumiria caso a outra apresentasse determinado valor não estabelecido pelos métodos empíricos, por exemplo, conhecendo empiricamente quanto vendemos de um dado produto quando praticamos determinado preço ou desejar saber qual seriam as vendas se o preço fosse aumentado em, vamos supor, 30%. Funções de regressão linear podem nos fornecer essas informações se nós soubermos trabalhar com elas. Exercícios Questão 1. A tabela a seguir mostra a variação mensal do nível de preços no Brasil em 2016. Calcule a variação percentual acumulada em doze meses usando o número índice: Obs: adote dezembro de 2015 como base = 100 Tabela 31 Mês Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Variação mensal 1,27% 0,90% 0,43% 0,61% 0,78% 0,35% 0,52% 0,44% 0,08% 0,26% 0,18% 0,30% Em 2016, a variação do nível de preços foi de: A) 6,12%. B) 6,04%. C) 5,95%. 107 ESTATÍSTICA APLICADA D) 6,29%. E) 4,50%. Resposta correta: alternativa D. Análise das alternativas A) Alternativa incorreta. Justificativa: a variação de 6,12% é aquela obtida pela somatória de percentuais da tabela, erro grave para verificar variação percentual anual. B) Alternativa incorreta. Justificativa: para variação igual a 6,04%, seria necessário suprimir a variação de preços do mês de setembro (+0,08%). C) Alternativa incorreta. Justificativa: para esta variação, o cálculo deveria levar em conta uma inflação de 0,12% no mês de agosto. D) Alternativa correta. Justificativa: usando o número 100 como base, temos: 100*(1+0,0127) = 101,27; 101,27*(1+0,009)= 102,18...105,97*(1+0,003) = 106,29. 106,29-100= 6,29 ou 6,29%. E) Alternativa incorreta. Justificativa: nem de forma intuitiva daria para chegar neste resultado; 4,5% trata-se do centro da meta de inflação no Brasil em 2019, por exemplo. Questão 2. Em um determinado ano, uma dada economia apresentou os seguintes dados: diminuição de 3%, 1% e 0,5% nos gastos do governo, volume de investimentos e número de empregados, respectivamente. A despeito dos dados citados, no mesmo ano a referida economia apresentou crescimento de 10% no volume de vendas e crescimento nominal de 2,3% do produto interno bruto (PIB) com uma inflação anual associada de 0,9%. Com relação aos dados anteriores, é correto o que se afirma em: I – O crescimento do real do PIB pode ser feito deduzindo a variação de preços da variação nominal do produto, ou seja, o crescimento real neste ano foi de 1,4%. 108 Unidade III II – O PIB do país cresceu apenas em função do aumento do volume de vendas. III – Somados, PIB e volume de vendas trazem um resultado positivo da ordem de 7,8%. IV – Entende-se por variação nominal aquela que não desconta os efeitos da variação de preços do período em análise. Pode-se dizer que: A) Apenas a afirmativa I está correta. B) Apenas as afirmativas I e II estão corretas. C) Apenas as afirmativas II e III estão corretas. D) Apenas as afirmativas I e IV estão corretas. E) Todas as afirmativas estão incorretas. Resolução desta questão na plataforma. 109 REFERÊNCIAS Audiovisuais O HOMEM que mudou o jogo. Dir. Bennett Miller. EUA: Columbia Pictures, 2011. 133 minutos. O JOGO da imitação. Dir. Morten Tyldum. EUA: Black Bear Pictures. 2015. 115 minutos. UMA MENTE brilhante. Dir. Ron Howard. EUA: Universal Pictures, 2001. 135 minutos. QUEBRANDO a banca. Dir. Robert Luketic. EUA: Columbia Pictures, 2008. 123 minutos. Textuais ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatística aplicada à administração e economia. 2. ed. São Paulo: Thomson Learning, 2007. BRUNI, A. L. Estatística aplicada à gestão empresarial. São Paulo: Atlas, 2007. BUSSAB, W. O.; MORETTIN, P. A. Estatística básica. 3. ed. São Paulo: Atual, 1986. COSTA NETO, P. L. O. Estatística. São Paulo: Edgard Blücher, 1979. COSTA NETO, P. L. O.; CYMBALISTA, M. Probabilidades. São Paulo: Edgard Blücher, 1974. DOWNING, D.; CLARK, J. Estatística aplicada. São Paulo: Saraiva 1998. FONSECA, J. S.; MARTINS, G. A.; TOLEDO, G. L. Estatística aplicada. São Paulo: Atlas, 1995. GUERRA, M.; GUERRA, M. J.; DONAIRE, D. Estatística aplicada. São Paulo: Ciência e Tecnologia, 1991. INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. Pesquisa nacional por amostra de domicílios (PNAD). Disponível em: <https://ww2.ibge.gov.br/home/estatistica/pesquisas/pesquisa_resultados. php?id_pesquisa=40>. Acesso em: 13 jun. 2019. JOHNSON, R.; KUBY, P. Estat. São Paulo: Cengage Learning, 2013. KAZMIER, L. J. Estatística aplicada à economia e administração. São Paulo: Makron Books, 1982. KUME, H. Métodos estatísticos para melhoria da qualidade. São Paulo: Gente, 1993. LAPPONI, J. C. Estatística usando Excel. 4. ed. Rio de Janeiro: Elsevier, 2005. MEYER, P. L. Probabilidade: aplicações à estatística. Rio de Janeiro: LTC, 1976. 110 MILONE, G.; ANGELINI, F. Estatística aplicada. São Paulo: Atlas, 1995. MOORE, D. A estatística básica e sua prática. Rio de Janeiro: LTC, 2000. MOORE, D. et al. A prática da estatística empresarial: como usar dados para tomar decisões. Rio de Janeiro: LTC, 2006. PODER 360. Publicações por Fernando Rodrigues. [on-line]: [s. d.]. Disponível em: <https://www. poder360.com.br/author/fernando-rodrigues/>. Acesso em: 13 jun. 2019. SILVA, E. M. et al. Estatística para os cursos de economia, administração e ciências contábeis. 2. ed. São Paulo: Atlas, 1997. v. 1 e 2. ___. Tabelas de estatística para os cursos de economia, administração e ciências contábeis. 2. ed. São Paulo: Atlas, 1999. SPIEGEL, M. R. Estatística. São Paulo: Makron Books, 1993. STEVENSON, W. J. Estatística aplicada à administração. São Paulo: Harbra, 1981. TRIOLA, M. F. Introdução à estatística. Rio de Janeiro: LTC, 2005. WITTE,R. S.; WITTE, J. S. Estatística. 7. ed. Rio de Janeiro: LTC, 2005. Sites <https://ibge.gov.br/> <www.tylervigen.com> 111 ANEXO Áreas sob a curva normal reduzida Valores da variável reduzida negativos - Área entre -3,99 e z y z Z 0 1 2 3 4 5 6 7 8 9 -3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 -3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 -3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 -3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 -3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 -3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002 -3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003 -3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005 -3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007 -3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010 -2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014 -2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019 -2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026 -2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036 -2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048 -2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064 -2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084 -2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110 -2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143 -2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183 -1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233 -1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294 -1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367 -1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455 -1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559 -1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681 -1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823 -1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985 -1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170 -1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379 -0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611 -0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867 -0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148 -0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451 -0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776 -0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121 -0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483 -0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859 -0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247 0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641 112 Áreas sob a curva normal reduzida Valores da variável reduzida positivos - Área entre z e 3,99 y z Z 0 1 2 3 4 5 6 7 8 9 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633 1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706 1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817 2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890 2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916 2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936 2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952 2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964 2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974 2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981 2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986 3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990 3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993 3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995 3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997 3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998 3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 113 114 115 116 Informações: www.sepi.unip.br ou 0800 010 9000
Compartilhar