Prévia do material em texto
1 MATERIAL DIDÁTICO MÉTODOS QUANTITATIVOS APLICADOS A NEGÓCIOS CREDENCIADA JUNTO AO MEC PELA PORTARIA Nº 1.282 DO DIA 26/10/2010 0800 283 8380 www.ucamprominas.com.br Impressão e Editoração 2 SUMÁRIO INTRODUÇÃO ............................................................................................................ 3 UNIDADE 1 – ANOVA E APLICAÇÕES ................................................................... 11 1.1 ASPECTOS INTRODUTÓRIOS ............................................................................... 11 1.2 ESTUDO DAS VARIAÇÕES ................................................................................... 12 UNIDADE 2 – CORRELAÇÃO E REGRESSÃO ...................................................... 42 2.1 ASPECTOS INTRODUTÓRIOS ................................................................................ 42 2.2 CORRELAÇÃO APLICADA AO MEIO EMPRESARIAL ................................................. 42 2.3 O COEFICIENTE DE CORRELAÇÃO DE PEARSON .................................................... 44 2.4 REGRESSÃO LINEAR SIMPLES ............................................................................ 52 2.5 GRÁFICO DE DISPERSÃO ................................................................................... 53 CONCLUSÃO DA DISCIPLINA ................................................................................ 64 REFERÊNCIAS ......................................................................................................... 65 3 INTRODUÇÃO “Estratégia significa enfrentar um adversário e combatê-lo para a conquista de um determinado território.” (Clausewitz) De acordo com a literatura, a teoria da decisão é uma área interdisciplinar de estudo, com definições que relacionam a Filosofia, a Matemática e a Estatística, aplicável a quase todos os ramos da ciência, engenharia e, principalmente, a contextos gerenciais de mercado. Grosso modo, relaciona-se à forma e ao estudo do comportamento e fenômenos psíquicos (reais ou fictícios) daqueles que tomam as decisões, a identificação de valores, incertezas e outras questões relevantes em uma dada decisão, sua racionalidade, as condições pelas quais após um processo será levado a ter como resultado a decisão ótima. É um campo relacionado muito intimamente com a teoria dos jogos. Salientamos que na situação geral de decisão aplicada ao meio empresarial, temos várias alternativas bem definidas e procuramos pela melhor ação, dado o problema que temos em mãos. Além disso, estamos em uma situação de incerteza e algumas das informações importantes para a decisão são desconhecidas. Ressalta-se ainda que, dependendo do contexto, algumas decisões tomadas são mais importantes que outras, principalmente as relacionadas ao âmbito financeiro. Nesse sentido, de acordo com Magalhães (2012), para um gestor ou profissional nas áreas empresariais, raciocinar estatisticamente, nos dias de hoje, é tão necessário quanto a habilidade de comando. Com o desenvolvimento das informações nas empresas, a questão que se coloca hoje não se refere mais à sua escassez, mas como ler e interpretar as informações disponíveis. As necessidades atuais estão requerendo: identificar situações problemáticas através de análise de clima organizacional; https://pt.wikipedia.org/wiki/Interdisciplinaridade https://pt.wikipedia.org/wiki/Ci%C3%AAncia https://pt.wikipedia.org/wiki/Engenharia https://pt.wikipedia.org/wiki/Valor https://pt.wikipedia.org/wiki/Incerteza https://pt.wikipedia.org/wiki/Tomada_de_decis%C3%A3o https://pt.wikipedia.org/wiki/Escolha_racional https://pt.wikipedia.org/w/index.php?title=Decis%C3%A3o_%C3%B3tima&action=edit&redlink=1 https://pt.wikipedia.org/wiki/Teoria_dos_jogos 4 utilizar o montante de dados armazenados nos computadores de suas empresas para entender melhor o que acontece em seus negócios e melhorar a qualidade de suas decisões; entender o comportamento das vendas de produtos ou serviços; identificar causas de defeitos ou motivadoras da baixa qualidade; entender o comportamento dos clientes frente à empresa e aos seus produtos. Portanto, diante da necessidade de tomada de decisões, diante de incertezas do mundo empresarial, coloca-se a Estatística como ferramenta importantíssima, talvez a que possa trazer melhores contribuições aos administradores ao lidarem com informações e com os mais diversos problemas encontrados nesse universo. Especificamente falando, neste material, estaremos trabalhando com as ferramentas da ANOVA, Regressão e Correlação aplicadas ao meio empresarial. Vejamos algumas aplicações da utilização direta da Estatística no meio empresarial e industrial como segue. Case Empresarial 01 (ANOVA) (Adaptado de Oliveira 2007): um grande grupo empresarial explora quatro supermercados distribuídos estrategicamente por zonas da cidade de Rio de Janeiro. Nos últimos meses, o grupo tem sido acusado por órgãos de defesa do consumidor de não praticar uma política de preços comum em todos os seus supermercados. Esta suposição baseia-se em visitas ocasionais que o órgão de defesa do consumidor tem realizado aos supermercados do grupo. Tais acusações têm contribuído para desgastar a imagem do grupo como também vem provocando a queda no faturamento de vendas de algumas lojas. Os responsáveis pelo grupo têm sempre alegado que as diferenças nos preços, caso existam, são meramente ocasionais e podem ser explicadas pelas ações promocionais que são realizadas com alguma frequência em cada uma de suas lojas. Como está para ser aberta em breve uma nova loja em um bairro nobre da cidade de Rio de Janeiro, os responsáveis pelo grupo empresarial solicitam uma consultoria, independente da realização de um estudo que permita esclarecer de uma vez por todas as dúvidas relacionadas com os preços praticados nas diferentes lojas do grupo. Com este estudo, o grupo empresarial pretende demonstrar que as acusações visam apenas denegrir a sua imagem e que as diferenças nos preços, 5 caso existam, foram ocasionais, não evidenciando qualquer tendência ao longo do tempo. Portanto, antes de ser levada a cabo qualquer campanha promocional relacionada com a abertura de uma nova loja do grupo, os seus dirigentes entendem ser de fundamental importância o esclarecimento dos fatos aos consumidores, pois somente dessa forma a imagem de transparência que sempre caracterizou o grupo poderá ser restabelecida. A metodologia proposta pela consultoria contratada pelo grupo foi dividida em três etapas mostradas a seguir: Etapa 01: deverá ser relacionado, ao acaso, um produto de grande consumo que seja comercializado permanentemente em todas as lojas do grupo. Etapa 02: o preço do produto terá seu preço coletado durante 40 dias do ano em curso. Na escolha dos dias do ano em curso deverá haver preocupação de excluir épocas festivas locais, uma vez que realização de ações promocionais em cada loja poderá provocar diferenças ocasionais nos preços dos produtos. Etapa 03: nessa última fase, uma técnica estatística (Análise de Variância - ANOVA) será escolhida para concluir se as diferenças observadas nos preços médios têm caráter sistemático ou ocasional. O produto selecionado para o estudo foi um detergente para limpeza de roupas de uma marca bastante conhecida e os preços que foram praticados nos 40 dias escolhidos são os que estão no Quadro 01 a seguir: 6 Quadro 01: Os dados coletados dos preços do produto escolhido ao longo de 40 dias. Supermercado A Supermercado B Supermercado C Supermercado D 3,78 3,80 3,80 4,00 3,97 3,99 4,00 3,99 3,62 3,64 3,64 3,64 4,06 4,08 4,09 4,08 3,82 3,84 3,84 3,84 4,38 4,40 4,41 3,90 4,27 4,29 4,30 4,29 3,86 3,88 3,89 3,88 4,18 4,20 3,00 6,89 3,98 4,00 4,014,00 4,79 4,81 4,82 4,82 4,26 4,28 4,29 4,28 4,46 4,48 4,49 4,48 3,91 3,93 3,94 3,93 4,58 4,60 4,61 4,61 4,33 4,35 4,36 4,35 4,31 4,33 4,34 4,33 4,34 4,36 4,37 4,36 4,46 4,48 4,49 4,48 4,10 4,12 4,13 4,12 4,56 4,58 4,59 4,59 4,24 4,26 4,27 4,26 4,18 4,20 4,21 4,20 3,94 3,96 3,97 3,96 4,36 4,38 4,39 4,38 7 4,22 4,24 4,25 4,24 4,40 4,42 4,43 4,42 3,97 3,99 4,00 3,99 4,54 4,50 4,57 4,56 4,32 4,34 4,35 4,34 4,36 4,38 4,39 4,38 4,60 4,62 4,63 4,63 3,89 3,91 3,92 5,00 3,96 3,98 3,99 3,98 4,37 4,39 4,40 4,39 4,50 4,52 4,53 4,52 4,13 4,15 4,16 4,15 4,73 4,75 4,76 4,76 4,23 4,25 4,26 4,25 4,00 4,02 4,03 5,00 Fonte: Elaborado pelo próprio autor. Qual seria a conclusão acerca do estudo de caso proposto pela empresa de consultoria contratada, considerando um nível de significância = 5%? Case Empresarial 02 (CORRELAÇÃO) (Adaptado de Oliveira 2007): a empresa Sigma Consultoria, estudando o comportamento dos consumidores do município de Sete Lagoas, elegeu vários indicadores que considerava relevantes para os empresários do comércio varejista. Entre esses indicadores, foram destaque: taxa de Comprometimento da Renda do Consumidor: diz respeito à parcela da renda dos consumidores que está comprometida com contas ou dívidas, tais como cheques pré-datados, cartões de crédito, carnês de lojas, empréstimo pessoal, compra de imóvel e prestações de carro e de seguros; taxa de Inadimplência em Potencial – é a taxa que reflete o número de consumidores que não terão condições de pagar contas ou dívidas atrasadas no 8 próximo mês, no que se referem a cheques pré-datados, cartões de crédito, carnês de lojas, empréstimo pessoal, compra de imóvel e prestações de carro e de seguros. Durante os doze meses do ano passado, os resultados obtidos pela empresa Sigma Consultoria são mostrados no Quadro 02 a seguir. Quadro 02: A disposição dos dados do problema. Fonte: Elaborado pelo próprio autor. Onde: X: Taxa de Comprometimento da Renda do Consumidor; e, Y: Taxa de Inadimplência em Potencial Pede-se para determinar o coeficiente de correlação para os indicadores e interpretá-lo. Que outras variáveis podemos citar que contribuem para a formação da Inadimplência dos consumidores nos dias atuais? Case Empresarial 03 (REGRESSÃO APLICADA À GESTÃO ESTRATÉGICA DE CUSTOS) (Adaptado de Oliveira 2007): o Quadro 03 a seguir indica as quantidades produzidas de certo produto, e os respectivos custos totais de produção, apresentados pela Empresa Argepal Ltda. Dessa forma, durante a primeira semana do mês de janeiro de 2010, os resultados obtidos pela Argepal foram os que seguem. 9 Quadro 03: Os resultados obtidos pela empresa Argepal no mês de janeiro de 2010. Fonte: Elaborado pelo próprio autor. Sendo assim, a partir da ferramenta da análise de regressão, pede-se: a) A reta que melhor se ajuste a esses dados, ou seja, o melhor modelo que ajusta esta distribuição conjunta de valores. b) O valor do coeficiente de correlação linear e sua interpretação prática. c) O valor mais provável dos custos fixos. d) O valor estimado do custo variável para uma produção de 180 unidades. e) Admitindo-se um preço de venda de R$16,00, por unidade, estimar a quantidade mínima que se deve produzir para obter lucro. f) O gráfico de dispersão e a sua interpretação prática. Neste sentido, o objetivo geral do nosso módulo é apresentar as principais propriedades da ANOVA, bem como, da Regressão e Correlação, além, é claro, da resolução de aplicações práticas do mercado empresarial utilizando os tópicos citados anteriormente. Pois bem, as palavras acima são nossa justificativa para o módulo em estudo. “Estratégia significa enfrentar um adversário e combatê-lo para a conquista de um determinado território.” (Clausewitz) 10 “Por serem mais precisos do que as palavras, os números são particularmente mais adequados para transmitir as conclusões científicas e, atualmente, as conclusões de mercado.” (Pagano e Gauvre) “Uma estratégia eficaz leva em conta os três principais envolvidos: a empresa; o cliente e a concorrência (...)” (Kenichi Ohmae ) “É a ação de projetar o produto e a imagem da empresa para ocupar um lugar diferenciado na mente do público alvo. O resultado do (bom) posicionamento é a criação bem sucedida de uma proposta de valor focada no cliente.” (Kotler) 11 UNIDADE 1 – ANOVA E APLICAÇÕES Da literatura sabemos que a ANOVA é uma coleção de modelos estatísticos na qual a variância amostral é particionada em diversos componentes devido a diferentes fatores (variáveis), que nas aplicações estão associados a um processo, produto ou serviço. Ou ainda, a Análise de variância é a técnica estatística que permite avaliar afirmações sobre as médias de populações. A análise visa, fundamentalmente, verificar se existe uma diferença significativa entre as médias e se os fatores exercem influência em alguma variável dependente. É uma metodologia muito utilizada na resolução de problemas empresariais diversos. 1.1 Aspectos Introdutórios De acordo com Triola (1999), a Análise de Variância trata-se de um conjunto de técnicas estatísticas para descobrir “fatores” que produzem mudanças sistemáticas em alguma variável de interesse. Os fatores propostos podem ser variáveis quantitativas ou atributos (qualitativas), enquanto que a variável dependente é quantitativa e é observada dentro das classes dos fatores, como, por exemplo: se quisermos verificar se os índices médios de produção de 3 postos de trabalho (A, B e C) diferem de forma significativa em uma determinada empresa na área alimentícia; podemos estar interessado em descobrir variáveis que causam consumo de combustível dos automóveis. A marca do veículo, idade, entre outros. Por meio da análise de variância, é possível verificar se a marca, idade – ou uma combinação desses fatores – produzem efeitos apreciáveis sobre o consumo, ou concluir que tais fatores não têm influência sobre o consumo; podemos nos interessar em descrever se três ou mais amostras provêm de uma mesma população. Em verdade, trata-se de uma generalização do teste t para a diferença entre duas médias (teste t de Student), para o caso de compararmos simultaneamente k médias (k > 2), supondo que as mesmas foram calculadas sobre amostras aleatórias extraídas da população. Em verdade, iremos trabalhar apenas com a análise de variância simples ou de um critério. https://pt.wikipedia.org/wiki/Vari%C3%A2ncia https://pt.wikipedia.org/wiki/Estat%C3%ADstica https://pt.wikipedia.org/wiki/M%C3%A9dia https://pt.wikipedia.org/wiki/Popula%C3%A7%C3%A3o https://pt.wikipedia.org/wiki/Signific%C3%A2ncia_estat%C3%ADstica 12 Importante! De acordo com Vieira (1999), a ANOVA é a generalização do Teste t, isto é, quando necessitamos comparar mais do que duas médias. Método estatístico desenvolvido por Fisher, que, por meio de teste de igualdade de médias, verifica se os fatores (variáveis independentes) produzem mudanças sistemáticas em alguma variável de interesse (variável dependente). Em verdade, de acordo com Triola (1999), temos dois tipos de metodologia associada à ANOVA, que são: Análise de Variância de Um Critério ou Análise de Variância de Dois Critérios. Figura 01: Tipos de ANOVA. Fonte: Elaborado pelo próprio autor. 1.2 Estudo das Variações De acordo com Vieira (1999), a “ANOVA” é um teste de média, utilizando as variâncias, sendo que ela analisa as variações dentro da amostra (variações aleatórias) e as variações entre amostras (variações explicadas). 13 Figura 02: Caracterização das variações. Fonte: Elaborado pelo próprio autor. Ou ainda, podemos visualizar da seguinte forma: Figura 03: Caracterização das variações. Fonte: Elaborado pelo próprio autor.Dessa forma, o estudo das variações nos leva ao conhecido QAV (Quadro da Análise de Variância). Salientamos, mais uma vez, que não será de nosso interesse explicar os cálculos a partir das fórmulas presentes nesta metodologia, já que são complexas e de difícil manuseio, dessa forma, estaremos interessados em aplicar a metodologia via implementação numérica no pacote estatístico SPSS. O Quadro da Análise de Variância (QAV) é mostrado abaixo. 14 Quadro 04: O Quadro da Análise de Variância. Fonte de Variação Soma de Quadrados Graus de Liberdade Quadrado Médio Teste F Entre Amostras 2 ij j e i i x S C n K – 1 1 eS K F = 1 e t S K S N K Dentro da Amostra r t eS S S N – K tS N K Total 2 t ij i j S x C N – 1 Fonte: Elaborado pelo próprio autor. Onde C = N x i j ij 2)( . Vejamos alguns exemplos de Cases Empresariais envolvendo a resolução de problemas simulados via a Análise de Variância (ANOVA). (Case Empresarial 01: ANOVA) (Adaptado de Oliveira 2007): uma multinacional na área alimentícia pede a uma empresa de consultaria de mercado que analise durante certo período, se as diferenças existentes na sua produção, são devidas aos turnos da manhã, tarde e noite, aqui denotados por postos de trabalho A, B e C, respectivamente. Os dados com relação aos índices de produção são apresentados abaixo, adotar ( = 5%). Os dados são apresentados no Quadro 05 a seguir. Qual foi a conclusão da empresa de consultoria? Fixar = 5%. 15 Quadro 05: Os índices de produção dos postos de trabalho do problema. Posto de Trabalho A Posto de Trabalho B Posto de Trabalho C 90,8 85,5 65,9 100,0 83,0 77,1 81,1 73,7 68,5 Fonte: Elaborado pelo próprio autor. Solução: inicialmente, devemos descrever o teste de hipóteses associado, ressaltando que estaremos utilizando a ANOVA, já que temos mais do que dois grupos, no caso três grupos. Desta forma, temos que: H 0 : Os três postos de trabalho são igualmente eficientes, ou seja, os postos não influenciam de forma significativa nos índices de produção ( CBA xxx = x ). H 1 : Os três postos de trabalho não são igualmente eficientes, ou seja, existe pelo menos um deles que é diferente dos demais em eficiência (existe um i tal que xxi ). Logo em seguida, devemos criar a nossa planilha de dados, que neste caso teremos duas variáveis, que denominaremos de indprod e posto, como mostradas abaixo. 16 Ou seja, Ou ainda, Além disso, notemos, com relação a variável posto, que temos a seguinte caracterização na opção VALORES: 17 Ou ainda, Observemos que claramente ambas as variáveis criadas, são colocadas como sendo variáveis numéricas, tal particularidade é necessária para o desenvolvimento da ANOVA via o programa SPSS. A seguir, entramos com os valores ou observações que compõem o nosso conjunto de dados. 18 A fim de utilizarmos a ANOVA, utilizamos a seguinte sequência de passos no programa SPSS. Figura 04: A sequência de passos para utilização da ANOVA no SPSS. Fonte: Elaborado pelo próprio autor. Ou seja, 19 Aparecendo a seguinte tela, Ou seja, 20 Agora, procedemos com a caracterização das variáveis na metodologia de resolução numericamente como segue. Ou seja, Na opção POST HOC, introduzimos o valor da probabilidade a priori ( = 5%). Além disso, nesta janela temos uma série de testes que servem para averiguar, por exemplo, quais pares de médias são diferentes, como o Teste de Sheffé, Bonferroni, LSD, entre outros. 21 Ou seja, Na sequência, clicamos em CONTINUAR e depois em OK, daí aparece automaticamente a janela de saída referente à aplicação da ANOVA, ou seja, aparece o QAV (Quadro da análise de variância) a seguir. 22 ANOVA Índice de produção 608,082 2 304,041 5,618 ,042 324,693 6 54,116 932,776 8 Between Groups Within Groups Total Sum of Squares df Mean Square F Sig. Conclusão do Case Empresarial: de acordo com o QAV acima, percebemos que o valor da probabilidade a posteriori (Sig.) é igual a p-valor = p = 0,042, ou seja, 4,2% que é menor do que a probabilidade a priori = 5%. E, portanto, em termos práticos, rejeitamos a hipótese nula H 0 , isto é, aceitamos a hipótese alternativa H 1 , significando em termos práticos que o turno de trabalho influencia no índice de produção, ou ainda, que os três turnos não são estatisticamente falando iguais com relação ao nível de produção. Figura 05: Conclusão do estudo de caso. Fonte: Elaborado pelo próprio autor. (Case Empresarial 02: ANOVA) (Adaptado de Oliveira 2007): o resultado das vendas efetuadas por três vendedores de uma empresa durante certo período é dado a seguir. Deseja-se saber, ao nível de significância de 5%, se há diferença de eficiência entre os vendedores. 23 Quadro 06: Os dados do problema. Vendedores A B C 29 27 30 27 27 30 31 30 31 29 28 27 32 29 30 Fonte: Elaborado pelo próprio autor. Solução: inicialmente, devemos descrever o teste de hipóteses associado, ressaltando que estaremos utilizando a ANOVA, já que temos mais do que dois grupos, no caso três grupos. Dessa forma, temos que: H 0 : Os três vendedores são igualmente eficientes com relação às vendas ( CBA xxx = x ); H 1 : Os três vendedores não são igualmente eficientes com relação às vendas (existe um i tal que xxi ). Logo em seguida, devemos criar a nossa planilha de dados, que neste caso teremos duas variáveis, que denominaremos de indprod e posto, como mostradas abaixo. 24 Ou seja, Além disso, notemos com relação à variável vendedor que temos a seguinte caracterização na opção VALORES: Ou ainda, 25 Observemos que claramente, ambas as variáveis criadas, são colocadas como sendo variáveis numéricas, tal particularidade é necessária para o desenvolvimento da ANOVA via o programa SPSS. A seguir, entramos com os valores ou observações que compõem o nosso conjunto de dados. Ou seja, temos a seguinte disposição de dados: 26 A fim de utilizarmos a ANOVA, utilizamos a seguinte sequência de passos no programa SPSS. Figura 06: A sequência de passos para utilização da ANOVA no SPSS. Fonte: Elaborado pelo próprio autor. Ou seja, 27 Aparecendo a seguinte tela: Ou seja, 28 Agora, procedemos com a caracterização das variáveis na metodologia de resolução numericamente como segue. Ou seja, Na opção POST HOC, introduzimos o valor da probabilidade a priori ( = 5%). Além disso, nesta janela temos uma série de testes que servem para averiguar, por exemplo, quais pares de médias são diferentes, como o Teste de Sheffé, Bonferroni, LSD, entre outros. 29 Ou seja, Na sequência, clicamos em CONTINUAR e depois em OK, daí aparece automaticamente a janela de saída referente a aplicação da ANOVA, ou seja, aparece o QAV (Quadro da análise de variância) abaixo. ANOVA Vendas efetuadas pelos vendedores 7,200 2 3,600 1,415 0,281 30,533 12 2,544 37,733 14 Between Groups Within Groups Total Sum of Squares df Mean Square F Sig. 30 Conclusão do Case Empresarial: de acordo com o QAV acima, percebemos que o valor da probabilidade a posteriori (Sig.) é igual a p-valor = p = 0,281, ou seja, 28,1% que é maior do que a probabilidade a priori = 5%. E, portanto, em termos práticos, aceitamos a hipótese nula H 0 , i.e., rejeitamos a hipótese alternativa H 1 , significando em termos práticos que os três vendedores são igualmente eficientes com relação às vendas. Figura 07: Conclusão do estudo de caso. Fonte: Elaborado pelo próprio autor. (Estudo de Caso 03: ANOVA) (Adaptadode Oliveira 2007): um grande grupo empresarial explora quatro supermercados distribuídos estrategicamente por zonas da cidade de Rio de Janeiro. Nos últimos meses, o grupo tem sido acusado por órgãos de defesa do consumidor de não praticar uma política de preços comum em todos os seus supermercados. Esta suposição baseia-se em visitas ocasionais que o órgão de defesa do consumidor tem realizado aos supermercados do grupo. Tais acusações têm contribuído para desgastar a imagem do grupo como também vem provocando a queda no faturamento de vendas de algumas lojas. Os responsáveis pelo grupo têm sempre alegado que as diferenças nos preços, caso existam, são meramente ocasionais e podem ser explicadas pelas ações promocionais que são realizadas com alguma frequência em cada uma de suas lojas. Como está para ser aberta em breve uma nova loja em um bairro nobre da cidade de Rio de Janeiro, os responsáveis pelo grupo empresarial solicitam a uma 31 consultoria independente a realização de um estudo que permita esclarecer de uma vez por todas as dúvidas relacionadas com os preços praticados nas diferentes lojas do grupo. Com este estudo, o grupo empresarial pretende demonstrar que as acusações visam apenas denegrir a sua imagem e que as diferenças nos preços, caso existam, foram ocasionais, não evidenciando qualquer tendência ao longo do tempo. Portanto, antes de ser levada a cabo qualquer campanha promocional relacionada com a abertura de uma nova loja do grupo, os seus dirigentes entendem ser de fundamental importância o esclarecimento dos fatos aos consumidores, pois somente dessa forma a imagem de transparência que sempre caracterizou o grupo poderá ser restabelecida. A metodologia proposta pela consultoria contratada pelo grupo foi dividida em três etapas mostradas a seguir: Etapa 01: deverá ser relacionado, ao acaso, um produto de grande consumo que seja comercializado permanentemente em todas as lojas do grupo. Etapa 02: o preço do produto terá seu preço coletado durante 40 dias do ano em curso. Na escolha dos dias do ano em curso deverá haver preocupação de excluir épocas festivas locais, uma vez que realização de ações promocionais em cada loja poderá provocar diferenças ocasionais nos preços dos produtos. Etapa 03: nessa última fase, uma técnica estatística (Análise de Variância - ANOVA) será escolhida para concluir se as diferenças observadas nos preços médios têm caráter sistemático ou ocasional. O produto selecionado para o estudo foi um detergente para limpeza de roupas de uma marca bastante conhecida e os preços que foram praticados nos 40 dias escolhidos são os que estão no Quadro 06 a seguir: Quadro 06: Os dados coletados dos preços do produto escolhido ao longo de 40 dias. Supermercado A Supermercado B Supermercado C Supermercado D 3,78 3,80 3,80 4,00 3,97 3,99 4,00 3,99 3,62 3,64 3,64 3,64 32 4,06 4,08 4,09 4,08 3,82 3,84 3,84 3,84 4,38 4,40 4,41 3,90 4,27 4,29 4,30 4,29 3,86 3,88 3,89 3,88 4,18 4,20 3,00 6,89 3,98 4,00 4,01 4,00 4,79 4,81 4,82 4,82 4,26 4,28 4,29 4,28 4,46 4,48 4,49 4,48 3,91 3,93 3,94 3,93 4,58 4,60 4,61 4,61 4,33 4,35 4,36 4,35 4,31 4,33 4,34 4,33 4,34 4,36 4,37 4,36 4,46 4,48 4,49 4,48 4,10 4,12 4,13 4,12 4,56 4,58 4,59 4,59 4,24 4,26 4,27 4,26 4,18 4,20 4,21 4,20 3,94 3,96 3,97 3,96 4,36 4,38 4,39 4,38 4,22 4,24 4,25 4,24 4,40 4,42 4,43 4,42 3,97 3,99 4,00 3,99 4,54 4,50 4,57 4,56 4,32 4,34 4,35 4,34 4,36 4,38 4,39 4,38 33 4,60 4,62 4,63 4,63 3,89 3,91 3,92 5,00 3,96 3,98 3,99 3,98 4,37 4,39 4,40 4,39 4,50 4,52 4,53 4,52 4,13 4,15 4,16 4,15 4,73 4,75 4,76 4,76 4,23 4,25 4,26 4,25 4,00 4,02 4,03 5,00 Fonte: Elaborado pelo próprio autor. Qual seria a conclusão acerca do estudo de caso proposto pela empresa de consultoria contratada considerando um nível de significância = 5%? Solução: inicialmente, devemos descrever o teste de hipóteses associado, ressaltando que estaremos utilizando a ANOVA, já que temos mais do que dois grupos, no caso três grupos. Dessa forma, temos que: H 0 : Os quatro supermercados praticam a mesma política de preços, ou seja, as diferenças existentes nos preços são ocasionais ( CBA xxx = Dx = x ); H 1 : Os quatro supermercados não praticam a mesma política de preços, ou seja, as diferenças existentes nos preços são sistemáticas (existe um i tal que xxi ). Logo em seguida, devemos criar a nossa planilha de dados, que neste caso teremos duas variáveis, que denominaremos de indprod e posto, como mostradas abaixo. 34 Além disso, notemos com relação à variável y (Classificação dos Supermercados) que temos a seguinte caracterização na opção VALORES: 35 Observemos que claramente ambas as variáveis criadas, são colocadas como sendo variáveis numéricas, tal particularidade é necessária para o desenvolvimento da ANOVA via o programa SPSS. A seguir, entramos com os valores ou observações que compõem o nosso conjunto de dados. Salientamos que esta nossa planilha possui 160 linhas de dados (observações), já que temos associado a cada um dos quatro supermercados 40 valores para o preço do produto em análise. A fim de utilizarmos a ANOVA, utilizamos a seguinte sequência de passos no programa SPSS. Figura 08: A sequência de passos para utilização da ANOVA no SPSS. Fonte: Elaborado pelo próprio autor. Ou seja, 36 Agora, procedemos com a caracterização das variáveis na metodologia de resolução numericamente como segue. Na opção POST HOC, introduzimos o valor da probabilidade a priori ( = 5%). Além disso, nesta janela temos uma série de testes que servem para averiguar, por exemplo, quais pares de médias são diferentes, como o Teste de Sheffé, Bonferroni, LSD, entre outros. 37 Na sequência, clicamos em CONTINUAR e depois em OK, daí aparece automaticamente a janela de saída referente à aplicação da ANOVA, ou seja, aparece o QAV (Quadro da análise de variância) abaixo. ANOVA Preços em R$ do produto selecionado durante os quarenta dias ,493 3 ,164 1,241 ,297 20,660 156 ,132 21,153 159 Between Groups Within Groups Total Sum of Squares df Mean Square F Sig. Conclusão do Case Empresarial: de acordo com o QAV acima, percebemos que o valor da probabilidade a posteriori (Sig.) é igual a p-valor = p = 0,297, ou seja, 29,7%% que é maior do que a probabilidade a priori = 5%, dessa forma aceitamos a hipótese nula. E, portanto, em termos práticos, concluímos que existe uma forte evidência de que as médias populacionais dos preços esperados, associados aos diferentes tipos de promoções, não são estatisticamente significativas, já que não rejeitamos a hipótese de igualdade dos preços médios. Ou ainda, em um linguajar mais simples, significa que o grupo empresarial através dos seus quatro supermercados não praticam preços diferenciados. 38 Complementação da Discussão do Estudo de Caso: para finalizarmos este Estudo de Caso, em nível de discussão, poderíamos indagar diante dos resultados obtidos o que poderia ser feito pelo grupo empresarial a nível estratégico? Para tal, vamos determinar o valor de cada uma das médias de preços praticados em cada supermercado no SPSS, como descrito abaixo. Figura 09: Os passos para encontrarmos a média de cada supermercado. Fonte: Elaborado pelo próprio autor. Aparecerá a tela, 39 Adicionamos as variáveis para os retângulos do lado direito, como mostramos abaixo, Depois clicamos em Estatísticas para descrevermos quais as medidas a serem encontradas, no caso optamos pelo número de casos, pela média e pelo desvio padrão. Clicamos em CONTINUAR e OK, e após, aparecerá a janela de resultados separados por cada supermercado. 40 Ou ainda, sem a disposição de todos os casos, visualizamos.41 Ou seja, temos a tabela abaixo com os valores da média de cada supermercado. Case Summaries Preços em R$ do produto selecionado durante os quarenta dias 40 4,2240 ,27341 40 4,2425 ,27179 40 4,2230 ,33881 40 4,3568 ,51608 160 4,2616 ,36475 Classif icação dos SupermercadosA B C D Total N Mean Std. Dev iation Claramente, percebemos na tabela acima que o supermercado D é o que pratica na média os maiores preços. Observação Importante! Diante desses resultados, os responsáveis pelos supermercados, vão reafirmar publicamente que não existem diferenças nos preços praticados pelo grupo. Se os preços são levemente mais altos no Supermercado D, são resultantes de serviços que não funcionam em outras lojas. Os responsáveis pelos supermercados decidiram também enviar uma carta questionário aos clientes do Supermercado D informando dessa situação e solicitando opinião sobre a preservação desses serviços gratuitos que são disponibilizados por esse supermercado. Se a maioria dos consumidores decidirem abdicar de alguns serviços, os preços serão nivelados pelos praticados nas outras lojas do grupo. 42 UNIDADE 2 – CORRELAÇÃO E REGRESSÃO 2.1 Aspectos Introdutórios De acordo com Vieira (1999), a regressão e a correlação são duas técnicas estreitamente relacionadas que envolvem uma forma de estimação. Especificamente, a análise de correlação e regressão corresponde à análise de dados amostrais para saber se, e como duas ou mais variáveis estão relacionadas com a outra numa população. Figura 10: Associação entre variáveis. Fonte: Elaborado pelo próprio autor. Importante! A correlação mede a força, ou grau, de relacionamento entre duas variáveis; a regressão dá uma equação que descreve o relacionamento em termos matemáticos (isto é, o modelo matemático). 2.2 Correlação Aplicada ao Meio Empresarial Quando estudamos duas ou mais variáveis, além das medidas individuais que já estudamos anteriormente tais como medidas de centralidade, medidas de dispersão, assimetria, entre outras, também é de nosso interesse conhecer se elas possuem algum relacionamento entre si, isto é, se os valores altos (ou baixos) de uma das variáveis implicam em valores altos (ou baixos) da outra variável. 43 Importante! Quando não é possível percebermos uma relação sistemática entre as variáveis é dito que as mesmas não são correlacionadas, ou são independentes, ou ainda que são ortogonais. Por exemplo, poderíamos estar interessados em averiguar se existe associação entre os seguintes pares de variáveis: o volume de vendas a prazo e a taxa de inadimplência no comércio varejista; verba investida em propaganda e retorno nas vendas; índice de Produção do turno da manhã com o Índice de Produção do turno da tarde; entre outros. Definição (Correlação) – de acordo com Oliveira (2007), a esse estudo do relacionamento entre duas ou mais variáveis dá-se o nome de correlação. Grosso modo, a correlação tem como objetivo o de nos dar um número que resuma o grau de relacionamento linear entre as duas variáveis. Se o estudo tratar apenas de duas variáveis, temos a correlação simples e, caso trabalhemos com mais de duas variáveis, teremos a correlação múltipla. Figura 11: A interpretação do estudo envolvendo a correlação. Fonte: Elaborado pelo próprio autor. Salientamos ainda que o coeficiente de correlação como medida de intensidade de relação linear entre duas variáveis é apenas uma interpretação puramente matemática ficando, pois, isenta de qualquer implicação de causa e 44 efeito. Em outras palavras, o fato de que duas variáveis tendam a aumentar ou a diminuir não pressupõe que uma delas exerça efeito direto e indireto sobre a outra. Figura 12: Principais coeficientes de correlação. Fonte: Elaborado pelo próprio autor. 2.3 O Coeficiente de Correlação de Pearson De acordo com Oliveira (2007), o Coeficiente de Correlação Simples de Pearson é uma medida de associação linear entre variáveis quantitativas variando entre – 1 e +1. Quando seu valor é igual a 1, a correlação é dita perfeita negativa: os valores altos em uma variável correspondem a valores baixos na outra. Quando seu valor é +1, a correlação é denominada perfeita positiva: valores altos em uma variável correspondem a valores altos na outra. Quando o seu valor é igual a 0 (zero), concluímos que não existe correlação. Figura 13: O Coeficiente de Correlação de Pearson. Fonte: Elaborado pelo próprio autor. 45 Ainda de acordo com Oliveira (2007), salientamos que o Coeficiente de Correlação de Pearson é uma medida de associação linear. Duas variáveis podem se relacionar perfeitamente, mas se a relação não for linear, o Coeficiente de Correlação de Pearson não será uma estatística apropriada para mensurarmos a associação entre as variáveis de estudo. Resumindo, o Coeficiente de Correlação de Pearson pode ser interpretado como uma versão estandardizada da covariância, funcionando os desvios padrões como fatores de estandardização. De outra forma, para calcularmos correlações no pacote estatístico SPSS, procedemos de forma bastante simples como mostramos na Figura 14 abaixo. Figura 14: Obtendo correlações no SPSS. Fonte: Elaborado pelo próprio autor. Na caixa de diálogo subsequente, selecionamos as variáveis na caixa de diálogo e em seguida escolhemos o tipo de correlação que se deseja calcular em Coeficientes de Correlação. Para variáveis quantitativas, normalmente distribuídas, devemos escolher o Coeficiente de Correlação de Pearson, que em verdade, é o mais usado para tal análise envolvendo variáveis quantitativas. Se os dados forem normalmente distribuídos ou têm categorias (classes ou atributos) ordenadas, escolhemos o tau-b de Kendall ou Spearman, que mensura a associação entre as ordens de classificação. 46 No SPSS, temos a disposição apresentada na Figura 15 abaixo. Figura 15: A janela da correlação no SPSS. Fonte: Elaborado pelo próprio autor. Além disso, o pacote estatístico SPSS 20.0 nos permite ainda que escolhamos através do botão Opções como deverá ser feito o tratamento estatístico dos Valores Ausentes (missing Valores). Vejamos agora um Case Empresarial envolvendo a correlação, a fim de aplicarmos os aspectos teóricos e computacionais descritos anteriormente. (Estudo de Caso: Correlação de Pearson) (Adaptado de Oliveira 2007): a empresa Sigma Consultoria, estudando o comportamento dos consumidores do município de Sete Lagoas, elegeu vários indicadores que considerava relevantes para os empresários do comércio varejista. Entre esses indicadores, foram destaque: taxa de Comprometimento da Renda do Consumidor: diz respeito à parcela da renda dos consumidores que está comprometida com contas ou dívidas, tais como cheques pré-datados, cartões de crédito, carnês de lojas, empréstimo pessoal, compra de imóvel e prestações de carro e de seguros; taxa de Inadimplência em Potencial: é a taxa que reflete o número de consumidores que não terão condições de pagar contas ou dívidas atrasadas no próximo mês, no que se referem a cheques pré-datados, cartões de crédito, 47 carnês de lojas, empréstimo pessoal, compra de imóvel e prestações de carro e de seguros. Durante os doze meses do ano passado, os resultados obtidos pela empresa Sigma Consultoria são mostrados no Quadro 02 a seguir. Quadro 02: A disposição dos dados do problema. Fonte: Elaborado pelo próprio autor. Onde: X: Taxa de Comprometimento da Renda do Consumidor; e, Y: Taxa de Inadimplência em Potencial. Pede-se para determinar o coeficiente de correlação para os indicadores e interpretá-lo. Que outras variáveis podemos citar que contribuem para a formação da Inadimplência dos consumidores nos dias atuais? Solução: Para encontrarmos o coeficiente de correlaçãoatravés do pacote estatístico SPSS 20.0, inicialmente definimos um banco de dados para a leitura dos dados pelo SPSS, onde nesse caso, criamos a estrutura apresentada abaixo na planilha Variable View. 48 A partir do momento em que definimos as variáveis que comporão a nossa planilha, partimos para a digitação dos nossos dados encontrados nos dizeres do estudo de caso (Tabela 01), como mostramos abaixo na planilha Visualização de dados. Na barra de menu do SPSS, como citado anteriormente, escolhemos a sequência de passos mostradas na Figura 16 abaixo. 49 Figura 16: Sequência de passos: correlação do estudo de caso. Fonte: Elaborado pelo próprio autor. Ou seja, Selecionamos as variáveis na caixa de diálogo e escolhemos o tipo de correlação que desejamos calcular. No nosso caso, vamos escolher a Correlação de Pearson, já que as variáveis da nossa planilha são variáveis quantitativas, como mostramos abaixo. 50 Pressionamos a seguir o botão OK na janela de comandos acima e o SPSS 20.0 nos dá o resultado automaticamente no formato da tabela mostrada abaixo. Correlations 1 ,945** ,000 12 12 ,945** 1 ,000 12 12 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Taxa de Comprometimento da Renda do Consumidor Taxa de Inadimplência em Potencial Taxa de Comprometi mento da Renda do Consumidor Taxa de Inadimplência em Potencial Correlation is signif icant at the 0.01 level (2-tailed).**. Conclusão do Case Empresarial: de acordo com a tabela acima, observamos que existe uma forte correlação positiva entre a Taxa de Comprometimento da Renda do Consumidor e Taxa de Inadimplência em Potencial, já que o Coeficiente de Correlação de Pearson (r) é igual a r = 0,945 ou 94,5%. Em outras palavras, percebemos que à medida que aumenta o comprometimento da renda do consumidor, esperamos também que aumente o número de consumidores inadimplentes. Salientamos ainda, com relação à tabela acima (saída do SPSS) que no cruzamento (células iguais a 1), temos tal valor já que é a associação entre a 51 variável com ela mesma, por exemplo, a primeira célula representa a associação da Taxa de Comprometimento da Renda do Consumidor com ela mesma. Para finalizarmos tal discussão acerca do Estudo de Caso presente, frisamos que não é apenas o Comprometimento da Renda do Consumidor que leva a Inadimplência. Outras variáveis contribuem para levar os consumidores ao inadimplemento, tais como as mostradas na Figura 17 a seguir. Figura 17: Outras variáveis que contribuem para o inadimplemento. Fonte: Elaborado pelo próprio autor. Ressaltamos ainda de forma bem simples, que a ocorrência da maioria destes fatores é mais comum em tempos de crise. E como poderíamos lidar com a Inadimplência? É necessário o conhecimento por inteiro e de forma detalhada da inadimplência, sabendo quais os fatores que a ocasionaram. A partir deste ponto, devemos utilizar ações de ordem preventiva, a fim de atingirmos o estágio de controle da mesma. Para tanto, o empresário gestor deve verificar os seguintes pontos: sazonalidade, ou seja, em que épocas do ano a inadimplência é maior ou menor; número de prestações em atraso; valor médio das prestações em atraso; 52 verificação do tempo de abertura da conta corrente. Aqui, salientamos que de acordo com estudos realizados as contas abertas com menos de um ano, têm maior índice de inadimplência. 2.4 Regressão Linear Simples De acordo com Vieira (1999), muitos estudos na área da Estatística têm como objetivo central estabelecer uma relação, traduzida por uma equação (modelo matemático), que permite estimar o valor de uma variável, em função de outra variável ou de outras variáveis. O caso mais simples é traduzir tal relação pela equação de uma reta, quando o acréscimo de uma variável, designada por dependente e usualmente denotado por Y, varia de forma linear com os acréscimos provocados em outra variável, designada por independente e, denotada por X. Essas equações são usadas em situações que aparecem no dia-a-dia de um empresário ou gestor quando, por exemplo, se deseja: estimar valores de uma variável com base em valores conhecidos de outra; explicar valores de uma variável em termos de outra; predizer valores futuros de uma variável. Duas importantes características da equação linear devem ser destacadas: o coeficiente angular da reta e a cota da reta em determinado ponto (também denominado de coeficiente linear ou simplesmente intercepto). Figura 18: Aspectos fundamentais da regressão linear simples. Fonte: Elaborado pelo próprio autor. 53 Em outras palavras, a regressão linear em verdade trabalha com uma equação como sendo uma equação afim, ou função polinomial do primeiro grau. Figura 19: Informações referentes a regressão linear. Fonte: Elaborado pelo próprio autor. 2.5 Gráfico de Dispersão De acordo com Vieira (1999), para analisarmos a regressão linear simples, é desejável a construção de um gráfico bidimensional denominado diagrama de dispersão. Cada valor é marcado em função das coordenadas de X e Y. O Quadro 07 a seguir indica as quantidades produzidas, de certo produto, e os respectivos custos totais de produção apresentados por uma empresa. Quadro 07: Dados referentes à quantidade produzida e custo total. Quantidade Produzida (X) Custo Total (R$) (Y) 100 1460,00 250 2950,00 500 5400,00 800 8390,00 1000 10200,00 Fonte: Elaborado pelo próprio autor. 54 Dessa forma, o gráfico de dispersão associado é dado na Figura 20 abaixo. Note que tal gráfico foi gerado no pacote SPSS. Quantidade produzida de determinado produto por uma empresa 120010008006004002000 C us to to ta l d a pr od uç ão d o pr od ut o 12000 10000 8000 6000 4000 2000 0 Figura 20: O gráfico de dispersão referente aos dados do Quadro 07. Fonte: Elaborado pelo próprio autor. Vejamos um exemplo ilustrativo (Case Empresarial) envolvendo a Regressão Linear Simples. (Estudo de Caso: Regressão Linear Simples) (REGRESSÃO APLICADA A GESTÃO ESTRATÉGICA DE CUSTOS) (Adaptado de Oliveira 2007): o Quadro 03 a seguir indica as quantidades produzidas de certo produto, e os respectivos custos totais de produção, apresentados pela Empresa Argepal Ltda. Dessa forma, durante a primeira semana do mês de janeiro de 2010 os resultados obtidos pela Argepal foram os que seguem. Quadro 03: Os resultados obtidos pela empresa Argepal no mês de janeiro de 2010. Fonte: Elaborado pelo próprio autor. 55 Sendo assim, a partir da ferramenta da análise de regressão, pede-se: a) A reta que melhor se ajuste a esses dados, ou seja, o melhor modelo que ajusta esta distribuição conjunta de valores. b) O valor do coeficiente de correlação linear e sua interpretação prática. c) O valor mais provável dos custos fixos. d) O valor estimado do custo variável para uma produção de 180 unidades. e) Admitindo-se um preço de venda de R$16,00, por unidade, estimar a quantidade mínima que se deve produzir para obter lucro. f) O gráfico de dispersão e a sua interpretação prática. Solução: Inicialmente, vamos definir uma planilha de dados no SPSS, na qual montamos a seguinte disposição de variáveis mostradas a seguir na planilha Variable View. O arquivo de dados apresenta a seguinte forma após a digitação dos mesmos na planilha Visualização de dados como é mostrado a seguir. 56 Dessa forma, vamos responder às perguntas do nosso estudo de caso. a) Para desenharmos o diagrama de dispersão procedemos da seguinte forma: Figura 21: Sequência de passos para a representação do diagrama de dispersão. Fonte: Elaborado pelo próprio autor. 57 Ou seja, na tela do SPSS, temos a seguintedisposição: Ou seja, A partir da tela acima, escolhemos a opção Dispersão Simples e clicamos no botão DEFINIR e, automaticamente aparece a nova tela abaixo para definição das variáveis nos respectivos eixos ordenados. 58 Daí, definimos o Custo Total para o eixo das ordenadas (Eixo Y) e a Quantidade Produzida para o eixo das abscissas (Eixo X), como apresentamos na tela a seguir. Por fim, clicamos no botão OK e, a janela de saída nos dá o gráfico de dispersão em questão. 59 Aparentemente, já podemos visualizar que os pontos do nosso conjunto de dados parecem estar alinhados. Para respondermos às demais indagações do Estudo de Caso, procedemos da seguinte forma. Figura 22: Sequência de passos para a caracterização da reta de regressão. Fonte: Elaborado pelo próprio autor. Ou seja, 60 E escolhemos as variáveis para análise, conforme mostramos a seguir. 61 Com as variáveis já selecionadas, temos que: Notemos que definimos a variável Custo Total (Dependente) e a variável Quantidade Produzida (Independente), como já havíamos interpretado anteriormente. Pressionamos o botão OK na janela de comandos e os resultados necessários para a análise de regressão serão mostrados na tela do computador como segue. 62 Portanto, segue que: b) A reta de regressão é dada por: ^ Y = 55,286 + 9,583.X, na qual tiramos os valores dos parâmetros da reta de regressão na última tabela da saída de resultados referentes a análise de regressão no SPSS. c) O coeficiente de correlação linear (r) é igual a r = 0,999, onde encontramos o mesmo na tabela abaixo que aparece na saída da análise de regressão no SPSS. 63 d) A estimativa para os custos fixos será igual a: )0( ^ Y = 55,286 + 9,583.(0) = 55,286. Portanto, os custos fixos totalizam R$55,286. e) A estimativa para o custo variável para X = 180 unidades, será dada por: CV = 9,583.(180) = R$1.724,94. Donde concluímos que o custo variável perfaz a quantia de aproximadamente R$1.724,94. f) Vamos denotar por Q a quantia procurada. Desta forma, temos que: Lucro = Receita – Custo Total 16.Q – (55,286 + 9,583.Q) > 0, Q > 8,615 Donde concluímos que é necessário produzir no mínimo 9 (nove) unidades de tal produto. 64 CONCLUSÃO DA DISCIPLINA Vimos que a Estatística é uma importante e poderosa ferramenta para a análise de situações do meio empresarial para a tomada de decisão de forma confiável, já que no mundo globalizado em que vivemos, a concorrência entre as organizações é acirrada e contínua e, especificamente falando, a Análise de Variância, a Correlação e a Regressão, todas elas técnicas específicas de inferência. Em linhas gerais, vimos que para três ou mais fatores, a metodologia a ser utilizada é a Análise de Variância, que trabalha analisando as variações dentro das amostras, entre as mesmas, cuja soma nos dá a variação total. Além disso, na ANOVA temos o QAV, que é o quadro da Análise de Variância. Na sequência, trabalhamos com a Correlação entre duas variáveis, vimos que ela nos mostra a força de associação entre duas variáveis, além disso, em análises envolvendo variáveis quantitativas, temos o Coeficiente de Correlação de Pearson, que nos dá diretamente este grau de associação entre tais variáveis. Quando a associação envolver variáveis qualitativas, a caracterização do grau de associação pode ser feita de forma direta pelo Coeficiente de Correlação por Postos de Spearman. A seguir, discutimos as principais definições acerca da Regressão Linear Simples, que envolve mais uma vez a associação entre duas variáveis, mas que, em termos práticos, caracteriza a relação linear entre as mesmas, através da Reta de Regressão. Apresentamos também a ferramenta gráfica Diagrama de Dispersão, bem como o coeficiente de correlação de Pearson associado. Por fim, apresentamos alguns Estudos de Caso, envolvendo tais aspectos discutidos anteriormente no pacote estatístico SPSS. 65 REFERÊNCIAS ANDERSON, Sweeney, Williams. Estatística Aplicada à Administração e Economia. Rio de Janeiro: Pioneira, 2003. CALEGARE, Álvaro J. de A. Introdução ao Delineamento de Experimentos. 2° Edição. Rio de Janeiro: Edgard Blucher, 2009. FONSECA, Jairo S. da; MARTINS, Gilberto de A.. Curso de estatística. 6. ed.. Rio de Janeiro: Atlas, 2009. FREUND, John E. Estatística aplicada: economia, administração e contabilidade. 11. ed.. Porto Alegre: Bookman, 2006. LEVINE, David et al.. Estatística: teoria e aplicações. 5. ed.. Rio de Janeiro: LTC, 2008. MALHOTRA, Naresh K. Pesquisa de Marketing: Uma orientação Aplicada. 3° Edição. Porto Alegre: Bookman, 2001. MARTINS, Gilberto de Andrade. Estatística geral e aplicada. 3. ed.. Rio de Janeiro: Atlas, 2010. MILONE, Giuseppe. Estatística geral e aplicada. Rio de Janeiro: Cengage Learning, 2009. MOORE, David. A Prática da Estatística Empresarial: como usar dados para tomar decisões. Rio de Janeiro: LTC Editora, 2006. MORETTIN, Pedro A.; BUSSAB, Wilton de O. Estatística básica. 6. ed.. Rio de Janeiro: Saraiva, 2010. OLIVEIRA, Francisco E. M. de. SPSS Básico para Análise de Dados. 2 Edição. Rio de Janeiro: Ciência Moderna, 2007. PALADINI, Edson Pacheco. Gestão de Qualidade no Processo: a qualidade na produção de bens e serviços. São Paulo: Atlas, 1995. TRIOLA, Mario f. Introdução à Estatística. Tradução: Alfredo Alves de Faria, Eliana Farias e Soares, Vera Regina L. S. Flores. 7ed. Editora LTC, RJ – Cpyright, 1999. VIEIRA, S. Elementos de Estatística. São Paulo: Ed. Atlas, 1999.