Baixe o app para aproveitar ainda mais
Prévia do material em texto
Métodos Estatísticos Aplicados à Engenharia de Produção Responsável pelo Conteúdo: Prof.ª Dr.ª Brena Silva Revisão Textual: Prof.ª Dr.ª Selma Aparecida Cesarin Pensamento Estatístico e Estatística Descritiva Pensamento Estatístico e Estatística Descritiva • Calcular e interpretar a média, variância, o desvio-padrão e a amplitude; • Construir e interpretar a disposição gráfica de dados. OBJETIVOS DE APRENDIZADO • Introdução; • Pensamento Estatístico; • Estatística Descritiva. UNIDADE Pensamento Estatístico e Estatística Descritiva Introdução Seja bem-vindo(a) ao conteúdo de Métodos Estatísticos aplicados à Engenharia de Produção. Esta Disciplina é de extrema importância para a formação do Engenheiro de Produção (EP) devido a aplicações de cálculos estatísticos para garantir a confia- bilidade de desenvolvimento de novos produtos e processos, para a previsão de demanda, do planejamento e do controle da produção, para a simulação e para o controle de qualidade. Assim, leia atentamente o conteúdo. Boa leitura! Pensamento Estatístico A aplicação do pensamento estatístico para melhor compreender as variações nos processos de manufatura foi introduzida por W. A. Shewhart, no início do século XX. Shewhart foi um dos precursores no uso das Teorias de Probabilidade e da Esta- tística no âmbito das aplicações industriais. Nos anos 1950, W. E. Deming motivou o uso da Estatística como um meio para tentar mudar o desempenho dos processos (SANTOS; MARTINS, 2004). Antes de definirmos o significado de pensamento estatístico, precisamos relem- brar o que é um processo. Segundo Slack, Brandon-Jones e Johnston (2018), operações são processos com- postos por um conjunto de recursos de input que são usados para transformar algo ou que se transformam em outputs de serviços e produtos. Embora todas as operações se conformem a esse modelo geral de input – transfor- mação – output, elas diferem na natureza de seus inputs e outputs específicos. Todas as operações criam e entregam serviços e produtos pela transformação de inputs (entradas) em outputs (saídas), usando o processo “input – transformação – output”. Podemos estudar os processos em geral por meio do seu mapeamento. Um tipo de mapeamento é o diagrama SIPOC, que costuma ser usado em projetos Lean Manufacturing e/ou Seis Sigma para identificar os elementos principais de um processo. Ele fornece uma visão geral que reúne Fornecedores (Suppliers), Entradas (Inputs), Processos (Process), Saídas (Outputs) e Clientes (Customers). A Figura 1 apresenta um SIPOC: 8 9 Suppliers Inputs Process Outputs Customers Fornecedores Entradas Processo Saídas Clientes S I P O C O fornecedor de insumos para o seu processo. Materiais, recursos ou dados necessários para executar o processo. Os produtos ou serviços que resultam do processo. O destinatário do resultado do processo. Um conjunto estruturado de atividades que transformam um conjunto de entradas em saídas especí�cas, proporcionando valor aos clientes e partes interessadas. Figura 1 – SIPOC Fonte: fundacaoroge.org.br Um Engenheiro de Produção, dentre tantos objetivos, busca estudar os processos e operações de manufatura com o objetivo de controlar as variáveis dos inputs e processos para ter resultados satisfatórios e conforme o planejado. Assim, é possível que os clientes fiquem satisfeitos com seus produtos e/ou serviços. Nesse contexto, o pensamento estatístico é primordial nos processos de opera- ções para o controle de variáveis em todas as etapas, desde os fornecedores até o cliente, pois a gestão eficaz e eficiente de um processo deve ocorrer por meio da análise de fatos e dados. Além disso, como uma das definições de qualidade, temos a qualidade do proces- so que está associada à redução da variabilidade. Por variabilidade, queremos dizer que sucessivas observações de um sistema ou de um fenômeno não produzem exatamente o mesmo resultado. Todos nós encontramos variabilidade em nosso dia a dia e o pensamento esta- tístico pode nos dar uma maneira útil para incorporar essa variabilidade em nossos processos de tomada de decisão. Nesse contexto, o campo da Estatística lida com coleta, apresentação, análise e uso dos dados para tomar decisões, resolver problemas e planejar produtos e processos. Em termos simples, Estatística é a ciência de dados. Em razão de muitos aspec- tos da prática de Engenharia envolverem o trabalho com dados, obviamente algum conhecimento de Estatística é importante para qualquer Engenheiro. Especificamente, técnicas Estatísticas podem ser uma ajuda poderosa no plane- jamento de novos produtos e sistemas, melhorando os projetos existentes e plane- jando, desenvolvendo e melhorando os processos de produção (MONTGOMERY; RUNGER, 2018). A lista a seguir, segundo Snee (1990), apresenta os Princípios do Pensamento Estatístico (PE): 9 UNIDADE Pensamento Estatístico e Estatística Descritiva • Treinamento contínuo e disseminação dos princípios de Pensamento Estatístico; • Compromisso da alta gerência com a implementação dos princípios do PE; • Visão de processos interconectados; • Compreensão da necessidade de quantificar e reduzir a variabilidade; • Importância dos dados que serão usados na análise (qualidade dos dados); • Foco nos dados e sua medição; • Tomada de decisão com base em fatos e dados; • Reconhecer relações de causa-efeito para analisar o problema da variabilidade. Conforme a a lista anteriror apresenta, para que o pensamento estatístico funcio- ne corretamente em uma Organização, há a necessidade de envolvimento de toda a Organização para que funcione de forma eficaz. Segundo Snee (1990), o pensamento estatístico pode ser definido como: [...] processo de raciocínio que reconhece que variação está em tudo ao nosso redor e presente em tudo que fazemos, que todo trabalho é uma série de processos interligados; e que identificar, caracterizar, quantificar, controlar e reduzir variação fornece oportunidades de melhoria. Vamos estudar um pouco de Estatística?! Nas próximas seções, serão apresentados conteúdos importantes para essa área. Boa leitura! Estatística Descritiva Podemos começar os nossos estudos em Métodos Estatísticos por meio dos grá- ficos e cálculos da Estatística Descritiva. Certa investigação, frequentemente, concentra-se em uma coleção bem definida de objetos que constituem uma população de interesse. Em um estudo, a população pode consistir em todas as cápsulas de gelatina de determinado tipo produzidas durante um período específico. Outra investigação pode envolver a população que consiste em todos os indiví- duos que receberam diploma de Engenharia durante o ano acadêmico mais recente. Quando as informações desejadas estiverem disponíveis para todos os objetos da população, temos o que é denominado censo. Restrições de tempo, dinheiro e outros recursos escassos geralmente tornam um censo impraticável ou inviável. Em vez disso, um subconjunto da população – uma amostra – é selecionado de forma prescrita (DEVORE, 2019). 10 11 Assim, podemos definir como população como um conjunto de todos os elemen- tos de um contexto sejam itens, produtos, pessoas ou eventos que desejamos fazer inferências. Um subconjunto desse conjunto é chamado de amostra. Quando estamos estudando Estatística, é comum que tenhamos definido o con- junto em estudo, mas, muitas vezes, não é viável analisarmos todo o conjunto. Por esse motivo, selecionamos uma amostra. Os resultados gerados com os cálcu- los e observações de uma amostra são chamados de estimativas, já que nós temos resultados baseados em um subconjunto e não no conjunto todo. Quando calculamos os dados baseados em toda a população, chamamos de pa- râmetros populacionais. Nós podemos diferenciar os símbolos dos cálculos para parâmetros populacionais e estimadores. Alguns são apresentados na Tabela 1: Tabela 1 – Exemplos de estimadores e parâmetros EstimadoresParâmetros Populacionais Média x µ Variância s² ²σ Desvio-padrão S σ As Estatísticas mais comuns são, segundo Morettin e Bussab (2017): • Média amostral: 1 n ii x x n == ∑ • Variância da amostra: ( ) 2 2 1 1 n ii x x n σ = − = − ∑ • Desvio-padrão amostral: ( ) 2 1 1 n ii x x n σ = − = − ∑ • Amplitude: maior valor menor valorR X X= − Exemplo (GUPTA; GUTTMAN, 2017) Nos últimos anos, tem crescido o interesse comercial no uso do que é conhecido como concreto internamente curado. Esse concreto contém inclusões porosas mais comumente na forma de agregado Leve (LWA, sigla em inglês). O Artigo Characterizing lightweight aggregate desorption at high relative humidities using a pressure plate apparatus ( MOHAMMAD, et al, 2012), relatou um estudo no qual pesquisadores examinaram diversas propriedades físicas de 14 amostras de LWA. 11 UNIDADE Pensamento Estatístico e Estatística Descritiva As porcentagens de absorção de água num período de 24 horas são: Tabela 2 x1 16 x2 10 x3 18,9 x4 30,5 x5 15,6 x6 18,5 x7 17,7 x8 15 x9 12,2 x10 17,5 x11 19,1 x12 6 x13 14,1 x14 17,9 Calcule a média, a variância, o desvio-padrão e a amplitude desses dados. Resolução Podemos calcular o resultado aplicando as fórmulas dadas acima. A Tabela 3 apresenta os dados e os cálculos que precisamos fazer previamente para o cálculo da variância e do desvio-padrão. Tabela 3 – Dados do exercício e cálculo de ( ) 2 1 n i x xi = −∑ Dados (Xbarra - xi)² x1 16 0,1276 x2 10 40,4133 x3 18,9 6,4661 x4 30,5 200,0204 x5 15,6 0,5733 x6 18,5 4,5918 x7 17,7 1,8033 x8 15 1,8418 x9 12,2 17,2818 x10 17,5 1,3061 x11 19,1 7,5233 x12 6 107,2704 x13 14,1 5,0947 x14 17,9 2,3804 Somatório 229 396,6943 n 14 12 13 Podemos obter a média: 229 16,3571 14 x = = A variância será: 2 396,6943 30,5149 14 1 σ = = − Já o desvio-padrão é a raiz da variância, então: 5,5240σ = Finalmente, a amplitude será: 30,5 6 24,5R = − = Contudo, também poderemos inserir os dados em uma Planilha do Microsoft Excel (2005) para o resultado dessas estatísticas. Podemos digitar as seguintes funções: • Média: digitar =MÉDIA (lembre-se de colocar o acento agudo); • Variância: digitar =VAR.A; • Desvio-padrão: digitar =DESVPAD.A; • Amplitude: digitar =MAIOR (selecionar os dados;1) – MENOR (selecionar os dados;1). A Figura 2 apresenta os comandos no Excel. Figura 2 – Comando para cálculo de Estatísticas no Excel Os resultados dos cálculos estatísticos no Excel podem ser vistos na Figura 3. 13 UNIDADE Pensamento Estatístico e Estatística Descritiva Observem que os valores são iguais àqueles calculados com a aplicação das fórmulas. Figura 3 – Resultado das Estatísticas pelo Excel A média, juntamente com mediana, quartis e moda são consideradas medidas de posição. A mediana e quartis dividem os dados em tamanho iguais. A mediana divide em 2 partes de 50%, enquanto o quartil divide em 4 partes de 25% (portanto, podemos ter 4 quartis). A moda corresponde ao valor com maior frequência. As medidas de posição são medidas que apresentam a situação dos dados quanto a resultados, isto é, sua posição. Já o desvio- -padrão, variância e amplitude são considerados medidas de dispersão. As medidas de dis- persão são muito importantes para percebermos se os resultados das medidas de posição representam a maioria dos dados ou se há discrepância entre os valores. Além da definição de população e amostra, devemos saber com clareza o que é uma variável. Uma variável é uma característica de interesse, como o próprio nome diz, ela pode variar e assumir diferentes valores a depender do resultado da inferên- cia Estatística. Segundo Morettin e Bussab (2017), as variáveis podem ser classificadas, conforme a Figura 2, em: 1. Variáveis qualitativas: são aquelas avaliadas em categorias e não de forma numérica. Podemos subdividi-las em: nominal (categorias que não são ordenadas como cor dos olhos, tipo sanguíneo etc.) e ordinal (catego- rias com sentido de ordem como classe social, escolaridade etc.); 2. Variáveis quantitativas: são aquelas avaliadas em categorias numéricas. Podemos subdividi-la em: discretos (números que não podem assumir qualquer valor, isto é, são numeráveis como número de filho, número de itens de uma produção etc.) e contínuos (números que podem assumir qualquer valor como volume, peso, densidade etc.). 14 15 Nominal Qualitativa Quantitativa Variável Ordinal Discreta Contínua Figura 4 – Classifi cação de variáveis Fonte: MORETTIN; BUSSAB, 2017 Gráficos e resumo de dados numéricos Os Gráficos em Estatística é uma importante ferramenta visual para rápida análi- se de um resumo de dados. Desse modo, além de cálculos estatísticos, devemos saber desenvolver e interpre- tar gráficos em Estatística. A seguir, serão apresentados alguns dos principais gráficos. Diagrama de ramo e folhas O diagrama de ramo e folhas é utilizado quando queremos organizar os dados de acordo com os seus dígitos. Para elaborar esse tipo de gráfico, devemos seguir as seguintes etapas, segundo Devore (2019): • Selecione um ou mais primeiros dígitos para formarem o ramo. Os dígitos à direita serão as folhas; • Relacione os valores de ramo possíveis em uma coluna vertical; • Registre a folha de toda observação ao lado do ramo correspondente; • Indique as unidades dos ramos e das folhas em algum lugar do diagrama. Exemplo (DEVORE, 2019) Há uma preocupação crescente nos EUA de que não é suficiente que os alunos se for- mem na faculdade. A América costumava ser a número 1 do mundo para a porcentagem de adultos com diplomas universitários, mas, recentemente, caiu para o 16°. Aqui estão dados sobre a porcentagem de pessoas de 25 a 34 anos em cada es- tado que possuía algum tipo de pós-secundário a partir de 2010 (listados em ordem alfabética, incluindo o Distrito de Colúmbia): 15 UNIDADE Pensamento Estatístico e Estatística Descritiva Tabela 4 31,5 37,9 68,8 37,2 42,3 45,5 32,1 28,7 37,6 32,9 43,3 36,2 45,3 33,3 54,3 39,3 49,6 43,9 33 45,9 35,5 36,1 30,3 37,2 40,3 37,6 42,5 28,6 37,2 40,5 45,5 37,2 49,8 44,2 50,8 32,2 44,5 40,9 41,3 42,2 47,2 28,4 38 38,5 44,6 29,5 35,4 32,8 46 30,8 35,2 Elabore o gráfico ramo e folhas. Resolução Para elaborar o gráfico ramo e folhas, devemos adicionar os dados em uma Ta- bela no Excel. Os dados deverão ser colocados em uma única coluna e organizados em rol. Rol é a organização dos dados em ordem crescente. No Excel, podemos fazer isso selecionando a opção colocar do Menor para o Maior. Poderemos colocar no ramo os dois primeiros dígitos dos números e os números decimais como folhas. Tabela 5 Ramo Folhas Frequência 28 4 6 7 3 29 5 1 30 3 8 2 31 5 1 32 1 2 8 9 4 33 0 3 2 35 2 4 5 3 36 1 2 2 37 2 2 2 2 6 6 9 7 38 0 5 2 39 3 1 40 3 5 9 3 41 3 1 42 2 3 5 3 43 3 9 2 44 2 5 6 3 45 3 5 5 9 4 46 0 1 47 2 1 49 6 8 2 50 8 1 64 3 1 68 8 1 16 17 Distribuições de frequência e histogramas Uma distribuição de frequências é um resumo mais compacto dos dados, em re- lação ao diagrama de ramo e folhas. Para construir uma distribuição de frequências, temos de dividir a faixa de dados em intervalos, que são, geralmente, chamados de intervalos de classe ou células. Se possível, os intervalos devem ser de iguais larguras de modo a aumentar a informa- ção visual na distribuição de frequências. Algum julgamento tem de ser usado na seleção do número de intervalos de clas- ses, de modo que uma apresentação razoável possa ser desenvolvida. O número de intervalos depende do número de observações e da quantidade de espalhamento ou dispersão dos dados. Uma distribuição de frequências não será informativa se usar um número muito baixo ou muito alto de intervalos de classe. Geralmente,achamos que 5 a 20 interva- los são satisfatórios na maioria dos casos e que o número de intervalos deve crescer com n (MONTGOMERY; RUNGER, 2018). Para construir um Diagrama de Frequência, podemos seguir os passos: • Organiza-se os dados em ordem crescente; • Determina-se o maior e o menor número dos dados brutos e, então, calcula-se a amplitude (R) total; • Determina-se o número de classes, tirando a raiz quadrada da quantidade N de dados; • Determina-se a amplitude das classes, dividindo-se a amplitude total pelo núme- ro de classes; • Calcula-se o ponto médio dos dois primeiros números. O ponto médio é: 1 2 2 x xPM += . O resultado do ponto médio deverá ser subtraído do valor da amplitude da classe; • Determina-se o número de observações que caem dentro de cada intervalo de classe, isto é, calculam-se as frequências de classe; • Construção do Gráfico Histograma. Exemplo A tabela a seguir apresenta as alturas em centímetros de pessoas que se apresen- taram em um centro especializado para verificar se tinham realmente gigantismo ou eram altos simplesmente por questões genéticas. Utilize esse quadro para montar um Diagrama de Frequências e um Histograma. Tabela 6 212 213 198 216 219 204 220 216 214 215 209 225 205 213 221 222 220 207 226 207 207 215 208 208 210 208 213 215 214 228 200 218 216 219 202 220 222 215 212 214 17 UNIDADE Pensamento Estatístico e Estatística Descritiva Resolução Podemos desenvolver um diagrama de frequência seguindo passo a passo: • Organização dos dados: os dados devem começar em 198 e terminar em 228; • Cálculo da amplitude total: R = 228-198 = 30; • Total de dados: n = 40. Logo, o número de classes será 40 7 classes≈ ; • Amplitude das classes será 30 4,28 5 7 = ≈ ; • Cálculo do ponto médio: 198 200 199 2 PM += = . O valor do ponto médio menos a amplitude da classe será o primeiro ponto: 199 5 194Primeiro ponto = − = . • Construção da distribuição de frequências será a distribuição dos dados em 7 classes com uma amplitude de 5 em cada classe: Tabela 7 Classes Intervalo Frequência absoluta Frequência relativa Frequência relativa acumulada 1º 194-199 1 2,50% 2,50% 2º 199-204 3 7,50% 10,00% 3º 204-209 8 20,00% 30,00% 4º 209-214 9 22,50% 52,50% 5º 214-219 10 25,00% 77,50% 6º 219-224 6 15,00% 92,50% 7º 224-229 3 7,50% 100,00% TOTAL 40 Podemos construir um Histograma a partir da Tabela de Distribuição de frequências. Basta selecionar as colunas de classes, intervalo e frequência absoluta no Microsoft Excel (2005) e inserir um gráfico de Frequência, conforme mostra a Figura 5: Figura 5 – Desenvolvimento do histograma no Excel Fonte: Acervo do conteudista O histograma gerado com os dados da distribuição de frequências é apresentado na Figura 6: 18 19 Figura 6 – Histograma do exemplo Fonte: Acervo do conteudista Um Histograma muito utilizado para gestão de operações é o Diagrama de Pareto que é um tipo de Histograma organizado com as colunas em ordem decrescente e uma linha de frequência absoluta relativa, que acompanha o gráfico. Veja uma imagem do Diagrama de Pareto feito com os dados do exemplo que acabamos de resolver na Figura 7. O objetivo desse Diagrama é analisarmos frequência de defeitos em operações de modo a priorizarmos as análises e os planos de ação para os defeitos com maior ocorrência. Figura 7 – Exemplo de um Diagrama de Pareto Fonte: Acervo do conteudista Caso o número de classes não seja suficiente para a quantidade de dados, é pos- sível adicionar mais classes com o mesmo valor da amplitude nas classes ou, ainda, é possível adicionar o valor que falta na última classe. Há outros métodos para a construção de histogramas e distribuições de frequências, inclusive por meio de softwares estatísticos. Contudo, devido às apostilas terem exercí- cios e avaliações objetivas, é aconselhável padronizar dessa forma a construção deles. 19 UNIDADE Pensamento Estatístico e Estatística Descritiva Diagramas de caixa ou boxplot O diagrama de caixa ou também conhecido como boxplot é uma outra ferramen- ta gráfica útil para analisarmos a disposição de dados em termos de variação entre si. Por meio do boxplot, é possível observar se os dados estão dispostos divididos de formas iguais mediante a disposição dos quartis, se estão centrados ou não. A Figura 8 nos mostra as informações que podem ser obtidas por meio de um boxplot. É possível analisar a variação dos dados, bem como os outliers. Segundo Montgomery e Runger (2018), um diagrama de caixa apresenta três quartis, o mínimo e o máximo dos dados em uma caixa retangular, alinhados tanto horizontal como verticalmente. A caixa inclui a faixa de interquartil, com o canto esquerdo (ou inferior) no primei- ro quartil, q1, e o canto direito (ou superior) no terceiro quartil, q3. Uma linha é desenhada, através da caixa, no segundo quartil (que é o 50° per- centil ou a mediana), q2 = x . Uma linha (whisker) se estende de cada extremidade da caixa. A linha inferior começa no primeiro quartil, indo até o menor valor do conjunto de pontos dentro das faixas de 1,5 interquartil a partir do primeiro quartil. A linha superior começa no terceiro quartil, indo até o maior valor do conjunto de pontos dentro das faixas de 1,5 interquartil a partir do terceiro quartil. Dados mais afastados da caixa do que as linhas são plotados como pontos indivi- duais. Um ponto além da linha, porém a menos de três faixas interquartis da extre- midade da caixa, é chamado de outlier. Um ponto a mais de três faixas interquartis da extremidade da caixa é chamado de um outlier extremo. Figura 8 – Descrição das informações de um boxplot Fonte: MONTGOMERY; RUNGER, 2018 Exemplo (MONTGOMERY; RUNGER, 2018) O “tempo de ignição fria” de um motor de carro está sendo investigado por um fabricante de gasolina. Os seguintes tempos (em segundos) foram obtidos em um veículo de teste: 1,75; 1,92; 2,62; 2,35; 3,09; 3,15; 2,53 e 1,91. • (a) Calcule a média, mediana, os quartis, a variância e o desvio-padrão da amostra; • (b) Construa um Diagrama de caixa dos dados. 20 21 Resolução Podemos colocar os dados do exemplo em uma coluna no Excel. Para calcularmos a mediana e os quatro quartis, devemos adicionar os dados no Excel, organizá-los em ordem crescente e adicionar os comandos por vez, conforme a Figura 9. Para o cálculo da mediana no Excel, devemos incluir =MED e para os quartis de- vemos incluir =QUARTIL.EXC(SELECIONAR OS DADOS; VALOR DO QUARTIL). Se for o primeiro quartil, colocamos 1, se for o segundo quartil, colocamos dois e assim por diante. Figura 9 – Cálculo da mediana (=MED) e dos quartis (=QUARTIL.EXC(ESCOLHA DOS DADOS;ESCOLHA DO QUARTIL) Fonte: Acervo do conteudista Os resultados da mediana e dos quatro quartis serão: Tabela 8 Mediana 2,44 Valor mínimo 1,75 1° Quartil (25%) 1,91 2° Quartil (50%) 2,44 3° Quartil (75%) 2,97 Para calcularmos a média, a variância e o desvio-padrão deveremos adicionar os comandos um de cada vez e selecionar os dados da coluna, conforme a Figura 10. O resultado da média, variância e desvio-padrão serão: 2,4150x = 2 0, 2854σ = 0,5342σ = 21 UNIDADE Pensamento Estatístico e Estatística Descritiva Figura 10 – Comandos para média (MÉDIA), variância (VAR.A) e desvio-padrão (DESVPAD.A) Fonte: Acervo do conteudista Para a elaboração do boxplot, deveremos: • Selecionar os dados; • Ir a Inserir > Gráfico > Caixa Estreita. A Figura 11 apresenta o comando: Figura 11 – Sequência de comandos para a elaboração do boxplot Fonte: Acervo do conteudista 22 23 O resultado do boxplot é apresentado na Figura 12: Figura 12 – Resultado do boxplot do exercício Fonte: Acervo do conteudista Podemos verificar, no Diagrama de Caixa ou boxplot, os valores da mediana, que é 2,44. Na análise do Diagrama, podemos comparar os valores da caixa com os valores dos quartis. O primeiro quartil é igual a 1,91 e o 3° quartil é igual a 2,97. Diagrama de Dispersão O Diagrama de Dispersão apresentaa relação entre variáveis. Suponha que um Engenheiro queira saber se determinada falha no processo é gerada ou não por uma matéria-prima específica. Nesse caso, é possível associar os dados de volume de matéria-prima utilizado ao volume de falhas no processo de um dado período e verificar se há ou não relação entre as variáveis. Além disso, segundo Montgomery e Runger (2018), em muitos problemas, En- genheiros e Cientistas trabalham com dados que são multivariados por natureza, ou seja, cada observação consiste em medidas de várias variáveis. Suponha que quiséssemos fazer um gráfico da relação potencial entre qualidade e uma das outras variáveis, por exemplo, cor. O Diagrama de Dispersão é uma maneira útil de fazer isso. Ele é construído co- locando cada par de observações distribuído nos eixos, sendo uma medida desse par colocada no eixo vertical do gráfico e outra medida no eixo horizontal. O coeficiente de correlação da amostra, xyr , é uma medida quantitativa da força da relação linear entre duas variáveis aleatórias x e y. O coeficiente de correlação da amostra é definido como: ( ) ( ) ( ) 1 1/22 2 1 1 n i ii xy n n i ii i y x x r y y x x = = = − = − − ∑ ∑ ∑ 23 UNIDADE Pensamento Estatístico e Estatística Descritiva O valor de xyr varia entre -1 e 1. Quanto mais próximos dos valores -1 ou 1, mais forte é a correlação entre as variáveis, seja essa correlação negativa ou positiva. Se as duas variáveis forem relacionadas perfeitamente de forma linear com uma inclinação positiva, teremos 1xyr = , e se elas forem relacionadas perfeitamente de forma linear com uma inclinação negativa, então teremos 1xyr = − . Se nenhuma relação linear existir entre as duas variáveis, então 0xyr = . É comum encontrarmos análises do coeficiente de correlação conforme a Tabela 9: Tabela 9 – Análises do valor do coeficiente de r Valores de r Tipo de correlação 1 0,8r− ≤ ≤ − Negativa forte 0,8 0,6r− < < − Moderada negativa Correlação fraca. Se 0 , r = não há correlação Moderada positiva Positiva forte Podemos analisar, ainda, pelo formato do Gráfico de Dispersão formado, confor- me a Figura 13: Figura 13 – Relação potencial entre as variáveis Fonte: MONTGOMERY; RUNGER, 2018 O simples coeficiente de correlação é também chamado, algumas vezes, de coeficiente de correlação de Pearson, em homenagem a Karl Pearson, um dos 24 25 gigantes da Estatística no final do século 19 e começo do século 20 (MONTGOMERY; RUNGER, 2018). Exemplo (MONTGOMERY; RUNGER, 2018) Considere que um Engenheiro de Qualidade deseja saber quais fatores afetam a qualidade do vinho. Os possíveis fatores são: pH, SO2, intensidade de cor e cor do vinho. O que você poderia afirmar sobre a relação desses fatores com a qualidade do vinho? Tabela 10 Qualidade pH SO2 Intensidade cor Cor 19,2 3,85 66 9,35 5,65 18,3 3,75 79 11,15 6,95 17,1 3,88 73 9,4 5,75 15,2 3,66 86 6,4 4 14 3,47 178 3,6 2,25 13,8 3,75 108 5,8 3,2 12,8 3,92 96 5 2,7 17,3 3,97 59 10,25 6,1 16,3 3,76 22 8,2 5 16 3,98 58 10,15 6 15,7 3,75 120 8,8 5,5 15,3 3,77 144 5,6 3,35 14,3 3,76 100 5,55 3,25 14 3,76 104 8,7 5,1 13,8 3,9 67 7,41 4,4 12,5 3,8 89 5,35 3,15 11,5 3,65 192 6,35 3,9 14,2 3,6 301 4,25 2,4 17,3 3,86 99 12,85 7,7 15,8 3,93 66 4,9 2,75 Resolução Podemos resolver esse problema por meio do Microsoft Excel. Deveremos respei- tar os seguintes passos para o cálculo de r: • Para o cálculo entre duas variáveis x e y, podemos calcular o r da seguinte forma: » Digitar na célula do Excel =CORREL e selecionar duas colunas com os dados da relação, conforme a Figura 14; » A Figura 14 apresenta a seleção de dados para o cálculo de r das variáveis Qualidade e pH. O resultado de r ficou igual a 0,3492qual e pHr = , ou seja, a correlação entre a qualidade e o pH é fraca; 25 UNIDADE Pensamento Estatístico e Estatística Descritiva » Podemos elaborar o gráfico de dispersão entre essas duas variáveis também pelo Excel. Deveremos selecionar as colunas de dados Qualidade e pH > In- serir > Gráfico Dispersão, conforme apresenta a Figura 15: Figura 14 – Dados do exemplo para o Gráfico de Dispersão Fonte: Acervo do conteudista Figura 15 – Passo a passo para a elaboração do Gráfico de Dispersão entre duas variáveis Fonte: Acervo do conteudista 26 27 Poderemos calcular por pares, seguindo os mesmos passos, os valores de r para cada relação entre x e y e também poderemos elaborar os gráficos de dispersão en- tre essas duas variáveis. Dessa forma, obteremos as relações entre cada uma delas. Contudo, o valor de r também poderá ser calculado de uma só vez por meio do seguinte passo no Excel: • Para o cálculo de vários xyr entre várias variáveis x e y, podemos calcular da seguinte forma: » Deveremos ir a “Suplementos” e inserir Ferramentas de Análise, por meio do caminho: Arquivo > Opções > Suplementos > Ferramentas de análise. Depois disso, aparecerá em “Dados” a opção ‘Ferramentas de Análise’; » Assim, deveremos ir a Dados > Análise de Dados > Correlação, conforme apresenta a Figura 16. Figura 16 – Passo a passo para o cálculo de r para várias relações Fonte: Acervo do conteudista Após esse passo, deveremos adicionar todas as colunas de dados em “Intervalo de Entrada”, conforme mostra a Figura 17: Figura 17 – Inclusão dos dados para o cálculo do coefi ciente r Fonte: Acervo do conteudista Aparecerá em uma nova planilha todos os resultados de r, referentes às compara- ções entre os diferentes aspectos de análise, incluindo Qualidade x pH igual a 0,34. Os resultados aparecerão sem a descrição exata da característica analisada, mas poderemos editar as legendas de acordo com a necessidade. 27 UNIDADE Pensamento Estatístico e Estatística Descritiva A Figura 18 apresenta a primeira Tabela com os resultados de r sem edição, e embaixo foram adicionadas as legendas para visualizarmos melhor os diferentes va- lores de r. Figura 18 – Resultado dos valores de r para as características analisadas Fonte: Acervo do conteudista Podemos perceber que há uma correlação moderada entre Qualidade e Intensida- de de Cor, com 0,7024r = e Qualidade e Cor, com 0,7121r = . O fator Qualidade possui relação fraca com as demais características. Exercite! Analise os demais resultados e construa os gráficos de dispersão. Diagramas sequenciais temporais Uma série temporal ou sequência temporal é um conjunto de dados em que as observações são registradas na ordem em que elas ocorrem. Um Gráfico de Séries Temporais é aquele em que o eixo vertical denota o valor observado da variável (por exemplo, x) e o eixo horizontal denota o tempo (que poderia ser minutos, dias, anos etc.). Quando as medidas são plotadas como uma série temporal, frequentemente ve- mos tendências, ciclos ou outras extensas características dos dados que não pode- riam ser vistas de outra forma (MONTGOMERY; RUNGER, 2018). 28 29 Material Complementar Indicações para saber mais sobre os assuntos abordados nesta Unidade: Livros O papel da Estatística na formação do Engenheiro de Produção SILVA JUNIOR, G. B.; LOPES, C. E. O papel da Estatística na formação do Engenheiro de Produção. Bolema, São Paulo, v. 30, n. 56 . Vídeos Estatística descritiva no Excel para comparação https://youtu.be/mg-xk0UOiKk Excel 2016 – Novos gráficos https://youtu.be/9b-0vTAZbTg Leitura Estatística descritiva: tabelas e gráficos https://bit.ly/3eJSuFs 29 UNIDADE Pensamento Estatístico e Estatística Descritiva Referências DEVORE, J. L. Probabilidade e Estatística para engenharia e ciências. 3.ed. São Paulo, SP: Cengage Learning, 2019. GUPTA, C. B.; GUTTMAN, I. Estatística e probabilidade com aplicações para engenheiros e cientistas. Rio de Janeiro: LTC, 2017. MICROSOFT EXCEL, W. Microsoft Excel. Estados Unidos: Microsoft Windows, 2005. MONTGOMERY, D. C.; RUNGER, G. C. Estatística aplicada e probabilidade para engenheiros. 6.ed. Rio de Janeiro: LTC, 2018. MORETTIN, P. A.; BUSSAB, W. O. Estatística básica. 9.ed.São Paulo: Saraiva, 2017. SANTOS, A. B.; MARTINS, M. F. Pensamento estatístico: um componente primor- dial para o sucesso do Programa de Qualidade Seis Sigma. XXIV ENEGEP. Anais[...] Florianópolis: Associação Brasileira de Engenharia de Produção (ABEPRO), 2004. SLACK, N.; BRANDON-JONES, A.; JOHNSTON, R. Administração da produ- ção. 8.ed.. São Paulo, SP: Atlas, 2018. SNEE, R. D. Statistical Thinking and Its Contribution to Total Quality. The American Statistician, Estados Unidos, v. 44, n. 2, p. 116, maio 1990. 30
Compartilhar