Baixe o app para aproveitar ainda mais
Prévia do material em texto
Diagrama de Dispersão 1 Graduação Tecnológica em Gestão da Qualidade Ferramentas de Gestão da Qualidade Prof. Anderson Farias – anderson.farias@fadergs.edu.br DIAGRAMA DE DISPERSÃO A maioria dos estudos estatísticos envolve a análise de mais de uma variável. Muitas vezes poderemos estar interessados na relação existente entre duas variáveis. O entendimento dos tipos de relações existentes entre as variáveis associadas a um processo contribui para aumentar a eficiência dos métodos de controle do processo em questão e permite também a detecção de possíveis problemas e facilita o planejamento de ações de melhoria para o problema. A maneira mais eficiente de demonstrar a relação existente entre duas variáveis quantitativas é através do Diagrama de Dispersão. Mas, antes de sua utilização, devemos analisar algumas questões pertinentes: - Queremos simplesmente explorar a natureza da relação? - Algumas variáveis explicam ou modificam outras? - Algumas variáveis são variáveis ‘respostas’ e outras são variáveis ‘explanatórias’? Uma variável resposta mede o resultado de um processo, enquanto que uma variável explanatória procura explicar os resultados observados. Por exemplo: o álcool tem vários efeitos sobre o corpo humano. Um destes efeitos é a queda da temperatura do corpo. Para estudar este efeito, os pesquisadores dão a ratos várias dosagens diferentes de álcool e medem a variação da temperatura do corpo de cada rato nos 15 minutos subsequentes. A quantidade de álcool é a variável explanatória, e a variação da temperatura é a variável resposta. As duas variáveis apresentadas no diagrama de dispersão podem ser: - Duas causas de um processo, como Pressão e Temperatura de uma Matriz de Termo moldagem; - Uma causa e um efeito do processo, como Tempo Médio de Atendimento e Quantidade de Reclamações dos Clientes; - Dois efeitos de um processo, como Temperatura de Extração e empenamento de Peças. Aspecto geral do Diagrama de Dispersão 0 10 20 30 40 50 60 0 2 4 6 8 10 Variável 1 V ar iá ve l 2 Diagrama de Dispersão 2 Graduação Tecnológica em Gestão da Qualidade Ferramentas de Gestão da Qualidade Prof. Anderson Farias – anderson.farias@fadergs.edu.br 1. Etapas para Construção de um Diagrama de Dispersão 1- Colete pelo menos 30 pares de observações (x,y) das variáveis cujo tipo de relacionamento será estudado; 2- Registre os dados coletados em uma tabela; 3- Escolha a variável que será representada no eixo horizontal X. Esta variável deve ser aquela que, por algum motivo, é considerada preditora da outra variável, a qual será plotada no eixo Y; 4- Determine os valores ‘máximo e mínimo’ das observações de cada variável; 5- Escolha escalas adequadas e de fácil leitura para os eixos vertical e horizontal. O menor valor da escala deve ser menor que o mínimo e o maior valor da escala deve ser maior que o máximo das observações da variável correspondente. O comprimento dos dois eixos devem ser aproximadamente iguais; 6- Desenhe as escalas; 7- Represente no gráfico os pares de observações (x,y) – quando existirem pares de observações repetidos, indique este fato desenhando círculos concêntricos; 8- Registre informações importantes que devem constar no gráfico. 2. Interpretação dos Diagramas O padrão evidenciado em um diagrama de dispersão nos fornece informações sobre o tipo de relacionamento existente entre as variáveis consideradas. No início da análise de um diagrama de dispersão é necessário verificar a presença de pontos discrepantes ou atípicos, conhecidos como outliers. Um ponto discrepante em qualquer gráfico de dados é uma observação individual que se afasta do padrão global do gráfico. Os valores discrepantes podem fornecer informações importantes sobre situações pouco comuns que usualmente são de interesse do pesquisador, devendo então ser analisados com cuidado. A identificação de valores discrepantes e a análise das causas que levaram ao seu aparecimento podem, portanto, resultar em melhorias no processo ou em um novo conhecimento sobre a forma de atuação de fatores cujos efeitos na variável resposta e ainda eram desconhecidos. A existência de uma correlação entre as variáveis consideradas não implica necessariamente na existência de uma relação de causa e efeito entre x e y. Este resultado apenas indica que existe um relacionamento significativo entre as duas variáveis. Relações estatisticamente significativas entre x e y podem estar presentes sempre que estas variáveis apresentarem um relacionamento monotônico, isto é, à medida que uma variável aumenta a outra variável sempre aumenta ou sempre diminui, devido à atuação de outros fatores. Diagrama de Dispersão 3 Graduação Tecnológica em Gestão da Qualidade Ferramentas de Gestão da Qualidade Prof. Anderson Farias – anderson.farias@fadergs.edu.br As principais correlações obtidas de um Diagrama de Dispersão são: Elevada Correlação Positiva Elevada Correlação Negativa Moderada Correlação Positiva Moderada Correlação Negativa Ausência de Correlação Relação Número do Pé x Altura 1,5 1,75 2 35 36 37 38 39 40 41 42 43 44 45 Número do Pé A ltu ra ( m ) Relação: Altura x Número do Pé 1,5 1,75 2 35 36 37 38 39 40 41 42 43 44 45 Número do Pé Al tu ra ( m ) Relação Altura x Número do Pé 1,5 1,75 2 35 36 37 38 39 40 41 42 43 44 45 Número do Pé A ltu ra ( m ) Relação: Altura x Número do Pé 1,5 1,75 2 35 36 37 38 39 40 41 42 43 44 45 Número do Pé Al tu ra ( m ) Relação Altura x Número do Pé 1,5 1,75 2 35 36 37 38 39 40 41 42 43 44 45 Número do Pé A ltu ra ( m ) Diagrama de Dispersão 4 Graduação Tecnológica em Gestão da Qualidade Ferramentas de Gestão da Qualidade Prof. Anderson Farias – anderson.farias@fadergs.edu.br 3. Índice de Correlação Um diagrama de dispersão mostra a direção, a forma e a intensidade da relação entre duas variáveis quantitativas. A correlação é à medida que vamos utilizar para suplementar o gráfico. A correlação mede a intensidade e a direção da relação linear entre duas variáveis quantitativas. Costuma-se representar a correlação pela letra r. - Suponha que tenhamos dados sobre variáveis x e y para n amostras. Os valores para a primeira amostra são x1 e y1, os valores para a segunda amostra são x2 e y2, e assim por diante. Um valor positivo de r indica associação positiva entre as variáveis, e um valor negativo de r indica uma associação negativa. - A correlação r estará sempre entre –1 (forte correlação negativa) e 1 (forte correlação positiva). Valores dos Coeficientes Descrição +1,00 Correlação positiva perfeita + 0,70 a 0,99 Correlação positiva muito forte + 0,50 a 0,69 Correlação positiva substancial + 0,30 a 0,49 Correlação positiva moderada + 0,10 a 0,29 Correlação positiva baixa + 0,01 a 0,09 Correlação positiva ínfima 0,00 Nenhuma correlação - 0,01 a 0,09 Correlação negativa ínfima - 0,01 a 0,29 Correlação negativa baixa - 0,30 a 0,49 Correlação negativa moderada - 0,50 a 0,69 Correlação negativa substancial - 0,70 a 0,99 Correlação negativa muito forte - 1,00 Correlação negativa perfeita - É calculada pelas fórmulas apresentadas ou fornecida por softwares que tenham análise estatística.Diagrama de Dispersão 5 Graduação Tecnológica em Gestão da Qualidade Ferramentas de Gestão da Qualidade Prof. Anderson Farias – anderson.farias@fadergs.edu.br Um exemplo do Cálculo do Coeficiente de Correlação, para um caso de análise do Sistema Prisional, onde se verificou a existência de relação entre os Meses que um detento está na prisão e a quantidade de tentativas de fugas. Meses na Prisão (x) Tentativas de Fugas (y) 3 0 6 1 9 2 12 4 15 3 18 5 21 6 24 4 x y x*y x2 y2 3 0 0 9 0 6 1 6 36 1 9 2 18 81 4 12 4 48 144 16 15 3 45 225 9 18 5 90 324 25 21 6 126 441 36 24 4 96 576 16 Soma 108 25 429 1836 107 Média 13,5 3,125 Diagrama de Dispersão 6 Graduação Tecnológica em Gestão da Qualidade Ferramentas de Gestão da Qualidade Prof. Anderson Farias – anderson.farias@fadergs.edu.br 4. Reta de Regressão A Reta de Regressão é calculada com base nas equações abaixo. Busca-se o estabelecimento da Equação de Reta para a Análise de Correlação, onde poderemos estimar valores de análises. Após a apresentação das equações, evidencia-se sua aplicação no mesmo caso anterior, onde se definiu o Coeficiente de Correlação, referente ao Sistema Prisional. b = 732 / 3024 = 0,242 a = Média (y) – (b*Média (x)) a = 3,125 – (0,242*13,5) a = 3,125 – 3,268 = - 0,143 Substituindo os valores de “a” e “b” na equação da reta temos a seguinte equação da regressão: y = a + bx y = - 0,143 + 0,242x Com a reta de regressão é possível prever o número de tentativas de fugas que teremos em função do tempo prisional. Por exemplo: Se um preso ficar 17 meses na cadeia, de acordo com a equação acima ele tentará fugir 4 vezes (y = - 0,143 + (0,242*17) = 4) 5. Coeficiente de determinação (r2) Este coeficiente define quanto à variação da variável dependente (y) pode ser explicada pela variação da variável independente (x). É obtida elevando-se o Coeficiente de Correlação ao quadrado. No caso do exemplo anterior, referente ao Sistema Prisional, (r2) = 0,77, ou seja, ao utilizar a equação da regressão, podemos afirmar que 77% das tentativas de fugas (Y) podem ser explicadas pelo tempo prisional (X). Os outros 23% das tentativas são devidas a outras variáveis independentes, para identificá-las é necessário fazer uma análise de regressão multivariada. Diagrama de Dispersão 7 Graduação Tecnológica em Gestão da Qualidade Ferramentas de Gestão da Qualidade Prof. Anderson Farias – anderson.farias@fadergs.edu.br EXERCÍCIOS 1. O dono de uma lancheria tem a impressão de que, em dias de calor, o volume de clientes aumenta. Para constatar isto, ele fez um levantamento em um mês do ano, relacionando a temperatura média do dia e a quantidade de operações em sua caixa registradora (dados abaixo). Faça um Diagrama de Dispersão e, confirme ou não a impressão do dono desta lancheria. Também, elabore a Reta de Regressão que represente esta distribuição. Determine a equação que rege o comportamento deste caso e, por fim, o Coeficiente de Determinação. Dia Temp. Qtd. Op. Dia Temp. Qtd. Op. Dia Temp. Qtd. Op. 1 23 320 11 23 275 21 30 315 2 24 321 12 23 280 22 31 360 3 27 319 13 21 285 23 31 350 4 28 330 14 18 290 24 31 340 5 27 380 15 22 320 25 33 350 6 28 390 16 25 330 26 20 290 7 28 400 17 26 340 27 21 295 8 31 412 18 26 320 28 22 315 9 30 390 19 28 310 29 24 330 10 21 280 20 27 315 30 24 390 2. Um pesquisador deseja verificar se um instrumento para medir a concentração de determinada substância no sangue está bem calibrado. Para isto, ele tomou 15 amostras de concentrações conhecidas (X) e determinou a respectiva concentração através do instrumento (Y), obtendo: X 2,0 2,0 2,0 4,0 4,0 4,0 6,0 6,0 6,0 8,0 8,0 8,0 10,0 10,0 10,0 Y 2,1 1,8 1,9 4,5 4,2 4,0 6,2 6,0 6,5 8,2 7,8 7,7 9,6 10,0 10,1 Faça um Diagrama de Dispersão e elabore a Reta de Regressão que represente esta distribuição. Também, determine a equação que rege o comportamento deste caso e, por fim, o Coeficiente de Determinação. Diagrama de Dispersão 8 Graduação Tecnológica em Gestão da Qualidade Ferramentas de Gestão da Qualidade Prof. Anderson Farias – anderson.farias@fadergs.edu.br 3. É esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa relação, uma nutricionista selecionou 18 mulheres, com idade entre 40 e 79 anos, e observou em cada uma delas a idade (X) e a massa muscular (Y). Faça um Diagrama de Dispersão, estabeleça o valor de correlação e a equação da Reta de Regressão. Também, determine a equação que rege o comportamento deste caso e, por fim, o Coeficiente de Determinação. Massa muscular (Y) Idade (X) 82.0 71.0 91.0 64.0 100.0 43.0 68.0 67.0 87.0 56.0 73.0 73.0 78.0 68.0 80.0 56.0 65.0 76.0 84.0 65.0 116.0 45.0 76.0 58.0 97.0 45.0 100.0 53.0 105.0 49.0 77.0 78.0 73.0 73.0 78.0 68.0
Compartilhar