Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Federal do Rio Grande do Norte Centro de Tecnologia - CT Departamento de Engenharia de Produção ESTATÍSTICA PARA ENGENHARIA DE PRODUÇÃO Prof. Luciano Queiroz Natal/RN 29/01/14 Sumário Estatística descritiva Análise Estatística Uma primeira fase em que se procura descrever e estudar a amostra: Estatística Descritiva e uma segunda fase em que se procura tirar conclusões para a população: Estatística Indutiva Esquematicamente temos Análise Estatística Podemos dizer que uma análise estatística envolve duas fases fundamentais, com objetivos distintos: 1ª Fase : Estatística descritiva Procura-se descrever a amostra, pondo em evidência as características principais e as propriedades. 2ª Fase: Estatística Indutiva Conhecidas certas propriedades (obtidas a partir de uma análise descritiva da amostra), expressas por meio de proposições, imaginam-se proposições mais gerais, que exprimam a existência de leis (na população). Estatística Descritiva É a parte da Estatística que procura somente descrever e avaliar um certo grupo sem tirar quaisquer conclusões ou inferências sobre um grupo maior. Gráficos, Diagramas de Pareto e de Ramo-e-Folha Após coletar os dados da amostragem, precisamos “nos familiarizar” com eles. Gráfico Estatístico O gráfico estatístico é uma forma de apresentação dos dados estatísticos que visa produzir no público uma impressão mais viva e rápida do fenômeno estudado. Por sua finalidade, os gráficos devem ser simples, claros e trazer informações verídicas, pois com esta iremos estudar os padrões de comportamento da variável. Gráficos IMPORTANTE: Não há somente uma resposta correta ao se construir um gráfico. O julgamento do analista e a circunstâncias que envolvem o problema desempenham um papel importante no desenvolvimento do gráfico. Qualquer representação gráfica utilizada, independente do tipo, tem de ser totalmente autoexplicativa. Isso inclui: título descritivo significativo e a identificação adequada das quantidades e variáveis identificadas. Gráficos Existem diversas formas gráficas de descrever dados. Gráficos de dados qualitativos Gráficos de dados quantitativos Gráficos – Dados Qualitativos Gráfico de pizza Gráficos que mostram a quantidade de dados que pertencem a cada categoria como uma parte proporcional do círculo. Gráfico de barra Gráficos que mostram a quantidade de dados que pertencem a cada categoria como uma área retangular dimensionada proporcionalmente Gráficos – Dados Qualitativos Exemplo Tabela - Cirurgias realizadas no Hospital Geral no ano passado Tipos de cirurgia Número de casos Torácica 20 Ossos e articulações 45 Olho, ouvido, nariz e garganta 58 Geral 98 Abdominal 115 Urológica 74 Proctológica 65 Neurocirúrgica 23 TOTAL 498 Gráficos – Dados Qualitativos Exemplo Cirurgias realizadas no Hospital Geral no ano passado TOTAL Abdominal Geral Urológica Proctológica Olho, ouvido, nariz e garganta Ossos e articulações Neurocirúrgica Gráficos – Dados Qualitativos Exemplo 0 100 200 300 400 500 600 TOTAL Abdominal Geral Urológica Proctológica Olho, ouvido, nariz e garganta Ossos e articulações Neurocirúrgica Cirurgias realizadas no Hospital Geral no ano passado Gráficos – Dados Qualitativos Diagrama de Pareto Gráfico de barras n qual as barras são organizadas da categoria mais numerosa para a menos numerosa. Inclui também um gráfico de linhas que mostra as porcentagens e contagens cumulativas com relação às barras. Muito utilizado no controle da qualidade, pois um Pareto dos tipos de defeito mostrará aqueles que tem maior impacto sobre a taxa de defeitos em ordem de efeito. Gráficos – Dados Qualitativos Exemplo 115 98 74 65 58 45 23 2023,09% 42,77% 57,63% 70,68% 82,33% 91,37% 95,98% 100,00% 0,00% 20,00% 40,00% 60,00% 80,00% 100,00% 120,00% 0 20 40 60 80 100 120 140 Abdominal Geral Urológica Proctológica Olho, ouvido, nariz e garganta Ossos e articulações Neurocirúrgica Torácica CIRURGIAS REALIZADAS NO HOSPITAL GERAL NO ANO PASSADO Gráficos – Dados Quantitativos Uma razão importante para construir um gráfico de dados quantitativos é mostrar a sua distribuição, ou o padrão de variabilidade exibido pelos dados de uma variável. A distribuição mostra a frequência de cada valor da variável. Gráficos – Dados Quantitativos Gráfico Dotplot Exibe os dados de uma amostra representando cada dado por meio de um ponto posicionado ao longo de uma escala. Essa escala pode ser tanto horizontal, quanto vertical. A frequência dos valores é representada ao longo da escala. Gráficos – Dados Quantitativos Exemplo 0 20 40 60 80 100 120 0 2 4 6 8 10 12 14 16 18 17 notas da prova Amostra de 17 notas da prova 76 74 82 96 66 76 72 52 88 86 84 92 76 68 92 74 88 Gráficos – Dados Quantitativos Diagrama de Ramo e Folhas Exibe os dados de uma amostra utilizando os dígitos reais que formam os valores desses dados. Cada valor numérico é dividido em duas partes: o(s) dígitos inicial(is) forma(m) o ramo e o(s) dígito(s) adicional(is) forma(m) a folha. Os ramos são dispostos ao longo do eixo principal, sendo inserida uma folha para cada valor de dados de forma que exibe a distribuição dos dados. Gráficos – Dados Quantitativos Exemplo Distribuição de Frequências e Histogramas Lista de grandes conjuntos de dados não apresentam uma imagem muito boa Distribuição de Frequências Na análise de conjuntos de dados é costume dividi-los em classes ou categorias e verificar o número de indivíduos pertencentes a cada classe, ou seja, a freqüência da classe. Os dados a seguir apresentam um conjunto de 50 observações da principal característica dimensional de um tipo de peça usinada (dados em ordem crescente). Distribuição de Frequências Tabela de freqüência absoluta Tabela de freqüência absoluta Amplitude da classe: Os limites tais como 12,50 a 13,50 são chamados de intervalos de classe. O número menor (12,50), é o limite inferior da classe; e o maior (13,50) é o limite superior da classe. Ponto Médio: é obtido somando-se o limite inferior ao superior e dividindo por dois. Assim, o ponto médio do intervalo 12,50 a 13,50 é (12,50+13,50)/2 = 13,00 Tabela de freqüência absoluta Amplitude da classe: A diferença entre os limites superior e inferior dessa classe. Todas as classes devem possuir a mesma amplitude Não pode existir sobreposição de classes Quando conveniente, uma amplitude de classe de número par é geralmente vantajosa Distribuição de frequências - NOTAS Se os dados tiverem sidos classificados (em forma de lista, dotplot, ou ramo e folhas), a tabulação é desnecessária, basta contar os dados que pertencem a cada classe. Se os dados não foram classificados, tenham cuidado com a tabulação. A frequência f para cada classe é o número de blocos que pertencem a cada classe. A soma das frequências deve ser igual ao número de blocos de dados n (n=Σf). Essa soma serve como uma boa forma de verificação. Histogramas Histograma é um gráfico de barras que representa uma distribuição de frequência de uma variável quantitativa. Formado por três componentes: Um título, que identifica a população ou a amostra em questão Uma escala vertical, que identifica as frequências nas diversas classes Uma escala horizontal, que identifica a variável x. Os valores para os limites de classe ou pontos médios podem ser identificados ao longodo eixo-x. Utilize o método de identificação do eixo que melhor apresenta a variável. Histograma Histogramas Resumidamente, os termos usados para descrever os histogramas são os seguintes: Simétricos: ambos os lados dessa distribuição são idênticos (as metades são imagens de espelho). Normal (triangular): A distribuição simétrica é elevada em torno da média e torna-se escassa nas extremidades. Uniforme (retangular): Cada valor aparece com igual frequência. Assimétricos: Um pico alonga-se mais do que o outro. A direção da assimetria está do lado do pico mais longo. Forma de J: Não existe assimetria ao lado do pico da classe com a maior frequência. Bimodal: As duas classes mais populosas são separadas por uma ou mais classes. Essa situação, geralmente, implica que duas populações estão sendo mostradas. Histograma Comparação com as especificações de controle: Histograma Estratificação de dados Conceito de se trabalhar com dados classificados em agrupamentos (camadas ou estratos) Tempo: os resultados relacionados com o problema são diferentes de manhã, à tarde ou a noite? Local: os resultados são diferentes nas linhas de produção? Tipo: os resultados obtidos são diferentes dependendo dos fornecedores? Sintoma: os resultados diferem dependendo dos defeitos que posssam ocorrer? Indivíduo: é possível comparar os operadores? Medidas de tendência central As medidas de tendência central são valores numéricos que localizam, de certa forma, o centro de um conjunto de dados, segundo uma regra estabelecida a priori. Média aritmética Moda Mediana Medidas de tendência central Determinação de média É a média com a qual você está mais familiarizado. Representada por n i ix n x 1 1 Medidas de tendência central Anotamos o número de produtos com defeito coletados de 1 em 1 hora, durante 7 horas. Qual a média de defeitos? Valores observados: 37, 37, 38, 39, 37, 39, 39. O tamanho da amostra é n = 7 38 7 39393739383737 x Medidas de tendência central Determinação da mediana O valor que ocupa a posição central quando colocados em ordem de acordo com o tamanho. Representado por parn ímparn xx x x nn n 2 ~ )12/()2/( )2/)1(( Medidas de tendência central Grupo de dados ordenados separado ao meio Qual a mediana dos defeitos? Valores observados: 37, 37, 38, 39, 37, 39, 39 Valores ordenados: 37, 37, 37, 38, 39, 39, 39 n = 7 é ímpar – mediana valor central 38~ x Medidas de tendência central Determinação da moda O valor de x que ocorre com a mais frequência Medidas de tendência central Qual a moda de defeitos? Valores observados: 37, 37, 37, 38, 39, 39, 39 Duas modas: 37 e 39 Medidas de tendência central Relação entre média e mediana → fornece a forma da dispersão A Distribuição simétrica 10 12 14 16 18 14~ 14 xx B Distribuição assimétrica à direita 10 12 14 16 23 14~ 15 xx C Distribuição assimétrica à esquerda 05 12 14 16 18 14~ 13 xx Simétrica Forma de Sino Assimétrica à Direita Assimetria Positiva Assimétrica à Esquerda Assimetria Negativa x x~ x~ x x x~ Mediana tem maior robustez a dados atípicos do que a média Medidas de dispersão (variabilidade) Tendo localizado o “ponto médio” com as medidas de tendência central, a nossa busca por informações com base nos conjuntos de dados agora se volta para as medidas de dispersão (variabilidade). Medidas de dispersão (variabilidade) Variância: quadrado da distância de todos os valores xi em relação a sua média alpopulacioniância n x amostraliância n xx s n i i n i i var )( var 1 )( 2 12 2 12 Medidas de dispersão (variabilidade) Desvio-padrão: a raiz quadrada da variância (é expresso na unidade original dos dados) alpopulacionpadrãodesvio n x amostralpadrãodesvio n xx s n i i n i i 2 1 2 1 )( 1 )( Medidas de dispersão (variabilidade) Observação Quando a amostra é grande (n > 30) ou quando trata-se da população usa-se n no denominador Medidas de dispersão (variabilidade) Medida do diâmetro de uma peça Amostra 10 12 14 16 18 (cm) A média é e a variância e o desvio-padrão são: 14 cmx 2 22222 2 98,9 15 )1418()1416()1414()1412()1410( cms cms 16,398,9 Medidas de dispersão (variabilidade) Medida do diâmetro de uma peça 41418 21416 01414 21412 41410 A média e o desvio padrão possuem a mesma unidade de medida Os desvios de cada valor em relação à média totalizam zero pois a média é o valor central Medidas de dispersão (variabilidade) Coeficiente de variação Um desvio padrão pode ser considerado grande ou pequeno dependendo da ordem de grandeza da média da variável. Quanto menor o CV mais homogêneo é o conjunto de dados. Medida adimensional, útil para comparar resultados de amostras cujas unidades podem ser diferentes. 100 x s CV Medidas de dispersão (variabilidade) BoxPlot Gráfico que apresenta a variabilidade de um conjunto de dados através de 6 medidas Exemplo: 1, 2, 2, 3, 4, 5, 6 Medidas de posição Medidas de posição são utilizadas para descrever a posição de uma valor de dados específico em relação ao resto dos dados Medidas de posição Quartis Valores da variável que dividem os dados classificados em quatro partes iguais, sendo que cada conjunto de dados é composto por três quartis. Ela não é influenciada pelos dados atípicos Medidas de posição Quartis 1º quartil ou quartil inferior (Q1) = valor aos 25% da amostra ordenada 2º quartil ou mediana (Q2) = valor até ao qual se encontra 50% da amostra ordenada 3º quartil ou quartil superior (Q3) = valor a aos 75% da amostra ordenada Medidas de posição Quartis Exemplo Amostra: 36, 40, 7, 41, 15, 39 Amostra ordenada: 7, 15, 36, 39, 40, 41 Q1 = 15 Q2 = (39+36)/2 = 37,5 Q3 = 40 Amplitude inter-quartil: Q3-Q1 (40 - 15 = 25) Medidas de posição Quartis Regra para descobrir os quartis 1) use a mediana para dividir os dados ordenados em duas metades, não inclua a mediana nas metades 2) o quartil inferior (ou superior) é a mediana da metade inferior (ou superior). Medidas de posição Percentis Valores da variável que dividem um conjunto de dados classificados em cem subconjuntos iguais, sendo que cada conjunto de dados é composto por 99 percentis. Medidas de dispersão (variabilidade) BoxPlot Exemplo: 1, 2, 2, 3, 4, 5, 6 Medidas de posição Pontuações padrão Até aqui examinamos medidas de posição gerais, mas às vezes é necessário medir a posição de um valor específico com relação à média e ao desvio padrão. Nesses casos, é utilizada a pontuação padrão, comumente chamada de escore-z. A pontuação padrão (ou escore-z) é a posição de um determinado valor de x em relação à média, medida e desvios-padrão. Medidas de posição Pontuações padrão O escore-z é determinado pela fórmula Medidas de posição Vamos aplicar essa fórmula para determinar as pont~uações padrão para (a) 92 e (b) 72 com relação a uma amostra de notas de provas com uma pontuação média de 74,92 e um desvio padrão de 14,20. Medidas de posição SOLUÇÃO (a)x = 92, xbarra = 74,92, s = 14,20. Z = 1,20 (b) x = 72, xbarra = 74,92, s = 14,20 Z - -0,21 Interpretação: a pontuação (a) é aproximadamente um desvio padrão e um quinto acima da média, enquanto a (b) é um quinto do desvio padrão abaixo da média. Medidas de posição Por ser um escore-z uma medida de posição relativa quanto à média, pode ser utilizado para ajudar a comparar duas pontuações brutas obtidas de populações distintas. Por exemplo, suponha que você deseja comparar a nota que tirou em uma prova com a nota que uma amiga obteve em uma prova equivalente no curso que ela faz. Você recebeu uma nota de 45 pontos, enquanto ela obteve 72 pontos. A nota dela é melhor? Medidas de posição Necessitamos de mais informações antes de chegarmos a uma conclusão. Suponha que a média que você obteve na prova foi 38 e a média de sua amiga na prova dela foi 65. Suas notas estão, ambas, 7 pontos acima da média, mas ainda não podemos estabelecer uma concisão definitiva. O desvio padrão da prova que você fez foi de 7 pontos, e de 14 pontos da prova da sua amiga. Medidas de posição Isso significa que a sua pontuação está em (1) desvio padrão acima da média (z=1), enquanto a nota da sua amiga é apenas meio desvio padrão acima da média (z=0,5). Uma vez que a sua pontuação tem a “melhor” posição relativa, conclui-se que é ligeiramente melhor do que a pontuação da sua amiga (LEMBRANDO: ESTAMOS FALANDO DE UM PONTO DE VISTA RELATIVO).
Compartilhar