Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Tratamento de Dados Simone Echeveste Tratamento de Dados O grande avanço tecnológico das últimas décadas gerou a necessida-de de formação de profissionais capazes de acompanhar esse de- senvolvimento com habilidades para gerar e analisar dados, produzindo informação útil a ser utilizada na resolução de problema. Nesse contexto, as ferramentas estatísticas são imprescindíveis e o conhecimento das mes- mas torna-se necessário para qualquer profissional. A Estatística hoje se configura como uma das ciências que mais vem crescendo em termos de utilização e importância na Engenharia: estudos de qualidade, confiabilidade, desenvolvimentos de novos produtos, avalia- ção de metodologias de produção, novos materiais etc. são alguns exem- plos da ampla utilização das ferramentas estatísticas para resolução de problemas e tomada de decisões nessa área. A disciplina de Tratamento de Dados tem por objetivos: propiciar ao aluno o estudo da estatística com vistas a análise de dados experimentais, cálculo e interpretação das medidas descritivas, uso de probabilidades e raciocínio lógico na resolução de problemas, utilização de testes estatísti- cos como ferramenta de análise de comparação e relação de dados no contexto das organizações industriais. Os conteúdos serão apresentados em 10 capítulos contendo a explica- ção teórica dos mesmos, bem como a apresentação de exemplos e aplica- ções em problemas na área da Engenharia. Em cada capítulo será desta- cado o objetivo de cada ferramenta estatística bem como a interpretação dos resultados obtidos. Introdução Sumário 1 Conceitos Básicos de Estatística .............................................1 2 Medidas Estatísticas ............................................................16 3 Gráficos de Controle ...........................................................46 4 Probabilidade .....................................................................67 5 Distribuições de Probabilidade ............................................83 6 Estimação e Intervalos de Confiança .................................114 7 Testes de Hipóteses ...........................................................129 8 Análise de Variância – Anova ............................................164 9 Análise de Correlação ......................................................182 10 Análise de Regressão Linear Simples .................................205 Conceitos Básicos de Estatística ÂÂNeste capítulo, será apresentado o contexto da pesqui-sa em que a estatística está inserida, bem como serão destacados os principais conceitos básicos de estatística. O objetivo aqui é que o aluno compreenda o vocabulário pertinente à análise estatística e que consiga identificar as variáveis de um estudo, organizando-as em tabelas de frequência. Ao final deste capítulo, espera-se que o aluno, dada uma situação problema, identifique corretamente a amos- tra de estudo e as variáveis envolvidas, bem como cons- trua tabelas de frequência como forma de resumo e apre- sentação de dados. Capítulo 1 Simone Echeveste 2 Tratamento de Dados Conceitos de estatística e o seu papel na ciência A necessidade de analisar um conjunto de dados estatistica- mente está sempre inserida no contexto de uma pesquisa, ou seja, temos inicialmente uma situação problema a ser resol- vida, ou ainda uma hipótese a ser testada e, para isso, uma pesquisa deve ser realizada. Com isso, em uma pesquisa, destaca-se a importância da utilização da estatística de acordo com os seguintes fa- tores: a) Em uma pesquisa, muitas vezes, são realizados estudos experimentais ou observacionais que culminam em uma coleção de dados numéricos que devem ser organizados e resumidos. b) O padrão de variação nos dados faz a resposta não ser óbvia, ou seja, somente tratando os dados adequadamen- te é que poderemos verificar o comportamento das variá- veis de estudo. c) Uma análise estatística é composta por métodos para coleta e descrição dos dados, viabilizando a verificação da força da evidência nos dados pró ou contra as hi- póteses de pesquisa. A presença de uma variação não previsível nos dados faz disso, muitas vezes, uma tarefa pouco trivial. Capítulo 1 Conceitos Básicos de Estatística 3 Problema Solução a partir de Experiências passadas, “palpites” Tomada de Decisão Solução a partir da ciência - Estatística Figura 1 O papel da Estatística na pesquisa. Em toda a pesquisa realizada, almeja-se a resposta a um problema ou ainda uma situação-problema que está vincula- da a uma tomada de decisão a ser realizada. Podemos con- siderar que nossa decisão pode ser tomada a partir de dois tipos de soluções: a primeira que pode ser considerada uma solução empírica que se fundamenta na observação e na ex- periência, livre de um método científico – é uma forma de solução muitas vezes subjetiva que pode levar a tomada de decisão errada. O outro tipo de solução seria a partir do método científico, à luz de dados provenientes de uma pesquisa que segue uma metodologia pré-determinada para garantir a imparcialidade das informações obtidas. Nesse caso, as ferramentas estatísti- cas são indispensáveis para a viabilização de uma tomada de decisão com menores riscos e incertezas. 4 Tratamento de Dados Rao (1999) define estatística como: “A estatística é uma ciência que estuda e pesquisa sobre: o levantamento de dados com a máxima quantidade de informação possível para um dado custo; o processamento de dados para a quantificação da quantidade de incerteza existente na resposta para um determinado problema; a to- mada de decisões sob condições de incerteza, sob o menor risco possível. Finalmente, a estatística tem sido utilizada na pesquisa científica, para a otimização de recursos econô- micos, para o aumento da qualidade e produtividade, na otimização em análise de decisões.” Dentre os conceitos importantes frequentemente utilizados na Estatística estão as definições de População e Amostra: Uma população (N) é conjunto de elementos de interesse em um determinado estudo, que podem ser pessoas ou resultados experimentais, com uma ou mais características comuns, que se pretendem estudar. Uma amostra (n) é um subconjunto da população usado para obter informação acerca do todo. Obtemos uma amostra para fazer inferências de uma população. Nossas inferências são vá- lidas somente se a amostra é representativa da população. A Estatística pode ser dividida em duas áreas: Descritiva e Inferencial. A área descritiva é mais simples, contemplando ferramentas de organização de dados e síntese de informação. Capítulo 1 Conceitos Básicos de Estatística 5 A área Inferencial, por sua vez, permite ao pesquisador proje- tar resultados amostrais para populações, bem como testar hi- póteses concernentes a parâmetros populacionais. Inferência estatística é o processo pelo qual estatísticos tiram conclusões acerca da população usando informação de uma amostra. A Estatística Inferencial está baseada em dois pilares fundamen- tais: a Amostragem e a Probabilidade. Outro conceito importante é o conceito da Variável, que vem a ser a matéria prima de qualquer pesquisa, ou seja, quando se termina uma coleta de dados em um primeiro mo- mento dispomos de um conjunto de valores ou ainda respostas pertinentes às nossas variáveis de pesquisa. Uma variável (x) é uma característica dos elementos investiga- dos que difere de um elemento para outro e do qual temos inte- resse em estudar. Cada unidade (elemento) da população que é escolhido como parte de uma amostra fornece uma medida de uma ou mais variáveis, também chamadas observações. As variáveis podem ser classificadas em: a) Variáveis Quantitativas: são as características que po- dem ser medidas em uma escala quantitativa, ou seja, apresentam valores numéricos/quantidades. Podem ser contínuas ou discretas.  Discretas: características mensuráveis que podem as- sumir apenas um número finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros. 6 Tratamento de Dados Exemplos: número de falhas, número de itens perfeitos números de carros vendidos etc.  Contínuas: características mensuráveis que assumem valores em uma escala para as quais valores fracionais fazem sentido. Exemplos: comprimento da peça, tempe- ratura, tempo de vida de um componente eletrônico etc. b) Variáveis Qualitativas (ou categóricas): são as carac- terísticas que não possuem valores quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, re- presentam uma classificação dos elementos. Podem ser nominais ou ordinais.  Variáveis Qualitativas nominais: não existe ordena- ção dentre as categorias. Exemplos: marca do carro, tipo de fornecedor, região de produção etc.  Variáveis Qualitativas ordinais: existe uma ordenação entre as categorias. Exemplos: escolaridade (Fundamen- tal, Médio ou Superior), grau de importância (nenhuma, pouca, razoável, muito) etc. 1.1 Análise descritiva: tabelas de frequência O primeiro contato do pesquisador com os seus dados é feito a partir da construção das tabelas de frequência, po- demos dizer que, nesse momento, os dados recebem o seu primeiro tratamento. Nessa etapa de análise, o pesquisador Capítulo 1 Conceitos Básicos de Estatística 7 identificará as possíveis respostas a uma determinada variá- vel e o comportamento das mesmas no que se refere a sua frequência. A tabela de frequência tem por objetivo apresentar os resul- tados de cada variável de uma forma organizada e resumida. Nessa tabela, encontramos o número de repetições de cada categoria de resposta de uma variável bem como o seu per- centual no grupo investigado. De acordo com as normas da ABNT (Associação Brasileira de Normas Técnicas) e do IBGE (Instituto Brasileiro de Geo- grafia e Estatística), as tabelas de frequência devem considerar os seguintes elementos: a) Título: deve conter as informações necessárias para que se compreenda “o que” está sendo apresentado na tabela, “onde” os dados foram obtidos e “quando” esses dados foram coletados. b) Cabeçalho: indica a natureza do conteúdo de cada colu- na da tabela. c) Corpo da Tabela: é a parte composta por linhas e colunas com as informações observadas. d) Rodapé: espaço logo abaixo da tabela que pode ser uti- lizado para a apresentação de notas ou observações de natureza informativa. e) Fonte: refere-se à entidade que organizou ou forneceu os dados apresentados na tabela. 8 Tratamento de Dados Exemplo de construção de uma tabela de frequência: Considere uma pesquisa realizada com uma amostra de 20 lotes de parafusos com o objetivo de investigar o número de parafusos fora da conformidade. Os dados observados foram: 0 1 0 2 3 3 2 1 0 4 3 1 0 0 4 2 1 0 1 0 Verifique que temos 20 números apresentados – cada nú- mero desses corresponde a um lote. Por exemplo, o primeiro lote possui os parafusos fora da conformidade, o segundo 1 parafuso e assim sucessivamente até o vigésimo lote que pos- sui 0 parafusos não conformes. Para esse problema, podemos destacar as seguintes infor- mações: a) Variável de pesquisa: número de parafusos fora da con- formidade. b) Amostra investigada: 20 lotes. Para a construção da tabela, precisamos das seguintes in- formações: c) Valores da variável que surgiram: corresponde às quan- tidades observadas de parafusos fora da conformidade. Nesse caso, encontramos 0, 1, 2, 3 e 4 parafusos. d) Frequência (f) de cada valor da variável: corresponde ao número de vezes que cada valor se repetiu. Capítulo 1 Conceitos Básicos de Estatística 9 Para o exemplo, podemos observar que 0 parafusos fora da conformidade se repetiu em 7 lotes: 0 1 0 2 3 3 2 1 0 4 3 1 0 0 4 2 1 0 1 0 Na sequência, 1 parafuso fora da conformidade se repetiu em 5 lotes: 0 1 0 2 3 3 2 1 0 4 3 1 0 0 4 2 1 0 1 0 Já 2 parafusos fora da conformidade se repetiu em 3 lotes: 0 1 0 2 3 3 2 1 0 4 3 1 0 0 4 2 1 0 1 0 Para 3 parafusos fora da conformidade, observamos uma ocorrência em 3 lotes: 0 1 0 2 3 3 2 1 0 4 3 1 0 0 4 2 1 0 1 0 Por fim, para 4 parafusos fora da conformidade, observa- mos uma ocorrência em 2 lotes: 0 1 0 2 3 3 2 1 0 4 3 1 0 0 4 2 1 0 1 0 10 Tratamento de Dados Agora, organizamos essa informação a partir da estrutura de uma tabela de frequência, considerando todos os seus ele- mentos: Número de parafusos fora da conformidade Fábrica A – Junho 2013 Nº Parafusos Frequência % 0 7 35 1 5 25 2 3 15 3 3 15 4 2 10 Total 20 100 Fonte: Pesquisa Interna Cálculo da Porcentagem: Expressão Geral: Capítulo 1 Conceitos Básicos de Estatística 11 IMPORTANTE!!! De acordo com as normas, as tabelas de frequência não podem ser fechadas dos lados nem ter linhas dividindo as categorias da variável. As únicas linhas permitidas são as que delimitam o cabeçalho e as que delimitam o total, e no centro da tabela é opcional colocar ou não o traço divisório das colunas. Recapitulando As ferramentas estatísticas são indispensáveis no tratamen- to de dados provenientes de uma pesquisa. É pela análise e tratamento de dados que o pesquisador obtém todas as in- formações pertinentes ao objeto de estudo, propiciando uma tomada de decisão com menores riscos e incertezas. Algumas definições importantes:  População (N): é o conjunto de elementos de interesse em um determinado estudo.  Amostra (n): parte da população selecionada é a quan- tidade de elementos investigada.  Variável (x): é a característica da amostra a ser investi- gada, ou seja, o que desejamos saber com a pergunta realizada.  Categorias: representam as possíveis respostas para a variável investigada. 12 Tratamento de Dados  Frequência (f): é o número de vezes que cada catego- ria da variável se repetiu, ou ainda, quantos elemen- tos investigados optaram por determinada resposta da questão. As tabelas de frequência correspondem a uma forma de apresentação de dados, seus elementos são: Título, Cabeça- lho, Corpo, Rodapé e Fonte. Sua estrutura é composta por linhas e colunas. As colunas são determinadas de forma que a variável a ser apresentada e suas respectivas categorias loca- lizam-se na primeira coluna, já na segunda coluna é apresen- tada a frequência (número de repetições) de cada categoria, e por fim a terceira coluna representa a porcentagem de cada categoria de resposta. Atividades: Conceitos básicos de estatística Considere a seguinte situação de pesquisa: “Um engenheiro realizou uma pesquisa com os pneus ra- diais de um novo veículo produzido por sua montadora com o objetivo de verificar o desgaste. Para esse estudo, ele sele- cionou um grupo de 50 pneus e observou a quilometragem em que estes rodavam até a ocorrência do desgaste”. Questão 1. A população dessa pesquisa pode ser considera- da como: a) Os carros produzidos pela montadora. Capítulo 1 Conceitos Básicos de Estatística 13 b) Pneus radiais do novo veículo. c) Desgaste dos pneus radiais. d) Um grupo de 50 pneus investigados. e) Quilometragem rodada pelos pneus radiais até ocorrer o desgaste. Questão 2. A amostra dessa pesquisa pode ser considerada como: a) Os carros produzidos pela montadora. b) Pneus radiais do novo veículo. c) Desgaste dos pneus radiais. d) Um grupo de 50 pneus investigados. e) Quilometragem rodada pelos pneus radiais até ocorrer o desgaste. Questão 3. A variável dessa pesquisa pode ser considerada como: a) Os carros produzidos pela montadora. b) Pneus radiais do novo veículo. c) Desgaste dos pneus radiais. d) Um grupo de 50 pneus investigados. e) Quilometragem rodada pelos pneus radiais até ocorrer o desgaste. 14 Tratamento de Dados Questão 4. Marque V para verdadeiro e F para falso nas se- guintes afirmativas: a) ( ) Em uma pesquisa, o padrão de variação nos dados faz os resultados não serem óbvios, por esse motivo, os resultados obtidos devem receber um tratamento estatístico que permiti- rá a verificação do comportamento das variáveis de estudo. b) ( ) As variáveis quantitativas são características que não possuem valores, mas, ao contrário, são definidas por ca- tegorias, ou seja, representam uma classificação dos ele- mentos. c) ( ) No título de uma tabela de frequências, deve-se colocar todas as informações necessárias para que se compreenda “o que” está sendo apresentado na tabela, “onde” os dados foram obtidos e “quando” esses dados foram coletados. d) ( ) O número de repetições de cada categoria de uma variá- vel é chamado de frequência e é representado pela letra “x”. Questão 5. Os dados a seguir referem-se ao tempo que de- terminada marca de transformador levou para apresentar a primeira falha grave, em anos, obtidos em um grupo de 15 transformadores. Os resultados do tempo de falhas em anos são dados por: 6 5 6 7 8 8 8 8 5 7 8 7 6 8 6 Construa uma tabela de frequência para representar esses dados. Capítulo 1 Conceitos Básicos de Estatística 15 Gabarito das atividades propostas Questão 1. b) Pneus radiais do novo veículo. Questão 2. d) Um grupo de 50 pneus investigados. Questão 3. e) Quilometragem rodada pelos pneus radiais até ocorrer o desgaste. Questão 4. a) V, b) F, c) V, d) F. Questão 5. Tempo que determinada marca de transformador levou para apresentar a primeira falha grave, em anos Tempo Frequência % 5 2 13,3 6 4 26,7 7 3 20,0 8 6 40,0 Total 15 100 Fonte: Pesquisa Interna Medidas Estatísticas  Neste capítulo, iremos abordar as principais medidas esta-tísticas utilizadas na área da Engenharia. Elas são dividi- das em dois grupos: Medidas de Tendência Central e Medi- das de Variabilidade. Nosso objetivo aqui é a apresentação de cada uma dessas medidas no que se refere à aplicabilida- de, ao cálculo e à interpretação dos resultados obtidos. O aluno, ao final deste capítulo, deverá conseguir cal- cular e interpretar as medidas estatísticas apresentadas. Podemos ainda aprofundar um pouco mais a nossa análise estatística para o caso em que as variáveis anali- sadas sejam QUANTITATIVAS por meio das medidas es- tatísticas. Essas medidas dividem-se em dois grupos de medidas: as Medidas de tendência central e as Medidas de variabilidade. Simone Echeveste Capítulo 2 Capítulo 2 Medidas Estatísticas 17 Medidas Estatísticas Medidas de tendência Central Medidas de Variabilidade Média Mediana Moda Variância Desvio- padrão Coeficiente de variação Figura 2 Medidas Estatísticas. 2.1 Medidas de tendência central Essas medidas têm por objetivo encontrar a “tendência central” de um conjunto de dados, ou seja, encontrar o valor do meio ou ainda os valores típicos de uma distribuição. São medidas úteis para caracterizar e representar um conjunto de dados a partir de um único valor utilizando critérios distintos para isso. As medidas de tendência central são: média, mediana e moda. 2.1.1 Média A média é a medida de tendência central mais conhecida e mais utilizada de todas. Existem vários tipos de médias, a que 18 Tratamento de Dados utilizamos em pesquisas é a Média aritmética, obtida pela soma de todos os valores da variável investigada (valores de x) dividida pelo número total de valores no conjunto de dados (total da amostra – n). É representada pelos símbolos na amostra e por µ na população. Notação: µ – média populacional – média amostral Fórmula: Onde: Σ = somatório x – variável (valores obtidos para a variável investigada) n – tamanho da amostra Exemplo Os dados abaixo representam o tempo de vida útil (em mil horas) de um conjunto de 7 lâmpadas fluorescentes: 15 18 18 20 17 18 16 Capítulo 2 Medidas Estatísticas 19 Elementos importantes: Amostra (n): 7 lâmpadas fluorescentes Variável (x): tempo de vida útil (em mil horas) Média: = 17,4 mil horas Interpretação: Em média, o tempo de vida útil dessas lâmpa- das fluorescentes é de 17,4 mil horas. Média para dados agrupados em tabelas de frequência Quando os dados estão organizados na forma de uma tabela de frequências, devemos multiplicar os diferentes valores “x” pelas respectivas frequências “f”. A fórmula utilizada deverá ser nesse caso: Onde: Σ = somatório x – variável 20 Tratamento de Dados f – frequência de cada valor da variável n – tamanho da amostra Exemplo Considere a seguinte tabela referente ao Número de peças defeituosas encontradas em uma amostra de 62 lotes produ- zidos: Número de peças defeituosas Nº peças (x) Frequência (f) % x.f 0 5 8,0 0 x 5 = 0 2 25 40,3 2 x 25 = 50 4 30 48,4 4 x 30 = 120 6 2 3,2 6 x 2 = 12 Total 62 (n) 100 182 = 2,9 peças Capítulo 2 Medidas Estatísticas 21 Interpretação: Em média, cada lote possui 2,9 peças defeitu- osas. 2.1.2 Mediana Ordenados os elementos da amostra em ordem crescente, a mediana é o valor considerado o ponto do meio, que a divide ao meio, isto é, metade dos elementos da amostra é menor ou igual à mediana e a outra metade é maior ou igual à mediana. Notação: Md ou Me Como obter a Mediana: 1º) todos os valores do conjunto de dados devem ser coloca- dos em ordem crescente, se houver algum valor que se repita mais de uma vez, ele deve ser repetido na ordenação também. 2º) devemos encontrar a posição da mediana considerando a seguinte regra: se o tamanho da amostra (n) é ímpar, a me- diana é o valor central; se o tamanho da amostra (n) for par, a mediana será a média dos dois valores centrais. Exemplo 1: Quando o tamanho da amostra “n” for ímpar. “Uma pesquisa foi realizada com o objetivo de verificar o pH de 5 amostras de tintas acrílicas de diferentes marcas. Os dados coletados estão apresentados abaixo”. 8,0 9,1 8,5 9,7 9,2 Amostra (n): 5 amostras de tintas de diferentes marcas 22 Tratamento de Dados Variável (x): valor do pH Mediana (Md) 1º) Colocar os valores em ordem crescente 8,0 8,5 9,1 9,2 9,7 2º) Encontrar o valor central no conjunto de dados 8,0 8,5 9,1 9,2 9,7 Mediana Interpretação: Metade das amostras de tinta possuem pH de 9,1 ou menos, e metade das amostras de tinta possuem pH de 9,1 ou mais. Exemplo 2: Quando o tamanho da amostra “n” for par. Vamos observar o mesmo exemplo anterior, porém agora va- mos considerar um grupo de 6 amostras de tintas acrílicas. “Uma pesquisa foi realizada com o objetivo de verificar o pH de 6 amostras de tintas acrílicas de diferentes marcas. Os dados coletados estão apresentados abaixo”. 8,0 8,8 8,5 9,7 9,5 9,2 Amostra (n): 6 amostras de tintas de diferentes marcas Variável (x): valor do pH Capítulo 2 Medidas Estatísticas 23 1º) Colocar os valores em ordem crescente 8,0 8,5 8,8 9,2 9,5 9,7 2º) Encontrar os dois valores centrais no conjunto de dados 8,0 8,5 8,8 9,2 9,5 9,7 Mediana 3º) Calcular o ponto médio entre esses dois valores centrais (somando os dois valores e dividindo por dois) Md = 9,0 Interpretação: Metade das amostras de tinta possuem pH infe- rior a 9, e metade das amostras de tinta possuem pH superior a 9. 2.1.3 Moda A moda de um conjunto de dados é simplesmente o valor do conjunto de dados que ocorreu com maior frequência, ou seja, que mais se repetiu. Notação: Mo 24 Tratamento de Dados Exemplo Os dados apresentados a seguir são provenientes de experi- mentos realizados com uma marca de concreto para determi- nar a resistência (kg/cm2) em uma amostra de 8 unidades: 200 kg/cm2 210 kg/cm2 200 kg/cm2 210 kg/cm2 210 kg/cm2 250 kg/cm2 230 kg/cm2 210 kg/cm2 Amostra (n): 8 unidades Variável (x): resistência do concreto (kg/cm2) Moda Mo = 210 kg/cm2 (esse valor se repete quatro vezes na amostra, foi o valor de resistência que mais se repetiu). 200 kg/cm2 210 kg/cm2 220 kg/cm2 210 kg/cm2 210 kg/cm2 250 kg/cm2 230 kg/cm2 210 kg/cm2 Interpretação: O valor da resistência do concreto que ocorreu com maior frequência foi de 210 kg/cm2. Capítulo 2 Medidas Estatísticas 25 Algumas situações podem ocorrer em relação à moda: 1ª) Um conjunto de dados pode não ter moda, ou seja, nenhum valor se repetir Exemplo: Tempo de produção de 5 peças (em minutos) 34, 56, 23, 42, 38 Nenhum valor se repete – não tem moda! 2ª) Um conjunto de dados pode ter mais que uma moda, ou seja, poderemos ter mais que um valor da variável se repetindo com frequências iguais Exemplo: Número de peças produzidas em 8 dias: 35, 23, 35, 40, 51, 40, 32, 55 Duas modas: 35 e 40 peças! 2.2 Medidas de variabilidade Tão importante quanto representarmos todos os valores de um conjunto de dados a partir das medidas de tendência central é ter o conhecimento da variação que ocorre em torno dessa medida. As medidas de variabilidade são extremamente úteis no tratamento de dados, pois estas indicam a variação existen- te em torno da média. 26 Tratamento de Dados Vamos considerar o seguinte exemplo apresentado abaixo: Exemplo Considere uma linha de produção que possui três máquinas em operação: Máquina A, Máquina B e Máquina C. Está sen- do investigado o número de unidades com falhas produzidas em três dias de produção. Os dados coletados foram: MÁQUINA A Unidades com falhas: 1º Dia: 5 unidades 2º Dia: 0 unidades 3º Dia: 10 unidades Média de vendas: 5 + 0 + 10 3 5x n = = = xΣ Em média, a Máquina A produz 5 unidades com falhas por dia. MÁQUINA B Unidades com falhas: 1º Dia: 5 unidades 2º Dia: 5 unidades 3º Dia: 5 unidades Média de vendas: 5 + 5 + 5 3 5x n = = = xΣ Em média, a Máquina B produz 5 unidades com falhas por dia. MÁQUINA C Unidades com falhas: 1º Dia: 5 unidades 2º Dia: 4 unidades 3º Dia: 6 unidades Média de vendas: 5 + 4 + 6 3 5x n = = = xΣ Em média, a Máquina C produz 5 unidades com falhas por dia. Observando apenas a média de unidades com falhas das três máquinas investigadas, chegaremos à conclusão de que elas são iguais, ou seja, possuem o mesmo comportamento no que se refere à produção de unidades com falhas. Porém, ao Capítulo 2 Medidas Estatísticas 27 analisar os dados brutos (unidades com falhas para cada um dos dias investigados), observamos que, embora a média seja a mesma entre as três máquinas, a variação de um dia para o outro possui um comportamento bem distinto. Enquanto a Máquina A varia de 0 unidades com falha em um dia a 10 unidades com falha em outro, a Máquina B mantém uma produção de unidades com falha constante de 5 unidades em todos os três dias do estudo. Para esse caso a análise realizada utilizando somente a média como ferramen- ta estatística pode induzir o investigador a uma interpretação errônea a respeito dos dados. Por esse motivo, além das medidas de tendência central, devemos obter as medidas de variabilidade que contribuem para uma melhor interpretação do comportamento de uma variável quantitativa. Essas medidas representam a variação de um conjunto de dados em torno da média. Medias de Variabilidade Variância Desvio-padrão Coeficiente de Variação Figura 3 Medidas de Variabilidade. 28 Tratamento de Dados 2.2.1 Variância A variância de uma amostra corresponde à média dos qua- drados dos desvios dos valores em relação à média, Quanto maior for a variação dos valores do conjunto de dados, maior será a variância. Notação: σ2– variância populacional s2 – variância amostral Fórmula: Onde: x – valores da variável investigada – média da amostra n – tamanho da amostra Σ – somatório Propriedades da variância 1. Somando-se (ou subtraindo-se) a cada elemento de um con- junto de valores uma constante, a variância não se altera; 2. Multiplicando-se (ou dividindo-se) cada elemento de um con- junto de valores por um valor constante, a variância fica multipli- cada (ou dividida) pelo quadrado da constante. Capítulo 2 Medidas Estatísticas 29 No cálculo da variância, pode-se observar que a unidade da variável estudada é levada ao quadrado, dificultando, as- sim, a interpretação de seu resultado final. A solução para esse problema é extrair a raiz quadrada da variância, permitindo assim que se volte à unidade original da variável. Essa nova medida (a raiz quadrada da variância) é chamada de desvio- -padrão. 2.2.2 Desvio-padrão O desvio-padrão corresponde à raiz quadrada da variância. Essa medida expressa a variação média do conjunto de dados em torno da média, para mais ou para menos na mesma uni- dade de medida da média. Notação: σ – desvio-padrão populacional s – desvio-padrão amostral Fórmula: 30 Tratamento de Dados Propriedades do desvio-padrão 1. Somando-se (ou subtraindo-se) a cada elemento de um con- junto de valores uma constante, o desvio-padrão não se altera; 2. Multiplicando-se (ou dividindo-se) cada elemento de um con- junto de valores por um valor constante, o desvio-padrão fica multiplicado (ou dividido) pela constante. O desvio-padrão de uma amostra pode ser calculado con- siderando as seguintes etapas: 1a) Calcular a média 2a) Subtrair a média de cada valor do conjunto (desvio) 3a) Elevar ao quadrado cada desvio 4a) Somar os quadrados dos desvios 5a) Dividir essa soma por (n-1) 6a) Extrair a raiz quadrada Figura 4 Etapas para o cálculo do Desvio-padrão. Capítulo 2 Medidas Estatísticas 31 Vamos considerar o exemplo inicial da comparação do nú- mero de unidades com falhas entre as máquinas A, B e C em uma amostra de 3 dias: MÁQUINA A Unidades com falhas: 1º Dia: 5 unidades 2º Dia: 0 unidades 3º Dia: 10 unidades MÁQUINA B Unidades com falhas: 1º Dia: 5 unidades 2º Dia: 5 unidades 3º Dia: 5 unidades MÁQUINA C Unidades com falhas: 1º Dia: 5 unidades 2º Dia: 4 unidades 3º Dia: 6 unidades Importante: Amostra (n): 3 dias Variável (x): Número de unidades produzidas com falhas Máquina A Média de vendas: Interpretação: Para a Máquina A, observa-se que, em média, são produzidas ao dia 5 unidades com falhas com uma varia- ção em torno dessa média de 5 unidades. [5 unidades com falha/dia ± 5 unidades com falha/dia] MÁQUINA A Unidades com falhas: 1o Dia: 5 unidades 2o Dia: 0 unidades 3o Dia: 10 unidades 32 Tratamento de Dados Máquina B Média de vendas – Interpretação: Para a Máquina B, observa-se que, em média, são produzidas ao dia 5 unidades com falhas com uma varia- ção em torno dessa média de 0 unidades. [5 unidades com falha/dia ± 0 unidades com falha/dia] Máquina C Média de vendas – MÁQUINA B Unidades com falhas: 1o Dia: 5 unidades 2o Dia: 5 unidades 3o Dia: 5 unidades MÁQUINA C Unidades com falhas: 1o Dia: 5 unidades 2o Dia: 4 unidades 3o Dia: 6 unidades Capítulo 2 Medidas Estatísticas 33 Interpretação: Para a Máquina C, observa-se que, em média, são produzidas ao dia 5 unidades com falhas com uma varia- ção em torno dessa média de 1 unidade. [5 unidades com falha/dia ± 1 unidades com falha/dia] Podemos agora comparar as três máquinas utilizando as medidas estatísticas média e desvio-padrão da seguinte forma: MÁQUINA A Nessa máquina, em média, são produzidas 5 uni- dades com falhas ao dia com uma variação de 5 uni- dades. [5 ± 5] MÁQUINA B Nessa máquina, em média, são produzidas 5 uni- dades com falhas ao dia com uma variação de 0 uni- dades. [5 ± 0] MÁQUINA C Nessa máquina, em média, são produzidas 5 uni- dades com falhas ao dia com uma variação de 1 uni- dade. [5 ± 1] 2.2.3 Coeficiente de variação Neste momento, poderemos questionar: quando um desvio- -padrão é grande e quando ele é pequeno? Na verdade, um desvio padrão pode ser considerado grande ou pequeno de- pendendo da ordem de grandeza da variável. Por esse motivo, quando desejamos comparar a variabilidade entre métodos, ou ainda entre grupos de valores, é indicada a utilização do Coeficiente de Variação que representa o desvio-padrão ex- presso como uma porcentagem da média. 34 Tratamento de Dados Notação: C.V. – Coeficiente de variação Fórmula: C. V. = s × 100 x Onde: – média da amostra s – desvio-padrão No exemplo da comparação das filiais: MÁQUINA A C. V. = 5 × 100 5 C. V. = 100% MÁQUINA B C. V. = 0 × 100 5 C. V. = 0% MÁQUINA C C. V. = 1 × 100 5 C. V. = 20% Analisando as medidas de variabilidade, podemos obser- var que, embora o número médio de unidades com falhas produzidas pelas três máquinas seja o mesmo, não podemos considerar a qualidade da produção dessas máquinas a mes- ma, já que a variabilidade apresenta resultados bem distintos entre as máquinas. Uma informação importante que podemos obter a partir do Coeficiente de variação diz respeito à homogeneidade de um conjunto de dados comparado a outro, por exemplo, podemos Capítulo 2 Medidas Estatísticas 35 observar que, dessas filiais, a que possui uma produção de uni- dades com falhas mais homogênea é a máquina B, pois possui menor coeficiente de variação (C.V. = 0%), seguida pela má- quina C (C.V. = 20%) e, por fim, com maior coeficiente de va- riação e maior heterogeneidade está a máquina A (C.V. = 100). Maior coeficiente de variação - Dados mais HETEROGÊNEOS Menor coeficiente de variação - Dados mais HOMOGÊNEOS Figura 5 Interpretação Coeficiente de Variação. Exemplo Vamos considerar agora um exemplo em que não tenhamos que comparar conjunto de valores: Os dados apresentados a seguir são provenientes de expe- rimentos realizados com uma marca de concreto para deter- minar a resistência (kg/cm2) em uma amostra de 6 unidades: 200 kg/cm2 210 kg/cm2 200 kg/cm2 210 kg/cm2 250 kg/cm2 230 kg/cm2 36 Tratamento de Dados Amostra (n): 6 unidades Variável (x): resistência do concreto (kg/cm2) Para estes dados, vamos calcular e interpretar a Média e o Desvio-padrão: Média Variância Desvio-Padrão Interpretação: Em média, a resistência dessa marca de con- creto é de 216,7 kg/cm2 com uma variação de 19,7 kg/cm2. [216,7 ± 19,7 kg/cm2] Capítulo 2 Medidas Estatísticas 37 Exemplo para dados agrupados em tabelas de frequência Considere a seguinte tabela anteriormente citada referente ao Número de peças defeituosas encontradas em uma amostra de 62 lotes produzidos: Número de peças defeituosas Nº peças (x) Frequência (f) % x.f 0 5 8,0 0 x 5 = 0 2 25 40,3 2 x 25 = 50 4 30 48,4 4 x 30 = 120 6 2 3,2 6 x 2 = 12 Total 62 (n) 100 182 Para esse exemplo, já havíamos calculado a média: 0 + 50 + 120 + 12 62 x n = = x . fΣ 182 62 x n = = x . fΣ = 2,9 Agora, vamos calcular a variância e o desvio-padrão. Nes- se caso, devemos considerar a frequência de cada valor da variável. 38 Tratamento de Dados Variância Número de peças defeituosas Nº peças (x) Frequência (f) % 0 5 8,0 (0 – 2,9)2. 5 = 42,05 2 25 40,3 (2 – 2,9)2. 25 = 20,25 4 30 48,4 (4 – 2,9)2. 30 = 36,3 6 2 3,2 (6 – 2,9)2. 2 = 19,22 Total 62 (n) 100 117,82 Desvio-padrão s = 1,4 peças defeituosas Interpretação: Em média, são produzidas 2,9 peças defeitu- osas com uma variação de 1,4 peças. [2,9 ± 1,4 peças defei- tuosas] Capítulo 2 Medidas Estatísticas 39 Recapitulando Para o caso em que a variável analisada é QUANTITATIVA, podemos aprofundar nossa análise a partir das medidas esta- tística. Essas medidas dividem-se em dois grupos de medidas: as Medidas de tendência central e as Medidas de variabilidade. As Medidas de Tendência Central (média, mediana e moda) são medidas úteis para caracterizar e representar um conjunto de dados a partir de um único valor, utilizando critérios distin- tos para isso. Já as Medidas de Variabilidade (Variância, Desvio-padrão e Coeficiente de Variação) são extremamente úteis no tratamento de dados, pois estas indicam a variação existente em torno da média. Quando realizamos o tratamento estatístico de dados pro- venientes de variáveis quantitativas, o cálculo e interpretação dessas medidas fornece informação detalhada e de extrema importância na tomada de decisão do pesquisador. Atividades medidas de tendência central e medidas de variabilidade Questão 1. Os dados abaixo são referentes às taxas de de- semprego (em %) em alguns países selecionados: Grupo 1: Países da América do Sul e América do Norte Brasil 11.4 Uruguai 12.1 Chile 5.6 Argentina 7.3 Canadá 4.8 EUA 5.3 Venezuela 7.3 40 Tratamento de Dados Grupo 2: Países da Europa Espanha 4.8 Portugal 5.2 Itália 4.3 Alemanha 3.8 Suécia 2.5 Inglaterra 5.8 França 3.6 2a) Complete a tabela abaixo com as medidas estatísticas so- licitadas: Comparação das taxas de desemprego (em %) Grupo n Taxa Média Desvio-padrão Coef. Variação Américas do Sul e Norte Europa 2b) Qual dos grupos apresentou resultados mais homogêneos? a) ( ) Países da América do Sul e América do Norte b) ( ) Países da Europa c) ( ) Nenhum dos grupos foi mais homogêneo Questão 2. A companhia GE Esmaltec usa um processo para pintar geladeiras com uma camada de esmalte. Durante cada turno, uma amostra de 5 geladeiras é selecionada e a espes- sura da pintura (mm) é determinada. Considere os seguintes dados coletados: Manhã: 2,7 2,3 2,6 2,4 2,7 Tarde: 2,6 2,3 2,0 2,5 2,4 Noite: 1,8 2,8 2,3 1,6 2,9 Capítulo 2 Medidas Estatísticas 41 a) Calcule as medidas descritivas: média e desvio-padrão da espessura da pintura para cada turno. b) Qual turno apresentou resultados mais homogêneos? Questão 3. Um fabricante de molas está interessado em im- plementar um sistema de controle de qualidade para monitorar seu processo de produção. Para isso, foi registrado o número de molas fora da conformidade em cada lote de produção. Os dados apresentados na tabela de frequência abaixo referem- -se a 20 lotes selecionados, observando-se o número de mo- las fora da conformidade. Tabela 1 Número de molas fora de conformidade Número de molas f % 6 3 15,0 7 6 30,0 8 4 20,0 9 3 15,0 12 4 20,0 Total 20 100,0 a) Calcule e interprete as medidas descritivas: média e des- vio-padrão para esses dados. 42 Tratamento de Dados Questão 4. A capacidade em litros dos porta-malas dos car- ros populares produzidos no Brasil foi investigada, obtendo-se os seguintes dados: Corsa: 240 litros Uno: 224 litros Hobby: 325 litros Gol: 146 litros a) Calcule e interprete a Mediana para esses dados. b) Calcule e interprete a média e o desvio-padrão para esses dados. Gabarito das atividades propostas Questão 1 a) Comparação das taxas de desemprego (em %) Grupo n Taxa Média Desvio-padrão Coef. Variação Américas do Sul e Norte 7 7,7% 2,9% 37,7% Europa 7 4,3% 1,1% 25,6% b) O mais homogêneo foi o grupo dos países da Europa, pois possui menor Coeficiente de variação. Questão 2 a) Manhã: Média = 2,5 mm Desvio-padrão = 0,19 mm CV = 7,6% Capítulo 2 Medidas Estatísticas 43 Tarde: Média = 2,4 mm Desvio-padrão = 0,23 mm CV = 9,6% Noite: Média = 2,3 mm Desvio-padrão = 0,58 mm CV = 25,2% b) O turno da manhã, pois o seu coeficiente de variação (CV) foi o menor, comparado com os dos demais turnos. Questão 3 Tabela 1 Número de molas fora de conformidade Número de molas f % x . f (x – x–)2. f 6 3 15,0 6 x 3 = 18 (6 – 8,4)2 . 3 = 17,28 7 6 30,0 7 x 6 = 42 (7 – 8,4)2 . 6 = 11,76 8 4 20,0 8 x 4 = 32 (8 – 8,4)2 . 4 = 0,64 9 3 15,0 9 x 3 = 27 (9 – 8,4)2 . 3 = 1,08 12 4 20,0 12 x 4 = 48 (12 – 8,4)2 . 4 = 51,84 Total 20 100,0 167 82,6 Média 167 20 x n = = x . fΣ = 8,4 44 Tratamento de Dados Variância Desvio-padrão s = 2,1 molas fora da conformidade Interpretação: Em média, são produzidas, por lote, 8,4 molas fora da conformidade com uma variação de 2,1 molas. [8,4 ± 2,1 molas fora da conformidade] Questão 4 a) Calcule e interprete a Mediana para estes dados. 146 224 240 325 Interpretação: Em metade dos carros, a capacidade do porta- -malas é inferior a 232 litros, e em metade dos carros a capa- cidade do porta-malas é superior a 232 litros. b) Calcule e interprete a média e o desvio-padrão para estes dados. Média Capítulo 2 Medidas Estatísticas 45 Variância Desvio-padrão Interpretação: Em média, a capacidade do porta-malas des- ses carros é de 233,8 litros com uma variação de 73,4 litros. Gráficos de Controle ÂÂNeste capítulo, iremos abordar a utilização das medi-das estatísticas anteriormente vistas em uma aplica- ção prática extremamente importante na área da Enge- nharia: Controle de qualidade. Aqui, será demonstrada a construção de gráficos de controle e a interpretação das informações que estes nos fornecem. O aluno deverá conseguir construir gráficos de contro- le utilizando, para isso, medidas estatísticas de tendência central e variabilidade, bem como deverá realizar a corre- ta interpretação dos mesmos. Simone Echeveste Capítulo 3 Capítulo 3 Gráficos de Controle 47 Os gráficos de controle estão inseridos no Controle Estatís- tico de Qualidade – é um sistema amplo e complexo que tem por finalidade a inspeção, a análise e a ação corretiva aplica- dos a um processo produtivo. O processo estará sob controle quando a variação da qualidade estiver dentro dos limites de especificação do produto. Alguns dos princípios fundamentais dos gráficos de controle:  Pensar e decidir baseado em dados e fatos.  Pensar separando a causa do efeito, buscar sempre co- nhecer a causa fundamental dos problemas.  Reconhecer a existência da variabilidade na produção e administrá-la.  Identificar instantaneamente focos e locais de disfunção e corrigir os problemas a tempo. A variação que ocorre em um processo de produção pode ser desmembrada em duas componentes: uma de difícil con- trole, chamada variação aleatória; e outra chamada varia- ção controlável. Assim, a equação da variação total de um processo pode ser escrita como: Variação Aleatória Variação Controlável Variação Total 48 Tratamento de Dados Se as variações forem conhecidas, controladas e reduzidas, os índices de produtos defeituosos certamente se reduzirão. Os gráficos de controle são utilizados para avaliar se o processo está sob controle. A partir de sua análise, é possível evitar, re- duzir ou eliminar não conformidades em tempo real (durante o processo de produção). Os gráficos de controle são úteis para: Monitorar variabilidade do processo Detectar variabilidade do processo Auxiliar na eliminação de causas especiais, trazendo o processo para o estado de controle Dar indicações de como mudanças podem afetar um processo sob controle Benefícios dos gráficos de controle  Podem ser aplicados pelos próprios operários, que po- derão discutir com os supervisores, engenheiros e técni- cos por meio da linguagem dos dados fornecidos pelos gráficos de controle.  Os gráficos de controle servem para monitoramento do processo, mostrando a ocorrência de um descontrole (presença de causas especiais) e/ou a tendência dessa ocorrência.  Ao melhorar o processo, os gráficos de controle per- mitem: aumentar a porcentagem de produtos que sa- tisfaçam exigências dos clientes; diminuir os índices de Capítulo 3 Gráficos de Controle 49 retrabalho dos itens produzidos e, consequentemente, dos custos de produção aumentando a produtividade. Gráficos de controle para medições O uso dos gráficos de controle para medições deve ocorrer sempre que uma característica da qualidade observada é ex- pressa em unidades reais como peso em quilogramas, compri- mento em centímetros, temperatura em graus Celsius. Fornecem informações sobre um processo a partir dos re- sultados de pequenas amostras coletadas periodicamente em que, a cada intervalo h, retira-se uma amostra de tamanho n para análise. Cada grupo fornece uma ideia do que o proces- so está produzindo naquele momento. Para a construção de um gráfico controle de variáveis, são coletados dados de subgrupos de pequenas amostras de n = 4 ou 5 itens extraídos a intervalos regulares (de hora em hora, dia a dia etc.). O intervalo adequado para extração das amos- tras depende de cada processo de fabricação. Símbolos Importantes: n = tamanho da amostra k = número (quantidade) de amostras = média das médias das amostras (média global) R = amplitude amostral média = média das amplitudes d2, A3, D3, D4 = fatores de correção tabelados 50 Tratamento de Dados Passo a passo: Gráfico de controle para média e amplitude 1º) Determinar o tamanho das amostras n (usualmente 4 ou 5) e a quantidade K das amostras (no mínimo 25, ou 20, respectivamente). 2º) Calcular para cada amostra a média e a amplitude R: 3º) Calcular para todas as k amostras obtidas a Média das Médias e a Média das amplitudes : 4º) Calcular o desvio-padrão das médias Capítulo 3 Gráficos de Controle 51 Tamanho das amostras (n) Fator de Correção D3 D4 D c4 d2 2 0 3,267 0,709 0,798 1,128 3 0 2,574 0,524 0,886 1,693 4 0 2,282 0,446 0,921 2,059 5 0 2,114 0,403 0,94 2,326 6 0 2,004 0,375 0,952 2,534 7 0,076 1,924 0,353 0,959 2,704 8 0,136 1,864 0,338 0,965 2,847 9 0,184 1,816 0,325 0,969 2,970 10 0,223 1,777 0,314 0,973 3,078 Figura 6 Fator de Correção para gráfico de controle das Médias. 5º) Calcular os Limites  Limite Superior de Controle (LSC)  Linha Média (LM)  Limite Inferior de Controle (LIC) 52 Tratamento de Dados 6º) Plotar o gráfico no Excel 90 85 80 75 70 65 60 55 50 1 2 3 4 5 6 7 8 9 10 Amostra Média LSC LM LIC 7º) O gráfico obtido constitui a norma de controle de fabrica- ção; permitirá acompanhar o processo. 8º) Por fim, construir o gráfico de controle para R – amplitude  Limite Superior de Controle (LSC)  Linha Média (LM)  Limite Inferior de Controle (LIC) Capítulo 3 Gráficos de Controle 53 Exemplo 1 A cada 2 horas de atividade, uma amostra de 5 peças é me- dida e dentre as características de qualidade monitoradas está o peso de um dos componentes plásticos que são fabricados por sopro. Foram extraídas 10 amostras (cada uma com as respectivas 5 peças), foram pesadas e indicaram os resultados descritos abaixo: Amostra Pesos Observados (n = 5) 1 65 70 75 60 80 2 75 70 80 90 70 3 80 70 70 80 80 4 65 65 65 80 65 5 80 60 80 80 75 6 75 70 60 85 75 7 80 75 65 75 70 8 70 65 75 65 85 9 85 85 75 65 80 10 65 65 65 80 60 Atenção: K = 10 amostras extraídas n = 5 peças em cada amostra - Calcular para cada amostra a média e a amplitude R: R = xmax – xmin 54 Tratamento de Dados Amostra Pesos Observados (n = 5) Soma Média (x–) Amplitude (R) 1 65 70 75 60 80 350 70 20 2 75 70 80 90 70 385 77 20 3 80 70 70 80 80 380 76 10 4 65 65 65 80 65 340 68 15 5 80 60 80 80 75 375 75 20 6 75 70 60 85 75 365 73 25 7 80 75 65 75 70 365 73 15 8 70 65 75 65 85 360 72 20 9 85 85 75 65 80 390 78 20 10 65 65 65 80 60 335 67 20 - Calcular para todas as k amostras obtidas a Média das Médias e a Média das amplitudes - Calcular o desvio-padrão das médias Como obter o valor para d2 Fator de Correção para gráfico de controle das Médias Tamanho das amostras (n) Fator de Correção D3 D4 D c4 d2 4 0 2,282 0,446 0,921 2,059 5 0 2,114 0,403 0,94 2,326 6 0 2,004 0,375 0,952 2,534 7 0,076 1,924 0,353 0,959 2,704 Capítulo 3 Gráficos de Controle 55 - Calcular os Limites Limite Superior de Controle (LSC) Linha Média (LM) Limite Inferior de Controle (LIC) Amostra Média LCS LM LCI 1 70 83,57 72,9 62,23 2 77 83,57 72,9 62,23 3 76 83,57 72,9 62,23 4 68 83,57 72,9 62,23 5 75 83,57 72,9 62,23 6 73 83,57 72,9 62,23 7 73 83,57 72,9 62,23 8 72 83,57 72,9 62,23 9 78 83,57 72,9 62,23 10 67 83,57 72,9 62,23 56 Tratamento de Dados - Construir o gráfico de controle para a Média 50 55 60 65 70 75 80 85 90 95 100 1 2 3 4 5 6 7 8 9 10 LSC Média LM LIC - Gráfico de controle para R – Amplitude  Limite Superior de Controle (LSC) Como obter o valor para D4 Fator de Correção para gráfico de controle das Médias Tamanho das amostras (n) Fator de Correção D3 D4 D c4 d2 4 0 2,282 0,446 0,921 2,059 5 0 2,114 0,403 0,94 2,326 6 0 2,004 0,375 0,952 2,534 7 0,076 1,924 0,353 0,959 2,704  Linha Média (LM) Capítulo 3 Gráficos de Controle 57  Limite Inferior de Controle (LIC) Como obter o valor para D3 Fator de Correção para gráfico de controle das Médias Tamanho das amostras (n) Fator de Correção D3 D4 D c4 d2 4 0 2,282 0,446 0,921 2,059 5 0 2,114 0,403 0,94 2,326 6 0 2,004 0,375 0,952 2,534 7 0,076 1,924 0,353 0,959 2,704 Amostra Amplitude R LSC LM LIC 1 20 39,11 18,5 0 2 20 39,11 18,5 0 3 10 39,11 18,5 0 4 15 39,11 18,5 0 5 20 39,11 18,5 0 6 25 39,11 18,5 0 7 15 39,11 18,5 0 8 20 39,11 18,5 0 9 20 39,11 18,5 0 10 20 39,11 18,5 0 58 Tratamento de Dados - Construir o Gráfico de controle para R – Amplitude Gráfico de controle para amplitude 55 50 45 40 35 30 25 20 15 10 5 0 -5 -10 1 2 3 4 5 6 7 8 9 10 LSC Amplitude R LM LIC Avaliação dos gráficos de controle Processo sob controle: é aquele cujos resultados de medição apresentam variação dentro dos limites de controle.  Se os pontos estão dentro dos limites, não é necessário intervir no processo.  A variação é decorrente de causas aleatórias.  Se um ponto cai fora desses limites: deve-se intervir no processo, pois o afastamento excessivo desse ponto em relação à linha média provavelmente é devido a uma causa especial. Capítulo 3 Gráficos de Controle 59 Exemplo de um processo que está FORA de controle 50 55 60 65 70 75 80 85 90 1 2 3 4 5 6 7 8 9 10 Amostra Média LCI LM LCS Recapitulando Os gráficos de controle correspondem a uma das ferramen- tas mais úteis no controle de um processo, pois permitem a identificação de causas que não são naturais ao processo de produção e que podem prejudicar a qualidade de um produto. Após a identificação de um processo fora de controle, po- deremos agir nas causas e melhorar continuamente o proces- so de produção garantindo a qualidade desejada no produto final. 60 Tratamento de Dados Atividades gráficos de controle Questão 1. Considere os dados apresentados a seguir de 12 amostras de tamanho 5, para os quais foi medido o volume em saquinhos de 1 litro de leite. Construa o gráfico de controle para a Média e para a Amplitude com esses dados e verifique se o processo está sob controle. Amostra Medidas (litros de leite) 1 1003,2 1004,4 993,5 994,6 997,6 2 1002,3 999,0 1000,8 1000,7 998,0 3 998,3 998,1 1004,2 1002,1 991,3 4 1002,2 996,6 1002,7 1004,2 1001,8 5 998,3 997,5 1006,1 996,5 998,1 6 995,8 1000,8 999,1 1002,5 1001,0 7 1004,1 1003,0 1004,8 997,9 999,9 8 1000,1 994,9 1000,1 1004,9 997,3 9 1000,2 996,1 998,0 1006,1 999,4 10 996,2 1017,3 993,6 996,5 1003,7 11 1014,0 1008,9 1004,1 1007,9 1000,7 12 997,1 1000,7 999,8 1000,6 1001,7 Questão 2. Responda: quais são os princípios fundamentais dos gráficos de controle? Capítulo 3 Gráficos de Controle 61 Questão 3. Os gráficos de controle são utilizados para: a. ( ) Identificar exatamente o que está causando algum tipo de problema no processo. b. ( ) Identificar o tipo de defeito nas unidades produzidas. c. ( ) Auxiliar na eliminação de causas especiais, trazendo o processo para o estado de controle. d. ( ) Analisar a melhor forma de efetuar o controle estatístico do processo. Questão 4. A variação que ocorre em um processo de pro- dução pode ser desmembrada em duas componentes, quais são elas? Questão 5. Um processo está sob controle quando: a. ( ) Os resultados de medição apresentam variação dentro dos limites de controle. b. ( ) O desvio-padrão encontrado é menor que a média da variável. c. ( ) A variação aleatória é conhecida durante todo o pro- cesso. d. ( ) Não há ocorrência registrada de danos nas unidades produzidas. 62 Tratamento de Dados Gabarito atividades propostas Questão 1 Amostra Medidas (litros de leite) Amplitude (R) Média (x–) 1 1003,2 1004,4 993,5 994,6 997,6 10,9 998,7 2 1002,3 999,0 1000,8 1000,7 998,0 4,3 1000,2 3 998,3 998,1 1004,2 1002,1 991,3 12,9 998,8 4 1002,2 996,6 1002,7 1004,2 1001,8 7,6 1001,5 5 998,3 997,5 1006,1 996,5 998,1 9,6 999,3 6 995,8 1000,8 999,1 1002,5 1001,0 6,7 999,8 7 1004,1 1003,0 1004,8 997,9 999,9 6,9 1001,9 8 1000,1 994,9 1000,1 1004,9 997,3 10,0 999,5 9 1000,2 996,1 998,0 1006,1 999,4 10,0 1000,0 10 996,2 1017,3 993,6 996,5 1003,7 23,7 1001,5 11 1014,0 1008,9 1004,1 1007,9 1000,7 13,3 1007,1 12 997,1 1000,7 999,8 1000,6 1001,7 4,6 1000,0 Resultados para o gráfico de controle para a média Média LIC LM LSC 998,7 994,9 1000,7 1006,5 1000,2 994,9 1000,7 1006,5 998,8 994,9 1000,7 1006,5 1001,5 994,9 1000,7 1006,5 999,3 994,9 1000,7 1006,5 999,8 994,9 1000,7 1006,5 1001,9 994,9 1000,7 1006,5 999,5 994,9 1000,7 1006,5 1000,0 994,9 1000,7 1006,5 1001,5 994,9 1000,7 1006,5 1007,1 994,9 1000,7 1006,5 1000,0 994,9 1000,7 1006,5 Capítulo 3 Gráficos de Controle 63 Resultados para o gráfico de controle para a amplitude LSC Amplitude (R) LM LIC 21,2 10,9 10,04 0 21,2 4,3 10,04 0 21,2 12,9 10,04 0 21,2 7,6 10,04 0 21,2 9,6 10,04 0 21,2 6,7 10,04 0 21,2 6,9 10,04 0 21,2 10 10,04 0 21,2 10 10,04 0 21,2 23,7 10,04 0 21,2 13,3 10,04 0 21,2 4,6 10,04 0 Gráfico de controle para média 985 990 995 1000 1005 1010 1015 1 2 3 4 5 6 7 8 9 10 11 12 LSC Média LM LIC 64 Tratamento de Dados O processo está fora do controle! Gráfico de controle para amplitude -10 -5 0 5 10 15 20 25 30 1 2 3 4 5 6 7 8 9 10 11 12 LSC Amplitude ( R ) LM LIC O processo está fora do controle! Questão 2 Resposta: pensar e decidir baseado em dados e fatos; pensar separando a causa do efeito, buscar sempre conhecer a causa fundamental dos problemas; reconhecer a existência da varia- bilidade na produção e administrá-la e Identificar instantane- amente focos e locais de disfunção e corrigir os problemas a tempo. Questão 3 c. ( x ) Auxiliar na eliminação de causas especiais, trazendo o processo para o estado de controle. Capítulo 3 Gráficos de Controle 65 Questão 4 Uma de difícil controle que é a variação aleatória e outra chamada variação controlável. Questão 5 Um processo está sob controle quando: a.( x ) Os resultados de medição apresentam variação dentro dos limites de controle. Como construir gráficos de controle no Excel Após a realização dos cálculos para determinar os limites para o gráfico, em uma planilha do Excel, coloque as informações obtidas da seguinte forma: 66 Tratamento de Dados Vá até a barra de ferramentas na opção Inserir – gráfico de linhas - Probabilidade  Este capítulo tem por objetivo apresentar os conceitos básicos de probabilidade, viabilizando ao aluno o ra- ciocínio lógico e probabilístico na resolução de proble- mas. Ao final deste estudo, espera-se que o aluno resolva problemas aplicando, para isso, os conhecimentos bási- cos de probabilidade aprendidos. Simone Echeveste Capítulo 4 68 Tratamento de Dados Conceitos básicos de probabilidade A Teoria das Probabilidades se apresenta como um estudo teórico de fenômenos envolvendo a incerteza, utilizando fer- ramentas básicas do Cálculo Matemático. Esses fenômenos, conhecidos como aleatórios, estocásticos ou não determinísti- cos, são aqueles que a sua repetição, em condições idênticas, produz resultados diferenciados, isto é, não é possível determi- nar, com exatidão, qual o seu resultado. A Probabilidade é o ramo da matemática que trata de fenô- menos aleatórios. A observação de um fenômeno aleatório por parte do homem é chamada de experimento aleatório. Características de um experimento aleatório: 1ª) Não se conhece um particular valor do experimento antes dele ser executado, porém podemos descrever todos os possíveis resultados – as possibilidades – o conjunto das possibilidades de um experimento aleatório é denominado de Espaço Amostral (S). 2ª) Quando o experimento é repetido algumas vezes, os re- sultados ocorrem de uma forma aparentemente acidental. Mas quando o número de repetições aumenta, uma regu- laridade aparecerá. E essa regularidade que torna possível construir um modelo matemático preciso para analisar o experimento. Capítulo 4 Probabilidade 69 Definição de probabilidade Na definição clássica de probabilidade, considerando que todos os resultados possíveis são equiprováveis, podemos de- finir probabilidade de um evento qualquer A como: Exemplo Considere uma caixa contendo 10 brindes: 4 livros, 2 celula- res, 1 rádio e 3 perfumes. Você tem direito a um desses brindes que serão sorteados. Qual a probabilidade de você: a) Ganhar um livro? b) Ganhar um celular? c) Ganhar um rádio ou um celular? d) Não ganhar perfume? Resolução: Vamos considerar então que, ao todo, nessa caixa, temos 10 brindes dos quais apenas 1 deles será seu. Então o Espaço amostral (conjunto de todos os possíveis resultados de um ex- perimento) pode assim ser definido: S = { livro, celular, rádio, perfume} 70 Tratamento de Dados a) Ganhar um livro Como temos na caixa 4 livros em um total de 10 brindes, a probabilidade de ganhar um livro é: b) Ganhar um celular c) Ganhar um rádio ou um celular d) Não ganhar perfume Não esqueça! A probabilidade de um evento A deve ser sempre: 0 ≤ P(A) ≤ 1 ou ainda 0% ≤ P(A) ≤ 100% Capítulo 4 Probabilidade 71 Propriedades da probabilidade Propriedade 1: Probabilidade Complementar A probabilidade complementar de A É o evento formado por todos os resultados do espaço amostral que não pertencem à A. A probabilidade de não ocorrência de A é descrita como )(AP e é expressa da forma: )(1)( APAP −= Propriedade 2: Regra da Adição  Se A e B são dois eventos independentes, então: A B P(A ou B) = P(A) + P(B) Exemplo Ao retirar uma carta do baralho, considere os eventos: A – retirar um Ás e R – retirar um Rei. Qual a probabilidade de selecionar aleatoriamente uma carta desse baralho e ela ser um Ás ou um Rei? P(A ou R) = P(A) + P(R) = 4/52 + 4/52 = 8/52 = 0,1538 72 Tratamento de Dados  Se A e B são dois eventos dependentes, então: A B P(A ou B) = P(A) + P(B) – P(A e B) Exemplo Ao retirar uma carta do baralho, considere os eventos: A – re- tirar um Ás e E – retirar uma carta no naipe Espadas. Qual a probabilidade de selecionar aleatoriamente uma carta desse baralho e ela ser um Ás ou uma carta do naipe de espadas? P(A ou E) = P(A) + P(E) – P(A e E) 4/52 + 13/52 – 1/52 = 16/52 = 0,3077 Atenção! Dois eventos são independentes quando a ocorrência ou não de um evento não tem efeito algum na probabilidade de ocor- rência do outro evento. Dois eventos são dependentes quando a ocorrência ou não ocorrência de um evento afeta a probabi- lidade de ocorrência do outro. Capítulo 4 Probabilidade 73 Mais exemplos de aplicação das propriedades Questão 1 De 300 estudantes do curso de Engenharia, 100 são matricu- lados em Geometria Analítica e 80 em Estatística. Esses dados incluem 30 estudantes que estão matriculados em ambas as disciplinas. Qual a probabilidade de um estudante de enge- nharia selecionado ao acaso estar matriculado em Geometria Analítica ou Estatística? Vamos considerar os eventos: GA – estar matriculado em Geometria Analítica E – estar matriculado em Estatística Qual a probabilidade de um estudante de engenharia se- lecionado ao acaso estar matriculado em Geometria Analítica ou Estatística? 74 Tratamento de Dados Questão 2 De 100 pessoas que solicitaram emprego de engenheiro de produção, durante o ano passado, 65 possuíam experiência anterior e 30 possuíam um certificado profissional. Vinte dos candidatos possuíam tanto experiência anterior como certifi- cado profissional. Qual a probabilidade de um candidato se- lecionado ao acaso desse grupo ter experiência anterior ou certificado profissional? Vamos considerar os eventos: EA – possuir experiência anterior CP – possuir certificado profissional Qual a probabilidade de um candidato selecionado ao acaso desse grupo ter experiência anterior ou certificado pro- fissional? Capítulo 4 Probabilidade 75 Propriedade 3: Regra da Multiplicação  Se A e B são dois eventos independentes, então: P(A e B) = P(A) x P(B) Exemplo Em uma linha de produção, a probabilidade de uma peça fa- bricada estar fora das especificações em relação a sua largura é 2%, em relação ao seu comprimento é 5%. Considere que a ocorrência de defeito na largura ou comprimento acontece de forma independente. Uma peça foi aleatoriamente selecionada dessa linha de produção e seu comprimento e largura verificados pelo controle de qualidade, qual a probabilidade dessa peça: a) Apresentar defeito na largura e no comprimento P(DL e Dc) = 0,02 x 0,05 = 0,001 b) Apresentar defeito apenas na largura P(DL e Pc) = 0,02 x 0,95 = 0,019 c) A peça ser perfeita na largura e no comprimento P(PL e Pc) = 0,98 x 0,95 = 0,931 d) A peça apresentar pelo menos um desses defeitos P(DL e Pc) ou P(PL e Dc) ou P(DL e Dc)= (0,02 x 0,95) + (0,98 x 0,05) + (0,02 x 0,05) = 76 Tratamento de Dados 0,019 + 0,049 + 0,001 = 0,069 Propriedade 4: Probabilidade Condicional  Se A e B são dois eventos dependentes, então: Quando dois eventos são dependentes, o conceito de pro- babilidade condicional é empregado para indicar a probabi- lidade de ocorrência de um evento relacionado. A expressão P(B/A) indica a probabilidade de ocorrer o evento B, dado que tenha ocorrido o evento A . P(A e B) = P(A) x P(B/A) Onde: P(A) B) eP(A P(B/A) = Exemplo Um lote de 10 peças produzidas por uma fábrica contém 8 peças boas e 2 defeituosas. Duas peças são retiradas alea- toriamente sem reposição pelo comprador do lote. Qual é a probabilidade de: a) As duas peças serem boas P(B1 e B2) = P(B1) x P(B2/B1) = 8/10 x 7/9 = 56/90 = 0,6222 b) A primeira peça ser boa e a segunda defeituosa P(B1 e D2) = P(B1) x P(D2/B1) = 8/10 x 2/9 = 16/90 = 0,1777 c) As duas peças serem defeituosas P(D1 e D2) = P(D1) x P(D2/D1) = 2/10 x 1/9 = 2/90 = 0, 0222 Capítulo 4 Probabilidade 77 ÁRVORE DE PROBABILIDADES 8 Boas 2 Defeituosas __________ 10 peças Boa 8/10 Defeituosa 2/10 Boa 7/9 Boa 8/9 Defeituosa 2/9 Defeituosa 1/9 1ª Peça 2ª Peça Mais exemplos de aplicação das propriedades Questão 1 Um sistema tem dois componentes A e B que operam inde- pendentemente. Suponha que a probabilidade de falha do componente A seja 10% e do componente B 20%. Qual é a probabilidade de: a) A falha do sistema ocorrer em ambos componentes 78 Tratamento de Dados b) A falha do sistema ocorrer apenas no componente A Utilizando a propriedade 1 da probabilidade complementar: Então A falha do sistema ocorrer apenas no componente A: c) Não ocorrer falha no sistema Então Não ocorrer falha no sistema Questão 2 Dos eleitores de certa comunidade, 33% são homens e 10% dos eleitores votaram em branco na última eleição. Supondo Capítulo 4 Probabilidade 79 que esses eventos sejam independentes, determine a probabi- lidade de escolher aleatoriamente um homem e este ter votado em branco na última eleição. Considere os eventos: H – ser homem B – votar em branco Recapitulando O estudo da probabilidade viabiliza o entendimento das chan- ces associadas aos fenômenos aleatórios presentes em várias atividades do nosso dia a dia. A definição clássica de uma probabilidade é Para a resolução dos problemas, podemos considerar algu- mas propriedades importantes do cálculo das probabilidades: Probabilidade Complementar: )(1)( APAP −= 80 Tratamento de Dados Regra da Adição: Se A e B são dois eventos independentes: P(A ou B) = P(A) + P(B) Se A e B são dois eventos dependentes: P(A ou B) = P(A) + P(B) – P(A e B) Regra da Multiplicação: Se A e B são dois eventos independentes: P(A e B) = P(A) x P(B) Se A e B são dois eventos dependentes: P(A e B) = P(A) x P(B/A) Onde: P(A) B) eP(A P(B/A)= Atividades Questão 1. Um pacote de sementes de flores contém 4 se- mentes de flores vermelhas, 3 amarelas, 3 roxas e 1 flor la- ranja. Escolhida ao acaso, uma semente desse pacote, qual a probabilidade de: a) ser de flor vermelha ou laranja? b) não ser de flor amarela? c) ser roxa? Questão 2. A probabilidade de um homem estar vivo daqui a 30 anos é de 40% e de sua mulher é de 65%. Qual a proba- bilidade de que daqui a 30 anos: a) Ambos estejam vivos. b) Somente a mulher esteja viva. Capítulo 4 Probabilidade 81 Questão 3. Marcelo tem dois velhos automóveis. Nas manhãs frias, há 20% de probabilidade de um deles não pegar e 30% do outro não pegar. Em uma manhã fria, qual a probabilidade de nenhum dos carros pegar? Questão 4. Uma urna contém 7 moedas de 50 centavos e 5 mo- edas de 10 centavos. Duas moedas são retiradas ao acaso, sem reposição. Qual a probabilidade de se retirar dessa urna 1 real. Questão 5. Verificou-se que, na exportação de um artigo de higiene, problemas relacionados à embalagem ocorrem com probabilidade de 0,02, e que problemas relacionados à con- sistência desse produto ocorrem com uma probabilidade de 0,05. Considerando que esses problemas ocorrem de forma independente do outro, qual é a probabilidade de ao sele- cionar ao acaso um desses artigos de higiene este apresentar pelo menos um desses problemas? Gabarito Questão 1 a) P(V ou L) = 5/11 = 0,4545 b) P(não Amarela) = 8/11 = 0,7272 c) P(R) = 3/11 = 0,2727 Questão 2 a) P(Ambos estejam vivos) = 0,26 b) P(Somente a mulher esteja viva) = 0,39 82 Tratamento de Dados Questão 3 P(Nenhum pegar) = 0,60 Questão 4 P(50 centavos) = 7/12 = 0,5833 P(10 centavos) = 5/12 = 0,4167 p(1 real) = p(50 e 50) = 0,5833 x 0,5833 = 0,3403 Questão 5 P(Embalagem) = 0,02 P(Consistência) = 0,05 P(E e C) = P(E) X P(C) = 0,02 X 0,05 = 0,001 Distribuições de Probabilidade  Este capítulo tem por objetivo apresentar as principais distribuições de probabilidades aplicadas à área da Engenharia, trazendo exemplos da área. O aluno deverá conseguir identificar, para cada situação, a distribuição de probabilidade indicada para resolvê-la bem como aplicar corretamente os modelos na resolução dos problemas. Simone Echeveste Capítulo 5 84 Tratamento de Dados Uma distribuição de probabilidades é caracterizada pela construção de um modelo matemático que representa para uma variável aleatória “X” as probabilidades associadas aos possíveis valores que essa variável pode assumir. Seu objeti- vo é determinar a probabilidade de ocorrência de cada valor que uma variável aleatória pode assumir, ou seja, é uma cor- respondência que associa probabilidades aos valores de uma variável aleatória, ou ainda, é uma Função que relaciona a probabilidade de ocorrência de um valor da variável aleatória: P(X=x) = f(x) 5.1 Distribuição binomial A distribuição Binomial é útil para avaliar experimentos em que so- mente dois resultados são possíveis: sucesso ou fracasso que são mutuamente excludentes. As características dessa distribuição são: Características:  O experimento pode ser repetido “n” vezes em condi- ções essencialmente inalteradas;  Há apenas dois resultados possíveis em cada repetição, denominados sucesso (p) e fracasso (1-p)  As probabilidades “p” (sucesso) e “1-p” (fracasso) per- manecem constantes em todas as repetições.  As repetições são independentes, ou seja, o resultado de uma repetição não é influenciado por outros resultados. Capítulo 5 Distribuições de Probabilidade 85 O modelo binomial Exemplo 1 A probabilidade da ocorrência de peças defeituosas em um lote produzido por uma fábrica é de 5%. Cinco lotes são inves- tigados, qual é a probabilidade de: a) Somente um lote contenha uma peça defeituosa n = 5 lotes x = nº lotes com peças defeituosas p = 0,05 (5%) (1-p) = 1- 0,05 = 0,95 (95%) Pede-se: somente um lote contenha peças defeituosas – P(x = 1) 86 Tratamento de Dados b) Nenhum lote contenha peças defeituosas n = 5 lotes x = nº lotes com peças defeituosas p = 0,05 (5%) (1-p) = 1- 0,05 = 0,95 (95%) Pede-se: nenhum lote contenha peças defeituosas – P(x = 0) Exemplo 2 A probabilidade de ocorrer problemas na direção hidráulica de um caminhão de uma determinada marca é de 0,10. Con- siderando uma frota de 8 caminhões dessa marca, qual é a probabilidade de que metade deles venha a ter problemas na direção hidráulica? X = Nº de caminhões com problemas na direção hidráulica p = 0,10 (a probabilidade de um caminhão ter problemas na direção hidráulica) (1-p) = 0,90 n = 8 caminhões Capítulo 5 Distribuições de Probabilidade 87 Pede-se: P(metade da frota de 8 caminhões apresentar problemas na direção hidráulica) P(x=4) Resolução: P(x= 4) = 0,0046 0,6561 . 0,0001 . 70 .0,90.0,10 4!.4! 8! 44 == P(x= 4) = 0,0046 Média ou valor esperado da distribuição binomial Se a variável aleatória X possui distribuição Binomial, então sua média e seu desvio-padrão podem ser definidos como: )1.(. ppn –=σpnxE .)( ==µ Média Desvio -padrão Exemplo Vamos considerar o exemplo anteriormente visto: a probabi- lidade de ocorrer problemas na direção hidráulica de um ca- minhão de uma determinada marca é de 0,10. Considerando uma frota de 8 caminhões dessa marca, qual é a probabili- dade de que metade deles venha a ter problemas na direção hidráulica? 88 Tratamento de Dados A média de caminhões com problemas na direção hidráu- lica, ou ainda o valor esperado de caminhões com problemas na direção hidráulica seria de: E o desvio-padrão: 5.2 Distribuição Poisson Depois da Binomial, a distribuição de Poisson é a distribuição de probabilidade discreta mais utilizada, pois pode ser apli- cada a muitos casos práticos nos quais interessa o número de vezes que um determinado evento pode ocorrer durante um intervalo de tempo ou em um determinado ambiente físico, por exemplo:  O número de acidentes de carros por dia em uma gran- de cidade.  O número de garrafas mal fechadas por trinta minutos na máquina de enchimento de cerveja.  O número de defeitos de soldagem em seis metros de tubo. Em um processo de Poisson, podem ser observados eventos discretos em uma área de oportunidade de tal forma que, re- Capítulo 5 Distribuições de Probabilidade 89 duzindo suficientemente essa área de oportunidade, que pode ser um intervalo de tempo, espaço, ou área na qual mais de uma ocorrência de um evento pode ocorrer: Características da distribuição Poisson  A probabilidade de observar apenas um sucesso no in- tervalo é estável.  A probabilidade de observar mais de um sucesso no in- tervalo é zero.  A ocorrência de um sucesso em qualquer intervalo é es- tatisticamente independente da ocorrência em qualquer outro intervalo. A distribuição de Poisson é caracterizada apenas pelo pa- râmetro λ. Enquanto a variável aleatória do processo de Poisson “X” se refere ao número de sucessos por área de oportunidade, o parâmetro λ se refere ao valor esperado, ou média, do núme- ro de sucessos por área de oportunidade. O modelo Poisson A probabilidade de ocorrerem exatamente “x” eventos é dada por: 90 Tratamento de Dados Onde: P(x) = a probabilidade de x ocorrências em um intervalo p = número de ocorrências por unidade (tempo ou espaço) λ = valor esperado ou número médio de ocorrências em um intervalo e ≅ 2,71828 (número de Euler) Exemplo 1 Em uma linha de produção, uma peça é finalizada a uma taxa λ = 2 peças por minuto. Qual a probabilidade de que, nessa mesma linha, sejam finalizadas 8 peças no próximo 1 minuto? x = Nº peças finalizadas n = 1 minuto p = λ = n . p = Pede-se: P(x = 8 peças finalizadas) Capítulo 5 Distribuições de Probabilidade 91 Exemplo 2 Os defeitos na produção de espumas para revestimentos ocor- rem a uma taxa de 2 defeitos a cada 10 metros. Determine a probabilidade de que, em três metros ocorram: a) nenhum defeito; b) 3 defeitos. Informações Importantes: x = nº de defeitos p = = 0,2 n = 3 metros λ = n . p = a) Nenhum defeito Pede-se: P(x = 0) b) Ocorram 3 defeitos Pede-se: P(x = 3) 5.3 Distribuição Normal A distribuição Normal é o modelo probabilístico mais utilizado no tratamento estatístico de dados, pois diversas ferramentas 92 Tratamento de Dados estatísticas necessitam da suposição de que os dados se distri- buam normalmente para ser utilizadas. A sua função densidade de probabilidade f(x) é dada por: 2 2 2 )( 2 1)( σ µ− − σπ = x exf ; para –∞ < x < ∞, –∞ < µ < ∞ e σ2 > 0 Os parâmetros da Normal são a média (µ) e o desvio- -padrão (σ), que permitem infinitas curvas normais com dife- rentes formatos (mas sempre simétricas). O gráfico da função densidade de probabilidade é apresentado a seguir: Distribuição Normal .500 .450 .400 .350 .300 .250 .200 .150 .100 .050 .000 µ − 4σ µ − 3σ µ − 2σ µ − 1σ µ µ + 1σ µ + 2σ µ + 3σ µ + 4σ Figura 7 Gráfico da Curva Normal. Características da distribuição normal  Sua curva de probabilidades tem forma de sino.  A área total sob a curva é igual a 1. Capítulo 5 Distribuições de Probabilidade 93  No ponto mais alto na curva, encontra-se a média da distribuição.  A curva é simétrica em relação à média.  O desvio padrão determina a largura da curva. Quanto maior o desvio padrão, mais larga e mais plana tende a ser a curva, mostrando a variabilidade nos dados.  As probabilidades para a variável aleatória normal são dadas por áreas sob a curva. A distribuição Normal, independentemente dos valores dos parâmetros, apresenta sempre a seguinte relação: f (x) Distribuição Normal 68,26% 95,46% 99,73% µ ± 1σ µ ± 2σ µ ± 3σ µ x Figura 8 Áreas importantes da Curva Normal. 94 Tratamento de Dados Distribuição normal-padrão ou normal reduzida – Z A função densidade de probabilidade f(x) da distribuição nor- mal depende dos valores de µ e σ, por essa razão teremos vá- rias equações para vários diferentes valores de µ e σ. Todas as curvas normais representativas de distribuições de frequências podem ser transformadas em uma curva normal padrão, usan- do-se a média µ e o desvio padrão σ da variável em estudo. Para evitar cálculos com a integração, uma tabela única foi desenvolvida para uma variável aleatória agora chamada de “Z” com µ=0 e σ=1, e sua distribuição de probabilidades é definida como normal padronizada, ou ainda normal padrão. Seja X uma variável aleatória normalmente distribuída com quaisquer parâmetros média µ e desvio-padrão σ. Para reali- zar o processo de padronização, devemos realizar a seguinte transformação: σ µ− = xZ Onde: x = valor de interesse da variável µ = média da variável σ = desvio-padrão da variável Após a padronização, poderemos obter as probabilidades associadas a cada área a partir da Tabela Normal padrão apresentada a seguir: Capítulo 5 Distribuições de Probabilidade 95 Tabela da Distribuição Normal Padrão P(Z<z) – VALORES POSITIVOS z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633 1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706 1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817 2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890 2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916 2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
Compartilhar