Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 TRATAMENTO DE DADOS Simone Echeveste 2 SUMÁRIO Introdução ................................................................................................. 003 1. Conceitos Básicos de Estatística .......................................................... 004 1.1.Tabelas de frequência ........................................................................ 008 2. Medidas Estatísticas ............................................................................. 016 2.1. Medidas de Tendência Central ................................................. 017 2.1.1. Média ..................................................................................... 017 2.1.2. Mediana ................................................................................. 020 2.1.3. Moda ...................................................................................... 023 2.2. Medidas de Variabilidade ......................................................... 024 2.2.1. Variância ................................................................................ 026 2.2.2. Desvio-padrão ....................................................................... 028 2.2.3. Coeficiente de Variação ........................................................ 032 3. Gráficos de Controle ............................................................................. 043 4. Probabilidade ........................................................................................ 060 5. Distribuições de probabilidade .............................................................. 075 5.1. Distribuição Binomial ................................................................ 076 5.2. Distribuição Poisson ................................................................. 079 5.3. Distribuição Normal .................................................................. 082 6. Intervalos de Confiança ........................................................................ 102 6.1. Intervalo de Confiança para média ........................................... 103 6.2. Intervalo de Confiança para proporção .................................... 110 7. Testes de hipóteses .............................................................................. 115 7.1. Teste t-student para uma média ............................................... 121 7.2. Teste t-student para comparação de duas médias .................. 131 7.3. Teste para proporção ............................................................... 140 8. Análise de Variância ............................................................................. 146 8.1. Teste de comparações múltiplas de Tukey .............................. 155 9. Análise de Correlação .......................................................................... 160 10. Análise de regressão linear simples ................................................... 176 3 INTRODUÇÃO O grande avanço tecnológico das últimas décadas gerou a necessidade de formação de profissionais capazes de acompanhar este desenvolvimento com habilidades para gerar e analisar dados, produzindo informação útil a ser utilizada na resolução de problema. Neste contexto as ferramentas estatísticas são imprescindíveis e o conhecimento das mesmas torna-se necessário para qualquer profissional. . A Estatística hoje se configura como uma das ciências que mais vem crescendo em termos de utilização e importância na Engenharia: estudos de qualidade, confiabilidade, desenvolvimentos de novos produtos, avaliação de metodologias de produção, novos materiais, etc. são alguns exemplos da ampla utilização das ferramentas estatísticas para resolução de problemas e tomada de decisões nesta área. A disciplina de Tratamento de Dados tem por objetivos: propiciar ao aluno o estudo da estatística com vistas a análise de dados experimentais, cálculo e interpretação das medidas descritivas, uso de probabilidades e raciocínio lógico na resolução de problemas, utilização de testes estatísticos como ferramenta de análise de comparação e relação de dados no contexto das organizações industriais. Os conteúdos serão apresentados em 10 capítulos contendo a explicação teórica dos mesmos, bem como a apresentação de exemplos e aplicações em problemas na área da Engenharia. Em cada capítulo será destacado o objetivo de cada ferramenta estatística bem como a interpretação dos resultados obtidos. 1. CONCEITOS BÁSICOS DE ESTATÍSTICA 4 Simone Echeveste Neste capítulo será apresentado o contexto da pesquisa em que a estatística está inserida, bem como serão destacados os principais conceitos básicos de estatística. O objetivo aqui é que o aluno compreenda o vocabulário pertinente à análise estatística e que seja capaz de identificar as variáveis de um estudo, organizando-as em tabelas de frequencia. Ao final deste capítulo espera-se que o aluno, dada uma situação problema, identifique corretamente a amostra de estudo e as variáveis envolvidas, bem como construa tabelas de frequência como forma de resumo e apresentação de dados. CONCEITOS DE ESTATÍSTICA E O SEU PAPEL NA CIÊNCIA A necessidade de analisar um conjunto de dados estatisticamente está sempre inserida no contexto de uma pesquisa, ou seja, temos inicialmente uma situação problema a ser resolvida, ou ainda uma hipótese a ser testada e para isso uma pesquisa deve ser realizada. Com isso, em uma pesquisa destaca-se a importância da utilização da estatística de acordo com os seguintes fatores: a) Em uma pesquisa, muitas vezes são realizados estudos experimentais ou observacionais que culminam em uma coleção de dados numéricos que devem ser organizados e resumidos. b) O padrão de variação nos dados faz com que a resposta não seja óbvia, ou seja, somente tratando os dados adequadamente é que poderemos verificar o comportamento das variáveis de estudo. 5 c) Uma análise estatística é composta por métodos para coleta e descrição dos dados, viabilizando a verificação da força da evidência nos dados pró ou contra as hipóteses de pesquisa. A presença de uma variação não previsível nos dados faz disso, muitas vezes, uma tarefa pouco trivial. Figura 1. O papel da Estatística na pesquisa Em toda a pesquisa realizada almeja-se a resposta a um problema ou ainda uma situação- problema que está vinculada a uma tomada de decisão a ser realizada. Podemos considerar que nossa decisão pode ser tomada através de dois tipos de soluções: a primeira que pode ser considerada uma solução empírica que se fundamenta na observação e na experiência, livre de um método científico – é uma forma de solução muitas vezes subjetiva que pode levar a tomada de decisão errada. O outro tipo de solução seria através do método científico, à luz de dados provenientes de uma pesquisa que segue uma metodologia pré-determinada para garantir a imparcialidade das informações obtidas. Neste caso as ferramentas estatísticas são indispensáveis para a viabilização de uma tomada de decisão com menores riscos e incertezas. Problema Tomada de Decisão Solução através de Experiências passadas, "palpites" Solução através da ciência - Estatística 6 Rao (1999) define estatística como: "A estatística é uma ciência que estuda e pesquisa sobre: o levantamento de dados com a máxima quantidade de informação possível para um dado custo; o processamento de dados para a quantificação da quantidade de incerteza existente na resposta para um determinado problema; a tomada de decisões sob condições de incerteza, sob o menor risco possível. Finalmente, a estatística tem sido utilizada na pesquisa científica, para a otimização de recursos econômicos, para o aumento da qualidade e produtividade,na otimização em análise de decisões” Dentre os conceitos importantes frequentemente utilizados na Estatística estão as definições de População e Amostra: A Estatística pode ser dividida em duas áreas: Descritiva e Inferencial. A área descritiva é mais simples, contemplando ferramentas de organização de dados e síntese de informação. A área Inferencial, por sua vez, permite ao pesquisador projetar resultados amostrais para populações, bem como testar hipóteses concernentes a parâmetros populacionais. Inferência estatística é o processo pelo qual estatísticos tiram conclusões acerca da população usando informação de uma amostra. A Estatística Inferencial está baseada em dois pilares fundamentais: a Amostragem e a Probabilidade. Uma população (N) é conjunto de elementos de interesse em um determinado estudo, que podem ser pessoas ou resultados experimentais, com uma ou mais características comuns, que se pretendem estudar. Uma amostra (n) é um subconjunto da população usado para obter informação acerca do todo. Obtemos uma amostra para fazer inferências de uma população. Nossas inferências são válidas somente se a amostra é representativa da população. 7 Outro conceito importante é o conceito da Variável, que vem a ser a matéria prima de qualquer pesquisa, ou seja, quando se termina uma coleta de dados em um primeiro momento dispomos de um conjunto de valores ou ainda respostas pertinentes as nossas variáveis de pesquisa. As variáveis podem ser classificadas em: a) Variáveis Quantitativas: são as características que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numéricos/quantidades. Podem ser contínuas ou discretas. Discretas: características mensuráveis que podem assumir apenas um número finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros. Exemplos: número de falhas, número de itens perfeitos números de carros vendidos, etc. Contínuas: características mensuráveis que assumem valores em uma escala para as quais valores fracionais fazem sentido. Exemplos: comprimento da peça , temperatura, tempo de vida de um componente eletrônico, etc. b) Variáveis Qualitativas (ou categóricas): são as características que não possuem valores quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, representam uma classificação dos elementos. Podem ser nominais ou ordinais. Uma variável (x) é uma característica dos elementos investigados que difere de um elemento para outro e do qual temos interesse em estudar. Cada unidade (elemento) da população que é escolhido como parte de uma amostra fornece uma medida de uma ou mais variáveis, também chamadas observações. 8 Variáveis Qualitativas nominais: não existe ordenação dentre as categorias. Exemplos: marca do carro, tipo de fornecedor, região de produção, etc. Variáveis Qualitativas ordinais: existe uma ordenação entre as categorias. Exemplos: escolaridade (Fundamental, Médio ou Superior), grau de importância (nenhuma, pouca, razoável, muito), etc. 1.1. ANÁLISE DESCRITIVA: TABELAS DE FREQUENCIA O primeiro contato do pesquisador com os seus dados é feito através da construção das tabelas de frequência, podemos dizer que neste momento os dados recebem o seu primeiro tratamento. Nesta etapa de análise o pesquisador identificará as possíveis respostas a uma determinada variável e o comportamento das mesmas no que se refere a sua frequência. A tabela de frequência tem por objetivo apresentar os resultados de cada variável de uma forma organizada e resumida. Nesta tabela encontramos o número de repetições de cada categoria de resposta de uma variável bem como o seu percentual no grupo investigado. De acordo com as normas da ABNT (Associação Brasileira de Normas Técnicas) e do IBGE (Instituto Brasileiro de Geografia e Estatística) as tabelas de frequência devem considerar os seguintes elementos: a) Título: deve conter as informações necessárias para que se compreenda “o que” está sendo apresentado na tabela, “onde” os dados foram obtidos e “quando” esses dados foram coletados. b) Cabeçalho: indica a natureza do conteúdo de cada coluna da tabela. c) Corpo da Tabela: é a parte composta por linhas e colunas com as informações observadas. 9 d) Rodapé: espaço logo abaixo da tabela que pode ser utilizado para a apresentação de notas ou observações de natureza informativa. e) Fonte: refere-se à entidade que organizou ou forneceu os dados apresentados na tabela. Exemplo de construção de uma tabela de frequência: Considere uma pesquisa realizada com uma amostra de 20 lotes de parafusos com o objetivo de investigar o número de parafusos fora da conformidade. Os dados observados foram: 0 1 0 2 3 3 2 1 0 4 3 1 0 0 4 2 1 0 1 0 Verifique que temos 20 números apresentados – cada número desses corresponde a um lote. Por exemplo, o primeiro lote possui o parafusos fora da conformidade, o segundo 1 parafuso e assim sucessivamente até o vigésimo lote que possui 0 parafusos não conformes. Para este problema podemos destacar as seguintes informações: a) Variável de pesquisa: Número de parafusos fora da conformidade b) Amostra investigada: 20 lotes Para a construção da tabela precisamos das seguintes informações: 10 c) Valores da variável que surgiram: corresponde às quantidades observadas de parafusos fora da conformidade. Neste caso encontramos 0, 1, 2, 3 e 4 parafusos. d) Frequência (f) de cada valor da variável: corresponde ao número de vezes que cada valor se repetiu. Para o exemplo, podemos observar que 0 parafusos fora da conformidade se repetiu em 7 lotes: 0 1 0 2 3 3 2 1 0 4 3 1 0 0 4 2 1 0 1 0 Na sequência, 1 parafuso fora da conformidade se repetiu em 5 lotes: 0 1 0 2 3 3 2 1 0 4 3 1 0 0 4 2 1 0 1 0 Já 2 parafusos fora da conformidade se repetiu em 3 lotes: 0 1 0 2 3 3 2 1 0 4 3 1 0 0 4 2 1 0 1 0 Para 3 parafusos fora da conformidade observamos uma ocorrência em 3 lotes: 0 1 0 2 3 3 2 1 0 4 3 1 0 0 4 2 1 0 1 0 Por fim, para 4 parafusos fora da conformidade observamos uma ocorrência em 2 lotes: 0 1 0 2 3 3 2 1 0 4 3 1 0 0 4 2 1 0 1 0 11 Agora organizamos essa informação através da estrutura de uma tabela de frequência, considerando todos os seus elementos: Número de parafusos fora da conformidade Fábrica A – Junho 2013 Nº Parafusos Frequência % 0 7 35 1 5 25 2 3 15 3 3 15 4 2 10 Total 20 100 Fonte: Pesquisa Interna Expressão Geral: % = Frequencia (f) Total da amostra (n) × 100 Cálculo da Porcentagem: % 0 𝑝𝑎𝑟𝑎𝑓𝑢𝑠𝑜𝑠 = 7 20 × 100 = 35% % 1 𝑝𝑎𝑟𝑎𝑓𝑢𝑠𝑜 = 5 20 × 100 = 25% % 2 𝑝𝑎𝑟𝑎𝑓𝑢𝑠𝑜𝑠 = 3 20 × 100 = 15% % 3 𝑝𝑎𝑟𝑎𝑓𝑢𝑠𝑜𝑠 = 3 20 × 100 = 15% % 4 𝑝𝑎𝑟𝑎𝑓𝑢𝑠𝑜𝑠 = 2 20 × 100 = 10% IMPORTANTE!!! De acordo com as normas, as tabelas de frequência não podem ser fechadas dos lados e nem ter linhas dividindo as categorias da variável. As únicas linhas permitidas são as que delimitam o cabeçalho e as que delimitam o total e no centro da tabela é opcional colocar ou não o traço divisório das colunas. 12 Recapitulando As ferramentas estatísticas são indispensáveis no tratamento de dados provenientes de uma pesquisa. É através da análise e tratamento de dados que o pesquisador obtém todas as informações pertinentes ao objeto de estudo, propiciando uma tomada de decisão com menores riscos e incertezas. Algumas definições importantes: População (N):: é o conjunto de elementos de interesse em um determinado estudo. Amostra (n):: parte da população selecionadaé a quantidade de elementos investigada Variável (x): é a característica da amostra a ser investigada, ou seja, o que desejamos saber com a pergunta realizada. Categorias: representam as possíveis respostas para a variável investigada. Frequência (f): é o número de vezes que cada categoria da variável se repetiu, ou ainda, quantos elementos investigados optaram por determinada resposta da questão. As tabelas de frequência correspondem a uma forma de apresentação de dados, seus elementos são: Título, Cabeçalho, Corpo, Rodapé e Fonte. Sua estrutura é composta por linhas e colunas. As colunas são determinadas de forma que a variável a ser apresentada e suas respectivas categorias localizam- se na primeira coluna, já na segunda coluna é apresentado a frequência (número de repetições) de cada categoria, e por fim, a terceira coluna representa a porcentagem de cada categoria de resposta. 13 Atividades: Conceitos Básicos de Estatística Considere a seguinte situação de pesquisa: “Um engenheiro realizou uma pesquisa com os pneus radiais de um novo veículo produzido por sua montadora com o objetivo de verificar o desgaste. Para este estudo ele selecionou um grupo de 50 pneus e observou a quilometragem em que estes rodavam até a ocorrência do desgaste dos pneus.” Questão 1. A população desta pesquisa pode ser considerada como sendo: a) Os carros produzidos pela montadora b) Pneus radiais do novo veículo c) Desgaste dos pneus radiais d) Um grupo de 50 pneus investigados e) Quilometragem rodada pelos pneus radiais até ocorrer o desgaste Questão 2. A amostra desta pesquisa pode ser considerada como sendo: a) Os carros produzidos pela montadora b) Pneus radiais do novo veículo c) Desgaste dos pneus radiais d) Um grupo de 50 pneus investigados e) Quilometragem rodada pelos pneus radiais até ocorrer o desgaste Questão 3. A variável desta pesquisa pode ser considerada como sendo: a) Os carros produzidos pela montadora b) Pneus radiais do novo veículo c) Desgaste dos pneus radiais d) Um grupo de 50 pneus investigados e) Quilometragem rodada pelos pneus radiais até ocorrer o desgaste 14 Questão 4. Marque V para verdadeiro e F para falso nas seguintes afirmativas: a) ( ) Em uma pesquisa o padrão de variação nos dados faz com que os resultados não sejam óbvios, por este motivo, os resultados obtidos devem receber um tratamento estatístico que permitirá a verificação do comportamento das variáveis de estudo. b) ( ) As variáveis quantitativas são características que não possuem valores, mas, ao contrário, são definidas por categorias, ou seja, representam uma classificação dos elementos. c) ( ) No título de uma tabela de frequências deve-se colocar todas as informações necessárias para que se compreenda “o que” está sendo apresentado na tabela, “onde” os dados foram obtidos e “quando” esses dados foram coletados. d) ( ) O número de repetições de cada categoria de uma variável é chamado de frequência e é representado pela letra “x”. Questão 5. Os dados a seguir referem-se ao tempo que determinada marca de transformador levou para apresentar a primeira falha grave, em anos, obtidos em um grupo de 15 transformadores. Os resultados do tempo de falhas em anos são dados por: 6 5 6 7 8 8 8 8 5 7 8 7 6 8 6 Construa uma tabela de frequência para representar estes dados. 15 Gabarito das atividades propostas Questão 1. b) Pneus radiais do novo veículo Questão 2. d) Um grupo de 50 pneus investigados Questão 3. e) Quilometragem rodada pelos pneus radiais até ocorrer o desgaste Questão 4. a) V, b) F, c) V, d) F Questão 5. Tempo que determinada marca de transformador levou para apresentar a primeira falha grave, em anos Tempo Frequência % 5 2 13,3 6 4 26,7 7 3 20,0 8 6 40,0 Total 15 100 Fonte: Pesquisa Interna 16 2. MEDIDAS ESTATÍSTICAS Simone Echeveste Neste capítulo iremos abordar as principais medidas estatísticas utilizadas na área da Engenharia. Elas são divididas em dois grupos: Medidas de Tendência Central e Medidas de Variabilidade. Nosso objetivo aqui é a apresentação de cada uma destas medidas no que se refere à aplicabilidade, ao cálculo e à interpretação dos resultados obtidos. O aluno ao final deste capítulo deverá ser capaz de calcular e interpretar as medidas estatísticas apresentadas. Podemos ainda aprofundar um pouco mais a nossa análise estatística para o caso em que as variáveis analisadas sejam QUANTITATIVAS através das medidas estatísticas. Estas medidas dividem-se em dois grupos de medidas: as Medidas de tendência central e as Medidas de variabilidade. 17 Figura 2. Medidas Estatísticas 2.1. MEDIDAS DE TENDÊNCIA CENTRAL Estas medidas têm por objetivo encontrar a “tendência central” de um conjunto de dados, ou seja, encontrar o valor do meio ou ainda os valores típicos de uma distribuição. São medidas úteis para caracterizar e representar um conjunto de dados através de um único valor utilizando critérios distintos para isso. As medidas de tendência central são: média, mediana e moda. 2.1.1. MÉDIA A média é a medida de tendência central mais conhecida e mais utilizada de todas. Existem vários tipos de médias, a que utilizamos em pesquisas é a Média aritmética, obtida através da soma de todos os valores da variável investigada (valores de x) dividida pelo número total de valores no conjunto de dados (total da amostra – n). É representada pelos símbolos �̅� na amostra e por na população. Notação: - média populacional �̅� - média amostral Medidas Estatísticas Medidas de tendência Central Média Mediana Moda Medidas de Variabilidade Variância Desvio- padrão Coeficiente de variação 18 Fórmula: �̅� = ∑ 𝑥 𝑛 onde: = somatório x – variável (valores obtidos para a variável investigada) n – tamanho da amostra Exemplo Os dados abaixo representam o tempo de vida útil (em mil horas) de um conjunto de 7 lâmpadas fluorescentes: 15 18 18 20 17 18 16 Elementos importantes: Amostra (n): 7 lâmpadas fluorescentes Variável (x): tempo de vida útil (em mil horas) Média: �̅� = ∑ 𝑥 𝑛 = 15 + 18 + 18 + 20 + 17 + 18 + 16 7 �̅� = 122 7 = 17,4 �̅� = 17,4 mil horas 19 Interpretação: “Em média o tempo de vida útil destas lâmpadas fluorescentes é de 17,4 mil horas” 20 MÉDIA PARA DADOS AGRUPADOS EM TABELAS DE FREQUENCIA Quando os dados estão organizados na forma de uma tabela de frequências devemos multiplicar os diferentes valores “x” pelas respectivas frequências “f”. A fórmula utilizada deverá ser neste caso: �̅� = ∑ 𝑥 . 𝑓 𝑛 onde: = somatório x – variável f – frequência de cada valor da variável n – tamanho da amostra Exemplo Considere a seguinte tabela referente ao Número de peças defeituosas encontradas em uma amostra de 62 lotes produzidos: Número de peças defeituosas Nº peças (x) Frequência (f) % x.f 0 5 8,0 0 x 5 = 0 2 25 40,3 2 x 25= 50 4 30 48,4 4 x 30= 120 6 2 3,2 6 x 2= 12 Total 62 (n) 100 182 �̅� = ∑ 𝑥 . 𝑓 𝑛 = (0 × 5) + (2 × 25) + (4 × 30) + (6 × 2) 62 21 �̅� = ∑ 𝑥 . 𝑓 𝑛 = 0 + 50 + 120 + 12 62 �̅� = ∑ 𝑥 . 𝑓 𝑛 = 182 62 = 2,9 �̅� = 2,9 peças Interpretação: “Em média cada lote possui 2,9 peças defeituosas” 2.1.2. MEDIANA Ordenados os elementos da amostra em ordem crescente a mediana é o valor considerado o ponto do meio, que a divide ao meio, isto é, metade dos elementos da amostra é menor ou igual à mediana e a outra metade é maior ou igual à mediana.Notação: Md ou Me Como obter a Mediana: 1º) todos os valores do conjunto de dados devem ser colocados em ordem crescente, se houver algum valor que se repita mais de uma vez ele deve repetido na ordenação também. 2º) devemos encontrar a posição da mediana considerando a seguinte regra: se o tamanho da amostra (n) é ímpar, a mediana é o valor central; se o tamanho da amostra (n) for par a mediana será a média dos dois valores centrais. Exemplo 1: Quando o tamanho da amostra “n” for ímpar 22 “Uma pesquisa foi realizada com o objetivo de verificar o pH de 5 amostras de tintas acrílicas de diferentes marcas. Os dados coletados estão apresentados abaixo” 8,0 9,1 8,5 9,7 9,2 Amostra (n): 5 amostras de tintas de diferentes marcas Variável (x): valor do pH Mediana (Md) 1º) Colocar os valores em ordem crescente 8,0 8,5 9,1 9,2 9,7 2º) Encontrar o valor central no conjunto de dados 8,0 8,5 9,1 9,2 9,7 Interpretação: “Metade das amostras de tinta possuem pH de 9,1 ou menos e metade das amostras de tinta possuem pH de 9,1 ou mais.” Exemplo 2: Quando o tamanho da amostra “n” for par Mediana 23 Vamos observar o mesmo exemplo anterior, porém agora vamos considerar um grupo de 6 amostras de tintas acrílicas. “Uma pesquisa foi realizada com o objetivo de verificar o pH de 6 amostras de tintas acrílicas de diferentes marcas. Os dados coletados estão apresentados abaixo” 8,0 8,8 8,5 9,7 9,5 9,2 Amostra (n): 6 amostras de tintas de diferentes marcas Variável (x): valor do pH 1º) Colocar os valores em ordem crescente 8,0 8,5 8,8 9,2 9,5 9,7 2º) Encontrar os dois valores centrais no conjunto de dados 8,0 8,5 8,8 9,2 9,5 9,7 3º) Calcular o ponto médio entre estes dois valores central (somando os dois valores e dividindo por dois) 𝑀𝑑 = 8,8 + 9,2 2 = 18 2 = 9,0 Md = 9,0 Interpretação: “Metade das amostras de tinta possuem pH inferior a 9 e metade das amostras de tinta possuem pH superior a 9.” 2.1.3. MODA Mediana 24 A moda de um conjunto de dados é simplesmente o valor do conjunto de dados que ocorreu com maior frequência, ou seja, que mais se repetiu. Notação: Mo Exemplo Os dados apresentados a seguir são provenientes de experimentos realizados com uma marca de concreto para determinar a resistência (kg/cm2) em uma amostra de 8 unidades: 200 kg/cm2 210 kg/cm2 200 kg/cm2 210 kg/cm2 210 kg/cm2 250 kg/cm2 230 kg/cm2 210 kg/cm2 Amostra (n): 8 unidades Variável (x): resistência do concreto (kg/cm2) Moda Mo = 210 kg/cm2 (este valor se repete quatro vezes na amostra, foi o valor de resistência que mais se repetiu). 200 kg/cm2 210 kg/cm2 220 kg/cm2 210 kg/cm2 210 kg/cm2 250 kg/cm2 230 kg/cm2 210 kg/cm2 Interpretação: “O valor da resistência do concreto que ocorreu com maior frequência foi de 210 kg/cm2”. 25 2.2. MEDIDAS DE VARIABILIDADE Algumas situações podem ocorrer em relação à moda: 1ª) Um conjunto de dados pode não ter moda, ou seja, nenhum valor se repetir Exemplo: Tempo de produção de 5 peças (em minutos) 34, 56, 23, 42, 38 Nenhum valor se repete – não tem moda! 2ª) Um conjunto de dados pode ter mais que uma moda, ou seja, poderemos ter mais que um valor da variável se repetindo com frequências iguais. Exemplo: Número de peças produzidas em 8 dias: 35, 23, 35, 40, 51, 40, 32, 55 Duas modas: 35 e 40 peças! 26 Tão importante quanto representarmos todos os valores de um conjunto de dados através das medidas de tendência central é ter o conhecimento da variação que ocorre em torno desta medida. As medidas de variabilidade são extremamente úteis no tratamento de dados, pois estas indicam a variação existente em torno da média. Vamos considerar o seguinte exemplo apresentado abaixo: Exemplo: Considere uma linha de produção que possui três máquinas em operação: Máquina A, Máquina B e Máquina C. Está sendo investigado o número de unidades com falhas produzidas em três dias de produção. Os dados coletados foram: Observando apenas a média de unidades com falhas das três máquinas investigadas chegaremos à conclusão de que elas são iguais, ou seja, possuem MÁQUINA A Unidades com falhas: 1º Dia: 5 unidades 2º Dia: 0 unidades 3º Dia: 10 unidades Média de vendas: �̅� = ∑ 𝑥 𝑛 = 5 + 0 + 10 3 = 5 Em média a Máquina A produz 5 unidades com falhas por dia. MÁQUINA B Unidades com falhas: 1º Dia: 5 unidades 2º Dia: 5 unidades 3º Dia: 5 unidades Média de vendas: �̅� = ∑ 𝑥 𝑛 = 5 + 5 + 5 3 = 5 Em média a Máquina B produz 5 unidades com falhas por dia. MÁQUINA C Unidades com falhas: 1º Dia: 5 unidades 2º Dia: 4 unidades 3º Dia: 6 unidades Média de vendas: �̅� = ∑ 𝑥 𝑛 = 5 + 4 + 6 3 = 5 Em média a Máquina C produz 5 unidades com falhas por dia. 27 o mesmo comportamento no que se refere à produção de unidades com falhas. Porém ao analisar os dados brutos (unidades com falhas para cada um dos dias investigados) observamos que, embora a média seja a mesma entre as três máquinas, a variação de um dia para o outro possui um comportamento bem distinto. Enquanto que a Máquina A varia de 0 unidades com falha em um dia a 10 unidades com falha em outro, a Máquina B mantém uma produção de unidades com falha constante de 5 unidades em todos os três dias do estudo. Para este caso a análise realizada utilizando somente a média como ferramenta estatística pode induzir o investigador a uma interpretação errônea a respeito dos dados. Por este motivo, além das medidas de tendência central devemos obter as medidas de variabilidade que contribuem para uma melhor interpretação do comportamento de uma variável quantitativa. Estas medidas representam a variação de um conjunto de dados em torno da média. Figura 3. Medidas de Variabilidade 2.2.1. VARIÂNCIA Medias de Variabilidade Variância Desvio-padrão Coeficiente de Variação 28 A variância de uma amostra corresponde à média dos quadrados dos desvios dos valores em relação à média, Quanto maior for a variação dos valores do conjunto de dados, maior será a variância. Notação: 2 - variância populacional s2 - variância amostral Fórmula: 𝑠2 = ∑(𝑥− �̅�)2 𝑛−1 onde: x – valores da variável investigada �̅� - média da amostra n – tamanho da amostra Σ - somatório No cálculo da variância pode-se observar que a unidade da variável estudada é levada ao quadrado, dificultando assim, a interpretação de seu resultado final. A solução para este problema é extrair a raiz quadrada da variância, permitindo assim que se volte à unidade original da variável. Essa nova medida (a raiz quadrada da variância) é chamada de desvio-padrão. 2.2.2. DESVIO-PADRÃO Propriedades da Variância 1. Somando-se (ou subtraindo-se) a cada elemento de um conjunto de valores uma constante, a variância não se altera; 2. Multiplicando-se (ou dividindo-se) cada elemento de um conjunto de valores por um valor constante, a variância fica multiplicada (ou dividida) pelo quadrado da constante. 29 O desvio-padrão corresponde à raiz quadrada da variância. Esta medida expressa a variação média do conjunto de dados em torno da média, para mais ou para menos na mesma unidade de medida da média. Notação: - desvio-padrão populacional s - desvio-padrão amostral Fórmula: 𝑠 = √ ∑(𝑥−�̅�)2 𝑛−1 O desvio-padrão de uma amostra pode ser calculado considerando as seguintes etapas: Figura 12.Etapas para o cálculo do Desvio-padrão Propriedades do Desvio-padrão 1. Somando-se (ou subtraindo-se) a cada elemento de um conjunto de valores uma constante, o desvio-padrão não se altera; 2. Multiplicando-se (ou dividindo-se) cada elemento de um conjunto de valores por um valor constante, o desvio-padrão fica multiplicado (ou dividido) pela constante. 30 Vamos considerar o exemplo inicial da comparação do número de unidades com falhas entre as máquinas A, B e C em uma amostra de 3 dias: Importante: Amostra (n): 3 dias Variável (x): Número de unidades produzidas com falhas MÁQUINA A 1ª) Calcular a média 2ª) Subtrair a média de cada valor do conjunto (desvio) 3ª) Elevar ao quadrado cada desvio 4ª) Somar os quadrados dos desvios 5ª) Dividir esta soma por (n-1) 6ª) Extrair a raiz quadrada MÁQUINA A Unidades com falhas: 1º Dia: 5 unidades 2º Dia: 0 unidades 3º Dia: 10 unidades MÁQUINA B Unidades com falhas: 1º Dia: 5 unidades 2º Dia: 5 unidades 3º Dia: 5 unidades MÁQUINA C Unidades com falhas: 1º Dia: 5 unidades 2º Dia: 4 unidades 3º Dia: 6 unidades 31 Média de vendas: �̅� = 5 𝑠 = √ ∑(𝑥 − �̅�)2 𝑛 − 1 = √ (5 − 5)2 + (0 − 5)2 + (10 − 5)2 3 − 1 𝑠 = √ (0)2 + (−5)2 + (5)2 3 − 1 𝑠 = √ 0 + 25 + 25 3 − 1 = √ 50 2 = √25 = 5 Interpretação: “Para a Máquina A observa-se que, em média, são produzidas ao dia 5 unidades com falhas com uma variação em torno desta média de 5 unidades.” [ 5 unidades com falha/dia ± 5 unidades com falha/dia ] MÁQUINA B Média de vendas – �̅� = 5 𝑠 = √ ∑(𝑥 − �̅�)2 𝑛 − 1 = √ (5 − 5)2 + (5 − 5)2 + (5 − 5)2 3 − 1 𝑠 = √ ∑(𝑥 − �̅�)2 𝑛 − 1 = √ (0)2 + (0)2 + (0)2 3 − 1 𝑠 = √ 0 2 = √0 = 0 MÁQUINA A Unidades com falhas: 1º Dia: 5 unidades 2º Dia: 0 unidades 3º Dia: 10 unidades MÁQUINA B Unidades com falhas: 1º Dia: 5 unidades 2º Dia: 5 unidades 3º Dia: 5 unidades 32 Interpretação: “Para a Máquina B observa-se que, em média, são produzidas ao dia 5 unidades com falhas com uma variação em torno desta média de 0 unidades.” [ 5 unidades com falha/dia ± 0 unidades com falha/dia ] MÁQUINA C Média de vendas – �̅� = 5 𝑠 = √ ∑(𝑥 − �̅�)2 𝑛 − 1 = √ (5 − 5)2 + (4 − 5)2 + (6 − 5)2 3 − 1 𝑠 = √ ∑(𝑥 − �̅�)2 𝑛 − 1 = √ (0)2 + (−1)2 + (1)2 3 − 1 𝑠 = √ 0 + 1 + 1 3 − 1 𝑠 = √ 2 2 = √1 = 1 Interpretação: “Para a Máquina C observa-se que, em média, são produzidas ao dia 5 unidades com falhas com uma variação em torno desta média de 1 unidade.” [ 5 unidades com falha/dia ± 1 unidades com falha/dia ] Podemos agora comparar as três máquinas utilizando as medidas estatísticas média e desvio-padrão da seguinte forma: MÁQUINA C Unidades com falhas: 1º Dia: 5 unidades 2º Dia: 4 unidades 3º Dia: 6 unidades 33 2.2.3. COEFICIENTE DE VARIAÇÃO Neste momento poderemos questionar: quando um desvio-padrão é grande e quando ele é pequeno? Na verdade, um desvio padrão pode ser considerado grande ou pequeno dependendo da ordem de grandeza da variável. Por este motivo quando desejamos comparar a variabilidade entre métodos, ou ainda entre grupos de valores é indicada a utilização do Coeficiente de Variação que representa o desvio-padrão expresso como uma porcentagem da média.: Notação: C.V. - Coeficiente de variação Fórmula: 𝐶. 𝑉. = 𝑠 �̅� × 100 onde: �̅� - média da amostra s – desvio-padrão No exemplo da comparação das filiais: MÁQUINA A Nesta máquina em média são produzidas 5 unidades com falhas ao dia com uma variação de 5 unidades. [5 ± 5] MÁQUINA B Nesta máquina em média são produzidas 5 unidades com falhas ao dia com uma variação de 0 unidades. [5 ± 0] MÁQUINA C Nesta máquina em média são produzidas 5 unidades com falhas ao dia com uma variação de 1 unidade. [5 ± 1] 34 Analisando as medidas de variabilidade podemos observar que, embora o número médio de unidades com falhas produzidas pelas três máquinas seja o mesmo, não podemos considerar a qualidade da produção destas máquinas a mesma, já que a variabilidade apresenta resultados bem distintos entre as máquinas. Uma informação importante que podemos obter através do Coeficiente de variação diz respeito à homogeneidade de um conjunto de dados comparado a outro, por exemplo, podemos observar que destas filiais a que possui uma produção de unidades com falhas mais homogênea é a máquina B pois possui menor coeficiente de variação (C.V. = 0%), seguida pela máquina C (C.V. = 20%) e, por fim, com maior coeficiente de variação e maior heterogeneidade está a máquina C (C.V. = 100). Figura 4. Interpretação Coeficiente de Variação Exemplo Maior coeficiente de variação - Dados mais HETEROGÊNEOS Menor coeficiente de variação - Dados mais HOMOGÊNEOS MÁQUINA A 𝐶. 𝑉. = 5 5 × 100 𝐶. 𝑉. = 100% MÁQUINA B 𝐶. 𝑉. = 0 5 × 100 𝐶. 𝑉. = 0% MÁQUINA C 𝐶. 𝑉. = 1 5 × 100 𝐶. 𝑉. = 20% 35 Vamos considerar agora um exemplo em que não tenhamos que comparar conjunto de valores: Os dados apresentados a seguir são provenientes de experimentos realizados com uma marca de concreto para determinar a resistência (kg/cm2) em uma amostra de 6 unidades: 200 kg/cm2 210 kg/cm2 200 kg/cm2 210 kg/cm2 250 kg/cm2 230 kg/cm2 Amostra (n): 6 unidades Variável (x): resistência do concreto (kg/cm2) Para estes dados vamos calcular e interpretar a Média e o Desvio-padrão: Média �̅� = ∑ 𝑥 𝑛 = 200 + 210 + 200 + 210 + 250 + 230 6 = 1300 6 = 216,7 �̅� = 216,7 𝑘𝑔/𝑐𝑚2 Variância 𝑠2 = ∑(𝑥 − �̅�)2 𝑛 − 1 (200 − 216,7)2 + (210 − 216,7)2 + (200 − 216,7)2 + (210 − 216,7)2 + (250 − 216,7)2 + (230 − 216,7)2 6 − 1 36 278,9 + 44,89 + 278,9 + 44,89 + 1108,89 + 176,89 5 = 386,67 𝑠2 = 386,67 Desvio-Padrão 𝑠 = √ ∑(𝑥 − �̅�)2 𝑛 − 1 = √386,67 = 19,7 𝑘𝑔/𝑐𝑚2 Interpretação: “Em média a resistência desta marca de concreto é de 216,7 kg/cm2 com uma variação de 19,7 kg/cm2”. [216,7 ± 19,7 kg/cm2] Exemplo para dados agrupados em tabelas de frequência Considere a seguinte tabela anteriormente citado referente ao Número de peças defeituosas encontradas em uma amostra de 62 lotes produzidos: Número de peças defeituosas Nº peças (x) Frequência (f) % x.f 0 5 8,0 0 x 5 = 0 2 25 40,3 2 x 25= 50 4 30 48,4 4 x 30= 120 6 2 3,2 6 x 2= 12 Total 62 (n) 100 182 Para este exemplo já havíamos calculado a média: �̅� = ∑ 𝑥 . 𝑓 𝑛 = 0 + 50 + 120 + 12 62 �̅� = ∑ 𝑥 . 𝑓 𝑛 = 182 62 = 2,9 37 Agora vamos calcular a variância e o desvio-padrão. Neste caso devemos considerar a frequência de cada valor da variável. Variância 𝑠2 = ∑(𝑥 − �̅�)2. 𝑓 𝑛 − 1 Número de peças defeituosas Nº peças (x) Frequência (f) % (𝑥 − �̅�)2. 𝑓 0 5 8,0 (0 – 2,9)2. 5 = 42,05 2 25 40,3 (2 – 2,9)2. 25 = 20,25 4 30 48,4 (4 – 2,9)2. 30 = 36,3 6 2 3,2 (6 – 2,9)2. 2 = 19,22 Total 62 (n) 100 117,82 𝑠2 = ∑(𝑥 − �̅�)2. 𝑓 𝑛 − 1 = 42,05 + 20,25 + 36,3 + 19,22 62 − 1 = 117,82 61 = 1,93 Desvio-padrão 𝑠 = √ ∑(𝑥 − �̅�)2 𝑛 − 1 = √1,93 = 1,4 s = 1,4 peças defeituosas Interpretação: “Em média são produzidas 2,9 peças defeituosas com uma variação de 1,4 peças”. [2,9 ± 1,4 peças defeituosas] 38 Recapitulando Para o caso em que a variável analisada é QUANTITATIVA podemos aprofundar nossa análise através das medidas estatística. Estas medidas dividem-se em dois grupos de medidas: as Medidas de tendência central e asMedidas de variabilidade. As Medidas de Tendência Central (média, mediana e moda) são medidas úteis para caracterizar e representar um conjunto de dados através de um único valor utilizando critérios distintos para isso. Já as Medidas de Variabilidade (Variância, Desvio-padrão e Coeficiente de Variação) são extremamente úteis no tratamento de dados, pois estas indicam a variação existente em torno da média. Quando realizamos o tratamento estatístico de dados provenientes de variáveis quantitativas o cálculo e interpretação destas medidas fornece informação detalhada e de extrema importância na tomada de decisão do pesquisador. 39 Atividades Medidas de Tendência Central e Medidas de Variabilidade Questão 1. Os dados abaixo são referentes às taxas de desemprego (em %) em alguns países selecionados: Grupo 1: Países da América do Sul e América do Norte Brasil Uruguai Chile Argentina Canadá EUA Venezuela 11.4 12.1 5.6 7.3 4.8 5.3 7.3 Grupo 2: Países da Europa Espanha Portugal Itália Alemanha Suécia Inglaterra França 4.8 5.2 4.3 3.8 2.5 5.8 3.6 2a) Complete a tabela abaixo com as medidas estatísticas solicitadas: Comparação das taxas de desemprego (em %) Grupo n Taxa Média Desvio-padrão Coef. Variação Américas do Sul e Norte Europa 2b) Qual dos grupos apresentou resultados mais homogêneos? a) ( ) Países da América do Sul e América do Norte b) ( ) Países da Europa c) ( ) Nenhum dos grupos foi mais homogêneo Questão 2. A companhia GE Esmaltec usa um processo para pintar geladeiras com uma camada de esmalte. Durante cada turno uma amostra de 5 geladeiras é selecionada e a espessura da pintura (mm) é determinada. Considere os seguintes dados coletados: Manhã: 2,7 2,3 2,6 2,4 2,7 Tarde: 2,6 2,3 2,0 2,5 2,4 Noite: 1,8 2,8 2,3 1,6 2,9 a) Calcule as medidas descritivas: média e desvio-padrão da espessura da pintura para cada turno 40 b) Qual turno apresentou resultados mais homogêneos? Questão 3. Um fabricante de molas está interessado em implementar um sistema de controle de qualidade para monitorar seu processo de produção. Para isto, foi registrado o número de molas fora da conformidade em cada lote de produção. Os dados apresentados na tabela de frequência abaixo referem-se a 20 lotes selecionados, observando-se o número de molas fora da conformidade. Tabela 1. Número de molas fora de conformidade Número de molas f % 6 3 15,0 7 6 30,0 8 4 20,0 9 3 15,0 12 4 20,0 Total 20 100,0 a) Calcule e interprete as medidas descritivas: média e desvio-padrão para estes dados. Questão 4. A capacidade em litros dos porta-malas dos carros populares produzidos no Brasil foi investigada obtendo-se os seguintes dados: Corsa: 240 litros Uno: 224 litros Hobby: 325 litros Gol: 146 litros a) Calcule e interprete a Mediana para estes dados. b) Calcule e interprete a média e o desvio-padrão para estes dados. Gabarito das atividades propostas 41 Questão 1. a) Comparação das taxas de desemprego (em %) Grupo n Taxa Média Desvio-padrão Coef. Variação Américas do Sul e Norte 7 7,7% 2,9% 37,7% Europa 7 4,3% 1,1% 25,6% b) O mais homogêneo foi o grupo dos países da Europa, pois possui menor Coeficiente de variação. Questão 2: a) Manhã: Média = 2,5 mm Desvio-padrão = 0,19 mm CV = 7,6 % Tarde: Média = 2,4 mm Desvio-padrão = 0,23 mm CV = 9,6 % Noite: Média = 2,3 mm Desvio-padrão = 0,58 mm CV = 25,2 % b) O turno da manhã, pois o seu coeficiente de variação (CV) foi o menor, comparado com os dos demais turnos. Questão 3. Tabela 1. Número de molas fora de conformidade Número de molas f % 𝑥 . 𝑓 (𝑥 − �̅�)2. 𝑓 6 3 15,0 6 x 3 = 18 (6 – 8,4)2 . 3 = 17,28 7 6 30,0 7 x 6 = 42 (7 – 8,4)2 . 6 = 11,76 8 4 20,0 8 x 4 = 32 (8 – 8,4)2 . 4 = 0,64 9 3 15,0 9 x 3 = 27 (9 – 8,4)2 . 3 = 1,08 12 4 20,0 12 x 4 = 48 (12 – 8,4)2 . 4 = 51,84 Total 20 100,0 167 82,6 Média 42 �̅� = ∑ 𝑥 . 𝑓 𝑛 = 167 20 = 8,4 Variância 𝑠2 = ∑(𝑥 − �̅�)2. 𝑓 𝑛 − 1 = 17,28 + 11,76 + 0,64 + 1,08 + 52,84 20 − 1 = 82,6 19 = 4,35 Desvio-padrão 𝑠 = √ ∑(𝑥 − �̅�)2. f 𝑛 − 1 = √4,35 = 2,1 s = 2,1 molas fora da conformidade Interpretação: “Em média são produzidas por lote 8,4 molas fora da conformidade com uma variação de 2,1 molas”. [8,4 ± 2,1 molas fora da conformidade] Questão 4. a) Calcule e interprete a Mediana para estes dados. 146 224 240 325 𝑀𝑑 = 224 + 240 2 = 232 Interpretação: “Em metade dos carros a capacidade do porta malas é inferior a 232 litros e em metade dos carros a capacidade do porta malas é superiora 232 litros”. b) Calcule e interprete a média e o desvio-padrão para estes dados. 43 Média �̅� = ∑ 𝑥 𝑛 = 935 4 = 233,8 litros Variância 𝑠2 = ∑(𝑥 − �̅�)2 𝑛 − 1 = (146 − 233,8)2 + (224 − 233,8)2 + (240 − 233,8)2 + (325 − 233,8)2 4 − 1 𝑠2 = ∑(𝑥 − �̅�)2 𝑛 − 1 = 7708,84 + 96,04 + 38,44 + 8317,44 4 − 1 = 16160,76 3 = 5386,92 Desvio-padrão 𝑠 = √ ∑(𝑥 − �̅�)2 𝑛 − 1 = √5386,92 = 73,4 litros Interpretação: “Em média, a capacidade do porta malas destes carros é de 233,8 litros com uma variação de 73,4 litros”. 44 3. GRÁFICOS DE CONTROLE Simone Echeveste Neste capítulo iremos abordar a utilização das medidas estatísticas anteriormente vistas em uma aplicação prática extremamente importante na área da Engenharia: Controle de qualidade. Aqui, será demonstrada a construção de gráficos de controle e a interpretação das informações que estes nos fornecem. O aluno deverá ser capaz de construir gráficos de controle utilizando para isso medidas estatísticas de tendência central e variabilidade, bem como deverá realizar a correta interpretação dos mesmos. Os gráficos de controle estão inseridos no Controle Estatístico de Qualidade – é um sistema amplo e complexo que tem por finalidade a inspeção, a análise e a ação corretiva aplicados a um processo produtivo. O processo estará sob controle quando a variação da qualidade estiver dentro dos limites de especificação do produto. Alguns dos princípios fundamentais dos gráficos de controle: Pensar e decidir baseado em dados e fatos; Pensar separando a causa do efeito, buscar sempre conhecer a causa fundamental dos problemas; Reconhecer a existência da variabilidade na produção e administrá-la; Identificar instantaneamente focos e locais de disfunção e corrigir os problemas a tempo. 45 A variação que ocorre num processo de produção pode ser desmembrada em duas componentes: uma de difícil controle, chamada variação aleatória; e outra chamada variação controlável. Assim a equação da variação total de um processo pode ser escrita como sendo: Se as variações forem conhecidas, controladas e reduzidas, os índices de produtos defeituosos certamente se reduzirão. Os gráficos de controle são utilizados para avaliar se o processo está sob controle. A partir de sua análise é possível evitar, reduzir ou eliminar não conformidades em tempo real (durante o processo de produção) Os gráficos de controle são úteis para: Variação Aleatória Variação Controlável Variação Total Monitorar variabilidade do processo Detectar variabilidade do processo Auxiliar na eliminação de causas especiais, trazendo o processo para o estado de controle Dar indicações de como mudanças podem afetar um processo sob controle 46 Benefícios dos gráficos de controle Podem ser aplicados pelos próprios operários, que poderão discutir com os supervisores, engenheiros e técnicos através da linguagem dos dados fornecidos pelos gráficosde controle; Os gráficos de controle servem para monitoramento do processo, mostrando a ocorrência de um descontrole (presença de causas especiais) e/ou a tendência dessa ocorrência; Ao melhorar o processo os gráficos de controle permitem: aumentar a porcentagem de produtos que satisfaçam exigências dos clientes; diminuir os índices de retrabalho dos itens produzidos e, conseqüentemente, dos custos de produção aumentando a produtividade. Gráficos de controle para medições O uso dos gráficos de controle para medições deve ocorrer sempre que uma característica da qualidade observada é expressa em unidades reais como peso em quilogramas, comprimento em centímetros, temperatura em graus celsius Fornecem informações sobre um processo através dos resultados de pequenas amostras coletadas periodicamente onde a cada intervalo h, retira-se uma amostra de tamanho n para análise. Cada grupo fornece uma ideia do que o processo está produzindo naquele momento Para a construção de um gráfico controle de variáveis, são coletados dados de subgrupos de pequenas amostras de n= 4 ou 5 itens extraídos a intervalos regulares (de hora em hora, dia a dia, etc.). O intervalo adequado para extração das amostras depende de cada processo de fabricação. 47 Símbolos Importantes: n = tamanho da amostra k = número (quantidade) de amostras �̿� = média das médias das amostras (média global) R = amplitude amostral média �̅� = média das amplitudes d2, A3, D3, D4 = fatores de correção tabelados Passo a passo: Gráfico de Controle para Média e Amplitude 1º) Determinar o tamanho das amostras n (usualmente 4 ou 5) e a quantidade K das amostras (no mínimo 25, ou 20, respectivamente). 2º) Calcular para cada amostra a média �̅� e a amplitude R: �̅� = ∑ 𝑥 𝑛 𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 3º) Calcular para todas as k amostras obtidas a Média das Médias �̿� e a Média das amplitudes �̅�: �̿� = ∑ �̅� 𝑘 �̅� = ∑ 𝑅 𝐾 4º) Calcular o desvio-padrão das médias �̂��̅� = 1 𝑑2 ∙ �̅� √𝑛 48 Figura 1. Fator de Correção para gráfico de controle das Médias Tamanho das amostras (n) Fator de Correção D3 D4 D c4 d2 2 0 3,267 0,709 0,798 1,128 3 0 2,574 0,524 0,886 1,693 4 0 2,282 0,446 0,921 2,059 5 0 2,114 0,403 0,94 2,326 6 0 2,004 0,375 0,952 2,534 7 0,076 1,924 0,353 0,959 2,704 8 0,136 1,864 0,338 0,965 2,847 9 0,184 1,816 0,325 0,969 2,970 10 0,223 1,777 0,314 0,973 3,078 6º) Calcular os Limites Limite Superior de Controle (LSC) 𝐿𝑆𝐶 = �̿� + 3�̂��̅� Linha Média (LM) 𝐿𝑀 = �̿� Limite Inferior de Controle (LIC) 𝐿𝐼𝐶 = �̿� − 3�̂��̅� 49 7º) Plotar o gráfico no Excel 8º) O gráfico obtido constitui a norma de controle de fabricação; permitirá acompanhar o processo. 9º) Por fim, construir o gráfico de controle para R - amplitude Limite Superior de Controle (LSC) 𝐿𝑆𝐶 = 𝐷4 ∙ �̅� Linha Média (LM) 𝐿𝑀 = �̅� Limite Inferior de Controle (LIC) 𝐿𝐼𝐶 = 𝐷3 ∙ �̅� 50 55 60 65 70 75 80 85 90 1 2 3 4 5 6 7 8 9 10 Amostra Média LSC LM LIC 50 Exemplo 1 A cada 2 horas de atividade, uma amostra de 5 peças são medidas e dentre as características de qualidade monitoradas está o peso de um dos componentes plásticos que são fabricados por sopro. Foram extraídas 10 amostras (cada uma com as respectivas 5 peças) foram pesadas e indicaram os resultados descritos abaixo: Amostra Pesos Observados (n = 5) 1 65 70 75 60 80 2 75 70 80 90 70 3 80 70 70 80 80 4 65 65 65 80 65 5 80 60 80 80 75 6 75 70 60 85 75 7 80 75 65 75 70 8 70 65 75 65 85 9 85 85 75 65 80 10 65 65 65 80 60 Atenção: K = 10 amostras extraídas n = 5 peças em cada amostra - Calcular para cada amostra a média �̅� e a amplitude R: �̅� = ∑ 𝑥 𝑛 𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 51 Amostra Pesos Observados (n = 5) Soma Média (�̅�) Amplitude ( R ) 1 65 70 75 60 80 350 70 20 2 75 70 80 90 70 385 77 20 3 80 70 70 80 80 380 76 10 4 65 65 65 80 65 340 68 15 5 80 60 80 80 75 375 75 20 6 75 70 60 85 75 365 73 25 7 80 75 65 75 70 365 73 15 8 70 65 75 65 85 360 72 20 9 85 85 75 65 80 390 78 20 10 65 65 65 80 60 335 67 20 - Calcular para todas as k amostras obtidas a Média das Médias �̿� e a Média das amplitudes �̅� �̿� = ∑ �̅� 𝑘 = 729 10 = 72,9 �̅� = ∑ 𝑅 𝑘 = 185 10 = 18,5 - Calcular o desvio-padrão das médias �̂��̅� = 1 𝑑2 ∙ �̅� √𝑛 = 1 2,326 ∙ 18,5 √5 = 0,4299 ∙ 8,2734 = 3,5568 Como obter o valor para d2 Fator de Correção para gráfico de controle das Médias Tamanho das amostras (n) Fator de Correção D3 D4 D c4 d2 4 0 2,282 0,446 0,921 2,059 5 0 2,114 0,403 0,94 2,326 6 0 2,004 0,375 0,952 2,534 7 0,076 1,924 0,353 0,959 2,704 52 - Calcular os Limites Limite Superior de Controle (LSC) 𝐿𝑆𝐶 = x̿ + 3σ̂x̅ 𝐿𝑆𝐶 = 72,9 + 3 ∙ 3,5568 = 72,9 + 10,6704 = 83,57 𝑳𝑺𝑪 = 𝟖𝟑, 𝟓𝟕 Linha Média (LM) LM = x̿ 𝐋𝐌 = 𝟕𝟐, 𝟗 Limite Inferior de Controle (LIC) LIC = x̿ − 3σ̂x̅ LIC = 72,9 − 3 ∙ 3,5568 = 72,9 − 10,6704 = 62,23 𝐋𝐈𝐂 = 𝟔𝟐, 𝟐𝟑 Amostra Média LCS LM LCI 1 70 83,57 72,9 62,23 2 77 83,57 72,9 62,23 3 76 83,57 72,9 62,23 4 68 83,57 72,9 62,23 5 75 83,57 72,9 62,23 6 73 83,57 72,9 62,23 7 73 83,57 72,9 62,23 8 72 83,57 72,9 62,23 9 78 83,57 72,9 62,23 10 67 83,57 72,9 62,23 53 - Construir o gráfico de controle para a Média - Gráfico de controle para R – Amplitude Limite Superior de Controle (LSC) LSC = D4 ∙ R̅ LSC = 2,114 ∙ 18,5 = 39,11 𝐋𝐒𝐂 = 𝟑𝟗, 𝟏𝟏 Como obter o valor para D4 Fator de Correção para gráfico de controle das Médias Tamanho das amostras (n) Fator de Correção D3 D4 D c4 d2 4 0 2,282 0,446 0,921 2,059 5 0 2,114 0,403 0,94 2,326 6 0 2,004 0,375 0,952 2,534 7 0,076 1,924 0,353 0,959 2,704 50 55 60 65 70 75 80 85 90 95 100 1 2 3 4 5 6 7 8 9 10 LSC Média LM LIC 54 Linha Média (LM) LM = R̅ LM = 18,5 Limite Inferior de Controle (LIC) LIC = D3 ∙ R̅ LIC = 0 ∙ 18,5 = 0 LIC = 0 Como obter o valor para D3 Fator de Correção para gráfico de controle das Médias Tamanho das amostras (n) Fator de Correção D3 D4 D c4 d2 4 0 2,282 0,446 0,921 2,059 5 0 2,114 0,403 0,94 2,326 6 0 2,004 0,375 0,952 2,534 7 0,076 1,924 0,353 0,959 2,704 Amostra Amplitude R LSC LM LIC 1 20 39,11 18,5 0 2 20 39,11 18,5 0 3 10 39,11 18,5 0 4 15 39,11 18,5 0 5 20 39,11 18,5 0 6 25 39,11 18,5 0 7 15 39,11 18,5 0 8 20 39,11 18,5 0 9 20 39,11 18,5 0 10 20 39,11 18,5 0 55 - Construir o Gráfico de controle para R – Amplitude Gráfico de Controle para Amplitude Avaliação dos gráficos de controle Se os pontos estão dentro dos limites não é necessário intervir no processo A variação é decorrente de causas aleatórias Se um ponto cai fora desses limites: Deve-se intervir no processo, pois o afastamento excessivo desse ponto em relação à linha média provavelmente é devido a uma causa especial. -10 -5 0 5 10 15 20 25 30 35 40 45 50 55 1 2 3 4 5 6 7 8 9 10 LSC Amplitude R LM LIC Processo sob controle: é aquele cujos resultados de medição apresentam variação dentro dos limites de controle. 56 Exemplo de um processo que está FORA de controle Recapitulando Os gráficos de controle correspondem a uma das ferramentas mais úteis no controle de um processo, pois permitem a identificação de causas que não são naturais ao processo de produção e que podem prejudicar a qualidadede um produto. Após a identificação de um processo fora de controle poderemos agir nas causas e melhorar continuamente o processo de produção garantindo a qualidade desejada no produto final. 50 55 60 65 70 75 80 85 90 1 2 3 4 5 6 7 8 9 10 Amostra Média LCI LM LCS Este ponto está FORA Este ponto está FORA 57 Atividades Gráficos de Controle Questão 1. Considere os dados apresentados a seguir de 12 amostras de tamanho 5, para os quais foi medido o volume em saquinhos de 1 litro de leite. Construa o gráfico de controle para a Média e para a Amplitude com estes dados e verifique se o processo está sob controle. Amostra Medidas (litros de leite) 1 1003,2 1004,4 993,5 994,6 997,6 2 1002,3 999,0 1000,8 1000,7 998,0 3 998,3 998,1 1004,2 1002,1 991,3 4 1002,2 996,6 1002,7 1004,2 1001,8 5 998,3 997,5 1006,1 996,5 998,1 6 995,8 1000,8 999,1 1002,5 1001,0 7 1004,1 1003,0 1004,8 997,9 999,9 8 1000,1 994,9 1000,1 1004,9 997,3 9 1000,2 996,1 998,0 1006,1 999,4 10 996,2 1017,3 993,6 996,5 1003,7 11 1014,0 1008,9 1004,1 1007,9 1000,7 12 997,1 1000,7 999,8 1000,6 1001,7 Questão 2. Responda: Quais são os princípios fundamentais dos gráficos de controle? Questão 3. Os gráficos de controle são utilizados para: a.( ) Identificar exatamente o que está causando algum tipo de problema no processo b.( ) Identificar o tipo de defeito nas unidades produzidas. c.( ) Auxiliar na eliminação de causas especiais, trazendo o processo para o estado de controle. d.( ) Analisar a melhor forma de efetuar o controle estatístico do processo. Questão 4. A variação que ocorre num processo de produção pode ser desmembrada em duas componentes, quais são elas? 58 Questão 5. Um processo está sob controle quando: a.( ) Os resultados de medição apresentam variação dentro dos limites de controle. b.( ) O desvio-padrão encontrado é menor que a média da variável. c.( ) A variação aleatória é conhecida durante todo o processo. d.( ) Não há ocorrência registrada de danos nas unidades produzidas. Gabarito Atividades Propostas Questão 1. Amostra Medidas (litros de leite) Amplitude ( R ) Média (x̅) 1 1003,2 1004,4 993,5 994,6 997,6 10,9 998,7 2 1002,3 999,0 1000,8 1000,7 998,0 4,3 1000,2 3 998,3 998,1 1004,2 1002,1 991,3 12,9 998,8 4 1002,2 996,6 1002,7 1004,2 1001,8 7,6 1001,5 5 998,3 997,5 1006,1 996,5 998,1 9,6 999,3 6 995,8 1000,8 999,1 1002,5 1001,0 6,7 999,8 7 1004,1 1003,0 1004,8 997,9 999,9 6,9 1001,9 8 1000,1 994,9 1000,1 1004,9 997,3 10,0 999,5 9 1000,2 996,1 998,0 1006,1 999,4 10,0 1000,0 10 996,2 1017,3 993,6 996,5 1003,7 23,7 1001,5 11 1014,0 1008,9 1004,1 1007,9 1000,7 13,3 1007,1 12 997,1 1000,7 999,8 1000,6 1001,7 4,6 1000,0 Resultados para o Gráfico de Controle para a Média Média LIC LM LSC 998,7 994,9 1000,7 1006,5 1000,2 994,9 1000,7 1006,5 998,8 994,9 1000,7 1006,5 1001,5 994,9 1000,7 1006,5 999,3 994,9 1000,7 1006,5 999,8 994,9 1000,7 1006,5 1001,9 994,9 1000,7 1006,5 999,5 994,9 1000,7 1006,5 1000,0 994,9 1000,7 1006,5 1001,5 994,9 1000,7 1006,5 1007,1 994,9 1000,7 1006,5 1000,0 994,9 1000,7 1006,5 59 Resultados para o Gráfico de Controle para a Amplitude LSC Amplitude ( R ) LM LIC 21,2 10,9 10,04 0 21,2 4,3 10,04 0 21,2 12,9 10,04 0 21,2 7,6 10,04 0 21,2 9,6 10,04 0 21,2 6,7 10,04 0 21,2 6,9 10,04 0 21,2 10 10,04 0 21,2 10 10,04 0 21,2 23,7 10,04 0 21,2 13,3 10,04 0 21,2 4,6 10,04 0 Gráfico de Controle para Média O processo está fora do controle!! 985 990 995 1000 1005 1010 1015 1 2 3 4 5 6 7 8 9 10 11 12 LSC Média LM LIC 60 Gráfico de Controle para Amplitude O processo está fora do controle!! Questão 2. Resposta: Pensar e decidir baseado em dados e fatos; Pensar separando a causa do efeito, buscar sempre conhecer a causa fundamental dos problemas; Reconhecer a existência da variabilidade na produção e administrá-la e Identificar instantaneamente focos e locais de disfunção e corrigir os problemas a tempo. Questão 3. c.( x ) Auxiliar na eliminação de causas especiais, trazendo o processo para o estado de controle. Questão 4. Uma de difícil controle que é a variação aleatória e outra chamada variação controlável. -10 -5 0 5 10 15 20 25 30 1 2 3 4 5 6 7 8 9 10 11 12 LSC Amplitude ( R ) LM LIC 61 Questão 5. Um processo está sob controle quando: a.( x ) Os resultados de medição apresentam variação dentro dos limites de controle. Como construir gráficos de controle no Excel Após a realização dos cálculos para determinar os limites para o gráfico, em uma planilha do Excel coloque as informações obtidas da seguinte forma: Vá até a barra de ferramentas na opção Inserir – gráfico de linhas - 62 4. PROBABILIDADE Simone Echeveste Este capítulo tem por objetivo apresentar os conceitos básicos de probabilidade, viabilizando ao aluno o raciocínio lógico e probabilístico na resolução de problemas. Ao final deste estudo espera-se que o aluno resolva problemas aplicando para isso os conhecimentos básicos de probabilidade aprendidos. CONCEITOS BÁSICOS DE PROBABILIDADE A Teoria das Probabilidades se apresenta como um estudo teórico de fenômenos envolvendo a incerteza utilizando ferramentas básicas do Cálculo Matemático. Esses fenômenos, conhecidos como aleatórios estocásticos ou não-determinísticos, são aqueles que a sua repetição, em condições idênticas, produz resultados diferenciados, isto é, não é possível determinar, com exatidão, qual o seu resultado. A Probabilidade é o ramo da matemática que trata de fenômenos aleatórios. A observação de um fenômeno aleatório por parte do homem é chamada de experimento aleatório. Características de um experimento aleatório: 1ª) Não se conhece um particular valor do experimento antes dele ser executado, porém podemos descrever todos os possíveis resultados - as possibilidades – o conjunto das possibilidades de um experimento aleatório é denominado de Espaço Amostral (S); 63 2ª) Quando o experimento é repetido algumas vezes, os resultados ocorrem de uma forma aparentemente acidental. Mas quando o número de repetições aumenta, uma regularidade aparecerá. E esta regularidade que torna possível construir um modelo matemático preciso para analisar o experimento. Definição de probabilidade Na definição clássica de probabilidade, considerando que todos os resultados possíveis são equiprováveis, podemos definir probabilidade de um evento qualquer A como sendo: 𝑃(𝐴) = 𝑁º 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟á𝑣𝑒𝑖𝑠 𝑎𝑜 𝑒𝑣𝑒𝑛𝑡𝑜 𝐴 𝑁º 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠 𝑐𝑎𝑠𝑜𝑠 Exemplo Considere uma caixa contendo 10 brindes: 4 livros, 2 celulares, 1 rádio e 3 perfumes. Você tem direito a um destes brindes que serão sorteados. Qual a probabilidade de você: a) Ganhar um livro b) Ganhar um celular c) Ganhar um rádio ou um celular d) Não ganhar perfume Resolução: Vamos considerar então que ao todo nessa caixa temos 10 brindes dos quais apenas 1 deles será seu. Então o Espaço amostral (conjunto de todos os possíveis resultados de um experimento) pode assim ser definido: S= { livro, celular, rádio, perfume} 64 a) Ganhar um livro Como temos na caixa 4 livros em um total de 10 brindes, a probabilidade de ganhar um livro é: 𝑃(𝑙𝑖𝑣𝑟𝑜) = 4 10 = 0,40 𝑥 100 = 40% b) Ganhar um celular 𝑃(𝑐𝑒𝑙𝑢𝑙𝑎𝑟) = 2 10 = 0,20 𝑥 100 = 20% c) Ganhar um rádio ou um celular 𝑃(𝑟á𝑑𝑖𝑜 𝑜𝑢 𝑐𝑒𝑙𝑢𝑙𝑎𝑟) = 3 10 = 0,30 𝑥 100 = 30% d) Não ganhar perfume 𝑃(𝑛ã𝑜 𝑝𝑒𝑟𝑓𝑢𝑚𝑒) = 7 10 = 0,70 𝑥 100 = 70%Não esqueça!!! A probabilidade de um evento A deve ser sempre: 0 P(A) 1 ou ainda 0% P(A) 100% 65 Propriedades da probabilidade Propriedade 1: Probabilidade Complementar A probabilidade complementar de A, é o evento formado por todos os resultados do espaço amostral que não pertencem à A. A probabilidade de não ocorrência de A, é descrita como )(AP e é expressa da forma: )(1)( APAP Propriedade 2: Regra da Adição Se A e B são dois eventos independentes então: P(A ou B) = P(A) + P(B) Exemplo Ao retirar uma carta do baralho considere os eventos: A – retirar um Ás e R – retirar um Rei. Qual a probabilidade de selecionar aleatoriamente uma carta deste baralho e ela ser um Ás ou um Rei? P(A ou R) = P(A) + P(R) = 4/52 + 4/52 = 8/52 = 0,1538 Se A e B são dois eventos dependentes então: P(A ou B) = P(A) + P(B) – P(A e B) A B A B 66 Exemplo Ao retirar uma carta do baralho considere os eventos: A – retirar um Ás e E – retirar uma carta no naipe Espadas. Qual a probabilidade de selecionar aleatoriamente uma carta deste baralho e ela ser um Ás ou uma carta do naipe de espadas? P(A ou E) = P(A) + P(E) – P(A e E) 4/52 + 13/52 – 1/52 = 16/52 = 0,3077 Atenção! Mais exemplos de aplicação das propriedades Questão 1 De 300 estudantes do curso de Engenharia, 100 são matriculados em Geometria Analítica e 80 em Estatística. Estes dados incluem 30 estudantes que estão matriculados em ambas as disciplinas. Qual a probabilidade de um estudante de engenharia selecionado ao acaso esteja matriculado em Geometria Analítica ou Estatística? Vamos considerar os eventos: GA – estar matriculado em Geometria Analítica E- estar matriculado em Estatística Dois eventos são independentes quando a ocorrência ou não de um evento não tem efeito algum na probabilidade de ocorrência do outro evento. Dois eventos são dependentes quando a ocorrência ou não-ocorrência de um evento afeta a probabilidade de ocorrência do outro. 67 𝑃(𝐺𝐴) = 100 300 = 0,3333 𝑃(𝐸) = 80 300 = 0,2667 𝑃(𝐺𝐴 𝑒 𝐸) = 30 300 = 0,10 Qual a probabilidade de um estudante de engenharia selecionado ao acaso esteja matriculado em Geometria Analítica ou Estatística? 𝑃(𝐺𝐴 𝑜𝑢 𝐸) = 𝑃(𝐺𝐴) + 𝑃(𝐸) − 𝑃(𝐺𝐴 𝑒 𝐸) 𝑃(𝐺𝐴 𝑜𝑢 𝐸) = 0,3333 + 0,2667 − 0,10 𝑷(𝑮𝑨 𝒐𝒖 𝑬) = 𝟎, 𝟓𝟎𝟎𝟎 Questão 2 De 100 pessoas que solicitaram emprego de engenheiro de produção, durante o ano passado, 65 possuíam experiência anterior e 30 possuíam um certificado profissional. Vinte dos candidatos possuíam tanto experiência anterior como certificado profissional. Qual a probabilidade de um candidato selecionado ao acaso deste grupo tenha experiência anterior ou certificado profissional? Vamos considerar os eventos: EA – possuir experiência anterior CP- possuir certificado profissional 𝑃(𝐸𝐴) = 65 100 = 0,65 𝑃(𝐶𝑃) = 30 100 = 0,30 68 𝑃(𝐸𝐴 𝑒 𝐶𝑃) = 20 100 = 0,20 Qual a probabilidade de um candidato selecionado ao acaso deste grupo tenha experiência anterior ou certificado profissional? 𝑃(𝐸𝐴 𝑜𝑢 𝐶𝑃) = 𝑃(𝐸𝐴) + 𝑃(𝐶𝑃) − 𝑃(𝐸𝐴 𝑒 𝐶𝑃) 𝑃(𝐸𝐴 𝑜𝑢 𝐶𝑃) = 0,65 + 0,30 − 0,20 𝑃(𝐸𝐴 𝑜𝑢 𝐶𝑃) = 0,75 Propriedade 3: Regra da Multiplicação Se A e B são dois eventos independentes então: P(A e B) = P(A) x P(B) Exemplo Em uma linha de produção a probabilidade de uma peça fabricada estar fora das especificações em relação a sua largura é 2%, em relação ao seu comprimento é 5%. Considere que a ocorrência de defeito na largura ou comprimento acontece de forma independente. Uma peça foi aleatoriamente selecionada desta linha de produção e seu comprimento e largura verificados pelo controle de qualidade, qual a probabilidade desta peça: a) Apresentar defeito na largura e no comprimento P(DL e Dc) = 0,02 x 0,05 = 0,001 b) Apresentar defeito apenas na largura P(DL e Pc) = 0,02 x 0,95 = 0,019 69 c) A peça ser perfeita na largura e no comprimento P(PL e Pc) = 0,98 x 0,95 = 0,931 d) A peça apresentar pelo menos um destes defeitos P(DL e Pc) ou P(PL e Dc) ou P(DL e Dc)= (0,02 x 0,95) + (0,98 x 0,05) + (0,02 x 0,05) = 0,019 + 0,049 + 0,001 = 0,069 Propriedade 4: Probabilidade Condicional Se A e B são dois eventos dependentes então: Quando dois eventos são dependentes, o conceito de probabilidade condicional é empregado para indicar a probabilidade de ocorrência de um evento relacionado. A expressão P(B/A) indica a probabilidade de ocorrer o evento B, dado que tenha ocorrido o evento A . P(A e B) = P(A) x P(B/A) Onde: P(A) B) eP(A P(B/A) Exemplo Um lote de 10 peças produzidas por uma fábrica contém 8 peças boas e 2 defeituosas. Duas peças são retiradas aleatoriamente sem reposição pelo comprador do lote. Qual é a probabilidade de: a) As duas peças serem boas P(B1 e B2) = P(B1) x P(B2/B1) = 8/10 x 7/9 = 56/90 = 0,6222 70 b) A primeira peça ser boa e a segunda defeituosa P(B1 e D2) = P(B1) x P(D2/B1) = 8/10 x 2/9 = 16/90 = 0,1777 c) As duas peças serem defeituosas P(D1 e D2) = P(D1) x P(D2/D1) = 2/10 x 1/9 = 2/90 = 0, 0222 ÁRVORE DE PROBABILIDADES Mais exemplos de aplicação das propriedades Questão 1 Um sistema tem dois componentes A e B que operam independentemente. Suponha que a probabilidade de falha do componente A seja 10% e do componente B 20%. Qual é a probabilidade de: a) A falha do sistema ocorrer em ambos componentes 𝑃(𝐴) = 0,10 𝑃(𝐵) = 0,20 𝑃(𝐴 𝑒 𝐵) = 𝑃(𝐴) × 𝑃(𝐵) 𝑷(𝑨 𝒆 𝑩) = 𝟎, 𝟏𝟎 × 𝟎, 𝟐𝟎 = 𝟎, 𝟎𝟐 8 Boas 2 defeituosas __________ 10 peças Boa 8/10 Defeituosa 2/10 Boa 7/9 Boa 8/9 Defeituosa 2/9 Defeituosa 1/9 1ª Peça 2ª Peça 71 b) A falha do sistema ocorrer apenas no componente A 𝑃(𝐴) = 0,10 𝑃(𝐵) = 0,20 Utilizando a propriedade 1 da probabilidade complementar: 𝑃(�̅�) − 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑁Ã𝑂 𝑜𝑐𝑜𝑟𝑟𝑒𝑟 𝑓𝑎𝑙ℎ𝑎 𝑛𝑜 𝑐𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒 𝐴 𝑃(�̅�) − 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑁Ã𝑂 𝑜𝑐𝑜𝑟𝑟𝑒𝑟 𝑓𝑎𝑙ℎ𝑎 𝑛𝑜 𝑐𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒 𝐵 𝑃(�̅�) = 1 − 𝑃(𝐴) = 1 − 0,10 = 0,90 𝑃(�̅�) = 1 − 𝑃(𝐵) = 1 − 0,20 = 0,80 Então A falha do sistema ocorrer apenas no componente A: 𝑃(𝐴 𝑒 �̅�) = 𝑃(𝐴) × 𝑃(�̅�) 𝑷(𝑨 𝒆 �̅�) = 𝟎, 𝟏𝟎 × 𝟎, 𝟖𝟎 = 𝟎, 𝟎𝟖 c) Não ocorrer falha no sistema 𝑃(�̅�) = 1 − 𝑃(𝐴) = 1 − 0,10 = 0,90 𝑃(�̅�) = 1 − 𝑃(𝐵) = 1 − 0,20 = 0,80 Então Não ocorrer falha no sistema 𝑷(�̅� 𝒆 �̅�) = 𝟎, 𝟗𝟎 × 𝟎, 𝟖𝟎 = 𝟎, 𝟕𝟐 72 Questão 2 Dos eleitores de certa comunidade 33% são homens e 10% dos eleitores votaram em branco na última eleição. Supondo que estes eventos sejam independentes, determine a probabilidade de escolher aleatoriamente um homem e este ter votado em branco na última eleição. Considere os eventos: H – ser homem B- votar em branco 𝑃(𝐻) = 0,33 𝑃(𝐵) = 0,10 𝑷(𝑯 𝒆 𝑩) = 𝑷(𝑯) × 𝑷(𝑩) = 𝟎, 𝟑𝟑 × 𝟎, 𝟏𝟎 = 𝟎, 𝟎𝟑𝟑 73 Recapitulando O estudo da probabilidade viabiliza o entendimento das chances associadas aos fenômenos aleatórios presentes em várias atividades do nosso dia-a-dia. A definição clássica de uma probabilidade é 𝑃(𝐴) = 𝑁º 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟á𝑣𝑒𝑖𝑠 𝑎𝑜 𝑒𝑣𝑒𝑛𝑡𝑜 𝐴 𝑁º 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠 𝑐𝑎𝑠𝑜𝑠 Para a resolução dos problemas podemosconsiderar algumas propriedades importantes do cálculo das probabilidades: Probabilidade Complementar: )(1)( APAP Regra da Adição: Se A e B são dois eventos independentes: P(A ou B) = P(A) + P(B) Se A e B são dois eventos dependentes: P(A ou B) = P(A) + P(B) – P(A e B) Regra da Multiplicação: Se A e B são dois eventos independentes: P(A e B) = P(A) x P(B) Se A e B são dois eventos dependentes: P(A e B) = P(A) x P(B/A) Onde: P(A) B) eP(A P(B/A) 74 Atividades Questão 1. Um pacote de sementes de flores contém 4 sementes de flores vermelhas, 3 amarelas, 3 roxas e 1 flor laranja. Escolhida ao acaso, uma semente deste pacote, qual a probabilidade de: a) ser de flor vermelha ou laranja b) não ser de flor amarela c) ser roxa Questão 2. A probabilidade de um homem estar vivo daqui a 30 anos é de 40% e de sua mulher é de 65%. Qual a probabilidade de que daqui a 30 anos: a) Ambos estejam vivos b) Somente a mulher esteja viva Questão 3. Marcelo tem dois velhos automóveis. Nas manhãs frias, há 20% de probabilidade de um deles não pegar e 30% do outro não pegar. Em uma manhã fria qual a probabilidade de nenhum dos carros pegar: Questão 4. Uma urna contém 7 moedas de 50 centavos e 5 moedas de 10 centavos. Duas moedas são retiradas ao acaso, sem reposição. Qual a probabilidade de se retirar desta urna 1 real. Questão 5. Verificou-se que na exportação de um artigo de higiene problemas relacionados à embalagem ocorrem com probabilidade de 0,02, e que problemas relacionados à consistência deste produto ocorrem com uma probabilidade de 0,05. Considerando que estes problemas ocorrem de forma independente do outro, qual é a probabilidade de ao selecionar ao acaso um destes artigos de higiene este apresentar pelo menos um destes problemas? 75 Gabarito Questão 1 a) P(V ou L) = 5/11 = 0,4545 b) P(não Amarela) = 8/11 = 0,7272 c) P(R) = 3/11 = 0,2727 Questão 2. a) P(Ambos estejam vivos) = 0,26 b) P(Somente a mulher esteja viva) = 0,39 Questão 3. P(Nenhum pegar) = 0,60 Questão 4. P(50 centavos) = 7/12 = 0,5833 P(10 centavos) = 5/12 = 0,4167 P(1 real) = P(50 e 50) = 0,5833 x 0,5833 = 0,3403 Questão 5. P(Embalagem) = 0,02 P(Consistência) = 0,05 P(E e C) = P(E) X P(C) = 0,02 X 0,05 = 0,001 76 5. DISTRIBUIÇÕES DE PROBABILIDADE Simone Echeveste Este capítulo tem por objetivo apresentar as principais distribuições de probabilidades aplicadas à área da Engenharia, trazendo exemplos da área. O aluno deverá ser capaz de identificar para cada situação a distribuição de probabilidade indicada para resolvê-la, bem como aplicar corretamente os modelos na resolução dos problemas. Uma distribuição de probabilidades é caracterizada pela construção de um modelo matemático que representa para uma variável aleatória “X” as probabilidades associadas aos possíveis valores que esta variável pode assumir. Seu objetivo é determinar a probabilidade de ocorrência de cada valor que uma variável aleatória pode assumir, ou seja, é uma correspondência que associa probabilidades aos valores de uma variável aleatória, ou ainda, é uma Função que relaciona a probabilidade de ocorrência de um valor da variável aleatória: P(X=x) = f(x) 5.1. DISTRIBUIÇÃO BINOMIAL 77 A distribuição Binomial é útil para avaliar experimentos em que somente dois resultados são possíveis: sucesso ou fracasso que são mutuamente excludentes. As características desta distribuição são: Características: O experimento pode ser repetido “n” vezes em condições essencialmente inalteradas; Há apenas dois resultados possíveis em cada repetição, denominados sucesso ( p ) e fracasso ( 1- p ) As probabilidades “p” (sucesso) e “1-p” (fracasso) permanecem constantes em todas as repetições. As repetições são independentes, ou seja, o resultado de uma repetição não é influenciado por outros resultados. O Modelo Binomial fracasso de adeprobabilid p)-(1 sucesso de adeprobabilid p determinar deseja se que valor x evento do repetições de nº n onde , )1.(. )!!.( ! )( xnx pp xnx n xXP Exemplo 1 78 A probabilidade da ocorrência de peças defeituosas em um lote produzido por uma fábrica é de 5%. Cinco lotes são investigados, qual é a probabilidade de: a) Somente um lote contenha uma peça defeituosa n= 5 lotes x = nº lotes com peças defeituosas p = 0,05 (5%) (1-p) = 1- 0,05 = 0,95 (95%) Pede-se: Somente um lote contenha peças defeituosas - P(x = 1) 𝑃(𝑥 = 1) = 5! 1!. (5 − 1)! ∙ 0,051 ∙ 0,955−1 = 5 ∙ 0,05 ∙ 0,954 = 0,2036 𝑷(𝒙 = 𝟏) = 𝟎, 𝟐𝟎𝟑𝟔 b) Nenhum lote contenha peças defeituosas n= 5 lotes x = nº lotes com peças defeituosas p = 0,05 (5%) (1-p) = 1- 0,05 = 0,95 (95%) Pede-se: Nenhum lote contenha peças defeituosas - P(x = 0) 𝑃(𝑥 = 0) = 5! 0!. (5 − 0)! ∙ 0,050 ∙ 0,955−0 = 1 ∙ 1 ∙ 0,955 = 0,7738 𝑷(𝒙 = 𝟎) = 𝟎, 𝟕𝟕𝟑𝟖 Exemplo 2 79 A probabilidade de ocorrer problemas na direção hidráulica de um caminhão de uma determinada marca é de 0,10. Considerando uma frota de 8 caminhões desta marca, qual é a probabilidade de que metade deles venha a ter problemas na direção hidráulica? X = Nº de caminhões com problemas na direção hidráulica p = 0,10 (a probabilidade de um caminhão ter problemas na direção hidráulica) (1-p) = 0,90 n = 8 caminhões Pede-se: P(metade da frota de 8 caminhões apresentar problemas na direção hidráulica) P(x=4) Resolução: P(x= 4) = 0,0046 0,6561 . 0,0001 . 70 .0,90.0,10 4!.4! 8! 44 P(x= 4) = 0,0046 Média ou Valor Esperado da Distribuição Binomial Se a variável aleatória X possui distribuição Binomial então sua média e seu desvio-padrão podem ser definidos como: Exemplo )1.(. ppn pnxE .)( Média Desvio-padrão 80 Vamos considerar o exemplo anteriormente visto: A probabilidade de ocorrer problemas na direção hidráulica de um caminhão de uma determinada marca é de 0,10. Considerando uma frota de 8 caminhões desta marca, qual é a probabilidade de que metade deles venha a ter problemas na direção hidráulica? A média de caminhões com problemas na direção hidráulica, ou ainda o valor esperado de caminhões com problemas na direção hidráulica seria de: 𝛍 = 𝐧 ∙ 𝐩 = 𝟖 ∙ 𝟎, 𝟏𝟎 = 𝟎, 𝟖𝟎 E o desvio-padrão: 𝛔 = √𝐧 ∙ 𝐩 ∙ (𝟏 − 𝐩) = √𝟖 ∙ 𝟎, 𝟏𝟎 ∙ (𝟏 − 𝟎, 𝟏𝟎) = √𝟎, 𝟕𝟐 = 𝟎, 𝟖𝟓 5.2. DISTRIBUIÇÃO POISSON Depois da Binomial, a distribuição de Poisson é a distribuição de probabilidade discreta mais utilizada, pois pode ser aplicada a muitos casos práticos nos quais interessa o número de vezes que um determinado evento pode ocorrer durante um intervalo de tempo ou num determinado ambiente físico, por exemplo: O número de acidentes de carros por dia numa grande cidade. O número de garrafas mal fechadas por trinta minutos na máquina de enchimento de cerveja. O número de defeitos de soldagem em seis metros de tubo; Num processo de Poisson podem ser observados eventos discretos numa área de oportunidade de tal forma que, reduzindo suficientemente essa área de 81 oportunidade que pode ser um intervalo de tempo, espaço, ou área na qual mais de uma ocorrência de um evento pode ocorrer: Características da Distribuição Poisson A probabilidade de observar apenas um sucesso no intervalo é estável. A probabilidade de observar mais de um sucesso no intervalo é zero. A ocorrência de um sucesso em qualquer intervalo é estatisticamente independente
Compartilhar