Baixe o app para aproveitar ainda mais
Prévia do material em texto
2019 Planejamento de exPerimentos Profª. Gabriela de Paula Alves 1a Edição Copyright © UNIASSELVI 2019 Elaboração: Profª. Gabriela de Paula Alves Revisão, Diagramação e Produção: Centro Universitário Leonardo da Vinci – UNIASSELVI Ficha catalográfica elaborada na fonte pela Biblioteca Dante Alighieri UNIASSELVI – Indaial. Impresso por: AL474 Alves, Gabriela de Paula Planejamento de experimentos. / Gabriela de Paula Alves. – Indaial: UNIASSELVI, 2019. 212 p.; il. ISBN 978-85-515-0279-2 1. Física - Experiências - Brasil. II. Centro Universitário Leonardo Da Vinci. CDD 530 III aPresentação O planejamento de experimentos é uma área da ciência cujo objetivo é possibilitar aos profissionais a obtenção do melhor sistema de trabalho com menor uso de recursos. Mantendo como alicerce a estatística, este ramo do conhecimento nos auxilia com ferramentas e modelos para otimização de processos. Este trabalho tem como objetivo o estudo das bases da estatística para posterior aplicação de ferramentas visando empregá-las no planejamento e análise de experimentos, bem como controle de qualidade adequado ao tema. Para tanto, o conteúdo foi dividido em três unidades, sendo que cada unidade possui tópicos com temas separados visando à maior clareza e facilidade de compreensão dos assuntos trabalhados. Um exemplo prático da importância da temática que será estudado pode ser a aplicação de tal metodologia em uma pesquisa laboratorial em que se deseje avaliar duas variáveis, por exemplo, o tempo de uma reação e o reagente usado no processo. Uma análise separada dos fatores pode ser feita, porém, demandará um grande número de observações e, ainda assim, não haverá uma análise da interação entre os dois parâmetros, ou seja, como um fator pode influenciar o outro. Diversas ferramentas aplicadas no ramo do planejamento experimental abordam formas de relacionar condições de trabalho distintas com respostas independentes ou dependentes mutualmente. O uso de um planejamento experimental é capaz de investigar suas relações e prever os melhores resultados para um sistema com uso de poucas observações, ou ensaios. Na Unidade 1, com o objetivo de prepará-lo para o estudo mais aprofundado da área de planejamento de experimentos, serão inicialmente abordados conhecimentos de estatística básica e formas de representação comumente usadas para mensurar grandezas e unidades de medidas. Além disso, importa examinar diferentes tipos de representações gráficas e suas distintas aplicações. As representações visuais são amplamente praticadas em meios de comunicação ou trabalhos científicos para que as informações sejam traduzidas de modo mais didático e de fácil entendimento. A Unidade 2 será composta pela abordagem de diferentes formas de realização de um planejamento experimental. Serão mostradas estratégias, conceitos e tratamentos de técnicas necessárias para estruturar um experimento, bem como a análise dos dados a ser realizada. Vale apontar que o número de parâmetros a ser explorado é fator primordial para escolha da forma que um teste será realizado. IV Você já me conhece das outras disciplinas? Não? É calouro? Enfim, tanto para você que está chegando agora à UNIASSELVI quanto para você que já é veterano, há novidades em nosso material. Na Educação a Distância, o livro impresso, entregue a todos os acadêmicos desde 2005, é o material base da disciplina. A partir de 2017, nossos livros estão de visual novo, com um formato mais prático, que cabe na bolsa e facilita a leitura. O conteúdo continua na íntegra, mas a estrutura interna foi aperfeiçoada com nova diagramação no texto, aproveitando ao máximo o espaço da página, o que também contribui para diminuir a extração de árvores para produção de folhas de papel, por exemplo. Assim, a UNIASSELVI, preocupando-se com o impacto de nossas ações sobre o ambiente, apresenta também este livro no formato digital. Assim, você, acadêmico, tem a possibilidade de estudá-lo com versatilidade nas telas do celular, tablet ou computador. Eu mesmo, UNI, ganhei um novo layout, você me verá frequentemente e surgirei para apresentar dicas de vídeos e outras fontes de conhecimento que complementam o assunto em questão. Todos esses ajustes foram pensados a partir de relatos que recebemos nas pesquisas institucionais sobre os materiais impressos, para que você, nossa maior prioridade, possa continuar seus estudos com um material de qualidade. Aproveito o momento para convidá-lo para um bate-papo sobre o Exame Nacional de Desempenho de Estudantes – ENADE. Bons estudos! Na Unidade 3, o gerenciamento de riscos e falhas em experimentos será tema de trabalho. Além disso, as aplicações e comparativos do método de planejamento de experimentos com relação a outros utilizados, como exemplo, o método científico, serão abordados e analisados. Desse modo, as bases de conhecimento necessárias para realizar o planejamento, análise e controle de experimentos serão trabalhadas no decorrer deste livro. Profª. Gabriela de Paula Alves NOTA V VI VII UNIDADE 1 – INTRODUÇÃO À ESTATÍSTICA ............................................................................. 1 TÓPICO 1 – GRANDEZAS FÍSICAS E UNIDADES DE MEDIDAS............................................ 3 1 INTRODUÇÃO ..................................................................................................................................... 3 2 SISTEMAS DE UNIDADES DE MEDIDAS ................................................................................... 3 3 ANÁLISE DIMENSIONAL ................................................................................................................ 6 4 ALGARISMOS SIGNIFICATIVOS .................................................................................................. 9 RESUMO DO TÓPICO 1........................................................................................................................ 11 AUTOATIVIDADE ................................................................................................................................. 12 TÓPICO 2 – PRINCÍPIOS BÁSICOS DE ESTATÍSTICA DESCRITIVA ..................................... 13 1 INTRODUÇÃO ..................................................................................................................................... 13 2 ESTATÍSTICA DESCRITIVA ............................................................................................................. 13 3 MEDIDAS DE TENDÊNCIA CENTRAL ......................................................................................... 16 4 MEDIDAS DE DISPERSÃO ............................................................................................................... 19 5 MEDIDAS DE POSIÇÃO.................................................................................................................... 20 6 DISTRIBUIÇÃO DE FREQUÊNCIAS .............................................................................................. 21 7 ANÁLISE DE FREQUÊNCIAS ABSOLUTA, RELATIVA E ACUMULADA ............................ 21 8 DISTRIBUIÇÃO NORMAL ............................................................................................................... 23 RESUMO DO TÓPICO 2........................................................................................................................ 26 AUTOATIVIDADE ................................................................................................................................. 27 TÓPICO 3 – REPRESENTAÇÕES GRÁFICAS E O PRINCÍPIO 80/20 ......................................... 29 1 INTRODUÇÃO .....................................................................................................................................29 2 REPRESENTAÇÕES GRÁFICAS ...................................................................................................... 29 3 GRÁFICO DE LINHAS ....................................................................................................................... 30 4 GRÁFICO DE SETORES ..................................................................................................................... 32 5 GRÁFICO DE BARRAS E COLUNAS ............................................................................................. 33 6 HISTOGRAMA ..................................................................................................................................... 35 7 POLÍGONO DE FREQUÊNCIAS E OGIVA.................................................................................... 36 8 DIAGRAMA DE DISPERSÃO .......................................................................................................... 37 9 PICTOGRAMAS ................................................................................................................................... 38 10 PRINCÍPIO DE PARETO .................................................................................................................. 41 11 APLICAÇÃO DO MÉTODO ............................................................................................................ 41 LEITURA COMPLEMENTAR ............................................................................................................... 46 RESUMO DO TÓPICO 3........................................................................................................................ 50 AUTOATIVIDADE ................................................................................................................................. 51 TÓPICO 4 – PRINCÍPIOS BÁSICOS DE ESTATÍSTICA INFERENCIAL ................................... 53 1 INTRODUÇÃO ..................................................................................................................................... 53 2 POPULAÇÃO VERSUS AMOSTRA ................................................................................................. 53 3 COLETA DE DADOS ........................................................................................................................... 54 4 TÉCNICAS DE AMOSTRAGEM ...................................................................................................... 55 5 ESTIMAÇÃO ......................................................................................................................................... 56 sumário VIII 6 ESTIMAÇÃO DE PARÂMETROS ..................................................................................................56 7 TAMANHO DA AMOSTRA ............................................................................................................57 RESUMO DO TÓPICO 4......................................................................................................................59 AUTOATIVIDADE ...............................................................................................................................60 UNIDADE 2 – METODOLOGIAS PARA PLANEJAMENTO EXPERIMENTAL E SUAS PRINCIPAIS VARIÁVEIS .............................................................................63 TÓPICO 1 – INTRODUÇÃO AO PLANEJAMENTO EXPERIMENTAL ...................................65 1 INTRODUÇÃO ...................................................................................................................................65 2 INFERÊNCIA ESTATÍSTICA ...........................................................................................................66 3 INTERVALO DE CONFIANÇA ......................................................................................................67 4 TESTE DE HIPÓTESES .....................................................................................................................71 5 PLANEJAMENTO EXPERIMENTAL .............................................................................................72 6 TIPOS DE AMOSTRAS.....................................................................................................................74 7 TIPOS DE EXPERIMENTOS ............................................................................................................75 RESUMO DO TÓPICO 1......................................................................................................................81 AUTOATIVIDADE ...............................................................................................................................82 TÓPICO 2 – PLANEJAMENTO DE EXPERIMENTOS COM UM ÚNICO FATOR ................83 1 INTRODUÇÃO ...................................................................................................................................83 2 ANÁLISE DE VARIÂNCIA ENVOLVENDO UM ÚNICO FATOR..........................................83 3 ANÁLISE DE VARIÂNCIA PARA MODELO COM EFEITOS FIXOS ....................................85 4 ANÁLISE DE VARIÂNCIA PARA MODELO COM EFEITOS ALEATÓRIOS .....................94 5 ANÁLISE DE VARIÂNCIA COM BLOCOS COMPLETOS ALEATORIZADOS .................98 LEITURA COMPLEMENTAR .............................................................................................................108 RESUMO DO TÓPICO 2......................................................................................................................112 AUTOATIVIDADE ...............................................................................................................................113 TÓPICO 3 – PLANEJAMENTO DE EXPERIMENTOS COM VÁRIOS FATORES ..................115 1 INTRODUÇÃO ...................................................................................................................................115 2 ANÁLISE FATORIAL.........................................................................................................................115 3 ANÁLISE FATORIAL COM MODELO DE EFEITOS FIXOS COM DOIS FATORES .........116 4 ANÁLISE FATORIAL COM MODELO DE EFEITOS FIXOS COM MAIS DE DOIS FATORES ..................................................................................................................................124 LEITURA COMPLEMENTAR .............................................................................................................128 RESUMO DO TÓPICO 3......................................................................................................................134 AUTOATIVIDADE ...............................................................................................................................135 UNIDADE 3 – ANÁLISE DE EXPERIMENTOS E APLICAÇÕES ...............................................137 TÓPICO 1 – MÉTODO CIENTÍFICO VERSUS DOE ....................................................................139 1 INTRODUÇÃO ...................................................................................................................................139 2 MÉTODO CIENTÍFICO ....................................................................................................................139 3 DOE .......................................................................................................................................................141 4 COMPARATIVO .................................................................................................................................143 RESUMO DO TÓPICO 1......................................................................................................................144 AUTOATIVIDADE ...............................................................................................................................145 IX TÓPICO 2 – CONTROLE ESTATÍSTICO DO PROCESSO ..........................................................147 1 INTRODUÇÃO...................................................................................................................................147 2 CONTROLE ESTATÍSTICO DE PROCESSO ...............................................................................147 3 GRÁFICOS DE CONTROLE ............................................................................................................148 4 CAPACIDADE DE PROCESSO .......................................................................................................165 RESUMO DO TÓPICO 2......................................................................................................................169 AUTOATIVIDADE ...............................................................................................................................170 TÓPICO 3 – ANÁLISE DE FALHAS E GERENCIAMENTO DE RISCOS.................................173 1 INTRODUÇÃO ...................................................................................................................................173 2 GERENCIAMENTO DE RISCOS ....................................................................................................173 3 METODOLOGIA DE SUPERFÍCIE DE RESPOSTA ...................................................................176 4 OPERAÇÃO EVOLUTIVA ................................................................................................................178 5 ANÁLISE DE FALHAS ......................................................................................................................179 RESUMO DO TÓPICO 3......................................................................................................................183 AUTOATIVIDADE ...............................................................................................................................184 TÓPICO 4 – APLICAÇÕES DA METODOLOGIA DE PLANEJAMENTO DE EXPERIMENTOS .....................................................................................................185 1 INTRODUÇÃO ...................................................................................................................................185 2 PLANEJAMENTO, MELHORIA DE PROCESSOS E APLICAÇÕES ......................................185 3 SEIS SIGMA ........................................................................................................................................197 4 METODOLOGIA ................................................................................................................................198 LEITURA COMPLEMENTAR .............................................................................................................200 RESUMO DO TÓPICO 4......................................................................................................................204 AUTOATIVIDADE ...............................................................................................................................205 REFERÊNCIAS .......................................................................................................................................207 X 1 UNIDADE 1 INTRODUÇÃO À ESTATÍSTICA OBJETIVOS DE APRENDIZAGEM PLANO DE ESTUDOS A partir do estudo desta unidade, você deverá ser capaz de: • identificar as grandezas físicas e suas formas de mensuração; • demonstrar a uniformização das unidades padrão de medidas e a conversão de unidades; • introduzir conceitos básicos estatísticos; • conhecer os principais tipos de representações gráficas; • compreender o Princípio de Pareto e sua aplicabilidade ao analisar a causa de um problema. Esta unidade está dividida em quatro tópicos. No decorrer da unidade você encontrará autoatividades com o objetivo de reforçar o conteúdo apresentado. TÓPICO 1 – GRANDEZAS FÍSICAS E UNIDADES DE MEDIDAS TÓPICO 2 – PRINCÍPIOS DE ESTATÍSTICA DESCRITIVA TÓPICO 3 – REPRESENTAÇÕES GRÁFICAS E O PRINCÍPIO 80/20 TÓPICO 4 – PRINCÍPIOS DE ESTATÍSTICA INFERENCIAL 2 3 TÓPICO 1 UNIDADE 1 GRANDEZAS FÍSICAS E UNIDADES DE MEDIDAS 1 INTRODUÇÃO Medir é um ato tão costumeiro em nosso cotidiano que se tornou despercebido. Diversas são as atividades em que as medições estão presentes. Imagine, por exemplo, um dia típico de trabalho: ao acordar o despertador tocou no horário programado diariamente, para preparar o café da manhã, você utilizou o micro-ondas com a potência e tempo necessários para o aquecimento do leite. Depois, ao ir trabalhar, dirigiu a velocidade média permitida no trecho entre sua casa e seu local de trabalho. Ao almoçar, pesou o prato de comida em uma balança e pagou o valor compatível ao que foi consumido. Apenas nesta descrição de um dia comum é possível enumerar uma série de medidas recorrentes ao nosso cotidiano, como a mensuração do tempo, velocidade, pesos, entre outras várias formas que poderiam ser elencadas. Para que estas medições sejam possíveis, utilizamos diversas grandezas físicas na realização destes procedimentos e podemos usar diferentes sistemas de mensuração. 2 SISTEMAS DE UNIDADES DE MEDIDAS As unidades de medidas são grandezas que compõem um sistema de medidas. Como forma de conceituação, pode-se definir uma grandeza como: Propriedade dum fenômeno dum corpo ou duma substância, que pode ser expressa quantitativamente sob a forma dum número e duma referência. A referência pode ser uma unidade de medida, um procedimento de medição, um material de referência ou uma combinação destes (VIM, 2012, p. 2). Consoante ao que foi expresso no Vocabulário Internacional de Metrologia (VIM), uma grandeza é algo que pode ser medido. Para a mensuração das grandezas físicas de modo mais efetivo, foi necessária a criação de um padrão de unidades de medidas. Na antiguidade eram usadas unidades baseadas no corpo humano, como pé, polegadas, palmo, entre outras. Porém, devido a UNIDADE 1 | INTRODUÇÃO À ESTATÍSTICA 4 variações biológicas naturais, este tipo de medição gerava alto índice de erros, o que acarretou a indispensabilidade de uso de um sistema único, correspondente entre diversas cidades e nações. Em 1790 iniciou-se na França o processo de criação deste sistema único, concluído em 1799 com o projeto do Sistema métrico decimal. O Brasil só adotou o novo sistema em maio de 1875 (INMETRO, 2012a). Graças a inovações tecnológicas, novas unidades de medidas foram adotadas e, em 1960, criou-se o Sistema Internacional de Unidades, SI (INMETRO). O Vocabulário Internacional de Metrologia foi criado como uma medida para unificar as definições e terminologias utilizadas na metrologia. No Brasil, o Inmetro (Instituto Nacional de Metrologia, Qualidade e Tecnologia) é o órgão governamental responsável pela publicação e revisões do VIM, sendo o documento disponibilizado gratuitamente na página virtual do instituto (VIM, 2012). NOTA As grandezas adotadas no Sistema Internacional de Unidades, SI, são divididas em grandezas de base e grandezas derivadas. As primeiras são o fundamento das unidades, sendo, portanto, independentes. As grandezas derivadas são formadas por relações algébricas envolvendo as grandezas de base (INMETRO, 2012). As grandezas de base adotadas no SI foram organizadas no quadro a seguir, assim como a simbologia empregada para cada unidade e o conceito específico de cada uma delas. QUADRO 1 – GRANDEZAS FUNDAMENTAIS DO SI Grandeza de base Nome da unidade de base singular (plural) Símbolo da unidade de base Observações Comprimento Metro (metros) m O metro é o comprimento do trajeto percorrido pela luz no vácuo durante um intervalo de tempo de 1/299 792 458 de segundo. Massa quilograma ou quilogramas) kg O quilograma é a unidade de massa; ele é igual à massa do protótipo internacional do ou quilograma. Tempo segundo (segundos)s O segundo é a duração de 9 192 631 770 períodos da radiação correspondente à transição entre os dois níveis hiperfinos do estado fundamental do átomo de césio 133. TÓPICO 1 | GRANDEZAS FÍSICAS E UNIDADES DE MEDIDAS 5 Corrente elétrica ampere (amperes) A O ampere é a intensidade de uma corrente elétrica constante que, se mantida em dois condutores paralelos, retilíneos, de comprimento infinito, de seção circular desprezível, e situados à distância de 1 metro entre si, no vácuo, produz entre estes condutores uma força igual a 2 x 10-7 newton por metro de comprimento. Temperatura termodinâmica kelvin (kelvins) K O kelvin, unidade de temperatura termodinâmica, é a fração 1/273,16 da temperatura termodinâmica do ponto triplo da água. Quantidade de substância mol (mols) mol O mol é a quantidade de substância de um sistema que contém tantas entidades elementares quantos átomos existem em 0,012 quilograma de carbono 12. Intensidade luminosa candela (candelas) cd A candela é a intensidade luminosa, numa dada direção, de uma fonte que emite uma radiação monocromática de frequência 540 x 1012 hertz e que tem uma intensidade radiante nessa direção de 1/683 watt por esferorradiano. FONTE: Adaptado de Inmetro (2013) Por meio do Quadro 1, percebemos que muitas unidades conhecidas do nosso cotidiano não são consideradas grandezas de base. Como exemplo, a velocidade de um automóvel que é expressa através de uma grandeza derivada, proveniente de relações entre grandezas de base, de um comprimento por tempo (metros por segundo, quilômetros por hora...). Veja todas as unidades de medidas padrão em uso no Brasil no Quadro geral de Unidades de Medida disponibilizado no sítio <www.inmetro.gov.br>. No documento são abordados, além das unidades base do SI, os prefixos do SI, regras de grafia e tabelas gerais de unidades não pertencentes ao SI. DICAS Desse modo é possível exprimir o valor da massa de um produto em qualquer país do mundo utilizando o SI, o que propiciou a uniformização das unidades em todas as regiões, independentemente da nação na qual um produto foi produzido. Vale ressaltar que o comércio foi um dos maiores impulsionadores desta padronização, visando evitar prejuízos e/ou confusões com relação a conversões de unidades. UNIDADE 1 | INTRODUÇÃO À ESTATÍSTICA 6 3 ANÁLISE DIMENSIONAL Inicialmente, um tópico de grande importância ao estudar grandezas é o aprendizado da análise dimensional. Serway e Jewett (2010, p. 7) conceituam a análise dimensional como o procedimento específico para “tratar as dimensões como quantidades algébricas”. Isto pode ser entendido como a necessidade de manter um padrão de unidades ao expressar relações. Como exemplo, uma pessoa ao realizar uma trilha ecológica decide marcar a distância que será percorrida em todo trajeto. Ao finalizar a trilha, a anotação consiste em: • 500 metros de subida. • 3,5 km de plano. • 500 metros de descida. Para saber a distância total percorrida, não é correto apenas realizar o somatório das medidas listadas em unidades de medidas diferentes. Um dimensionamento correto só é realizado quando as grandezas possuem unidades iguais ao serem somadas ou subtraídas e, ao serem multiplicadas ou divididas apresentem as mesmas dimensões nos dois lados da expressão (SERWAY; JEWETT, 2010). No exemplo citado acima, deveríamos realizar a conversão das unidades para que todas possuíssem a mesma dimensão e, com isso, fosse possível realizar a operação. A conversão é utilizada para trocar unidades de um sistema de medidas para outro ou até mesmo dentro de um mesmo sistema (SERWAY; JEWETT, 2010). No exemplo citado, devem-se padronizar as grandezas para permitir a operação matemática. 500 m + 500 m + 3 5 1000 1 , km x m km � � � � � � = 500 m + 500 m + 3500 m = 4500 m A lição acima demonstra um tipo de conversão de unidades. Vamos agora nos aprofundar e aprender um pouco mais sobre este assunto! Inicialmente, a conversão de unidades para realização de operações de soma e subtração são realizadas por meio da igualdade das dimensões. Para tanto, devemos conhecer os múltiplos e submúltiplos das unidades fundamentais. No quadro a seguir, você pode notar quais são os múltiplos e submúltiplos das unidades. Desse modo, basta acrescentar a grandeza para realizar a conversão, como foi feito no exemplo anterior. TÓPICO 1 | GRANDEZAS FÍSICAS E UNIDADES DE MEDIDAS 7 QUADRO 2 – PREFIXOS DOS MÚLTIPLOS E SUBMÚLTIPLOS DAS UNIDADES Prefixo Símbolo Potência deci d 10-1 centi c 10-2 mili m 10-3 micro µ 10-6 nano n 10-9 deca da 10+1 hecto h 10+2 kilo k 10+3 mega M 10+6 giga G 10+9 FONTE: SI (2012) Para utilizar esta conversão, a dimensão estudada deve ser a mesma. Nos exemplos a seguir, veremos que qualquer unidade pode ser transformada utilizando os seus múltiplos e submúltiplos. O passo a passo é simples! Você deseja saber quantos centímetros equivalem a 10 metros. Conforme Serway e Jewett (2010), para realizar a conversão deve-se: Escrever o valor que deseja transformar e a unidade que será convertida. 10 m → cm O próximo passo consiste em, com base no quadro de múltiplos e submúltiplos, identificar qual o valor multiplicativo converte a dimensão inicial na dimensão final. Além disso, lembre-se de que, ao multiplicar os valores, as grandezas também são multiplicadas e devem ser reduzidas a fim de obter a dimensão desejada. 10 m → cm → 10 1 10 2 m cm m . − 1000 cm Um novo modo de realizar conversões de unidades, quando temos sistemas de medidas diferentes, é com uso de fatores de conversão padronizados já universalmente conhecidos. No quadro a seguir existem vários fatores de conversão amplamente utilizados. UNIDADE 1 | INTRODUÇÃO À ESTATÍSTICA 8 QUADRO 3 – FATORES DE CONVERSÃO 1 Polegada 2,54 centímetros 1 milha 1,609 quilômetros 1 hectare 10000 m2 1 metro 3,281 pé 1 litro 1dm3 1 minuto 60 segundos 1 hora 60 minutos 1 tonelada 1000 quilogramas 1 joule 6,242 x 1018 eV 1 caloria 4,186 joules 1 atmosfera 1,013 x 105 Pascal FONTE: Adaptado de Serway e Jewett (2010) Com o conhecimento dos fatores de conversão de unidades, é possível transformar medidas de acordo com a unidade apropriada para cada situação. A metodologia usada para transformação é a mesma da utilizada anteriormente, com cancelamento mútuo das unidades na análise dimensional. Veja agora alguns exemplos de conversão de unidades úteis para nosso dia a dia. Você em uma viagem ao exterior vê uma placa de trânsito que indica a velocidade máxima do automóvel igual a 75 milhas/hora. Qual é a velocidade correspondente em quilômetros/hora? Conforme Serway e Jewett (2010), para realizar a conversão deve-se: 1- Escrever o valor que deseja transformar e a unidade que será convertida. 75 mi/h → km/h 2- O próximo passo consiste em, com base no quadro de conversões, identificar qual é o fator de conversão ideal a ser utilizado. Além disso, lembre-se de que ao multiplicar, as grandezas também são multiplicadas e devem ser reduzidas a fim de obter a dimensão desejada. 75 mi/h → km/h → 75 1 609 1 mi h km mi . , 120,7 km/h As conversões de unidades são imprescindíveis quando se trabalha com números. Sempre que forem realizadas operações matemáticas, é fundamental incluir as unidades de medidas para evitar erros nos resultados. TÓPICO 1 | GRANDEZAS FÍSICAS E UNIDADES DE MEDIDAS 9 4 ALGARISMOS SIGNIFICATIVOS Suponha que você realize uma série de medidas do comprimento de um salão de festas que deseja utilizar no final de semana. Dificilmente todas as medidas obtidas serão exatamente iguais, por mais que o objeto de medição seja omesmo. Alguma incerteza sempre está inserida em uma mensuração. Para compreendermos o modo como esta incerteza está introduzida nas medidas, é importante conceituarmos os chamados algarismos significativos. Consoante a Serway e Jewett (2010), os valores das medidas são conhecidos dentro dos limites da incerteza experimental, ou seja, depende de fatores como a qualidade dos equipamentos utilizados para realizar uma medição, a habilidade do operador, o número de medições realizadas assim como o ambiente externo. Os algarismos significativos incluem o primeiro dígito estimado da medida e estão relacionados ao número de dígitos utilizados para retratar a medida. Isto quer dizer que quando realizamos operações com vários resultados medidos, temos que fornecer de forma correta o número exato de algarismos significativos. A regra básica para algarismos significativos em operações matemáticas é dada por: Ao multiplicar várias quantidades, o número de algarismos significativos na resposta final é o mesmo que o número de algarismos significativos na quantidade que tem o número menor de algarismos significativos. A mesma regra se aplica à divisão. [...] Quando dois valores são adicionados e subtraídos, o número de casas decimais no resultado deve ser igual ao menor número de casas decimais de qualquer termo na soma ou diferença” (SERWAY; JEWETT, 2010, p. 11). Assim, o número de casas decimais variará de acordo com o número de algarismos significativos de cada fator. Usando as regras para este tipo de operação matemática, deve-se igualar o número de casas decimais ao menor número de qualquer um dos termos na soma ou diferença, conforme Serway e Jewett (2010) descreveram. Porém, há regras específicas para demonstrar o resultado de forma correta, utilizando arredondamento dos números. Quando reduzir o número de casas decimais, deve-se analisar o último algarismo. Se o último dígito for maior que 5, deve-se acrescentar um incremento unitário no último algarismo reduzido, como exemplo 94,768 torna-se 94,8. Se o último dígito for menor que 5, mantém-se o número sem alteração, como exemplo 94,74 torna- se 94,7. Se o último algarismo for igual a 5, o dígito final deve ser mantido em caso de ser par ou deve ser arredondado para o número par maior, como exemplo 55,65 torna-se 55,6 e 15,75 torna-se 15,8 (SERWAY; JEWETT, 2010). Assim, utilizando as regras para algarismos significativos e para arredondamento, temos como resultados as equações a seguir: UNIDADE 1 | INTRODUÇÃO À ESTATÍSTICA 10 9,5 + 85,24 = 94,7 9,5 + 85,268 = 94,8 85,24 - 9,5 = 75,7 85,268 - 9,5 = 75,8 Vale ressaltar, conforme visto nos exemplos, que o arredondamento não é sucessivo, ou seja, a regra só é aplicada para o último algarismo significativo. Aplicando a regra referente às operações de multiplicação e divisão, ou seja, o número de algarismos significativos na resposta final é o mesmo que o número que houver menor quantidade de algarismos significativos. Neste ponto é necessário atentar para o conceito de algarismos significativos. O número de algarismos significativos de uma medida é exposto de acordo com o número de dígitos expressos. Desse modo, o número 2,30 possui 3 algarismos significativos e o número 0,03 possui um algarismo significativo, visto que ele pode ser expresso como 3x10-2. Já o número 0,0075 possui 2 significativos pelo mesmo motivo. Entretanto, se expressarmos o número como 7,50x10-2 haverá 3 algarismos significativos. De acordo com os exemplos citados, verifica-se que o número de algarismos expressos pode ser diferente do número de algarismos significativos na medida. Para evitar tal dificuldade, usa-se comumente notação científica. Análogo às operações de soma e subtração, usaremos as regras básicas para demonstrar exemplos de multiplicação e divisão e as regras para algarismos significativos e arredondamento. 1,25 x 5,8 = 7,2 1,25 x 5,647 = 7,06 5,647 : 0,857 = 6,59 5,8 : 1,1218 = 5,2 Nos exemplos acima, as soluções foram corrigidas para manter o menor número de algarismos significativos envolvidos na operação. 11 Neste tópico, você aprendeu que: • Tudo aquilo que pode ser medido é denominado grandeza. Para a mensuração das grandezas físicas foi criado um padrão de unidades de medidas. • O Sistema Internacional de Unidades, SI, é um sistema único de padronização de medidas adotado para ser possível a intercambialidade de dimensões internacionais. • A análise dimensional é um equacionamento para que as grandezas ao serem matematicamente operadas possuam unidades iguais. • Em toda medida há algarismos certos e duvidosos, sendo que o estudo dos algarismos significativos nos dá a metodologia de padronização de tais medidas. RESUMO DO TÓPICO 1 12 1 Determine o valor da medida após conversão conforme se pede. 2 Determine o valor da medida com o número de algarismos significativos e arredondamento corretos conforme se pede. AUTOATIVIDADE 1 45 μm → dam → dam 2 1000 µg → mg → mg 3 15 m → km → km 4 27 mm → dam → dam 5 1,5 m → mm → mm 6 100 km → mi → mi 7 35 MPa → atm → atm 8 8 hectares → m2 → m2 1 4,452 + 13,8 = 2 111 - 3,765 = 3 21,79 x 4,1 = 4 500 : 10,25 = 13 TÓPICO 2 PRINCÍPIOS BÁSICOS DE ESTATÍSTICA DESCRITIVA UNIDADE 1 1 INTRODUÇÃO A estatística está presente em nosso cotidiano de forma mais intensa do que imaginamos. Pesquisas de mercado, taxas de crescimento de doenças, taxas de natalidade, percentual de aumento de preços de produtos, estimativas gerais, entre outras várias aplicações possíveis de serem exemplificadas. De acordo com Larson e Farber (2015, p. 3), a “estatística é a ciência que trata da coleta, organização, análise e interpretação dos dados para a tomada de decisões”, sendo que os “dados consistem em informações provenientes de observações, contagens, medições ou respostas”. Para descrever as observações ou conjunto de dados de determinada população são utilizadas ferramentas de representação dos elementos, seja por meio de gráficos, empregados como um excelente recurso visual, ou cálculos que fornecem descrição numérica sumarizada dos dados. 2 ESTATÍSTICA DESCRITIVA A estatística é um ramo da ciência no qual há coleta, organização, análise e interpretação de informações provenientes de contagens, medições ou respostas para tomada de decisão. A estatística possui dois ramos de estudo principais, a estatística inferencial, que utiliza uma parte do conjunto de informações para obter conclusões de toda a representação e a estatística descritiva, que envolve a organização e reprodução dos dados por meios numéricos ou gráficos (LARSON; FARBER, 2015). A estatística descritiva é objeto de estudo deste tópico do trabalho. UNIDADE 1 | INTRODUÇÃO À ESTATÍSTICA 14 O filme “Moneyball: o homem que mudou o jogo” mostra uma aplicação prática e cotidiana da estatística, contando a história de um gerente de um time de baseball que utiliza técnicas estatísticas para escolher os jogadores de seu time e obter resultados. É importante apontar que o filme recebeu seis indicações para o Oscar em 2012. Vale a pena assistir a ele. DICAS Toda análise estatística parte de um objeto de estudo, um tema específico delimitado, ou seja, a variável de interesse. É importante salientar que se pode obter como resposta dados qualitativos ou quantitativos. O conjunto de dados qualitativos não possuem entradas numéricas, ou seja, apresentam atributos (qualidades) como objeto de pesquisa, como exemplo, diagnosticar grau de instrução, sexo, esporte favorito de uma população. Os dados qualitativos podem ser classificados em ordinais, quando háuma ordem entre as respostas, exemplo grau de instrução que pode ser separado e elencado em níveis, ou nominais, quando não há nenhuma ordenação. Entretanto, o conjunto de dados quantitativos possui grandezas numéricas ou contagens, como exemplo idade, peso, salário, altura de sua população. Do mesmo modo, os dados quantitativos podem ser classificados em discretos, quando usam-se apenas números inteiros para especificação, ou contínuos, quando tratam-se de números reais, podendo desta forma ter valores decimais (DANTE, 2016; LARSON; FARBER, 2015). Resumidamente, pode-se visualizar a classificação dos dados através da figura a seguir. FIGURA 1 – CLASSIFICAÇÃO DAS VARIÁVEIS FONTE: A autora (2018) Variáveis (dados) Qualitativas (atributos) Quantitativas (numéricas) Contínuas (núm. reais) Discretas (núm. inteiros) Ordinais (níveis) Nominais TÓPICO 2 | PRINCÍPIOS BÁSICOS DE ESTATÍSTICA DESCRITIVA 15 Além da classificação das variáveis, na Figura 1, há outro método de categorizar as variáveis, através dos níveis de mensuração nominal, ordinal, intervalar e de razão (LARSON; FARBER, 2015). Dados no nível nominal de mensuração são apenas qualitativos. Dados nesse nível são categorizados usando-se nomes, rótulos ou qualidades. Não é possível realizar cálculos matemáticos nesse nível. Dados no nível ordinal de mensuração são qualitativos ou quantitativos. Dados nesse nível podem ser postos em ordem ou classificados, mas as diferenças entre as entradas de dados não têm sentido matemático. Dados no nível de mensuração intervalar podem ser ordenados e é possível calcular diferenças que tenham sentido matemático entre as entradas de dados. No nível intervalar, um registro zero simplesmente representa uma posição em uma escala; a entrada não é um zero natural. Dados no nível de mensuração de razão são similares aos dados no nível intervalar, com a propriedade adicional de que, nesse nível, um registro zero é um zero natural. Uma razão de dois valores pode ser formada de modo que um dado possa ser expresso significativamente como um múltiplo de outro (LARSON; FARBER, 2015 p. 10-11). Consoante às definições apresentadas acima e sabendo que os níveis de mensuração descritos são importantes para determinar as melhores operações estatísticas a serem realizadas, analogamente aos tipos de dados, o nível de mensuração nominal são qualitativos, já os ordinais podem ser quantitativos ou qualitativos, sendo possível ordená-los. Pode-se concluir também que o nível de mensuração intervalar e de razão são similares, porém diferenciam-se pelo fator zero natural, que tem o sentido de “nenhum”. Imagine que o zero natural possui sentido numérico, como exemplo zero reais em uma conta bancária, velocidade igual a zero, de outro modo o zero é apenas uma posição dentro de um intervalo, como exemplo a temperatura. Como forma resumida dos níveis de mensuração há as informações resumidas sobre eles na figura a seguir (LARSON; FARBER, 2015). FIGURA 2 – OPERAÇÕES APROPRIADAS DE ACORDO COM O NÍVEL DE MENSURAÇÃO DOS DADOS Nível de mensuração Categorizar os dados Ordenados os dados Subtrair os dados Determinar se um dado é múltiplo do outro Nominal Sim Não Não Não Ordinal Sim Sim Não Não Intervalar Sim Sim Sim Não Razão Sim Sim Sim Sim FONTE: Larson e Farber (2015) UNIDADE 1 | INTRODUÇÃO À ESTATÍSTICA 16 Desse modo é possível em um único quadro associar as principais características de cada nível de mensuração de variáveis, como visto no quadro acima. Quando há o uso de todas as observações obtidas de um grupo inteiro num conjunto de dados, tem-se a definição de população. Ao realizar a análise, se apenas uma parte da população for examinada para alcance dos resultados há então uma pesquisa por amostragem e o conjunto é uma amostra. Esta definição é importante para entendimento que, na maioria das vezes, as conclusões são tomadas a partir de uma amostra representativa de uma população. Outro conceito de grande importância de ser determinado são os termos parâmetros e estatística amostral. Um parâmetro é a descrição numérica de uma característica de uma população e uma estatística amostral a descrição numérica de uma característica de uma amostra (MOORE, 2011; LARSON; FARBER, 2015). ATENCAO No Tópico 4 da presente unidade estes itens serão trabalhados com maior profundidade. ESTUDOS FU TUROS Para análise dos dados obtidos de determinada variável, é comum o uso de medidas de tendência central, medidas de variação e medidas de posição. Estas são formas de obter informações de valores comparativos e variabilidade em um conjunto de dados. 3 MEDIDAS DE TENDÊNCIA CENTRAL Inicialmente estudaremos as medidas de tendência central que representam observações típicas e centrais sobre os dados, como exemplos as medidas de média, mediana e moda (DANTE, 2016; LARSON; FARBER, 2015). A média possui diferentes formas de ser mensurada, sendo a mais conhecida a média aritmética. Por definição, a média aritmética é igual à soma dos valores dos dados dividida pelo número de observações, podendo ser uma média populacional ou amostral, diferenciando-se apenas se o número de observações é relativo a uma população ou a uma amostra. Matematicamente, a média aritmética pode ser descrita como a relação entre o somatório dos números dividido pelo número total de itens (DANTE, 2016; LARSON; FARBER, 2015). TÓPICO 2 | PRINCÍPIOS BÁSICOS DE ESTATÍSTICA DESCRITIVA 17 Exemplificando, pode-se pensar que uma universidade buscando conhecer o perfil dos alunos de uma sala de pós-graduação resolveu aplicar um questionário aos acadêmicos. Uma das variáveis de estudo é a idade dos alunos, obtendo-se os dados a seguir: 28 35 25 48 30 31 52 30 29 38 A média aritmética simples das medidas é dada pelo somatório de todas as medidas dividido pelo número de dados. Desse modo, tem-se: MA � � � � � � � � � � �28 35 25 48 30 31 52 30 29 38 10 34 6, A média aritmética simples é calculada conforme exemplo acima e, neste caso, tem como resultado o valor de 34,6 anos. Outra forma de cálculo de uma medida de tendência central é a média aritmética ponderada, que pode ser definida como uma média aritmética simples com o uso de pesos nas medidas. A média ponderada é calculada por meio da relação entre a soma de cada dado do conjunto multiplicado pelo seu respectivo peso e este resultado é dividido pelo somatório dos pesos (DANTE, 2016). Exemplificando, pode-se citar que um dos acadêmicos da turma da pós- graduação analisou seu boletim na disciplina Matemática Básica e calculou sua nota final para compará-la ao resultado apresentado no boletim. Para tanto, as notas e respectivos pesos encontram-se elencados a seguir. Atividade Peso Nota do aluno Prova 1 2 6,5 Prova 2 2 7,0 Prova 3 2 5,0 Atividades 1,5 8,0 Seminário 2,5 WW7,0 Realizando o cálculo conforme foi enunciado acima, temos que a média ponderada é igual a: MP � � � � � � � � � 2 6 5 2 5 1 5 8 2 5 7 2 2 2 1 5 2 5 6 65 . , . , . , . , , , Desse modo, o aluno conferiu sua nota final, igual a 6,65 pontos. Para isso, realizou o somatório das notas multiplicadas pelos respectivos pesos e dividiu o resultado pelo somatório dos pesos das medidas. UNIDADE 1 | INTRODUÇÃO À ESTATÍSTICA 18 Entretanto, nem sempre apenas a média é capaz de fornecer as características básicas de um conjunto de dados. Quando há medidas com dispersão muito elevada, a média pode induzir a um valor muito maior ou menor que a maioria dos valores do conjunto. Como exemplo, no caso de haver um conjunto igual a {102; 120; 105; 111; 1}, a média é 87,8 _ valor bem abaixo da maioria do universo de medidas. As outras medidas de tendência central auxiliam nestes casos específicos. A mediana é definida como umvalor que está no meio dos dados quando o conjunto está ordenado, indicando o centro de um conjunto de dados ordenados divididos em duas partes. Em caso do número de observações pares, usa-se a média entre os dois elementos centrais (DANTE, 2016; LARSON; FARBER, 2015). Utilizando o mesmo conjunto de dados das idades dos acadêmicos da pós-graduação de uma universidade e podemos obter a mediana. A variável idade foi questionada e teve como respostas os valores citados a seguir. 28 35 25 48 30 31 52 30 29 38 Para obtenção da mediana, primeiramente deve-se ordenar os valores dos dados. 25 28 29 30 30 31 35 38 48 52 Por se tratar de um número de observações par, deve-se calcular a média entre os dois valores centrais, neste caso, os números 30 e 31, com mediana igual a 30,5. Suponha que haja um aluno a mais na turma e, com isso, tenhamos o conjunto de dados com total ímpar descritos a seguir. 25 28 29 30 30 31 33 35 38 48 52 Desse modo, a mediana será igual a 31, valor central após ordenação dos dados. A última medida de tendência central estudada é a moda que representa o valor que ocorre com maior frequência dentro de um conjunto de dados, podendo haver duas modas no grupo quando a frequência de repetição é a mesma (DANTE, 2016; LARSON; FARBER, 2015). Exemplificando, suponha o conjunto de dados das idades dos alunos da pós-graduação para obtenção da moda. 28 35 25 48 30 31 52 30 29 38 Neste caso, a moda será 30, visto que é a única idade que tem maior frequência em relação às outras. TÓPICO 2 | PRINCÍPIOS BÁSICOS DE ESTATÍSTICA DESCRITIVA 19 4 MEDIDAS DE DISPERSÃO Estudaremos agora as medidas de dispersão ou variação, que têm como um dos objetivos comparar a variação em diferentes conjuntos de dados. Dentro deste conjunto de medidas, a primeira a ser analisada é a amplitude, medindo a diferença entre os valores máximo e mínimo para dados quantitativos. Uma das desvantagens desta medição reside no fato de utilizar apenas dois valores em um conjunto de dados. Desse modo, tem-se (LARSON; FARBER, 2015): Amplitude = Valor máximo – Valor mínimo Para sanar o ponto desfavorável da amplitude, outras medidas de dispersão a serem estudadas são a variância e o desvio padrão, medidas que utilizam todas as observações do conjunto de dados. Inicialmente, conceituar o termo desvio é importante para entendimento da variância e desvio padrão. O desvio em termos estatísticos significa a diferença do valor medido em relação à média do conjunto de dados. Vale ressaltar que uma propriedade da média aritmética, medida de tendência central, reside em que o somatório dos desvios de um conjunto de dados é sempre igual a zero. Pode-se concluir que haverá grande variabilidade dos dados para altos desvios e baixa variabilidade dos dados para pequenos desvios. A variância amostral ou variância populacional é definida como uma medida da média dos quadrados dos desvios. A variância é expressa como V, σ2, s2, sendo que a variância populacional considera todo o universo da pesquisa e a variância amostral apenas uma parte da população, a amostra (DANTE, 2016; LARSON; FARBER, 2015; FERREIRA, 2015). Variância x MA n i n ipopulacional = 2� � �� ��� 1 2 Sendo n o número de medidas, MA a média aritmética e x o valor da observação. Uma desvantagem do uso desta medida consiste no fato de obter como resultado uma unidade de medida diferente da unidade das observações, compreendendo sempre o quadrado da unidade inicial, em termos da análise dimensional. Para eliminar este problema, foi adotado o desvio padrão amostral ou populacional, que consiste na raiz quadrada da variância. Dessa maneira, o desvio padrão é apresentado na mesma unidade de medida da variável em questão. Em síntese, o valor do desvio só será igual a zero se todos os valores do conjunto forem iguais e, quanto mais próximo de zero o desvio se encontrar, menor será a dispersão dos valores do conjunto (DANTE, 2016; LARSON; FARBER, 2015; FERREIRA, 2015). Desvio padrão populacional = � � �� ��� in ix MA n 1 2 UNIDADE 1 | INTRODUÇÃO À ESTATÍSTICA 20 O desvio padrão é utilizado também como base para determinação estatística de um importante modelo para gestão da qualidade, o método seis sigma, técnica que utiliza ferramentas estatísticas para controle de qualidade. Os princípios e procedimentos de aplicação serão abordados ainda neste curso. Para conhecer mais sobre o assunto, fique ligado na dica a seguir! A metodologia de aplicação do seis sigma e seus conceitos podem ser entendidos de modo mais aprofundado no artigo Seis sigma como diferencial de lucratividade: uma abordagem conceitual, escrito por Rafael Scalabrin, Marcos Eduardo Servat, Leandro Dorneles, Claudir Padia, Edio Polacinski. Para tanto, o texto está disponível em: <http://www.fahor.com.br/publicacoes/sief/2013/ seis_sigma_como_um.pdf>. Aproveite a leitura! DICAS Ademais, outra forma de calcular a variabilidade dos dados é por meio do coeficiente de variação, constantemente expresso em porcentagem, o qual é dado pelo quociente entre o desvio padrão e a média do conjunto de dados, mensurando assim o grau de variação dos dados em relação à média aritmética, sendo um fator adimensional (LARSON; FARBER, 2015; FERREIRA, 2015). Coeficiente Desvio média de variação = padrão .100 Os principais modos de obter medidas de dispersão de um conjunto de dados foram abordados neste item. 5 MEDIDAS DE POSIÇÃO As últimas medidas a serem estudadas são as medidas de posição ou separatrizes, que compreendem os quartis, decis, percentis e escore padrão. Os quartis dividem a distribuição dos dados ordenados em quatro partes, ou seja, o primeiro quartil representa 25% das medidas, depois o segundo quartil representa 50% das medidas, o terceiro quartil 75% das medidas e o quarto quartil 100% das medidas. Vale apontar que o segundo quartil corresponde à mediana do conjunto de dados. Já para o cálculo de decis e percentis utiliza-se como base a divisão do conjunto de dados em dez partes iguais ou cem partes iguais, respectivamente. Vale apontar que os resultados são sempre arredondados para o número inteiro mais próximo ao representar as medidas, em caso da existência de números decimais (LARSON; FARBER, 2015; FERREIRA, 2015). TÓPICO 2 | PRINCÍPIOS BÁSICOS DE ESTATÍSTICA DESCRITIVA 21 Finalmente, a medida escore padrão ou escore-z é definida como o valor representado pelo número de desvios padrão em que um valor x se encontra a partir da média aritmética do conjunto de dados. Vale ressaltar que o escore padrão pode ser positivo, quando o valor analisado for maior que a média, negativo, quando o valor for menor que a média ou igual a zero, quando o valor analisado for igual a média (LARSON; FARBER, 2015). Desse modo, a medida escore padrão é dada por: z Valor desvio = X - média aritmética padrão O valor escore-z é utilizado como base da distribuição de probabilidade normal, amplamente utilizada na estatística e será estudada no item seguinte. 6 DISTRIBUIÇÃO DE FREQUÊNCIAS Ao coletar dados para um determinado estudo, é comum a análise da distribuição das variáveis de acordo com o número de vezes que são obtidas ou o modo que podem ser representadas. “Distribuição de frequência é uma tabela em que se resumem grandes quantidades de dados, determinando o número de vezes, que cada dado ocorre (frequência) e a porcentagem com que aparece” (FERREIRA, 2015, p. 25). Vale apontar que há diversos modos de organizar e interpretar os elementos, sendo necessário primeiramente descrever os principais tipos de variáveis que são alcançados em um experimento. As variáveis aleatórias podem ser classificadas em discretas ou contínuas. As primeiras são unitárias, ou seja, os resultados podem ser enumerados em um conjunto de valores possíveis,já as contínuas possuem número incontável de resultados possíveis, sendo representado por uma reta numérica (LARSON; FARBER, 2015). 7 ANÁLISE DE FREQUÊNCIAS ABSOLUTA, RELATIVA E ACUMULADA As frequências, ou seja, número de vezes que dado elemento aparece em um conjunto, podem ser classificadas em: frequência absoluta, frequência relativa e frequência acumulada (FERREIRA, 2015). A frequência absoluta corresponde ao número de vezes que um dado aparece no conjunto. A frequência relativa corresponde a uma relação da frequência absoluta pelo número total de dados de determinado conjunto. A frequência acumulada corresponde à soma de cada frequência relativa com todas aquelas que lhe são anteriores na distribuição (FERREIRA, 2015). UNIDADE 1 | INTRODUÇÃO À ESTATÍSTICA 22 Um exemplo de aplicação pode ser visto por meio do caso, adaptado, que foi apresentado por Ferreira (2015, p. 26). Um questionário foi aplicado a dez candidatos a uma vaga em uma loja de departamentos e os resultados foram organizados na tabela a seguir. TABELA 1 – CONJUNTO DE DADOS RELATIVOS À QUALIFICAÇÃO E IDADE DOS CANDIDATOS Candidato da Vaga Grau de escolaridade Idade Tempo de experiência na área 1 Ensino Médio 30 7 2 Ensino Superior 35 12 3 Ensino Superior 26 4 4 Ensino Médio 22 1 5 Ensino Médio 28 8 6 Pós-graduação 30 10 7 Ensino Médio 26 3 8 Ensino Superior 33 8 9 Pós-graduação 35 6 10 Ensino Médio 23 2 FONTE: Ferreira (2015, p. 27) As variáveis de interesse neste exemplo são: Grau d e escolaridade, idade e tempo de experiência. Para a demonstração do resultado do cálculo da distribuição de frequências das variáveis foi organizada a tabela a seguir. TABELA 2 – DISTRIBUIÇÃO DE FREQUÊNCIAS PARA AS VARIÁVEIS GRAU DE ESCOLARIDADE E Variável Classificação Frequência absoluta Frequência relativa (%) Frequência Acumulada (%) Grau de escolaridade Ensino Médio 5 50 50 Ensino Superior 3 30 80 Pós-graduação 2 20 100 Idade 22 1 10 10 23 1 10 20 26 2 20 40 28 1 10 50 30 2 20 70 33 1 10 80 35 2 20 100 FONTE: Ferreira (2015, p. 28) TÓPICO 2 | PRINCÍPIOS BÁSICOS DE ESTATÍSTICA DESCRITIVA 23 Em suma, a frequência absoluta é igual ao número de vezes que o dado aparece no conjunto. A frequência relativa, que pode ser percentual ou numérica, é dada pela frequência absoluta dividida pelo número total de observações, neste caso igual a 10, e em seguida multiplicada por 100 para obtenção da porcentagem. A frequência acumulada, neste caso, apresentada em valores percentuais, é o somatório de todas as observações da frequência relativa anteriores àquele dado. Posteriormente, as distribuições de frequências estudadas serão aplicadas nas representações gráficas apresentadas no Tópico 3 desta unidade. ESTUDOS FU TUROS 8 DISTRIBUIÇÃO NORMAL Ao explorar os dados de determinado experimento, pode-se observar um padrão geral regular para descrevê-los. A chamada curva de densidade geralmente é uma descrição adequada do padrão geral de uma distribuição e tem como características principais estar sempre sobre o eixo horizontal ou acima dele, ter área exatamente igual a 1 abaixo dela, ter área proporcional a todas as observações dentro do intervalo de análise e poder apresentar diversas formas (MOORE, 2011). Trata-se de uma representação precisa suficiente para ser usada na prática, não uma descrição exata do conjunto de dados. Numa curva de densidade, com auxílio de ferramentas matemáticas, estabelece-se algumas medidas como a mediana, que é dada pelo ponto em que é possível dividir a curva em duas áreas iguais e a média é dada pelo ponto de equilíbrio da curva. Vale apontar que numa distribuição simétrica a média e a mediana são iguais e correspondem ao ponto central da curva. Em geral, a média é representada pela letra μ e o desvio padrão por σ (MOORE, 2011). A distribuição mais comum de probabilidade utilizada na estatística e no planejamento experimental é a distribuição normal, em que se têm variáveis aleatórias contínuas aplicadas no modelamento de conjuntos de medidas. Na distribuição normal há uma curva de densidade em forma de sino, sempre simétrica com um único pico. A média corresponde ao ponto central da curva e o desvio padrão demonstra a dispersão dos dados no conjunto, Figura 3. Os pontos nos quais há mudança na curvatura ocorre a distâncias iguais nos dois lados da média, sendo estes pontos de inflexão o desvio padrão (MOORE, 2011; LARSON; FARBER, 2015). UNIDADE 1 | INTRODUÇÃO À ESTATÍSTICA 24 FIGURA 3 – DISTRIBUIÇÃO NORMAL DE PROBABILIDADE μ+3σμ+2σμ+σµμ-σμ-2σμ-3σ x Área total = 1 Pontos de inflexão FONTE: Larson e Farber (2015) Visando à padronização de valores em uma curva da distribuição normal, utiliza-se o escore z, relação entre a diferença de um determinado valor x com a média das observações dividido pelo desvio padrão do conjunto. O escore z nos indica quantos desvios padrões a observação original está distante da média e em qual direção, ou seja, positivas se posicionadas à direita da média e negativas se posicionadas à esquerda da média. Desse modo, a distribuição normal padrão é uma distribuição normal com média 0 e desvio padrão igual a 1 (MOORE, 2011; LARSON; FARBER, 2015). Conforme foi exposto, a área sob uma curva normal representa a proporção de observações da distribuição normal naquele determinado intervalo. Para obter de modo mais simples tal proporção acumulada, é ideal que se utilize a curva de distribuição normal padrão, com o uso do valor do escore z calculado. Para tanto, deve-se enunciar o problema em termos da variável x, em seguida padronizar x em termos de uma variável normal padrão z e, posteriormente, utilizar uma tabela padrão que representa as áreas sob a curva normal padronizada, como exemplificada parcialmente pela tabela a seguir. TÓPICO 2 | PRINCÍPIOS BÁSICOS DE ESTATÍSTICA DESCRITIVA 25 TABELA 3 – DISTRIBUIÇÃO NORMAL PADRÃO FONTE: Larson e Farber (2015) Desse modo, qualquer variável aleatória normal pode ser calculada e sua probabilidade de ocorrência obtida se for transformada para uma variável aleatória normal padrão. 26 RESUMO DO TÓPICO 2 Neste tópico, você aprendeu que: • A estatística possui dois ramos de estudo principais, a estatística inferencial, que utiliza uma parte do conjunto de informações para obter conclusões de toda a representação e a estatística descritiva, que envolve a organização e reprodução dos dados por meios numéricos ou gráficos. • As medidas de tendência central representam observações típicas e centrais sobre um conjunto de dados, como exemplos as medidas da média, mediana e moda. • As medidas de dispersão ou variação têm como objetivo principal comparar a variação em diferentes conjuntos de dados, como exemplos a amplitude, o desvio padrão, a variância e o coeficiente de variação. • As medidas de posição ou separatrizes compreendem os quartis, decis, percentis e escore padrão e representam modos de dividir o conjunto de observações. • A distribuição de frequências exprime o número de vezes que dado elemento aparece em um conjunto, podendo ser classificadas em: frequência absoluta, frequência relativa e frequência acumulada. • Ademais, a distribuição de probabilidade mais comum aplicada a estatística é a distribuição normal, em que se têm variáveis aleatórias contínuas aplicadas no modelamento de conjuntos de medidas. Na distribuição normal há uma curva de densidade em forma de sino, sempre simétrica com um único pico. A média corresponde ao ponto central da curva e o desvio padrão demonstra a dispersão dos dados no conjunto. 27 1 (UNCISAL/2015) Em cada bimestre, uma faculdade exige a realização de quatro tipos de avaliação, calculando a nota bimestral pela média ponderada dessas avaliações. Se a tabela apresentaas notas obtidas por uma aluna nos quatro tipos de avaliações realizadas e os pesos dessas avaliações, sua nota bimestral foi aproximadamente igual a: A frequência relativa de funcionários que ganham mensalmente menos de R$ 2000,00 é de: a) 0,07. b) 0,13. c) 0,35. d) 0,65. e) 0,70. a) 8,6. b) 8,0. c) 7,5. d) 7,2. e) 6,8. 2 Quais valores são, respectivamente, a moda, média e mediana dos números da lista a seguir? 133, 425, 244, 385, 236, 236, 328, 1000, 299, 325 a) 236; 361,1 e 312. b) 244; 361 e 312. c) 236; 360 e 312. d) 236; 361,1 e 310. e) 236; 361,1 e 299. 3 (CESGRANRIO/2014) A tabela a seguir apresenta a frequência absoluta das faixas salariais mensais dos 20 funcionários de uma pequena empresa. AUTOATIVIDADE Avaliação Nota Peso Prova escrita 6,00 4 Avaliação continuada 7,00 4 Seminário 8,00 2 Trabalho em grupo 9,00 2 Faixa salarial (R$) Frequência absoluta Menor que 1000,00 6 Maior ou igual a 1000,00 e menor que 2000,00 7 Maior ou igual a 2000,00 e menor que 3000,00 5 Maior ou igual a 3000,00 2 Total 20 28 29 TÓPICO 3 REPRESENTAÇÕES GRÁFICAS E O PRINCÍPIO 80/20 UNIDADE 1 1 INTRODUÇÃO Há diversas maneiras de se apresentar dados de um experimento ou processo. As representações visuais com o uso de gráficos são excelentes para facilitar o entendimento do conteúdo das observações. Contudo, há várias formas de organizar os dados e plotar os gráficos, o que torna imprescindível a compreensão dos fundamentos de cada modelo para melhor escolha ao utilizá-los. Um modelo gráfico específico extensamente aplicado a administração de produção é o Diagrama de Pareto, que apresenta num diagrama de barras as principais informações de um sistema de interesse de modo que permita evidenciar quais fatores são mais importantes em uma priorização de temas para um projeto ou experimento. Dessa forma, as principais formas de representar graficamente um conjunto de dados serão abordadas neste tópico do trabalho, visando fundamentar as principais características específicas de cada um e dar base para uma escolha acertada de um modelo adequado a um certo grupo de observações. 2 REPRESENTAÇÕES GRÁFICAS A representação gráfica de um conjunto de dados é exibida com objetivo de facilitar a visualização das observações, favorecendo o rápido entendimento ao estudar os elementos. Porém, o conhecimento dos principais tipos de gráficos é imprescindível para que não existam conclusões equivocadas acerca dos temas. 30 UNIDADE 1 | INTRODUÇÃO À ESTATÍSTICA De acordo com Dante (2016, p. 40), “a representação gráfica fornece uma visão de conjunto mais rápida que a observação direta dos dados numéricos. Por isso, os meios de comunicação com frequência oferecem a informação estatística por meio de gráficos”. Esta citação enfatiza o motivo pelo qual é tão difundido o uso de gráficos, bem mais frequente que tabelas, em artigos de jornais e revistas. Ademais, Morettin e Bussab (2013) citam que os gráficos são usados visando buscar padrões e relações, correlacionando variáveis e estudando se há inter-relacionamento entre dados. Além disso, facilita o descobrimento de novos fenômenos e a ágil apresentação de resultados. Neste tópico, estudaremos os principais tipos de gráficos, iniciando com o gráfico de segmentos ou também chamado gráfico de linhas. 3 GRÁFICO DE LINHAS O gráfico de linhas é amplamente aplicado para representar a evolução das frequências dos valores de uma variável durante um período, exprimindo possíveis tendências no conjunto de dados (FERREIRA, 2015; DANTE, 2016). Relembrando que a frequência absoluta ou apenas frequência representa o número de vezes que um valor de uma variável é citado. Já a frequência relativa indica a frequência absoluta em que um dado aparece em relação ao total de citações, sendo exposta em forma de fração ou porcentagem. Desse modo, a frequência relativa é o quociente da frequência absoluta pelo número total de dados. Já a frequência acumulada é dada pela soma de cada frequência em conjunto às demais em uma distribuição (FERREIRA, 2015; DANTE, 2016). NOTA O gráfico de linhas é comumente apresentado em reportagens com intuito de demonstrar visualmente dados obtidos em pesquisas e, com uso deste tipo de representação, facilitar o rápido entendimento dos leitores, conforme exemplos a seguir. TÓPICO 3 | REPRESENTAÇÕES GRÁFICAS E O PRINCÍPIO 80/20 31 FIGURA 4 – GRÁFICO DE LINHAS SOBRE A EVOLUÇÃO DA DÍVIDA PÚBLICA EM 2018 3700 3800 3750 3650 3550 3500 3600 JunhoMaioAbrilMarço Va lo r Fevereiro Evolução da dívida pública em 2018 Em bilhões de R$ Janeiro Dívida pública FONTE: <https://g1.globo.com/economia/noticia/2018/07/25/divida-publica-federal-sobe-1-em- junho-e-atinge-r-375-trilhoes.ghtml>. Acesso em: 25 jul. 2018. Na Figura 4 acima o gráfico de linhas exibe a evolução da dívida pública brasileira no ano de 2018. Com base na representação, é possível verificar a tendência de aumento da dívida com o passar dos meses do ano corrente. A Figura 5, mostrada a seguir, demonstra que a média dos salários dos homens tende a ser sempre maior que os das mulheres no estado do Paraná/Brasil. FIGURA 5 – GRÁFICO DE LINHAS SOBRE A MÉDIA SALARIAL ENTRE HOMENS E MULHERES NO PARANÁ 201520132011200920072006200320011999 Homens Mulheres R$ 0,00 R$ 250,00 R$ 500,00 R$ 750,00 R$ 1.000,00 R$ 1.250,00 R$ 1.500,00 R$ 1.750,00 R$ 2.200,00 R$ 2.250,00 R$ 2.500,00 R$ 2.750,00 R$ 3.000,00 FONTE: <https://www.bemparana.com.br/noticia/homens-sempre-terao-salarios-melhores-diz- estudo-estatistico-paranaense>. Acesso em: 25 jul. 2018. 32 UNIDADE 1 | INTRODUÇÃO À ESTATÍSTICA Tomando como base a Figura 5, percebe-se que não há uma tendência de redução ou aumento da diferença entre a média dos homens e das mulheres, porém mantendo sempre acima o salário dos homens em relação ao das mulheres. 4 GRÁFICO DE SETORES Já o gráfico de setores ou também denominado gráfico de pizza determina a proporção de cada item de análise, somando como frequência acumulada 100%, sendo amplamente utilizado para variáveis qualitativas. Desse modo, o gráfico exprime de modo bastante visual a proporção que cada setor representa para o total, simbolicamente como se cada “pedaço” de pizza expressasse uma categoria (MORETTIN; BUSSAB, 2013; DANTE, 2016). Por se tratar de uma representação utilizada para variáveis qualitativas e quantitativas o gráfico de setores é largamente usado em veículos de comunicação. Nas Figuras 6 e 7 vemos exemplos de aplicações dos gráficos de setores, sendo que eles demonstram claramente o percentual correspondente a cada categoria dentro do conjunto de dados analisados. Na Figura 6, o gráfico de setores expõe as emissões globais dos gases do efeito estufa por setor econômico, sendo possível com isso concluir qual segmento é o maior responsável por tais emissões. FIGURA 6 – GRÁFICO DE PIZZA – EMISSÕES GLOBAIS DOS GASES DO EFEITO ESTUFA POR SETOR ECONÔMICO Agricultura, silvicultura e outros usos da terra Eletricidade e aquecimento Indústria Transporte Energia Construções 6%10% 14% 21% 24% 25% FONTE: <https://noticias.uol.com.br/meio-ambiente/ultimas-noticias/redacao/2015/12/07/eletricidade- e-o-setor-campeao-na-emissao-dos-gases-do-efeito-estufa.htm>. Acesso em: 25 jul. 2018. Desse modo, de acordo com a Figura 6, podemos concluir que os setores de agricultura e eletricidade são os maiores responsáveis pelas emissões gasosas. Outro exemplo de aplicação do gráfico de setores é exposto na Figura 7, que demonstra os materiais mais usados em embalagens nos processos de fabricação. TÓPICO 3 | REPRESENTAÇÕES GRÁFICAS E O PRINCÍPIO 80/20 33 FIGURA 7 – GRÁFICO DE PIZZA – MATERIAIS UTILIZADOS NO SETORDE EMBALAGENS PLÁSTICO LIDERA VALOR DE PRODUÇÃO Nota: valores em milhares de reais Fonte: IBGE-PIA - Produto (UL)-2010 Elaboração: FGV - Posição 2012 Valor da produção: R$ 46.985.014 Material plástico 17.423.492 37,08% Papelão ondulado 8.807.395 18,75% Metálicas 7.889.494 16,79% Cartolina e Papel-cartão 4.463.409 9,50% Papel 2.921.233 6,22% Vidro 2.185.384 4,65% Têxteis 2.033.335 4,33% Madeira 1.261.282 2,68% FONTE: <https://www.plastico.com.br/wp-content/uploads/2013/07/noticias_grafico_ pizza_001-300x233.jpg>. Acesso em: 25 jul. 2018. Analisando a Figura 7, percebe-se que os materiais plásticos já representam o maior segmento de matéria-prima para o setor de embalagens. 5 GRÁFICO DE BARRAS E COLUNAS Outra forma de representação gráfica amplamente utilizada é o gráfico de barras, também conhecido como gráfico de colunas, que relaciona desempenho de alguma variável com sua respectiva frequência absoluta ou relativa. Algumas vezes, visando dar ênfase no valor real podem ser utilizados neste tipo de representação a relação entre a variável em análise e seu respectivo valor real numérico. As barras podem ser exibidas na posição horizontal ou vertical, sendo aplicado a variáveis qualitativas ou quantitativas. Alguns autores consideram os gráficos de barras aqueles em que as barras são representadas na direção horizontal e gráfico de colunas aqueles em que as barras são representadas na direção vertical (MORETTIN, 2010; DANTE, 2016). Nas Figuras 9 e 10, são exibidos exemplos de gráficos de barras ou colunas. Na Figura 9, é apresentada a estimativa das frequências relativas percentuais da população com mais de 65 anos no Brasil para as próximas décadas. 34 UNIDADE 1 | INTRODUÇÃO À ESTATÍSTICA FIGURA 8 – GRÁFICO DE COLUNAS – PERCENTUAL DA POPULAÇÃO ACIMA DE 65 ANOS NO BRASIL População com mais de 65 anos 201 0 201 8 202 0 203 0 30 25 20 em % do total 15 10 5 0 25,5 21,920,5 17,4 13,5 9,89,2 7,3 204 0 204 7 205 0 206 0 FONTE: <https://g1.globo.com/economia/noticia/2018/07/25/1-em-cada-4-brasileiros-tera- mais-de-65-anos-em-2060-aponta-ibge.ghtml>. Acesso em: 25 jul. 2018. De acordo com a Figura 8, percebe-se aumento progressivo do percentual da população acima de 65 anos, sendo que em 2060 haverá cerca de ¼ da população brasileira nesta faixa etária. Já na Figura 9 é mostrada a origem das pessoas solicitando refúgio na União Europeia no ano de 2014. Neste caso, são usadas barras horizontais na representação e o valor numérico real do número de pessoas que solicitam refúgio. FIGURA 9 – GRÁFICO DE BARRAS – ORIGEM DAS PESSOAS SOLICITANDO REFÚGIO NA UNIÃO EUROPEIA Origem das pessoas solicitando refúgio na UE Rússia Nigéria Irã Iraque Paquistão Sérvia Eritrea Kosovo Afeganistão Síria 2014 Total: 840.876 150.000120.00090.00060.00030.0000 FONTE: <https://goo.gl/1JxbNo>. Acesso em: 25 jul. 2018. TÓPICO 3 | REPRESENTAÇÕES GRÁFICAS E O PRINCÍPIO 80/20 35 Na Figura 9, o valor numérico real pode ser usado para enfatizar o total de pessoas refugiadas, sendo, mesmo assim, um gráfico de barras. 6 HISTOGRAMA O histograma figura como um dos mais importantes gráficos aplicados a estatística. Ele é usado quando há intervalos, ou seja, classes de valores das variáveis com relação às frequências absoluta ou relativa, sendo aplicado a variáveis quantitativas (MORETTIN; BUSSAB, 2013; DANTE, 2016). Histograma é um gráfico de barras no qual o eixo horizontal, subdividido em vários pequenos intervalos, apresenta os valores assumidos por uma variável de interesse. Para cada um destes intervalos é construída uma barra vertical, cuja área deve ser proporcional ao número de observações na amostra cujos valores pertencem ao intervalo correspondente (WERKEMA, 1995, p. 119). Dessa forma, o histograma é análogo ao gráfico de barras, porém com uso de intervalo de classes, geralmente com barras consecutivas encostadas umas nas outras. Ademais, o eixo horizontal de um histograma possui as unidades de medida para a variável (LARSON; FARBER, 2015). Outro ponto a ser abordado é que, por meio do histograma, as informações da forma de distribuição de um conjunto de dados e a dispersão destes dados em torno do valor central pode ser observado facilmente (WERKEMA, 1995). A figura a seguir apresenta um histograma da frequência dos equipamentos GPS em relação ao intervalo de preços praticados no mercado norte-americano. FIGURA 10 – HISTOGRAMA – EQUIPAMENTO DE NAVEGADORES GPS EM RELAÇÃO À FAIXA DE PREÇO DE MERCADO Preço (em dólares) Fr eq uê nc ia (n úm er o de na ve ga do re s G PS ) 64, 5 344 ,5 304 ,5 264 ,5 224 ,5 184 ,5 144 ,5 104 ,5 8 10 1 2 2 2 4 4 9 6 6 6 FONTE: Larson e Farber (2015) 36 UNIDADE 1 | INTRODUÇÃO À ESTATÍSTICA Pela Figura 11 é possível atentar para o fato de que as faixas de preços são mostradas no eixo horizontal e a frequência no vertical. Além disso, percebe- se que não há uma ordenação decrescente dos grupos de maior frequência. A simetria da distribuição é fator de análise para a correta interpretação dos dados apresentados nos histogramas. Para obtenção do número de classes que deve ser apresentado no gráfico, comumente utiliza-se a chamada regra da raiz, na qual há o cálculo da raiz quadrada do número de observações. O resultado é aproximado para o valor inteiro mais próximo e tem-se o número de classes que deve ser separado (FERREIRA, 2015). 7 POLÍGONO DE FREQUÊNCIAS E OGIVA Quando há o uso de um gráfico de segmentos ligando à sequência dos pontos médios superiores de cada intervalo de classes, tem-se um polígono do histograma ou polígono de frequências. Geralmente é denominado polígono do histograma quando representado em conjunto com um gráfico do tipo do histograma e possui como nomenclatura geral polígono de frequências (MORETTIN, 2010; DANTE, 2016). Trata-se de uma representação próxima a de um histograma em termos de haverem divisões de classes das observações, porém, há posteriormente a ligação, como em um gráfico de linhas, dos valores representativos para cada classe. Na figura a seguir é apresentado um polígono de frequências mostrando a relação do preço dos equipamentos de GPS versus a frequência de cada valor médio praticado no mercado norte-americano. FIGURA 11 – POLÍGONO DE FREQUÊNCIAS – FREQUÊNCIA DE PREÇOS DO EQUIPAMENTO GPS NO MERCADO NORTE-AMERICANO FONTE: Larson e Farber (2015) 44,5 84,5 124,5 164,5 204,5 244,5 284,5 324,5 364,5 Preço (em dólares) 8 10 2 4 6 Fr eq uê nc ia (n úm er o de na ve ga do re s G PS ) TÓPICO 3 | REPRESENTAÇÕES GRÁFICAS E O PRINCÍPIO 80/20 37 É interessante atentar na Figura 12 que a escala na horizontal não se inicia no zero, havendo uma marcação no eixo demonstrando tal alteração. Outro gráfico a ser estudado é uma ogiva, gráfico de frequência acumulada, que é representada por um diagrama de linhas que acumula a frequência de cada intervalo de classes (LARSON; FARBER, 2015). Este tipo de representação é amplamente empregado na área de administração de produção. Na figura a seguir há a representação do preço dos navegadores GPS praticados no mercado norte americano em relação a frequência acumulada de tais preços. FIGURA 12 – OGIVA – FREQUÊNCIA ACUMULADA DOS PREÇOS DE EQUIPAMENTOS GPS NO MERCADO NORTE-AMERICANO FONTE: Larson e Farber (2015) Por meio das Figuras 10, 11 e 12 foi possível confrontar a forma de apresentação de um conjunto de dados por meio de alguns tipos de gráficos, visto que foram retratadas as mesmas informações, isto é, com o uso do mesmo conjunto
Compartilhar