Baixe o app para aproveitar ainda mais
Prévia do material em texto
EDUCAÇÃO SUPERIOR Modalidade Semipresencial Métodos Estatísticos Aplicados à Produção São Paulo 2018 Luciana Borin de Oliveira Métodos Estatísticos Aplicados à Produção Sistema de Bibliotecas do Grupo Cruzeiro do Sul Educacional PRODUÇÃO EDITORIAL - CRUZEIRO DO SUL EDUCACIONAL. CRUZEIRO DO SUL VIRTUAL O48m Oliveira, Luciana Borin de. Métodos estatísticos aplicados à produção. / Luciana Borin de Oliveira. São Paulo: Cruzeiro do Sul Educacional. Campus Virtual, 2018. 120 p. Inclui bibliografia ISBN: (e-book) 1. Estatística. 2.Logística. I. Cruzeiro do Sul Educacional. Campus Virtual. II. Título. CDD 658.78 Pró-Reitoria de Educação a Distância: Prof. Dr. Carlos Fernando de Araujo Jr. Autoria: Luciana Borin de Oliveira Revisão Técnica: Carlos Henrique de Jesus Costa Revisão Textual: Kelciane da Rocha Campos 2018 © Cruzeiro do Sul Educacional. Cruzeiro do Sul Virtual. www.cruzeirodosulvirtual.com.br | Tel: (11) 3385-3009 Todos os direitos reservados. É proibida a reprodução, mesmo parcial, por qualquer processo, sem autorização por escrito dos autores e detentor dos direitos autorais Métodos Estatísticos Aplicados à Produção Plano de Aula 9 Unidade 1 – Conceitos Básicos 29 Unidade 2 – Distribuição de Frequências 45 Unidade 3 – Medidas de Posição 63 Unidade 4 – Medidas de Dispersão 81 Unidade 5 – Probabilidade 103 Unidade 6 – Intervalo de Confiança SUMÁRIO 6 PLANO DE AULA Orientações de estudo Para que o conteúdo desta Disciplina seja bem aproveitado e haja maior aplicabilidade na sua formação acadêmica e atuação profissional, siga algumas recomendações básicas: Assim: Organize seus estudos de maneira que passem a fazer parte da sua rotina. Por exemplo, você poderá determinar um dia e horário fixos como seu “momento do estudo”; Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma alimentação saudável pode proporcionar melhor aproveitamento do estudo; No material de cada Unidade, há leituras indicadas. Entre elas, artigos científicos, livros, vídeos e sites para aprofundar os conhecimentos adquiridos ao longo da Unidade. Além disso, você também encontrará sugestões de conteúdo extra no item Material Complementar, que ampliarão sua interpretação e auxiliarão no pleno entendimento dos temas abordados; Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de discussão, pois irão auxiliar a verificar o quanto você absorveu de conhecimento, além de propiciar o contato com seus colegas e tutores, o que se apresenta como rico espaço de troca de ideias e de aprendizagem. Organize seus estudos de maneira que passem a fazer parte da Mantenha o foco! Evite se distrair com as redes sociais. Mantenha o foco! Evite se distrair com as redes sociais. Determine um horário fixo para estudar. Aproveite as indicações de Material Complementar. Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma Não se esqueça de se alimentar e de se manter hidratado. Aproveite as Conserve seu material e local de estudos sempre organizados. formação acadêmica e atuação profissional, siga Procure manter contato com seus colegas e tutores para trocar ideias! Isso amplia a aprendizagem. Seja original! Nunca plagie trabalhos. 7 Objetivos de aprendizagem Un id ad e 1 Conceitos Básicos » O principal objetivo desta unidade é conhecer os conceitos de população, amostra, amostragem, processos estatísticos de abordagem e séries estatísticas. Un id ad e 2 Distribuição de Frequências » Conhecer as definições envolvidas em Estatística aplicada à Produção: Frequências, Dados, Distribuição e Gráficos. Un id ad e 3 Medidas de Posição » Conhecer as definições envolvidas em Estatística aplicada à produção: Média, Moda e Mediana. Un id ad e 4 Medidas de Dispersão » O principal objetivo desta unidade é trabalhar com os conceitos de amplitude, desvio e variância. » Em Materiais didáticos, você encontrará o conteúdo e as atividades propostas para os temas. Un id ad e 5 Probabilidade » Conhecer as definições envolvidas em Estatística aplicada à produção: Probabilidade e Incertezas. Un id ad e 6 Intervalo de Confiança » Conhecer as definições envolvidas em intervalos de confiança aplicados à produção: Amostragem, Estimação. Responsável pelo Conteúdo: Prof.a Me. Luciana Borin de Oliveira Revisão Técnica: Prof. Ms. Carlos Henrique de Jesus Costa Revisão Textual: Prof.a Esp. Kelciane da Rocha Campos 1 Conceitos Básicos Conceitos Básicos UNIDADE 1 10 Contextualização Você pode a qualquer momento entrar no site do IBGE: http://www.ibge.gov.br/ para conhecer todas as pesquisas que são feitas por esse órgão. Ex pl or Nesse site você poderá observar conceitos vistos nesta unidade. Além de visitar o site do IBGE, a partir deste momento observe no seu dia a dia com quais dados você pode começar a praticar os conceitos estatísticos estudados: • produtos que sua empresa possui, compra ou vende; • matérias-primas; • reclamações por mês; • chamadas telefônicas; • notícias do jornal. Oriente sua reflexão pelas seguintes questões: Escolha um processo no qual você esteja inserido(a) neste momento (no trabalho, em casa). Existem tarefas, pontos a serem trabalhados? Aplique o conceito, quantifique a atividade. Conceitos Básicos 11 A Estatística A Estatística é uma parte da Matemática. Na verdade, para muitos, trata-se de uma área distinta, porém intimamente ligada a esta, pois dela se utiliza no fornecimento de métodos e processos como ferramenta para tomada de decisão através desta, pois fornece os métodos e processos para coletar dados, organizar, resumir, apresentar e analisar tais dados e deles retirar conclusões que auxiliarão na tomada de decisão (figura 1). Figura 1 Fonte: iStock / Getty Images A palavra estatística vem de status, que em latim significa estado, pois as suas primeiras utilizações foram no sentido de fornecer dados à administração pública para tomada de decisão. A partir do século XIX, houve uma disseminação da utilização de estatística na análise de dados de forma mais abrangente, da forma que a utilização da estatística hoje toma decisões (figura 2). Ela encontra larga utilização nas ciências - física, química, medicina, economia, sociologia, administração pública e privada, entre outras áreas. Figura 2 Fonte: iStock / Getty Images Conceitos Básicos UNIDADE 1 12 Por exemplo, em processo produtivo é largamente utilizado o CEP (Controle Estatístico de Processo), que simplificadamente trata-se de uma ferramenta de auxílio da identificação de causas não intrínsecas aos processos que prejudicam a qualidade do produto manufaturado, e esse tipo de informação em mãos nos dá subsídios na tomada de medidas corretivas, com o intuito de aumentar ou garantir a qualidade do produto final conforme programado (figura 3). A aplicação da ferramenta CEP, dentre outras ferramentas estatísticas, foi de grande relevância no chamado “Milagre Industrial Japonês”, onde tais aplicações foram disseminadas nas empresas japonesas após a 2ª Guerra mundial com o auxílio de Deming, auxiliando o Japão a se tornar uma potência industrial e tecnológica, reconhecida pela produção de produtos de alta qualidade. Figura 3 Fonte: iStock / Getty Images Podemos dividir o estudo da Estatística em 2 partes: • Estatística Descritiva: nessa parte, o estudo se baseará na coleta, orga- nização, descrição dos dados coletados, análise e interpretação dos dados estatísticos. A estatística descritiva “descreve” os dados observados. • Estatística Indutiva: baseada na teoria das probabilidades, a qual estabelece hipóteses sobre uma população de origem, utiliza-se de amostragem e formula previsões. Nesse ramo a interpretação dos dados é baseada em uma margem de incerteza. Conceitos Básicos 13 Estatística na produção A estatística, como já vimos, é largamente utilizada em engenhariae podemos considerar que a sua maior utilização se dá no controle de processos. A ferramenta CEP é muito utilizada no controle de produtos e serviços, muito utilizada no monitoramento do processo de produção. Utiliza-se da estatística, por exemplo, na área de vendas, no acompanhamento e projeção de vendas. Na área industrial, a estatística participa de todas as etapas, desde os estudos de implantação de uma fábrica, até o controle de estoque, estudos de produtividade, acidentes de trabalho, etc. Na área tecnológica, é utilizada quando as informações sobre determinada projeção de produção, aumento ou diminuição de vendas necessitam de conceitos e teorias estatísticas mais elaboradas. Por exemplo, para a Engenharia de alimentos, há certa estatística na análise sensorial, para observar a aceitação ou não de um produto manufaturado pelo público (figura 4). Também se utiliza a estatística para analisar ensaios tanto destrutivos como não destrutivos, verificando-se a porcentagem de peças não conformes ou a probabilidade de vida de equipamentos ou peças. Figura 4 Fonte: iStock / Getty Images Conceitos Básicos UNIDADE 1 14 Conceitos básicos de Estatística População Consideramos a totalidade de um conjunto onde seus indivíduos ou elementos possuem ao menos uma característica comum entre eles, ou seja, o conjunto de todos os elementos que se deseja estudar (figura 5). Por exemplo: • a população dos alunos inscritos no curso de Engenharia de Produção; • a população de homens maiores de 18 anos da ilha de Marajó. A população é dividida em finita e infinita, dependendo da quantidade de elementos que possui. Diz-se finita quando há a possibilidade de quantificar os indivíduos, e quando não existe essa possibilidade consideramos a população como infinita. Na população finita, podemos considerar como exemplo a população das alturas dos homens maiores de 18 anos da ilha de Marajó que participarão de um sorteio. O conjunto dos elementos da população é denominado N. Agora, se todo indivíduo entrasse novamente no sorteio, essa população seria infinita. Consideramos, na prática, como população infinita uma população que apresenta um número de elementos enorme. Figura 5 – População e Amostra Amostra É qualquer subconjunto não vazio de uma população. Trata-se de uma subco- leção. Para obtenção da amostra, deve-se coletar uma amostra representativa da população. Consideramos como tamanho da amostra a quantidade de elementos que apresenta a amostra e representamos genericamente com a letra n. Conceitos Básicos 15 Parâmetro Característica numérica relacionada com toda uma população; por exemplo, em uma eleição para presidente temos a população desse evento como sendo o número total dos eleitores. Um parâmetro relacionado a essa população pode ser a proporção de eleitores para o candidato X. Estimador ou estatística Quando temos a característica numérica relacionada com a amostra. No exemplo anterior, um estimador pode ser a proporção de votos referentes ao candidato X decorrentes de uma amostra de 0,1% da população. Estimativa Relaciona-se também com a amostra e expressa o valor numérico do estimador. Amostragem Trata-se do processo de coleta da amostra da população, através de métodos apropriados para tal seleção, com base em um estimador através do cálculo de probabilidades. a. Amostragem aleatória simples (randômica) Como ocorre num concurso de loterias, não há nenhum critério a ser utilizado na seleção; a possibilidade de um dos elementos da população ser selecionado é igual para todos os elementos da população. b. Amostragem sistemática A seleção se dá através da seleção de um critério pré-estabelecido; por exemplo, fazer uma coleta de uma peça em linha de produção a cada 5 minutos. c. Amostragem por agrupamento Seleção de subgrupos naturalmente existentes em uma população que apresentam características similares entre si. d. Amostragem por estratificação Seleção de amostra de uma população heterogênea em estratos (subpopulações) mais ou menos homogêneos. Podemos especificar em amostragem por estratificação proporcional quando além de considerarmos os estratos, consideramos também os elementos da amostra que são proporcionais ao número de elementos dos estratos. Conceitos Básicos UNIDADE 1 16 Exemplo: N = 60.000 eleitores 35.000 Mulheres 25.000 Homens Vamos considerar uma amostra de 20% da população. Qual a quantidade amostral da população? Sexo População 20% AMOSTRA (n) Homem 25.000 5000 5000 Mulher 35.000 7000 7000 TOTAL 60.000 12.000 12.000 Na cervejaria, todo malte recebido para produção de cerveja deve ser analisado antes de ser liberado para produção. Como não é possível se fazer análise de todo recebimento, faz-se análise de amostra representativa de todo malte recebido. É retirada amostra de 10% do lote, escolhendo-se as sacas de malte aleatoriamente com a retirada de uma quantidade de 30g por saca no recebimento em sacaria. Caso seja a carga recebida a granel (sem embalagem e em grandes quantidades) é retirada amostra ao acaso de 40 kg para cada 500 toneladas ou fração recebida. Vimos, assim, em particular neste caso, que para termos uma amostra representativa de toda população precisamos de menos do que 0,01% da população. Ex pl or Importante! Você já se deu conta da quantidade de pessoas que são entrevistadas na população de eleitores para simular a porcentagem de votos para cada candidato em uma eleição presidencial? Trocando ideias... Processos estatísticos de abordagem Utilizados para o estudo de um fenômeno coletivo. Podemos utilizar os seguin- tes processos: Censo É uma avaliação direta de um parâmetro, onde utilizamos todos os elementos de uma população. É uma avaliação com confiabilidade 100% (considera todos os elementos da população), porém é muito lenta e cara, pode ser desatualizada. Como exemplo, temos a contagem da população brasileira feita pelo IBGE. Conceitos Básicos 17 Você sabia que no Censo de 2010 pelo IBGE, foram utilizados mais de 190 mil recenseadores, os quais realizaram visitas a 67,7 milhões de domicílios compreendi- dos nas 5.565 cidades brasileiras? Imagine o investimento e tempo para realização desse processo todo. Amostragem (estimação) Avaliação indireta de um parâmetro, utilizando-se do cálculo de probabilidades baseado na estatística da amostra. Avaliação que não apresenta confiabilidade 100%, porém é muito mais rápida que o censo, mais barata e quase sempre é atualizada. Experimento aleatório É a observação de um fenômeno qualquer que se deseja estudar. Os resultados apresentados são imprevisíveis. Natureza dos dados A natureza dos dados ou informações das populações denomina-se de variáveis. As variáveis podem classificar-se em variáveis qualitativas e quantitativas. Variáveis qualitativas São todas aquelas as quais não podemos mensurar, porém podemos atribuir valores como sexo, cor, nacionalidade. Variáveis quantitativas Estas são as que podemos medir, sendo expressas em números geralmente. São divididas em: a. Variáveis discretas, também chamadas de variáveis descontínuas. Seus valores só podem assumir valores associados a um intervalo de medição; sendo assim, seus valores possíveis formam um conjunto finito e enumerável, como, por exemplo, o número de operadores em uma linha de montagem, número de leitos disponíveis na ala de UTI de um hospital. b. Variáveis contínuas. Seus valores assumem qualquer valor dentro de um intervalo de medição, na verdade representação às medições, como, por exemplo, medidas de comprimento de peças em linha de produção, medida da estatura da população de uma cidade. Via de regra, temos que MEDIÇÃO se trata de variável contínua, enquanto CONTAGEM se trata de variável descontínua. Conceitos Básicos UNIDADE 1 18 Método estatístico Podemos definir método literalmente como “seguir um caminho de forma organizada” para se chegar a um determinado objetivo. O método estatístico também segue um caminhocom o intuito de mensurarmos de que forma cada variável impacta no processo de acordo com as suas oscilações e podemos dividi-lo da seguinte forma: 1º - Definição do problema Qual é o objetivo do estudo que se pretende e o que será analisado? 2º - Planejamento Como serão coletados os dados da pesquisa, definindo-se a população a ser estudada estatisticamente. Nessa fase definimos o exame das informações disponíveis, a definição do universo a ser estudado e qual o tipo de levantamento que será utilizado, se censo ou amostragem. 3º - Coleta de dados Coleta de dados propriamente dita utilizando-se de técnicas de amostragens, sempre se levando em conta a maximização dos recursos em função dos objetivos. Podemos classificar os dados coletados em: Dados primários É considerado primário quando a mesma organização é aquela que recolhe os dados e os publica. Exemplo: Tabelas estatísticas da variação do índice inflacionário das capitais do país desenvolvidas pelo ministério da economia. Dados secundários Os dados são coletados por uma organização e quem os publica é outra organização. Exemplo: Publicação das estatísticas referentes à variação do índice inflacionário das capitais do país extraídas do ministério da economia. Conceitos Básicos 19 Coleta direta A coleta realizada é obtida diretamente da fonte através do próprio agente que deseja realizar a pesquisa. Exemplo: Empresa que realiza uma pesquisa para saber qual é o que mais agrada ao consumidor em determinada marca de margarina. Pode ser: a. contínua - como próprio nome diz, feita continuamente, como nos registro de óbitos, nascimentos, etc.; b. periódica - como no caso dos censos; por exemplo, são feitas obedecendo a intervalos regulares de tempo; c. ocasional - feita para atender uma determinada demanda que se apresenta no momento, como no caso de pesquisas de mercado de empresas. Coleta indireta É feita por deduções a partir de elementos conseguidos através da coleta direta, por analogia, por avaliação, indícios ou proporcionalização, como, por exemplo, no caso de pesquisa sobre média de idade das pessoas casadas, data do casamento no país, com os dados obtidos por via direta. 4º - Apuração dos dados Verificação se os dados coletados são consistentes e estão livres de “erros” que nos levarão a desvios nos resultados finais do estudo. Os dados, então, são submetidos a processamento mediante critérios de classificação. 5º - Apresentação dos dados Os dados são apresentados basicamente sob duas formas, tabelas e gráficos, para que se tenha maior facilidade na condução do tratamento estatístico do que se quer analisar. A apresentação dos dados em tabelas nos permite uma visualização desses dados distribuídos de forma ordenada em colunas e linhas, conforme veremos a seguir na tabela. Conceitos Básicos UNIDADE 1 20 Variação percentual do PIB no Brasil Ano Variação Percentual 1991 1,03 1992 -0,54 1993 4,92 1994 5,85 1995 4,22 1996 2,76 1997 3,68 1998(1) 0,15 Nota: (1) O valor do PIB em 1998 foi de 901 bilhões de reais. Fonte: IBGE (1999) Na representação gráfica (gráficos 1 e 2), por se tratar de uma apresentação geométrica, permite-se uma visualização dos dados a serem estudados, de forma clara e rápida. Grá� co 1 – Comparativo dos percentuais de gordura nos teste realizados em atletas Fonte: iStock / Getty Images Conceitos Básicos 21 Grá� co 2 – Em forma de PIZZA Fonte: iStock / Getty Images 6º - Análise e interpretação dos dados Trata-se da última etapa do método estatístico e é também a mais importante, pois tiramos as conclusões sobre a população estudada, que é o objetivo final da estatística, a partir das informações da amostragem selecionada. Assim, realizadas as fases anteriores (Estatística descritiva), fazemos uma análise dos resultados obtidos, através dos métodos da Estatística Inferencial, que tem por base a indução ou inferência, e tiramos desses resultados conclusões e previsões. Séries estatísticas É toda tabela onde possa ser representado um conjunto de dados estatísticos considerados em função do local, da espécie ou da época. São divididas em: • Séries históricas ou temporais: os dados são coletados conforme a data de sua ocorrência. Exemplo na tabela a seguir. Vendas de carros da montadora XXXX. - 2010-2014 Ano Vendas (unidades) 2010 30.143 2011 37.500 2012 42.490 2013 47.523 2014 39.876 Conceitos Básicos UNIDADE 1 22 • Séries especiais ou geográficas: os dados são coletados conforme a localidade de sua ocorrência. Exemplo na tabela a seguir. Vendas de carros da montadora XXXX - 2014 Região Vendas (unidades) Norte 3.190 Nordeste 5.982 Centro-oeste 4.785 Sul 9.969 Sudeste 15950 • Séries específicas ou categóricas: os dados são coletados em determinado local e data, caracterizados conforme sua especificação. Exemplo na tabela a seguir. Produção agrícola da cidade X - 2012 Produto quantidade (ton) Café 45 Acúçar 28 Milho 14 Arroz 9 Feijão 7 • Séries mistas ou conjugadas: os dados apresentados vêm de mais de uma série e são dispostos em uma série só. Exemplo na tabela a seguir. Produção Brasileira de Cerveja - 2012-2014 Tipo de Cerveja Quantidade (Hectolitro) 2012 2013 2014 Pilsen 1.500.250 1.723.867 1.854.265 Stout 45.000 48.723 49.523 Especial 93.255 112.976 188.439 Conceitos Básicos 23 Gráficos estatísticos Representação gráfica de séries estatísticas utilizando-se de formas geométricas que serão representadas por linhas, pontos, volumes ou áreas. São os chamados diagramas. Vamos apresentar os principais: a) Diagrama de pizza ou circular Representação gráfica de série estatística com utilização da figura de um círculo. Muito usada para comparação de valores de uma série com o total. Divide-se o círculo em setores, onde cada setor corresponde à frequência de cada variável. Exemplo: Despesas com alimentação fora de casa no 1º trimestre de 2015. Gastos com alimentação 2015 R$ 942 R$ 745 Janeiro Fevereiro Março R$ 574 Grá� co 3 – Gastos com Alimentação 2015 b) Gráfico de linhas A representação da série estatística é dada por um gráfico de linha. Muito utilizada para representação de uma série temporal, onde podemos dispor os dados em ordem cronológica; mostra a variação entre os valores de uma série. Exemplo: Venda de veículos de uma concessionária entre 1990 a 2010. Grá� co 4 Conceitos Básicos UNIDADE 1 24 c) Diagrama de área ou superfície c.1) Gráfico de colunas Exemplo: Número de defeitos por peças produzidas (em milhares). Grá� co 5 – Número de Defeitos c.2) Gráfico de superfície em barras Exemplo: Venda de veículos de uma concessionária entre 1990 a 2010. Grá� co 6 – Vendas Conceitos Básicos 25 Concluindo Os gráficos estão por toda parte. Estão nas páginas da internet, nos jornais, nas revistas... Preste atenção a essa importante ferramenta estatística. E use-a sempre a seu favor em trabalhos e estudos! Conceitos Básicos UNIDADE 1 26 Material Complementar Indicações para saber mais sobre os assuntos abordados nesta Unidade: Para complementar os conhecimentos adquiridos e enriquecer sua compreensão sobre o assunto tratado nesta unidade, consulte os livros a seguir, disponíveis na Minha Biblioteca: Livros A estatística básica e sua prática. MOORE, David S.; NOTZ, William I.; FLIGNER, Michael A. A estatística básica e sua prática. 6. ed. Rio de Janeiro: LTC, 2014. Vital Book file. Curso de estatística básica. COSTA, Giovani Glaucio de Oliveira. Curso de estatística básica. São Paulo: Atlas, 2011. Vital Book file. Estatística aplicada. MARTINS, Gilberto de Andrade; TOLEDO, Geraldo Luciano; FONSECA, Jairo Simon da. Estatística aplicada. 2. ed. São Paulo: Atlas, 2012. Vital Book file. Conceitos Básicos 27 Referências BUSSAB, W. O.; MORETTIN, P. A. Estatística básica. Atual Editora, 1995. CALLEGARI-JACQUES, S. M. (2003). Bioestatística: princípios e aplicações. Porto Alegre: Artmed, 2003. FREUND, J. E.; SIMON, G. A. Estatística aplicada. Editora Bookman, 1999.KAZMIER, L. J. (2004). Estatística aplicada à economia e administração. São Paulo: Pearson Makron, 2004. KING, B. M.; MINIUM, E. M. (2003). Statistical reasoning in psychology and education (Fourth Edition). New Jersey: John Wiley & Sons, Inc. Responsável pelo Conteúdo: Prof.a Me. Luciana Borin de Oliveira Revisão Técnica: Prof. Ms. Carlos Henrique de Jesus Costa Revisão Textual: Prof.a Esp. Kelciane da Rocha Campos 2 Distribuição de Frequências Distribuição de Frequências UNIDADE 2 30 Contextualização Distribuição de frequências é um método utilizado para se agrupar dados em classes ou intervalos de tal forma que a visualização da ocorrência fique mais visível. Esse procedimento é muito utilizado para agrupar dados; por exemplo, de acidentes de trabalho X tamanho das empresas. Escolha a área em que você atua ou próxima a ela e busque dados que possam ser agrupados. Aplique o conceito estudado, faça tabelas e gráficos, use planilhas eletrônicas. Distribuição de Frequências 31 Definição É uma série estatística de dados agrupados, tabulados de acordo com o número de elementos distintos da série. Esta tabela de frequência resume categorias ou classe de valores, juntamente com as respectivas contagens (ou frequências) do número de valores. Vamos estudar as tabelas a seguir: Exemplos fictícios: Quantidade de televisores X Salário mensal Salário mensal em reais Número de televisores na residência 500 a 1000 01 1000 a 1500 02 1500 a 2000 02 2000 a 2500 03 2500 a 3000 03 Acima de 3000 04 Quantidade de automóveis X Pessoas que moram na casa Pessoas que moram na casa Número de automóveis na residência 01 a 02 01 02 a 03 01 03 a 04 02 04 a 05 02 Acima de 05 03 Dados brutos Arranjo de valores numéricos não organizados e nem agrupados, coletados a partir da observação de um fenômeno coletivo. Ex.: pesquisa de número de filhos por casal. 1; 0; 2; 0; 1; 1; 0; 2; 1; 0 Dados não organizados (Dados brutos) Distribuição de Frequências UNIDADE 2 32 Rol É a sequência ordenada de dados brutos, podendo ser crescente ou decrescente. Para o mesmo exemplo: 0; 0; 0; 0; 1; 1; 1; 1; 2; 2 Dados organizados (ROL) Amplitude amostral (Range) Trata-se do maior intervalo que pode ser conseguido em uma distribuição. Amplitude Amostral (AA) = x - xmax min Frequência Trata-se do número de vezes da ocorrência de um fenômeno. Tipos de frequência a) Frequência simples (absoluta) ( f ) Σ f i = n (I) É o número de eventos que é observado para determinada classe. Onde n é o tamanho da amostra. Exemplificando: Seguem os dados brutos correspondentes à altura em cm dos alunos matriculados no 1ª ano de Engenharia de Produção da Faculdade XYZ: 175 179 173 189 181 175 188 177 173 180 191 186 188 174 169 174 185 179 182 182 173 187 185 170 176 194 182 173 171 178 188 184 170 176 173 185 188 174 190 174 Qual é a frequência correspondente à altura de 173 cm? Resultado f=5, que corresponde ao número de ocorrências dessa medida dentro dos dados apresentados. Distribuição de Frequências 33 b) Frequência relativa (fr) fri = f i n (II) É o valor percentual entre a razão da frequência simples e a frequência total. Levando em consideração o exemplo acima, qual é a frequência relativa à altura de 188 cm? Resulta em: f = 4, que é a frequência simples relativa à altura de 188 cm. n = 40, que é o total de alunos coletados. Aplicando a equação: fr = 4 40 = 0,1 ou 10% c) Frequência acumulada (Fi) F = f i + f2 ....+ fk (III)k É a soma das frequências absolutas inferiores ao limite superior de uma determinada classe. Trabalhando novamente com o exemplo dos alunos de engenharia acima, qual é a frequência acumulada dos alunos com a altura abaixo de 176 cm? Agrupando os dados: Altura 169 cm; f=1, Altura 170 cm; f=2, Altura 171 cm; f=1, Altura 172 cm; f=0, Altura 173 cm; f=5, Altura 174 cm; f=4, Altura 175 cm; f=2, Fi = 1+2+1+5+4+2 = 15, que representa a quantidade de elementos abaixo de 176 cm. d) Frequência acumulada relativa (Fri) Fri = Fi n (IV) É o valor percentual entre a razão da frequência acumulada e a frequência total. Distribuição de Frequências UNIDADE 2 34 Ainda utilizando o nosso exemplo, qual seria a frequência acumulada relativa para os alunos com estatura abaixo de 174 cm? Fi=9 N=40 Fri = 9 40 0,225 ou 22,5% Conforme se apresentam os dados, será calculado cada tipo de frequência, ou seja, a distribuição de frequência é dependente do tipo de variável que se quer analisar. A exposição dos dados nos dois tipos de variáveis, discretas ou contínuas, será apresentada em tabelas ou em gráficos. Tipos de distribuição de frequências a) Distribuição de frequências por pontos Utilizamos quando os dados fornecidos correspondem a variáveis discretas. Sabe-se que as variáveis são discretas quando só podem assumir valores associados a um intervalo de medição e formam um conjunto finito e enumerável, como, por exemplo, o número de operadores em uma linha de montagem. Os dados observados serão tratados individualmente. Representação de uma distribuição de frequências a partir de dados em variáveis discretas. Vamos utilizar uma tabela para representação: Exemplo: número de ocupantes da suíte máster de hotel de luxo da zona sul de São Paulo no mês de setembro 2014. 0, 0, 3, 3, 3, 0, 1, 1, 1, 1, 0, 2, 2, 1, 3, 3, 1, 1, 1, 1, 0, 0, 2, 2, 2, 2, 0, 1, 1, 1 Vamos construir uma tabela com frequência absoluta a partir dos dados observados. 1º passo: Determinamos o Range (R) ou a Amplitude Amostral (AA). Para dados não tabelados, será o valor da diferença do maior valor menos o menor valor. No nosso exemplo, temos: AA = x - xmax min Do nosso exemplo, temos: AA = 3-0 = 3 Distribuição de Frequências 35 2º passo: Construir o ROL em ordem crescente 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3 3º passo: Construção de uma tabela para que tenhamos os dados agrupados em frequência absoluta. Xi fi 0 7 1 12 2 6 3 5 Total 30 b) Distribuição de frequência contínua Utilizamos quando trabalhamos com variáveis contínuas. Definimos variáveis contínuas quando os valores dos dados assumem qualquer valor dentro de um intervalo de medição, como na medição de peças em uma linha de produção. Para facilitação de análise, os dados são agrupados em intervalos ou classes. Como exemplo, podemos considerar uma tabela com a distribuição de idades dos hóspedes de um hotel de luxo da zona sul de São Paulo no mês de setembro de 2014. Idade Quantidade de pessoas 0 a 10 225 11 a 20 1246 21 a 30 1180 31 a 40 2310 41 a 50 1983 51 a 60 468 61 a 70 183 71 a 80 41 81 a 90 5 Total 7641 Podemos tirar as seguintes conclusões: a) A amplitude do intervalo de classes é de 10 anos. b) A classe de maior frequência é a de 31 a 40 anos, com o número de 2310 hóspedes. c) O número total de pessoas hospedadas no hotel em setembro de 2014 foi de 7641. d) O número de classes nessa distribuição foi de 9. Distribuição de Frequências UNIDADE 2 36 Agora, vamos descrever todos os passos para construção de uma tabela de distribuição de frequências por classes de variáveis discretas. 1. Determinação do Range (R) ou Amplitude Amostral (AA) Identificar nos dados brutos coletados o maior número e o menor. A determinação da amplitude amostral será o maior valor subtraído do menor valor. AA = x - x (V)max min 2. Determinar o número de classes da frequência (k) Obtido através da aproximação do número resultante da raiz quadrada do total de elementos de uma distribuição (n). k = n (VI) 3. Determinar a amplitude do intervalo de classe (h) Obtida pela divisão entra a amplitude total (AT – que é o valor da diferença entre o limite superior da última classe e o limite inferior da primeira classe) e o número de classes (k). h = AT k (VII) 4. Determinação do intervalo e limite de classes É a faixa de valores representada para cada classe, com um limite inferior (li) eum limite superior (Li). A representação do intervalo de classes é: li|__ Li (VIII) 5. Determinar o ponto média de cada classe (xi) É obtido como a média aritmética dos limites superior e inferior de cada classe. xi = li+Li 2 (IX) Exemplo prático: Foi feito o levantamento da altura dos times de Voleibol do campeonato paulista totalizando 42 atletas. A partir dos dados, vamos construir uma tabela de frequências, com todos os tipos de frequências e pontos médios das classes. Distribuição de Frequências 37 Seguem os dados brutos das alturas em cm: 191 186 203 205 197 184 198 185 196 210 194 192 195 190 191 199 187 211 188 196 198 195 186 201 205 193 192 196 200 192 205 193 196 198 203 190 188 182 208 194 199 206 Vamos optar nesse exemplo por variável contínua com o agrupamento dos valores em classes, já que mesmo com esses poucos dados há muitos valores entre o menor e o maior, dificultando a análise com a variável discreta. 1º passo: Organizar os dados em ordem crescente. Construir o ROL: 182 184 185 186 186 187 188 188 190 190 191 191 192 192 192 193 193 194 194 195 195 196 196 196 196 197 198 198 198 199 199 200 201 203 203 205 205 205 206 208 210 211 2º passo: Determinar a amplitude de classes. R = 211-182 = 29 Amplitude amostral 3º passo: Determinar o número de classes (k). Do nosso exemplo, n = 42 k = 6; utilizaremos, então, 6 classes.42 @ 4º passo: Cálculo da amplitude do intervalo de classe (h). h = 29 6 5≅ 5º passo: Determinar os intervalos e limites de classes. Fazemos a determinação da 1ª classe e repetimos as próximas da mesma forma. Limite inferior da 1ª classe: 182 Limite superior: 187, pois k = 5, então limite superior é o Li + k Distribuição de Frequências UNIDADE 2 38 Nessa classe, encontramos 5 jogadores. Então, construímos a tabela: Altura (cm) fi xi fri Fi Fri 182 187 5 184,5 0,119 5 0,119 187 192 7 189,5 0,167 12 0,286 192 197 13 194,5 0,309 25 0,595 197 202 8 199,5 0,190 33 0,785 202 207 6 204,5 0,143 39 0,928 207 212 3 209,5 0,071 42 1,000 =∑ 42 1,000 Gráficos A distribuição de frequências pode ser representada também graficamente. Veremos de que forma gráfica podemos representá-la. Histograma Gráfico formado por um conjunto de retângulos justapostos numa base de um eixo horizontal tendo como centro seu ponto médio. As amplitudes das classes correspondem às bases dos retângulos (h – amplitude de classe), e as alturas dos retângulos (f – frequência de classe) são proporcionais às frequências de classes. Ex.: Considerando os dados de amplitude (h) e frequências (f) da tabela do exemplo anterior, vamos construir o histograma para essa distribuição correspondente à tabela a seguir. Altura (cm) fi xi 182 187 5 184,5 187 192 7 189,5 192 197 13 194,5 197 202 8 199,5 202 207 6 204,5 207 212 3 209,5 =∑ 42 Distribuição de Frequências 39 Grá� co 1 – Histograma correspondente à Tabela anterior Obs.: Construir o gráfico com eixos X e Y, sendo o eixo X o eixo xi e o Eixo Y o eixo f. Polígono de frequência simples É um gráfico de linha, sendo os pontos obtidos através da intersecção das frequências com os pontos médios das classes. Utilizando-nos do histograma do exemplo anterior como modelo, podemos construir o polígono de frequência desta forma: Grá� co 2 Obs.: Construir uma linha unindo-se a intersecção dos pontos do eixo Y com o ponto médio dos retângulos. Como no gráfico anterior, o eixo X é xi e o eixo Y é f. Os valores dos pontos do eixo y são: 5, 7, 13, 8, 6 e 3. Distribuição de Frequências UNIDADE 2 40 Polígono de frequência acumulada É construído quando fazemos a representação gráfica das frequências acumuladas. É utilizado quando desejamos saber qual é a parcela da população que está abaixo de um determinado valor ou depois de um determinado valor. Constrói-se traçando uma linha dos pontos obtidos da intersecção das frequências acumuladas com os limites superiores dos intervalos de classes. Essa curvada formada também é conhe- cida como Ogiva de Galton. Do nosso exemplo, temos: Altura (cm) Fi 182 187 5 187 192 12 192 197 25 197 202 33 202 207 39 207 212 42 Grá� co 4 Com a Ogiva de Galton, podemos, utilizando-nos de interpolação linear, fazer um cálculo estimado de frequências acumuladas de uma distribuição em classes de frequências. Por exemplo, utilizando a tabela de frequências acumuladas de nosso exemplo, poderíamos estimar qual a frequência populacional de valores abaixo de 200 cm dos alunos. Para isso, seguimos os seguintes passos: 1º passo: Construir a tabela com as frequências acumuladas. Altura (cm) Fi 182 187 5 187 192 12 192 197 25 197 202 33 202 207 39 207 212 42 Distribuição de Frequências 41 2º passo: Considerando o valor a ser determinado no nosso exemplo, o de 200 cm, determinar os limites superior e abaixo com as frequências acumuladas desses limites dispostos na tabela a seguir: Limite Superior 197 200 202 Fi 25 x 33 3º passo: Montar, então, uma proporção entre as diferenças dos maiores valores com os menores valores da seguinte forma. 202 197 33 25 202 200 33 − − = − − x E desenvolvendo a equação, temos: 5 8 2 33 5 33 2 8 165 5 16 5 149 29 8 = − − = − = = = ( ) * ( ) * , x x x x x Portanto, a frequência é 29,8. Agora, é só “colocar a mão na massa”. Verifique suas tabelas e faça gráficos. Existem programas de computadores que são ótimas ferramentas na confecção de gráficos. Exercite-se! Distribuição de Frequências UNIDADE 2 42 Material Complementar: Indicações para saber mais sobre os assuntos abordados nesta Unidade: Para complementar os conhecimentos adquiridos e enriquecer sua compreensão sobre o assunto tratado nesta unidade, consulte os livros a seguir, disponíveis na Minha Biblioteca: Livros Curso de Estatística Básica COSTA, Giovani Glaucio de Oliveira. Curso de estatística básica. São Paulo: Atlas, 2011. VitalBook file. Métodos estatísticos multivariados LOESCH, Cláudio. Métodos estatísticos multivariados. São Paulo: Saraiva, 2012. VitalBook file. Probabilidade e estatística na Engenharia HINES, William W. et al. Probabilidade e estatística na engenharia. 4. ed. Rio de Janeiro: LTC, 2006. VitalBook file. Distribuição de Frequências 43 Referências BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. Florianópolis: Editora da UFSC, 2002. BARBETTA, Pedro Alberto et al. Estatística para cursos de engenharia e informática. São Paulo: Atlas, 2004. DEVORE, Jay L. Probabilidade e estatística: para engenharia e ciências. São Paulo: Pioneira Thomson Learning, 2006. DOWNING, D.; CLARK, J. Estatística aplicada. São Paulo: Editora Saraiva, 1999. HINES, William W. et al. Probabilidade e estatística na engenharia. 4. ed. Rio de Janeiro: LTC, 2006. KAZMIER, Leonard J. Estatística aplicada à economia e administração. São Paulo: Makron, 1982. MONTGOMERY, D. C.; RUNGER, G. C. Estatística aplicada e probabilidade para engenheiros. Rio de Janeiro: LTC, 2003. MOORE, David. A estatística básica e sua prática. Rio de Janeiro: Editora LTC, 2000. STEVENSON, W.J. Estatística aplicada à administração. São Paulo: Editora Harbra, 1986. TRIOLA, Mario F. Introdução à estatística. 7 ed. Rio de Janeiro: LTC, 1999. Responsável pelo Conteúdo: Prof.a Me. Luciana Borin de Oliveira Revisão Técnica: Prof. Ms. Carlos Henrique de Jesus Costa Revisão Textual: Prof.a Esp. Kelciane da Rocha Campos 3 Medidas de Posição Medidas de Posição UNIDADE 3 46 Contextualização Medidas de Posição são tópicos utilizados para controlar um processo. O conhecido CEP, ou Controle Estatístico do Processo, avalia a estabilidade ou não de um processo. Escolha a área em que você atua ou próxima a ela e busque dados que possam ser agrupados. Você pode usar também dados do dia a dia, como, por exemplo, a quantidade de calorias que você consome por dia. Aplique o conceito estudado, faça tabelas e gráficos, use planilhas eletrônicas. Avalie seu processo, calculesua média, moda e mediana. Compare os dados! Medidas de Posição 47 Medidas de posição Também chamadas de Medidas de tendência central, pois tais medidas tendem a se acumularem em torno dos valores centrais da distribuição, são os valores utilizados em auxílio para análise da posição de uma distribuição em relação aos valores observados no estudo da variável. Dentre tais medidas de tendência central, estudaremos: · Média aritmética (x) · Moda (Mo) · Mediana (Md) Para efetuarmos os cálculos dessas medidas, necessitamos primeiramente verificar se os dados estão agrupados ou não e se as variáveis são contínuas ou discretas. Medidas de posição para dados não agrupados Média aritmética ( x ): É o valor da divisão da soma dos valores observados da variável em estudo pela quantidade de valores observados: x x n i i = 1 n = ∑ (I) Sendo: x = a média aritmética; x i= os valores da variável; n= quantidade de valores observados. Por exemplo, vamos calcular a média aritmética das notas de Cálculo I dos alunos de Engenharia de uma faculdade, que foram: 4,0; 8,5; 7,0; 5,0; 5,5; 3,5; 6,5; 6,0; 9,0; 8,0; 5,0; 7,5; 5,5; 4,5; 2,5; 8,0 n= 16, que corresponde à quantidade total de notas. x = + + + + + + + + + + + + + + +4 8 5 7 5 5 5 3 5 6 5 6 9 8 5 7 5 5 5 4 5 2 5 8 16 , , , , , , , , x = =96 16 6 00, A média aritmética é bastante utilizada, pois para obtê-la é relativamente fácil; trabalha-se na destruição com todos os valores da mesma e para uma distribuição temos somente um valor associado. Medidas de Posição UNIDADE 3 48 Mediana (Md): É o valor que se encontra na posição central de um determinado rol. Por exemplo, qual é a mediana dos seguintes valores: 3, 8, 12, 5, 7, 14, 5, 9, 4? Organizando os dados em rol, temos: 3, 4, 5, 5, 7, 8, 9, 12, 14 – temos nesse rol 9 elementos. Como nesse exemplo o número n de elementos é um número ímpar, 9 elementos, a posição da moda será o valor n + = + = 1 2 9 1 2 5 A mediana corresponderá, então, ao 5º elemento do rol. O valor da mediana será, então, 7. No caso de uma quantidade par de valores, calculamos a posição da mediana como sendo a média aritmética entre os elementos das posições n n 2 2 1+ + . Por exemplo, qual é a mediana dos seguintes valores: 6, 5, 11, 5, 8, 5, 7, 4? Organizando os dados em rol, temos: 4, 5, 5, 5, 6, 7, 8, 11 – temos nesse rol 8 elementos. Como n=8, teremos, então, que o valor da mediana é o valor posicionado entre a 4ª e 5ª posição. Md = + = 5 6 2 5 5, A mediana desse rol, então, é calculada pela média aritmética do valor encontrado entre os valores 5 e 6, que correspondem respectivamente ao 4º e 5º valor: Utilizamos o cálculo da mediana sempre que desejamos obter o ponto que divide a distribuição em partes iguais. Utilizamos preferencialmente a mediana em relação à média aritmética quando há valores muito grandes que podem distorcer o valor médio da distribuição. Caso os valores calculados da média aritmética e mediana sejam muito diferentes, é mais aconselhável a utilização do valor da mediana como medida de posição central. Medidas de Posição 49 Moda (Mo): Definimos como moda de um conjunto de elementos o valor que ocorre com maior frequência dentro desse conjunto de elementos. Por exemplo, consideremos a seguinte sequência de números: 1, 4, 1, 2, 2, 3, 2, 6, 5, 2, 8, 4, 5. Organizando a sequência em um rol, temos: 1, 1, 2, 2, 2, 2, 3, 4, 4, 5, 5,6, 8. O número de maior frequência desse rol é o número 2, que será a sua moda. Numa sequência, podemos ter mais de uma moda ou até mesmo ela pode não ocorrer. Por exemplo, chamamos de uma distribuição amodal (sem moda) quando todos os elementos da distribuição apresentarem a mesma frequência. Por exemplo, na sequência: 1, 1, 4, 4, 3, 3, 5, 5, todos os elementos apresentam uma frequência igual a 2; logo, a distribuição é amodal, pois não há um elemento que apresenta uma maior frequência do que outro. Quando temos em uma distribuição duas modas, dizemos que a distribuição é bimodal; por exemplo, na seguinte distribuição: 2, 2, 2, 3, 3, 4, 5, 5, 5. Os valores de 2 e 5 apresentam as maiores frequências dessa distribuição, 3 elementos cada, logo a distribuição possui 2 modas (bimodal). Como para o cálculo da moda só é necessário sabermos o valor da frequência absoluta de uma distribuição, é bastante utilizada tanto para variável discreta quanto para variável contínua. Medidas de posição para dados agrupados – variável discreta a) Média aritmética Será obtida pelo cálculo de: Σ Σ xi fi fi * (II) Por exemplo, vamos considerar a tabela a seguir: xi fi 3 2 5 4 6 3 7 2 Medidas de Posição UNIDADE 3 50 Calculamos, então, o valor x fi * i , completando a tabela: xi fi xi*fi 3 1 3 5 4 20 6 3 18 7 2 14 ∑= 10 55 A média aritmética é igual a: x = =55 10 5 5, b) Média aritmética ponderada (x p) Utilizamos a média aritmética ponderada quando temos vinculados aos elementos x1, x2,x3,……..xn outros elementos que ponderam os primeiros, “pesos” associados aos primeiros elementos. O cálculo da média aritmética ponderada é dado pela fórmula: x xi pi pi p = Σ Σ * (III), sendo pi os pesos Como exemplo, vamos considerar a tabela a seguir, referente às notas anuais de uma aluna de Métodos estatísticos aplicados à produção. A partir dela, calculare- mos a média aritmética ponderada da aluna. 1º bimestre 2º bimestre 3º bimestre 4º bimestre Nota 4,0 7,5 6,0 8,5 Peso 1 2 3 4 A média aritmética será: x x p p = + + + + + + = = = + + + = = 4 0 1 7 5 2 6 0 3 8 5 4 1 2 3 4 4 0 15 18 34 10 71 10 , , , , , * * * * 77 1, Perceba que se não houvesse a ponderação, teríamos uma média com outro valor: Medidas de Posição 51 Média aritmética: x = + + + = = 4 0 7 5 6 0 8 5 4 26 4 6 5, , , , , A média aritmética ponderada nesse exemplo é maior que a média aritmética, pois o valor de nota do 4º bimestre, o qual apresenta o maior “peso”, é o maior valor entre todas as notas, “puxando” a média para cima. c) Mediana A mediana neste caso é facilmente identificada quando os dados estão dispostos em uma tabela de frequência, pois será identificada através de sua posição na tabela de frequências. Por exemplo, qual será a mediana referente à tabela de frequências a seguir? xi fi 1 8 4 10 6 2 13 5 11 5 Acrescentamos uma coluna na tabela com a frequência acumulada Fi e então determinamos o valor da mediana, que corresponderá ao valor xi associado à frequência absoluta n 2 para um valor da somatória de frequência par e n +1 2 para um valor ímpar. Então, a tabela ficará: xi fi Fi 1 8 8 4 10 18 6 2 20 13 5 25 11 5 30 Σ=30 Temos, então, n = 30 e a mediana será, então, o valor da 15ª posição n = 30 2 . O valor da mediana, que será o da 15ª posição, é de 4. d) Moda O valor associado à moda será àquele que apresentará o dado com maior frequência, o qual é facilmente identificado na tabela de frequências. Medidas de Posição UNIDADE 3 52 Considerando a tabela a seguir, qual o valor da moda? xi fi 1 1 3 4 7 9 8 4 11 3 O valor da moda é aquele correspondente ao de maior frequência e na nossa tabela corresponde ao número 7. Exemplo: Segue a tabela com a distribuição de salários de uma empresa metalúrgica: Salários Empregados R$ 1.100 15 R$ 1.650 3 R$ 3.250 6 R$ 6.150 3 R$ 12.500 1 TOTAL 28 Quais são os valores da média aritmética, da moda e mediana desses trabalhadores? Média aritmética: x x = + + + + = = 1100 15 1650 3 3250 6 6150 3 12 500 1 28 71900 28 256 * * * * *. $� R 88 Moda (Mo) Como a moda é o valor associado à maior frequência, temos o valor da moda em R$ 1.100, pois esse é o valor associado à maior frequência da tabela, que é valor pago a 15 dos trabalhadores da empresa. Mediana (Md) A mediana corresponderá no nosso exemplo, que tem número par de elemen- tos, ao 14º elemento n = 28 2 . Acrescentando à tabela a coluna de frequência acumulada, identificamos exata- mentea qual valor corresponde a 14º posição. Medidas de Posição 53 Salários Empregados Fi R$ 1.100 15 15 R$ 1.650 3 18 R$ 3.250 6 24 R$ 6.150 3 27 R$ 12.500 1 28 TOTAL 28 O valor da mediana é, então, R$ 1.100,00 também. Medidas de posição para dados agrupados – variável contínua a) Média aritmética Com os dados apresentando-se em uma distribuição de frequências em intervalo de classes, calcularemos a média através da seguinte fórmula: xi xi fi fi = Σ Σ * (IV) Sendo xi , o ponto médio do intervalo. Como exemplo de cálculo, calcularemos a média aritmética a partir da tabela a seguir: Classe:(i) Peso (kg) fi 1 5|–10 2 2 10|–15 8 3 15|–20 7 4 20|–25 1 Para o cálculo da média aritmética, completamos a tabela com o ponto médio dos intervalos de classes (xi) e a multiplicação de xi com fi (xi*fi): Classe: (i) Peso(kg) fi xi xi*fi 1 5|–10 2 7,5 15 2 10|–15 8 12,5 100 3 15|–20 7 17,5 122,5 4 20|–25 1 22,5 22,5 ∑= 18 260 A média aritmética é então: x = ≅ 260 18 14 45, Medidas de Posição UNIDADE 3 54 Cálculo da Média Aritmética pelo Método Simplificado Com a intenção de simplificar o grande número de cálculos que eventualmente ocorrem para a determinação da média x , podemos utilizar um método prático, utilizando mudança de variável x por outra z, de forma que: z xi xo n = − (V) Onde xo é uma constante escolhida entre os pontos médios da distribuição, sendo preferencialmente o ponto de maior frequência. Sendo assim, temos a média aritmética de x através da equação: x z h xo= +* (VI) Por exemplo, vamos calcular a média aritmética dos dados apresentados na tabela a seguir: Altura (cm) fi 165|–168 2 168|–171 10 171|–174 13 174|–177 8 177|–180 5 180|–183 2 1º - Calculamos o ponto médio dos intervalos de classe e acrescentamos uma nova coluna à tabela com esses pontos médios. Altura (cm) fi xi 165|–168 2 166,5 168|–171 10 169,5 171|–174 13 172,5 174|–177 8 175.5 177|–180 5 178,5 180|–183 2 181,5 2º - Promovemos a transformação da variável x para z, com a escolha dos valores arbitrários de xo e h. Por exemplo, escolheremos xo = 172,5 e h = 3. Medidas de Posição 55 Temos, então, a equação da variável transformada: z xi = − 1 172 5 3 , 3º - Calculamos os valores de zi e acrescentamos à tabela. Acrescentamos também a coluna zi * fi Altura (cm) fi xi zi zi*fi 165|–168 2 166,5 -2 -4 168|–171 10 169,5 -1 -10 171|–174 13 172,5 0 0 174|–177 8 175,5 1 8 177|–180 5 178,5 2 10 180|–183 2 181,5 3 6 ∑ 40 10 4º - Calculamos a média aritmética da variável transformada z utilizando a fórmula do cálculo de média aritmética z zi fi fi i = Σ Σ * , z = =10 40 1 4 5º - Calculamos a média aritmética da variável x, utilizando a fórmula x z h xo= +* Assim, temos: x = + = + =1 4 3 172 5 0 75 172 5 173 25* , , , , b) Moda No cálculo da moda em distribuição em intervalo de classes, calculamos a moda através de fórmulas ou através da interpolação linear. Vamos utilizar os dados da tabela, que utilizamos para o cálculo da média arit- mética, como exemplo: Altura (cm) fi 165|–168 2 168|–171 10 171|–174 13 174|–177 8 177|–180 5 180|–183 2 A classe de frequência associada à moda é do intervalo entre 171|––174, pois apresenta o maior valor de frequência (f=13). Medidas de Posição UNIDADE 3 56 b.1. Moda bruta O valor se da moda é obtido através do cálculo do ponto médio da classe onde se encontra a moda. Mo lMo LMo= + 2 (VII) Sendo lMo o limite inferior da classe onde se encontra a moda e LMo o limite superior da classe. Mo = + =171 174 2 172 5, b.2. Moda de King O cálculo da moda é dado através da fórmula: Mo lMo h fposterior fposteriorfanterior = + + * (VIII) Do nosso exemplo, temos que: lMo = 171 cm h = 3 , amplitude da classe modal fposterior = 8 fanterior = 10 Aplicando a fórmula, temos: Mo Mo = + + = + = 171 3 8 8 10 171 24 18 172 33 * , b.3. Moda de Czuber A moda é calculada através da fórmula: Mo lMo h fMo fanterior fMo fanterior fMo fposterior = + − − + − * ( ) ( ) (IX) Medidas de Posição 57 Sendo fMo = 13, que é o valor da frequência simples associada à classe onde se encontra a moda. Aplicando a fórmula, temos: Mo Mo = + − − + − = + = 171 3 13 10 13 10 13 8 171 3 3 8 172 125 * * ( ) ( ) , A moda calculada pelo método de Czuber é a mais precisa, enquanto a média bruta não traz um resultado muito preciso, porém é de muito fácil cálculo e dá uma “noção” do valor da moda. b.4. Método rápido – interpolação 1º - Coletamos os valores dos limites inferior e superior da classe onde a moda está inserida. Coletamos também os valores das frequências simples da classe onde se encontra a moda e as frequências simples anterior e superior à classe da moda. 2º - Dispomos os dados na grade da seguinte forma: IMo MODA LMo fanterior fMo fposterior 3º - Calculamos a Moda através da equação montada da seguinte forma: LMo Moda fMo fposterior Moda lMo fMo fanterior − − = − − Coletando os valores da nossa tabela, temos: 174 13 8 171 13 10 174 3 5 171 522 3 − − = − − − = − − Moda Moda Moda Mo ( ) (Moda )* * dda Moda Moda Moda = − = = = 5 855 8 1377 1377 8 172 125, Obs: Podemos chamar esse método rápido da divisão dos valores maior – menor pelo valor do maior – menor. Medidas de Posição UNIDADE 3 58 c) Mediana A mediana também, como a moda, será calculada através de fórmula ou então por interpolação. c.1. Mediana calculada através da fórmula: M I n Fanterior hmediana fmedianad = + − inf * 2 (X) Onde: Md = Mediana. linf = limite inferior da classe onde se encontra a mediana. Fanterior = Frequência acumulada anterior à da classe onde se encontra a mediana. hmediana = amplitude da classe onde se encontra a mediana. fmediana = frequência simples da classe onde se encontra a mediana. n = quantidade de elementos. Utilizando a tabela para o cálculo da média aritmética e moda, temos: Altura (cm) �i 165|–168 2 168|–171 10 171|–174 13 174|–177 8 177|–180 5 180|–183 2 1º - Acrescentamos à tabela uma coluna com as frequências acumuladas. Altura (cm) fi Fi 165|–168 2 2 168|–171 10 12 171|–174 13 25 174|–177 8 33 177|–180 5 38 180|–183 2 40 Medidas de Posição 59 2º - Identificamos a classe onde a mediana se encontra. Temos a quantidade de elementos n=40, então a classe que a mediana se encontra é aquela onde encontramos a frequência acumulada n 2 20= . Então, a classe correspondente é a de 171|––174. 3º - Aplicamos a fórmula com todos os elementos identificados: M M M d d d = + − = + ( ) = + ≅ 171 40 2 12 3 13 171 8 3 13 171 24 13 172 85 * * , c.2. Cálculo por interpolação da Ogiva de Galton 1º Passo: Coletamos os valores dos limites inferior e superior da classe onde se encontra a mediana. Coletamos também os valores da frequência acumulada da classe onde se encontra a mediana e a frequência acumulada anterior à classe onde se encontra a mediana e o valor de n 2 . 2º Passo: Considerando o valor a ser determinado, a mediana c, determinamos os limites superior e abaixo com as frequências acumuladas desses limites dispostos na tabela a seguir: Limites da classe onde está a mediana Inferior Mediana Superior Fi Anterior à classe da mediana n 2 Da classe da mediana 3º Passo: Montamos, então, uma proporção entre as diferenças dos maiores valores com os menores valores da seguinte forma: LMo lMo Fclasse mediana Fanterior LMo mediana Fclasse median − − = − aa n− 2 Medidas de Posição UNIDADE 3 60 Substituindo os dados de nosso exemplo: 174 171 25 12 174 25 20 3 13 174 5 15 2262 13 − − = − − = − = − Mediana Mediana Me diana Mediana = ≅2247 13 172 85, Obs: No cálculo da interpolação, utilizamos também o artifício do cálculo do “maior – menor”. Valores separatrizes: São aqueles que dividem a sequência de uma distribuição em partes as quais apresentam a mesma quantidade de valores. 1. Mediana: divide a distribuição em 2 partesiguais. 2. Quartil: divide a série em 4 partes iguais. a) O primeiro quartil separa a sequência ordenada, em 25% / 50%. b) O segundo quartil separa a sequência ordenada, em 50% / 50% e é igual à mediana. 3. Decil: divide a série em 10 partes, e o 5º decil é igual à mediana. 4. Percentil: divide a série em 100 partes e o 50º percentil equivale à mediana. Medidas de Posição 61 Material Complementar Indicações para saber mais sobre os assuntos abordados nesta Unidade: Para complementar os conhecimentos adquiridos e enriquecer sua compreensão sobre o assunto tratado nesta unidade, consulte os livros a seguir, disponíveis na Minha Biblioteca: Livros Estatística para cursos de engenharia e informática. BARBETTA, Pedro Alberto; REIS, Marcelo Menezes; BORNIA, Antonio Cezar. Estatística para cursos de engenharia e informática. 3. ed. São Paulo: Atlas, 2010. Curso de estatística. FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso de estatística. 6. ed. São Paulo: Atlas, 2012. Controle estatístico de processos LOUZADA, Francisco et al. Controle estatístico de processos: uma abor- dagem prática para cursos de engenharia e administração. Rio de Janeiro: LTC, 2013. Medidas de Posição UNIDADE 3 62 Referências BOTTER, Denise Aparecida. Noções de estatística. São Paulo: EDUSP, 1996. CALLEGARI-JACQUES, S. M. Bioestatística. Porto Alegre: Artmed, 2003. FRANCISCO, Walter de. Estatística. São Paulo: Atlas, 1982. GRIFFITHS, A. J. F. et al. Introdução à genética. Rio de Janeiro: Guanabara Koogan, 2006. MENDENHALL, W. Probabilidade e estatística. Rio de Janeiro: Campus, 1985. MEYER, P. Probabilidade – aplicações à estatística. Rio de Janeiro: 2.ª ed. Livros Técnicos e Científicos Editora, 1984. MILONE, G.; ANGELINI, F. Estatística geral. São Paulo: Ed. Atlas, 1993. STANSFIELD, W. D. Genética. São Paulo: McGraw Hill do Brasil, 1985. TOLEDO, G. L.; OVALLE, I. I. Estatística básica. São Paulo: Atlas, 1994. Responsável pelo Conteúdo: Prof.a Me. Luciana Borin de Oliveira Revisão Técnica: Prof. Ms. Carlos Henrique de Jesus Costa Revisão Textual: Prof.a Esp. Kelciane da Rocha Campos 4 Medidas de Dispersão Medidas de Dispersão UNIDADE 4 64 Contextualização Como vimos, várias são as aplicações para as medidas de dispersão. Encon- tramos um artigo no qual os autores provaram a eficiência dessa ferramenta para estudar investimentos. Escolha a área em que você atua ou próxima a ela e busque dados que possam ser agrupados. Você pode usar também dados do dia a dia, como, por exemplo, a quantidade de horas que o sol fica disponível por dia. Aplique o conceito estudado, faça tabelas e gráficos, use planilhas eletrônicas. Avalie seu processo, calcule o desvio, amplitude e variância desses dados. Compare os dados! Medidas de Dispersão 65 Medidas de Dispersão Estudamos com as medidas de posição central, média, mediana e moda com o intuito de podermos resumir em um único número aquilo que se apresentaria como sendo o que é “típico” ou “na média” para um conjunto de elementos. Porém, essas medidas necessitam de outras medidas que ajudam a caracterizar melhor o “resumo” do conjunto de elementos. Essas medidas nos mostram o quanto os dados se mostram dispersos em torno da posição central do nosso conjunto. Tais medidas nos proporcionam caracterizar, então, o grau de variação existente no conjunto de elementos e “explicar” melhor o resumo do conjunto de elementos, pois o valor de uma média aritmética pode ser igual para 2 conjuntos de elementos, mas os fenômenos que são retratados serem muito diferentes. Por exemplo: Consideremos uma cidade no litoral do nordeste brasileiro sob um clima tropical e uma cidade do litoral do Rio Grande do Sul que sofre a incidência de um clima temperado. Ambas as cidades possuem temperaturas médias anuais acima de 26 ºC, conforme podemos observar nos gráficos a seguir: Grá� co 1 Grá� co 2 Vemos nos gráficos que as temperaturas na cidade do NORDESTE variam muito pouco ao longo do ano, entre 25 e 27 ºC, enquanto que na cidade do SUL houve variações de 18 a 31ºC. Pergunta: como será que estão as praias nos meses de inverno nas 2 cidades? Certamente, a quantidade de banhistas na cidade do Nordeste será bem maior que na cidade do Sul. Outro exemplo: Vamos imaginar a média salarial de um gerente de empresa que tem seu salário fixo mensal de R$10.000 e a média salarial de um corretor de imóveis com o mesmo valor, que obtém sua renda através de comissões adquiridas pela venda de imóveis. Você acha que somente com essa informação da média salarial as distribuições de suas rendas são equivalentes? Podemos observar que há grandes diferenças entre a obtenção de suas rendas. O gerente de empresas tem a sua renda obtida de forma constante, o mesmo valor mês a mês, enquanto a renda Medidas de Dispersão UNIDADE 4 66 obtida pelo corretor é muito mais esparsa; num mês pode obter uma renda muito superior a R$ 10.000 com a comissão obtida e também pode passar alguns meses com a obtenção de uma renda muito inferior ou até mesmo não obter renda, o que exige desse trabalhador uma programação com despesas muito mais controladas, devido à imprevisibilidade da obtenção de suas rendas, enquanto o outro tem sua vida muito mais controlada. Voltando ao primeiro exemplo, concluímos que a distribuição de temperaturas da cidade da região Nordeste tem uma variação muito menor que da cidade do Sul, e de forma análoga concluímos que a distribuição de rendas do gerente de empresas é muito menor que do corretor de imóveis. Sendo assim, conforme já expusemos, as medidas de dispersão são medidas complementares às medidas de posição e estudaremos aqui as seguintes: • Amplitude; • Desvio médio; • Variância; • Desvio padrão. Medidas de dispersão (Dados não agrupados) Amplitude Como já estudamos anteriormente, a Amplitude Total (AT) ou Amplitude Amostral (R) é a subtração entre o elemento de maior valor e o de menor valor de uma sequência de dados. R = AT = xmax - xmin Por exemplo, em uma série de valores 2, 15, 4, 11, 1, 19, 5, temos a amplitude em: R = 19 – 1 = 18 Percebemos que quanto maior a diferença entre os elementos extremos da sequência, maior será a amplitude e, portanto, maior será a variação, ou dispersão dos valores da sequência. Como a amplitude depende de apenas a variação de dois valores de uma sequência, não nos fornece nenhuma informação da medida central da sequência, não levando em conta como se dá a variação entre os dados entre o valor máximo e mínimo da sequência de dados. É uma medida de pouca sensibilidade estatística, sendo utilizada para nos dar a informação de quanto há de variabilidade em uma amostra de dados. Medidas de Dispersão 67 Desvio a. Desvio em relação à média aritmética É calculado pela diferença entre um elemento de uma série e a média aritmética dessa mesma série. i id x x= − Considerando, por exemplo, as notas bimestrais de um aluno, temos: 6,0; 5,5; 7,0; 4,5. Como podemos calcular os desvios em relação à média aritmética? a.1) calculamos inicialmente a média aritmética das notas do aluno: 6,0 5,5 7,0 4,5 23 4 4 5,75 x x + + + = = = a.2) calculamos, então, os desvios em relação à média utilizando a fórmula i id x x= − d d d d 1 2 3 4 5 75 6 0 0 25 5 75 5 5 0 25 5 75 7 0 1 25 5 75 = − =− = − = = − =− = − , , , , , , , , , , 44 5 1 25, ,= Percebemos que sempre que somarmos todos os desvios em relação à média, o resultado sempre será zero. Do nosso exemplo: 1 2 3 4 0,25 0,25 1,25 1,25 d d d d zero+ + + − + − + == Essa relação é uma propriedade da média. ( ) zeroi id x x= − =∑ ∑ Medidas de Dispersão UNIDADE 4 68 Desvio médio Definimos como Desvio Médio (DM) a média aritmética dos valores absolutos dos desvios de cada valor de determinada série em relação à média aritmética da determinada série. ix xDM n − = ∑ Observação: O desvio absoluto é aquele no qual consideramos apenas o valor numérico, não importando se eleé positivo ou negativo em relação à média aritmética, pois se assim fosse, por exemplo se utilizássemos o desvio em relação à média, não haveria valor para o numerador da equação, pois seria zero. Utilizando os dados do exemplo anterior, temos: Notas do aluno: 6,0; 5,5; 7,0; 4,5. x d d d d d = = − =− ⇒ = = − = ⇒ = = 5 75 5 75 6 0 0 25 0 25 5 75 5 5 0 25 0 25 1 1 2 2 3 , , , , , , , , , 55 75 7 0 1 25 1 25 5 75 4 5 1 25 1 25 3 4 4 , , , , , , , , − =− ⇒ = = − = ⇒ = d d d Aplicando a fórmula: temos:i x x DM n − = =∑ 0,25 0,25 1,25 1,25 3 4 4 0,75 DM DM + + + = = = A conclusão a que se chega através do cálculo do desvio médio é que os valores da sequência estão afastados da média aritmética em 0,75, no nosso exemplo, em média. Variância Definimos a variância como sendo a média das diferenças ao quadrado entre cada valor de uma sequência e a média aritmética dessa mesma sequência, portanto a variância pode ser definida também como o desvio médio quadrático de uma sequência de dados. O cálculo da variância é dependente do conjunto de dados os quais ele representa, daí temos a variância de uma população e variância para uma amostra. Medidas de Dispersão 69 a. Variância populacional Ela é representada por 2σ e será calculada através da fórmula: ( )22 1 n ii x N µ σ −== ∑ Sendo: µ = média populacional N= quantidade de elementos da população b. Variância amostral Ela é representada por S2 e será calculada através da fórmula: ( )212 1 n ii X X S n −== − ∑ Sendo: X = média amostral n= quantidade de elementos da população n-1 = utilizada para amostras menores de 30 elementos. Para n>30 praticamente não há diferença. Por exemplo, vamos calcular a variância do seguinte conjunto de elementos A= {3; 6; 4; 8; 9}. Como trata- se de uma amostra, calcularemos a variância amostral (S2). 1º - Calcular o valor da média aritmética: 3 6 4 8 9 30 5 5 6 X X + + + + = = = 2º - Calcular os desvios médios: d d d d d 1 2 3 4 5 3 6 3 6 6 0 4 6 2 8 6 2 9 6 3 = − =− = − = = − =− = − = = − = Medidas de Dispersão UNIDADE 4 70 3º - Aplicar a fórmula da variância populacional: ( )212 1 n ii X X S n −== − ∑ S S S 2 2 2 2 2 2 2 2 3 0 2 2 3 5 1 9 4 4 9 4 26 4 6 5 = − + + − + + − = + + + = = ( ) ( ) ( ) ( ) ( ) , Podemos calcular a variância populacional e amostral através de fórmulas mais simplificadas que se seguem: Para variância populacional, temos: ( )22 21 ii X X N N σ = − ∑∑ Para variância amostral, temos: ( )22 21 1 i i x S x n n = − − ∑∑ Desvio padrão O desvio padrão é calculado como sendo a raiz quadrada da variância da amostra. Ele indica o quanto os elementos da amostra estão afastados em relação à média aritmética dessa amostra. Calculamos o desvio padrão para a população e para a amostra. a) Desvio padrão da população: 2σ σ= + b) Desvio padrão da amostra: 2S S= + De forma análoga à variância, calculamos também o desvio padrão populacional e amostral através de fórmulas mais simplificadas que se seguem: Medidas de Dispersão 71 Para desvio padrão populacional, temos: 22 i i X X N N σ = − ∑ ∑ Para desvio padrão amostral, temos: S n x x n n i i= −( ) −( ) ∑∑* * 2 2 1 Medidas de dispersão (Dados agrupados) Amplitude Da mesma forma que para os dados não agrupados, a amplitude é dependente apenas dos valores máximos e mínimos da sequência que se está estudando. Exemplificando, vamos determinar a amplitude dos dados da série representados na tabela a seguir: xi fi 3 1 4 7 5 9 8 3 A amplitude será calculada pela diferença entre o maior valor da série e o menor valor da série: 8 3 5R = − = Desvio médio O Desvio Médio (DM) é determinado através do cálculo de média aritmética ponderada dos valores absolutos dos desvios de cada um dos elementos da série em estudo em relação à média aritmética dessa série. A ponderação será proporcionada pelas respectivas frequências. Calculamos o desvio médio através da equação: DM x x f f = −∑ ∑ i 1 i * Medidas de Dispersão UNIDADE 4 72 Exemplificando o cálculo do desvio médio, consideremos a tabela a seguir: xi fi 3 1 4 7 5 9 8 3 1º Calculamos a média aritmética da série de dados da tabela, através da fórmula de média aritmética x x f f =∑ ∑ i i i * x= + + + + + + = = 3 1 4 7 5 9 8 3 1 7 9 3 100 20 * * * * 5 2º Calculamos os desvios e completamos a tabela de dados: xi fi |xi-x| |xi-x|*fi 3 1 2 2 4 7 1 7 5 9 0 0 8 3 3 9 =∑ 20 18=∑ 3º Calculamos o desvio médio através da fórmula: DM x x f f DM i i i = − = = ∑ ∑ * ,18 20 0 9 Medidas de Dispersão 73 Variância Calcularemos a variância populacional e a variância amostral. Como tratam-se de dados agrupados, distribuído em tabela, incluiremos à tabela a frequência: a. Variância populacional – é calculada através da fórmula: ( )22 21 i ii i f X f X N N σ = − ∑∑ b. Variância amostral – é calculada através da fórmula: ( )22 21 1 i i i i f x S fx n n = − − ∑∑ Também podemos descrever a fórmula da variância amostral da seguinte forma: ( ) ( ) 22 2 1 i i i in f x fxS n n − = − ∑ ∑ Desvio padrão Calcularemos o desvio padrão populacional e a desvio padrão amostral. Como tratam-se de dados agrupados, distribuído em tabela, incluiremos à tabela a frequência. c. Desvio padrão populacional – é calculado através da fórmula: 22 i i i i f X f X N N σ = − ∑ ∑ d. Desvio padrão amostral – é calculado através da fórmula: ( ) ( ) 22 1 i i i in f x fxS n n − = − ∑ ∑ Medidas de Dispersão UNIDADE 4 74 Exemplificando os cálculos da variância e desvio padrão para valores agrupados, temos: Calcular a variância e desvio padrão populacional dos dados da tabela a seguir: xi fi 3 1 4 7 6 9 5 4 8 3 1º Vamos completar a tabela com colunas de 2 2; ; i i i i ix f x fx ix 2 ix if i if x 2 i if x 3 9 1 3 9 4 16 7 28 112 6 36 9 54 324 5 25 4 20 100 8 64 3 24 192 24=∑ 129=∑ 737=∑ 2º Faremos o cálculo da variância inserindo os dados na fórmula da variância populacional: σ σ σ 2 2 2 2 2 2 1 1 24 737 129 24 = − ( ) = − ( ) = ∑ ∑N f X f X Ni i i i 443 625 24 1 82 , ,≅ 3º Extraindo a raiz quadrada da variância, teremos, então, o desvio padrão populacional: 1,82 ,σ = ≅ 1 35 Medidas de Dispersão 75 Variável contínua Amplitude Calculada através da subtração entre o limite superior da última classe e o limite inferior da primeira classe: max maxAT L l= − Desvio médio O desvio médio (DM) é determinado através do cálculo de média aritmética ponderada dos valores absolutos dos desvios de cada um dos elementos da série em estudo em relação à média aritmética dessa série. A ponderação será proporcionada pelas respectivas frequências. Os dados são apresentados na forma de distribuição de frequências em classes de valores. DM x x f f i i i = −∑ ∑ * Exemplificando o cálculo do desvio médio em relação aos dados da tabela a seguir: Intervalo de Classe if 0 4 4 4 8 7 8 12 6 12 16 3 1º Completamos a tabela com as colunas xi, xi fi e |xi-x|fi e calculamos a média aritmética: Intervalo de Classe fi xi xi fi |xi-x| fi 0 4 4 2 8 22,4 4 8 7 6 42 11,2 8 12 6 10 60 14,4 12 16 3 14 42 19,2 20=∑ 152=∑ 67,2=∑ 152 7,6 20 i i i x f x f = = =∑ ∑ Medidas de Dispersão UNIDADE 4 76 2º Calcular o desvio médio aplicando a fórmula: DM x x f f DM i i i = − = = ∑ ∑ * , , 67 2 20 3 36 Variância e desvio padrão Calculamos essas 2 medidas através da mesma fórmula para os dados agrupados utilizando os valores de xi como sendo os pontos médios de cada classe da série de dados. Exemplificando e utilizando a tabela do exemplo anterior, vamos calcular a variância e desvio padrão através dos dados da tabela: Intervalo de Classe if 0 4 4 4 8 7 8 12 6 12 16 3 Incluímos na tabela os valores de 2, e :i i i i ix xf fx Intervalo de Classe i f ix x fi i f xi i2 0 4 4 2 8 16 4 8 7 6 42 252 8 12 6 10 60 600 12 16 3 14 42 588 20=∑ 152=∑ 1456=∑ Aplicando a fórmula da variância populacional, temos: σ σ 2 2 2 2 2 1 1 20 1456 152 20 = = − ( ) − ( ) ∑∑N f X f X Ni i i i = ⇒ = = = ⇒ =σ σ σ 2 2 2 300 8 20 15 04 15 04 3 87 , , , , variância desvio padrrão Medidas de Dispersão 77 Fazendo uma comparação entre os resultados de DM e desvio padrão, temos: • 3,87 3,36DMσ = > = ⇒ o valor do desvio padrão é sempre maior que do desvio médio. Propriedades da Variância (S2) e Desvio Padrão (S) a. A variância e desvio padrão de uma constante é sempre igual a zero: 2 ( ) 0 ( ) 0S c S c= ⇒ = b. Com a soma ou subtração de uma constante que seja diferente de zero, teremos a nova variância e desvio padrão iguais à variância e desvio padrão anteriores, não há alteração de valores. y x c Si i y x y xS S S= ± ⇒ = ⇒ =2 2 c. Com a multiplicação ou divisão de todos os valores por uma constante que seja diferente de zero, teremos a nova variância multiplicada ou dividida pelo quadrado da constante utilizada. O novo desvio padrão será obtido multiplicado ou dividido por essa constante. S cx c S x S cx cS x 2 2 2( )= ( ) =( ) ( ) Medidas de Dispersão UNIDADE 4 78 Material Complementar Indicações para saber mais sobre os assuntos abordados nesta Unidade: Para complementar os conhecimentos adquiridos e enriquecer sua compreensão sobre o assunto tratado nesta unidade, consulte os livros a seguir, disponíveis na Minha Biblioteca: Livros Estatística : para cursos de engenharia e informática. BARBETTA, Pedro Alberto; REIS, Marcelo Menezes; BORNIA, Antonio Cezar. Estatística: para cursos de engenharia e informática. 3. ed. São Paulo: Atlas, 2010. Curso de estatística. FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso de estatística. 6. ed. São Paulo: Atlas, 2012. Controle estatístico de processos: uma abordagem prática para cursos de engenharia e administração. LOUZADA, Francisco et al. Controle estatístico de processos: uma abordagem prática para cursos de engenharia e administração. Rio de Janeiro: LTC, 2013. Medidas de Dispersão 79 Referências BUSSAB, Wilton O.; MORETTIN, P. A. Estatística básica. São Paulo: Editora Saraiva, 2006. 5ª ed. CASTANHEIRA, Nelson Pereira. Estatística aplicada a todos os níveis. Curitiba: IBPex, 2005. FONSECA, Jairo S.; MARTINS, Gilberto A. Curso de estatística. Editora Atlas, 2008. 6ª ed. MURRAY, Spiegel R. Estatística. Porto Alegre: Bookman, 4ª ed., 2009. SOARES, José Francisco; FARIAS, Alfredo A. de; CESAR, Cibele Comini. Introdução à estatística. Rio de Janeiro: Guanabara Koogan, 1991. TRIOLA, Mario F. Introdução à estatística. Tradução: Vera Regina de Farias e Flores. Rio de Janeiro: LTC, 2005. 9ª ed Responsável pelo Conteúdo: Prof.a Me. Luciana Borin de Oliveira Revisão Técnica: Prof. Ms. Carlos Henrique de Jesus Costa Revisão Textual: Prof.a Esp. Kelciane da Rocha Campos 5 Probabilidade Probabilidade UNIDADE 5 82 Contextualização Como vimos, várias são as aplicações para Probabilidade. Leia este texto, retirado do site do Instituto de Matemática da Universidade Federal do Rio Grande do Sul: Probabilidades na Engenharia Controle de qualidade da produção industrial A primeira pessoa a estudar matematicamente o controle da qualidade foi W. Gosset (mais conhecido por seu pseudônimo, Student) quando, no início do séc. XX, trabalhava numa fábrica de cerveja. Sucederam-se algumas aplicações de âmbito fechado, restrita ao setor militar (França: M. Dumas) e às atividades internas da Western Electric Company. Contudo, é só em torno de 1930 que surgem os primeiros tratados de cunho prático e destinado a engenheiros: o The Economic Control of the Quality of Manufactured Products (de W. A. Shewart, da Bell Telephone Co., USA, 1929 ) e o The Application of Statistical Methods in Industrial Standartization and Quality Control ( de Egon. S. Pearson, Inglaterra, 1935). Por essa mesma época, surgem as primeiras comissões tratando da uniformização das normas do controle estatístico da qualidade: o Joint Committe for the Development of Statistical Applications in Engineering and Manufacturing, americano, e a Section of Industrial and Agriculture Researches, na Royal Statistical Society of London. Apesar desses pioneiros, a real difusão dos métodos estatísticos na engenharia só iniciou durante a Segunda Guerra. Entre 1941 e 1942 os americanos e os ingleses desenvolveram um grande programa, procurando disseminar a prática do controle de qualidade estatístico na produção militar. Vários manuais foram escritos e divulgados amplamente. Especialmente decisiva foi a adoção desses manuais pelas universidades americanas que faziam parte do Engineering and Science War Training Program. Terminada a guerra, rapidamente tornou-se norma a inclusão de cursos de Probabilidades e Estatística em todos os cursos de engenharia americanos, ingleses e, logo, de outros países. Fonte: http://goo.gl/MBuUXz. Acesso em: 11 out. 2015. Escolha a área em que você atua ou próxima a ela e busque dados que possam ser analisados. Você pode usar também dados do dia a dia, como, por exemplo: qual a probabilidade de falhas numa produção de 1000 peças/dia? Aplique o conceito estudado, faça tabelas e gráficos, use planilhas eletrônicas. Avalie seu processo, calcule as probabilidades desses dados. Compare os dados! Probabilidade 83 Probabilidade Definição Probabilidade é uma palavra que vem do latim probare (testar ou provar). Podemos definir provável como algo que é incerto ou do qual não se tem certeza absoluta. O termo provável ainda pode ser utilizado para descrever o que é duvidoso e também ser associado com sorte, azar, risco. Portanto, estuda-se a teoria das probabilidades para que se possam avaliar as possibilidades de determinados fenômenos ocorrerem. Provavelmente, as teorias da probabilidade surgiram para que o homem pudesse obter alguma forma de predizer resultados em jogos de azar, muito frequentes na Idade Média; para que alguns pudessem obter vantagem em apostas sobre os outros, pois aquele que conseguisse estimar ou prever com maior chance um evento futuro obteria vantagem. Hoje em dia, uma aplicação da probabilidade muito importante relaciona- se fortemente com a questão de confiabilidade. Nos segmentos industriais de fabricação de bens de consumo, como automóveis, por exemplo, a questão da confiabilidade está intimamente relacionada com a qualidade e garantia do produto. Essa teoria é utilizada, então, com a intenção de que se diminua a probabilidade de falha no produto produzido. Conceitos • Experimento aleatório: é todo evento estatístico que gera resultados imprevisíveis. • Espaço Amostral → S: são todos os resultados possíveis da observação experimental aleatória. • Evento → A: é qualquer conjunto formado com dados do espaço amostral. Por exemplo, no caso hipotético de lançamento de um dado, podemos considerar como A o evento de ocorrer um número par no lançamento do dado. • Evento → A = {2,4,6} • Espaço Amostral → S = {1,2,3,4,5,6} Probabilidade UNIDADE 5 84 Conceito de probabilidade P(A) = n(A) n(S) , onde n(A): número de possibilidade desejada. n(S): número de possibilidade de ocorrência. Do nosso exemplo: n(A) = 3: há 3 possibilidades de ocorrência de número par (2,4 e 6) em um lançamento de dado. n(S) = 6: há 6 possibilidades de ocorrência de 1 número aleatório (1,2,3,4,5 e 6) em um lançamento de dado. P(A) = 3 6 = 1 2 • Evento Certo: resultado ≤ 6 → Evento que sempre ocorre. • Evento Impossível: resultado > 6 → Evento que nunca ocorre. • Evento Complementar (A) : corresponde a todo resultado possível do espaço amostral que não faz parte do Evento → (A) = S - A • Evento União: seja o evento A com a possibilidade de ocorrência de número par menor ou igual a 4 → A = {2 e 4} e B a possibilidade
Compartilhar