Baixe o app para aproveitar ainda mais
Prévia do material em texto
MM ÓÓ DD UU LL OO II XX LL OO 33 ll CURSO TÉCNICO DE SEGURANÇA DO TRABALHO ESTATÍSTICA BÁSICA Prof.ª Maria Leonor da Silva Teixeira Profª. Maria Leonor da Silva Teixeira Módulo: IX ESTATÍSTICA BÁSICA Disciplina do Eixo Curricular Transversal ao Currículo do Curso Técnico de Segurança do Trabalho do CEFET/RJ Edição: CEFET/RJ – COORDENAÇÃO DE SEGURANÇA DO TRABALHO Local: Av. Maracanã, 229 – Maracanã Editora: CEFET/RJ Ano de Publicação: 2012 Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 3 Presidente da República Dilma Rousseff Ministro da Educação Aloizio Mercadante Secretário de Educação Profissional e Tecnológica Eliezer Moreira Pacheco Professora – organizadora Maria Leonor da Silva Teixeira Diretor Geral do CEFET/RJ Carlos Henrique Figueiredo Alves Diretora de Ensino Gisele Maria Ribeiro Vieira Coordenadora da Educação à Distância no CEFET/RJ Maria Esther Provenzano Coordenador Geral do e-tec no CEFET/RJ Mauro Godinho Gonçalves Coordenador Geral Adjunto do e-tec no CEFET/RJ Alexandre Martinez dos Santos Coordenadora do Curso de Segurança do Trabalho do e-tec no CEFET/RJ Myrna da Cunha Coordenador de Tutoria do e-tec no CEFET/RJ Unapetinga Hélio Bomfim Vieira Professora Pesquisadora do e-tec no CEFET/RJ Lucia Helena Dias Mendes Design Instrucional Luciana Ponce Leon Montenegro de Morais Castro Ficha catalográfica elaborada pela Biblioteca Central do CEFET/RJ C977 Curso técnico de segurança do trabalho, módulo IX: Estatística Básica: Disciplina do Eixo Curricular Transversal ao Currículo do Curso Técnico de Segurança do Trabalho do CEFET-RJ / Maria Leonor da Silva Teixeira (org.). Rio de Janeiro: CEFET/RJ – 2012. 111p. : il. color. 1. Segurança do trabalho. 2. Estatística I. Centro Federal de Educação Tecnológica Celso Suckow da Fonseca. II. Teixeira, Maria Leonor da Silva(org.). III. Título. CDD 363.11 Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 4 Apresentação do e-Tec Brasil Prezado estudante, Bem vindo ao e-Tec Brasil! Você faz parte de uma rede nacional pública de ensino, a Escola Técnica Aberta do Brasil, instituída pelo Decreto n° 6.301, de 12de dezembro de 2007, com o objetivo de democratizar o acesso ao ensino técnico público, na modalidade à distância. O programa é resultado de uma parceria entre o Ministério da Educação, por meio das Secretarias de Educação Profissional e Tecnológica (SETEC), as universidades e escolas técnicas estaduais e federais. A educação à distância no nosso país, de dimensões continentais e grande diversidade regional e cultural, longe de distanciar, aproxima as pessoas ao garantir acesso à educação de qualidade, e promover o fortalecimento da formação de jovens moradores de regiões distantes, geograficamente ou economicamente, dos grandes centros. O e-Tec Brasil leva os cursos técnicos a locais distantes das instituições de ensino e para a periferia das grandes cidades, incentivando os jovens a concluir o ensino médio. Os cursos são ofertados pelas instituições públicas de ensino e o atendimento ao estudante é realizado em escolas-polo integrantes das redes públicas municipais e estaduais. O Ministério da Educação, as instituições públicas de ensino técnico, seus servidores técnicos e professores acreditam que uma educação profissional qualificada – integradora do ensino médio e educação técnica, - é capaz de promover o cidadão com capacidades para produzir, mas também com autonomia diante das diferentes dimensões da realidade cultural, social, familiar, esportiva, política e ética. Nós acreditamos em você! Desejamos sucesso na sua formação profissional! Ministério da Educação Janeiro de 2010 Nosso contato etecbrasil@mes.gov.br Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 5 SUMÁRIO Palavra do Professor – organizador...................................................................................06 Apresentação da Disciplina.................................................................................................07 Projeto Institucional.............................................................................................................08 Capítulo 1 Introdução. ....................................................................................................11 Capítulo 2 Estatística Aplicada........................................................................................15 Capítulo 3 Representações Gráficas...............................................................................21 Capítulo 4 Distribuição de Frequências...........................................................................29 Capítulo 5 Medidas de Tendência Central......................................................................41 Capítulo 6 Medidas de Dispersão...................................................................................59 Capítulo 7 Técnicas de Contagem e Teoria dos Conjuntos............................................69 Capítulo 8 Noções de Probabilidade...............................................................................81 Capítulo 9 Elaboração de gráficos Estatísticos Aplicados à Segurança do Trabalho.........................................................................................................99 Bibliografia.........................................................................................................................109 Currículo do Professor – organizador................................................................................110 Palavra do Coordenador....................................................................................................111 Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 6 COM A PALAVRA, A PROFESSORA... Segurança é quesito imprescindível quando o propósito é manter um ambiente de trabalho saudável e produtivo. Tal objetivo está diretamente ligado à valorização do ser humano, fator primordial para o sucesso de qualquer empresa. Sendo assim, o conhecimento técnico sobre segurança do trabalho é decisivo para se atingir e manter a qualidade de vida dos empregados. Considerando que segurança do trabalho pode ser entendida como o conjunto de medidas que são adotadas visando minimizar os acidentes de trabalho, doenças ocupacionais, bem como proteger a integridade e a capacidade de trabalho do trabalhador, ter profissionais treinados e capacitados para lidar com a implantação de normas de prevenção, coletar e manusear dados que realimentarão e darão idéia da eficácia dessa implantação é missão dos profissionais de segurança do trabalho. O mercado de trabalho nacional carece de mão de obra especializada, a nível técnico, neste setor. O curso no qual você está inserido procura diminuiresta deficiência de mão de obra, possibilitando àqueles que não podem fazer um curso presencial a oportunidade de fazer um curso à distância. A disciplina “Estatística Básica” foi esquematizada, visando facilitar o seu bom entendimento do conteúdo, bem como torná-lo agradável para estudo. Ela vai lhe proporcionar os ensinamentos básicos necessários para o levantamento de dados estatísticos e cálculo de medidas necessárias à análise e tomada de decisões necessárias ao acompanhamento dos procedimentos relativos ao seu trabalho. A fim de minimizar seu tempo disponível para estudo, procuramos colocar exercícios resolvidos para entendimento da teoria, além de exercícios propostos para fixá-la. Desejando-lhe um bom curso e esperando poder atender às suas expectativas, a respeito deste assunto, deixo o seguinte pensamento: “O aprender é um processo natural que surge da curiosidade das pessoas” Seja curioso. Maria Leonor da Silva Teixeira Estatística/ Professora Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 7 Apresentação da Disciplina MÓDULO – ESTATÍSTICAS BÁSICA Carga Horária: 40 horas Espera-se que o(a) cursista desenvolva as seguintes competências: ► Introdução ao Curso ► Apresentar os principais conceitos estatísticos e matemáticos necessários ao desenvolvimento do curso. ► Conhecer as principais representações gráficas usados na estatística. ► Aprender a representar grandes massas de dados através de distribuições de freqüências, bem como a sua representação gráfica. ► Aprender a calcular as principais medidas de tendência central e separatrizes dos valores considerados para estudo. ► Aprender a calcular as principais medidas de dispersão dos valores considerados para estudo. ► Recordar as técnicas de contagem bem como os conceitos fundamentais e as principais propriedades de conjuntos. ► Aprender as noções fundamentais do cálculo das probabilidades. Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 8 Projeto instrucional Disciplina: Estatísticas Básica (Carga horária: 40 horas) Ementa: Introdução a Estatística Aplicada – Conceitos Matemáticos – Representações Gráficas – Distribuição de Frequência – Medidas de Tendência Central e de Dispersão – Distribuições Discretas e Contínuas – Noções de Probabilidade – Aplicações de CEP e Qualidade – Elaboração de Gráficos Estatísticos aplicados à Segurança do Trabalho. AULA OBJETIVOS DE APRENDIZAGEM MATERIAIS CARGA HORÁRIA (horas) 1- Introdução Introdução ao Curso Impresso 1 2- Estatística Aplicada ●Aprender os conceitos fundamentais da estatística aplicada, e recordar os conceitos matemáticos necessários ao entendimento do conteúdo do curso, tais como: ● Diferença entre variáveis discretas e continuas; ●Arredondamento de dados; ● Notação científica de números; ● Algarismos significativos, e ● Funções e desigualdades. Impresso 5 3-Representações Gráficas ●Neste capítulo o aluno será apresentado às principais representações gráficas de dados estatísticos e de que maneira eles ajudam na apresentação e visualização dos dados. Impresso 5 4- Distribuição de Frequência ●Ao final deste capítulo o aluno deverá saber construir uma distribuição de freqüências, simples e por classes, bem como representá-la graficamente por um histograma e polígono de freqüências. Impresso 5 Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 9 5- Medidas de Tendência Central ●Ao final deste capítulo o aluno deverá saber calcular: ● A média aritmética, a média ponderada, a moda e a mediana de um conjunto de valores; ●As medidas separatrizes: Quartis, Decis e Percentis; ●Relação de assimetria entre média, moda e mediana; e ● A Média geométrica e harmônica Impresso 5 6- Medidas de Dispersão Ao final deste capítulo o aluno deverá saber calcular: ● A Amplitude Total; ● O Desvio médio; ● A Variância; ● O Desvio padrão, e ● O Coeficiente de variação. Impresso 5 7- Técnicas de Contagem e Teoria dos Conjuntos Ao final deste capítulo o aluno deverá estar em condições de aplicar o conhecimento abaixo para entender e resolver os exercícios do capítulo 8: ●Arranjos simples; ●Permutações simples; ●Combinações simples; ●Conceitos fundamentais de conjuntos; e ●As principais propriedades de conjuntos. Impresso 5 8- Probabilidade Neste capítulo o aluno aprenderá os conceitos fundamentais da probabilidade, além das suas principais propriedades e teoremas. Impresso 5 9- Elaboração de Gráficos Estatísticos Aplicados ● A partir de exemplos reais, construir gráficos estatísticos para apresentar os dados obtidos e classificados em uma distribuição de frequências. Impresso 4 Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 10 Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 11 II nn tt rr oo dd uu çç ãã oo Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 12 1. INTRODUÇÃO A Estatística é tão antiga como o primeiro homem, pois a necessidade de enumerar as coisas surgiu com ele. A vontade de saber é uma das tendências congênitas ao ser humano, o qual, vendo constantemente ao redor de si acontecimentos cuja grandeza e cuja causa desconhece, experimenta um sentimento de admiração e, a seguir, de curiosidade. Nascida como simples compilação de números, a Estatística tem evoluído até nossos dias como um poderoso instrumento destinado a pesquisar as ligações de causalidade existentes entre os fenômenos. Ela é um valioso instrumento que pode ser usada tanto pelo educador, como pelo político, o economista, o médico, o industrial, o agricultor, o cientista, o engenheiro, o matemático, etc..., em seus respectivos campos de atuação, ou seja, a Estatística encontra aplicações em quase todos os campos da atividade humana. 1.1- Por que estudar Estatística? A Estatística é a ciência da obtenção de informações a partir de dados numéricos. A utilização de dados vem se tornando cada vez mais freqüente em um numero cada vez maior de profissões. Vejamos alguns exemplos e perguntas que poderiam ser feitas: Exemplo 1. O Departamento de Estatística do Trabalho do País X relata uma taxa de 6,5% de desempregos no mês Y. Pergunta 1: O governo consultou todos os desempregados? Pergunta 2: Como obteve tal informação? Pergunta 3: Qual a precisão de 6,5% ? Exemplo 2. Um noticiário de TV dá notícias sobre o hábito de fumar em locais públicos. Alega-se que grande parte da evidência que relaciona o fumo ao câncer de pulmão e outros problemas de saúde é de natureza “estatística”Pergunta : Que tipo de evidência é a evidência estatística? Exemplo 3. Um repórter cita um estudo que pretende mostrar que o exercício físico regular contribui para prolongar a vida. Mas um médico consultado pelo repórter lança dúvidas sobre a real utilidade do estudo. Pergunta: Como podemos dizer se os dados em estudo realmente corroboram as conclusões anunciadas? Não podemos escapar dos dados, assim como não podemos evitar o uso de palavras. Tal como as palavras, os dados não se interpretam a si mesmos, mas devem ser lidos com entendimento. Da mesma maneira que um escritor pode dispor as palavras em argumentos convincentes ou frases sem sentido, os dados também podem ser convincentes, enganosos ou simplesmente inócuos. A capacidade de acompanhar e compreender argumentos baseados em dados é importante para a tomada de decisões ou a compreensão dos fatos. A estatística assim como a vida, é uma arte – a arte de tomar decisões acertadas em face da incerteza. Muitos pensam na estatística como uma simples coleção de números. Na Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 13 verdade foi este o seu significado original: State-istics era a coleção de informações populacionais e econômicas vitais para o Estado. Hoje, entretanto, a estatística é muito mais do que isso. Transformou-se em um método científico de análise com larga aplicação em negócios e em todas as ciências sociais e naturais. x.x.x.x.x. Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 14 Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 15 EE ss tt aa tt íí ss tt ii cc aa AA pp ll ii cc aa dd aa Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 16 MMeettaa:: AApprreesseennttaarr ooss pprriinncciippaaiiss ccoonncceeiittooss eessttaattííssttiiccooss ee mmaatteemmááttiiccooss nneecceessssáárriiooss aaoo ddeesseennvvoollvviimmeennttoo ddoo ccuurrssoo.. OObbjjeettiivvoo:: AAoo ffiinnaall ddeessttaa aauullaa vvooccêê ddeevveerráá sseerr ccaappaazz ddee:: AApprreennddeerr ooss ccoonncceeiittooss ffuunnddaammeennttaaiiss ddaa eessttaattííssttiiccaa aapplliiccaaddaa,, ee rreeccoorrddaarr ooss ccoonncceeiittooss mmaatteemmááttiiccooss nneecceessssáárriiooss aaoo eenntteennddiimmeennttoo ddoo ccoonntteeúúddoo ddoo ccuurrssoo,, ttaaiiss ccoommoo:: DDiiffeerreennççaa eennttrree vvaarriiáávveeiiss ddiissccrreettaass ee ccoonnttiinnuuaass;; AArrrreeddoonnddaammeennttoo ddee ddaaddooss;; NNoottaaççããoo cciieennttííffiiccaa ddee nnúúmmeerrooss;; AAllggaarriissmmooss ssiiggnniiffiiccaattiivvooss,, FFuunnççõõeess ee ddeessiigguuaallddaaddeess Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 17 2. ESTATISTICA APLICADA A Estatística Aplicada refere-se às técnicas pelas quais os dados de natureza quantitativa são coletados, organizados, apresentados e analisados. O ponto central da análise estatística moderna é a tomada de decisões sob condições de incerteza. A seguir, iremos apresentar alguns conceitos fundamentais necessários para o bom entendimento das medidas estatísticas que serão estudadas neste curso. 2.1. Estatística – está interessada nos métodos científicos para a coleta, organização, resumo, apresentação e análise de dados, bem como na obtenção de conclusões válidas e na tomada de decisões razoáveis baseadas em tais análises. 2.2. População ou Universo – conjunto de elementos a serem estudados e que apresentam determinada característica, representada pela letra N. Uma população pode ser finita ou infinita. Por exemplo: - finita - numero de crianças em uma determinada escola X. - infinita - numero de resultados (cara ou coroa) em sucessivos lances de uma moeda. . 2.3. Amostra – parte significativa de elementos da população, selecionados aleatoriamente, e representada pela letra “n”. Se uma amostra é representativa de uma população, conclusões importantes, sobre a população, podem ser inferidas (deduzidas, concluídas, tiradas como conseqüência) da sua análise. Inferência: Ato ou efeito de inferir. Exemplo: População: Numero de peças produzidas, num determinado dia numa fabrica X. Por exemplo: N = 1000 peças. Amostra: retirar, aleatoriamente, n peças para verificar se são defeituosas. Por exemplo: n = 100. OBS: A partir da amostra, podemos inferir a quantidade de peças defeituosas da população. 2.4. Estatística indutiva – ou inferência estatística, é a parte da estatística que trata das condições sob as quais as inferências são válidas, e como essa inferência não pode ser absolutamente certa, a linguagem da probabilidade é usada no estabelecimento das conclusões. 2.5. Estatística descritiva ou dedutiva – é a parte da estatística que procura somente descrever e analisar um certo grupo, sem tirar qualquer conclusão ou inferências sobre um grupo maior. 2.6. Dados brutos – são aqueles dados, colhidos para estudo, e que ainda não foram numericamente classificados. Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 18 2.7 ROL – Listagem ordenada de um conjunto de dados segundo uma ordem de grandeza crescente ou decrescente. 2.8. Amplitude total do rol (ATR) – é a diferença entre o maior e o menor valor do Rol, representado por ATR. Exemplo : N = { 5, 8, 3, 9, 11, 4, 7, 23, 11, 3, 4, 12 } Rol: { 3, 3, 4, 4, 5,7, 8, 9, 11, 11, 12, 23} ordem crescente de grandeza, ou Rol: {23, 12, 11, 11, 9, 8, 7, 5, 4, 4, 3, 3,} ordem decrescente de grandeza. , ATR= 23 – 3 = 20 2.9. CONCEITOS MATEMÁTICOS 2.9.1. VARIÁVEIS DISCRETAS E CONTÍNUAS. Variável discreta - quando pode assumir pontos determinados num intervalo [a –b] Exemplo 1: {O numero N de faces de um dado} = { 0,1, 2, 3, 4, 5, 6 } Exemplo 2: {O numero N de filhos de uma família} = {0, 1, 2, 3, 4, 5, 6, 7,...........} Variável contínua – quando pode assumir qualquer valor num intervalo [a – b] Exemplo 1: { A altura H de um individuo que pode estar entre 1,65m e 1,70mm, ou seja, a altura pode ser; 1,65m,1,653m,1,69222m, 1,69222456m ,.........} Exemplo 2: {O peso de um grupo de 10 crianças entre 5 e 10 anos} OBS: Na prática podemos verificar que contagens dão origem a variáveis discretas e medições a variáveis contínuas. 2.9.2 - Arredondamento de dados O arredondamento de um número à unidade mais próxima (décimo, ou outra decimal) reduz seus dígitos significativos ao numero de dígitos significativos garantido pelo cálculo realizado. Quando o resto a ser arredondado for “ exatamente 5´, a convenção é fazer o arredondamento para o par mais próximo . Esta prática faz com que, ao longo das operações, as diminuições e acréscimos devidos aos arredondamento tendam a se compensar. Exemplo: Arredondar os números abaixo:72,8 (para o inteiro mais próximo) = 73 , pois 8 é maior do que 5 72,8146 (para o centésimo mais próximo) = 72,81 , pois 46 é menor que 50 18,758 (para o décimo mais próximo) = 18,8 , pois 58 é maior que 50 15,449 (para o centésimo mais próximo) = 15,45 , pois 9 é maior que 5 89,1750 (para o centésimo mais próximo) = 89,18 , pois 50 igual 50 Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 19 2.9.3 - Notação científica Ao escrever números, especialmente que contenham muitos zeros, antes ou depois da vírgula, é conveniente empregar a notação científica que utiliza as potências de 10. Exemplo 1: 101 = 10 10 2 = 10x10 = 100 104 = 10x10x10x10 = 10.000 Obs: o expoente representa o numero de zeros depois do 1 Exemplo 2: 10 0 = 1 10-2 = 0,01 10 -1 = 0,1 10-4 = 0,0001 Obs1: O expoente representa o numero de casas depois da vírgula. Obs2: Quando multiplicamos um numero por 10x (x inteiro) , é a mesma coisa que deslocar a virgula x casas para a direita. Se por outro lado multiplicarmos por 10-x (x inteiro) é a mesma coisa que deslocar a vírgula x casas para a esquerda. Exemplo 3: 864.000.000 = 8,64 x 108 ( 8 é o numero de casas depois da virgula) 0,00003416 = 3,416 X 10-5 ( numero de casas deslocadas à direita) 2.9.4- Algarismos significativos Os algarismos corretos, separados dos zeros necessários para a localização da vírgula, chamam-se algarismos significativos ou dígitos significativos do numero. Exemplo 1: 1,66 tem 3 algarismos significativos Exemplo 2: 4,5300 tem 5 algarismos significativos Exemplo 3: 0,0018 = 1,8 X 10-3 tem 2 algarismos significativos Exemplo 4: 0,001800 = 1,800 x 10-3 tem 4 algarismos significativos 2.9.5. Funções Se cada valor que a variável X pode assumir corresponder a um ou mais valores da variável Y, diz-se que Y é uma função de X e escreve-se Y = F(X) (ler “ Y igual à função F de X” ), para indicar essa dependência funcional. Outras letras, tais como G, ø, etc. podem ser usadas. Se Y = F(X), temos que X é chamada de variável independente e Y de variável dependente. Exemplo 1: Seja Y = 2X – 3 ou seja, Y = F(X) Se X = 5, implica que Y = 2(5) – 3 = 7 ou seja, F(5) = 7 Se X = -1 implica que Y = 2(-1) – 3 = - 5 ou seja, F(-1) = - 5 Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 20 2.9.6- Desigualdades Os símbolos: > “ maior do que” ≥ “ maior do que ou igual ” < “menor do que” ≤ “ menor do que ou igual” , são conhecidos como símbolos de desigualdades. Exemplos: 3 < 5 leia-se “ 3 é menor do que 5” 5 > 3 leia-se “ 5 é maior do que 3” X < 8 leia-se “ X é menor do que 8” X ≥10 leia-se “ X é maior do que ou igual a 10” 4 < Y ≤ 6 leia-e “ Y maior do que 4 e menor ou igual a 6. x.x.x.x.x Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 21 RR ee pp rr ee ss ee nn tt aa çç õõ ee ss GG rr áá ff ii cc aa ss Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 22 MMeettaa:: Conhecer as principais representações gráficas usados na estatística. OObbjjeettiivvoo:: AAoo ffiinnaall ddeessttaa aauullaa vvooccêê ddeevveerráá sseerr ccaappaazz ddee:: Neste capítulo o aluno será apresentado às principais representações gráficas de dados estatísticos e de que maneira eles ajudam na apresentação e visualização dos dados. Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 23 3. REPRESENTAÇÕES GRÁFICAS Uma maneira de apresentar ou mesmo representar os dados estatísticos de modo que se tornem mais fáceis de serem vistos e entendidos, é através de sua representação gráfica. Um gráfico é uma representação de dados obtidos e representado por formas geométricas, de modo a fornecer ao leitor uma interpretação mais rápida e objetiva. A informática possibilita o uso de recurso nunca antes disponíveis, que agilizam o trabalho, bem como propicia a criação de gráficos elaborados. Existe uma grande quantidade de formas de representação gráfica e a crescente utilização de softwares específicos favorece a execução dos mesmos. A escolha da forma a ser utilizada está diretamente relacionada com o tipo de dados e o objetivo do gráfico. Os gráficos devem ser auto-explicativos e de fácil compreensão, e de preferência sem comentários inseridos. Um gráfico deve ter como requisito básico a simplicidade e a clareza. Não há uma regra rígida para o uso de um ou outro gráfico, mas caberá a quem está fazendo o trabalho analisar para que público alvo será emitido o relatório da pesquisa – nem sempre conhecedores do assunto - para estabelecer a melhor maneira de representar os dados. Na construção de um gráfico algumas regras devem ser observadas, como por exemplo: Tamanho adequado com a publicação; Escala adequada a fim de não desfigurar os dados; Titulo acima do gráfico; Escalas proporcionais aos valores, posicionadas da esquerda para a direita e de baixo para cima; Legendas. EXEMPLO DOS GRÁFICOS MAIS USADOS: 3.1. Gráfico de Linhas O gráfico de linhas é composto por dois eixos, um vertical e outro horizontal, e por uma linha que mostra a evolução de um fenômeno ou processo. Geralmente é usado em séries temporais, ou seja, em séries cujos dados estão em correspondência com o tempo. Exemplo: A tabela abaixo mostra a produção, em toneladas, de milho e trigo produzidos na fazenda AMOR, durante os anos de 1975 a 1980. Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 24 ANOS Produção de trigo (toneladas) Produção de milho (toneladas) 1975 195 100 1976 210 110 1977 225 105 1978 250 95 1979 230 110 1980 235 100 3.1.1. Vamos representar a tabela de dados acima por um gráfico de linhas Produção de milho e trigo da fazenda AMOR 0 50 100 150 200 250 300 1975 1976 1977 1978 1979 1980 TO NE LA DA S TRIGO MILHO 3.1.2. Gráfico de COLUNAS O gráfico de colunas é composto por duas linhas, uma vertical e outra horizontal, chamados de eixos cartesianos. No eixo horizontal são construídas as colunas que representam a variação de um fenômeno ou de um processo de acordo com sua intensidade. Essa intensidade é indicada pelo eixo vertical. As colunas devem sempre possuir a mesma largura e a distânciaentre elas deve ser constante. Este tipo de gráfico representa praticamente qualquer série estatística. 0 50 100 150 200 250 T O N E L A D A 1975 1976 1977 1978 1979 1980 PRODUÇÃO DE MILHO E TRIGO DA FAZENDA AMOR MILHO TRIGO Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 25 3.1.3. Gráfico de BARRAS É representado por retângulos dispostos horizontalmente, prevalecendo os mesmos critérios adotados na elaboração do gráfico de colunas. PRODUÇÃO DE MILHO E TRIGO DA FAZENDA AMOR 0 100 200 300 1975 1977 1979 TONELADAS TRIGO MILHO 3.2. Gráfico de SETORES Os gráficos de setores são representados por círculos divididos proporcionalmente de acordo com os dados do fenômeno ou do processo a ser representado. Os valores são expressos em números ou em percentuais (%). Apresentaremos alguns exemplos de como podemos criar um gráfico de setores. Exemplo 1: Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 26 Exemplo 2: Exemplo 3: Exemplo.4 : As áreas de alguns continentes do mundo, em milhões de quilômetros quadrados, estão apresentadas abaixo. Continente Área (milhões de km2 Ásia 26,9 Europa 4,9 América do Norte 24,3 América do Sul 17,9 TOTAL 133,3 Fonte: Nações Unidas Pede-se; Construir um gráfico adequado para os dados Solução: o exemplo acima pode ser representado por: Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 27 a) Gráfico de BARRAS b) Gráfico de SETORES OU, , Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 28 Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 29 DD ii ss tt rr ii bb uu ii çç ãã oo dd ee FF rr ee qq üü êê nn cc ii aa ss Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 30 MMeettaa:: Aprender a representar grandes massas de dados através de distribuições de freqüências, bem como a sua representação gráfica. OObbjjeettiivvoo:: AAoo ffiinnaall ddeessttaa aauullaa vvooccêê ddeevveerráá sseerr ccaappaazz ddee:: Ao final deste capítulo o aluno deverá saber construir uma distribuição de freqüências, simples e por classes, bem como representá-la graficamente por um histograma e polígono de freqüências. Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 31 4. DISTRIBUIÇÃO DE FREQUÊNCIAS Quando se resumem grandes massas de dados brutos, costuma-se freqüentemente distribuí-los em classes ou categorias e determinar o numero de elementos pertencentes a cada uma das classes, denomina-se freqüência de classe, representado por fi. Um arranjo tabular dos dados por classes, juntamente com as freqüências correspondentes, chama-se “distribuição de freqüências ou tabela de freqüências. Classes fi = (frequências) a1 .. b1 f1 a2 b2 f2 a3 b3 f3 ........................... ...... ........................... ...... ak bk fk ∑............... N = ∑ fi Onde: ai bi classe ai limite inferior de classe: Li bi limite superior de classe: Ls fi numero de elementos do Rol contidos em cada classe k numero de classes onde, 3 ≤ k ≤ 20 N = ∑ fi total de elementos do Rol Intervalo símbolo que une ai a bi, podendo ser de 4 tipos: 1. fechado (inclui ai e bi) 2. semi aberto a esquerda ( exclui ai e inclui bi ) 3. semi aberto à direita ( inclui ai e exclui bi ) 4. aberto ( exclui ai e bi ) Obs1: os intervalos 1,2,3 podem ser usados quando se trabalhar com variáveis discretas, e os intervalos 2,3,4, quando se trabalhar com variáveis continuas. Obs2: devemos usar uma distribuição de frequências por classes quando o numero de elementos for maior ou igual a 50 Obs3: quando o numero de elementos for menor do que 50, e havendo repetições significativas dos elementos, podemos construir uma distribuição de freqüências simples, onde as freqüências (fi) serão as repetições dos elementos. Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 32 Valores fi = (frequências) X1 f1 X2 f2 X3 f3 ...... ...... ..... ...... xk fk ∑............... N = ∑ fi Exemplo: Uma turma de 20 alunos de matemática da 7ª série da escola Bahia, apresentou as seguintes notas na prova final. 3, 3 4 4 4 5 5 5 5 6 6 6 6 6 8 8 9 9 9 10 Apresentar as notas segundo uma distribuição de freqüências? Solução Como N = 20 é menor do que 50 construiremos uma distribuição de freqüências simples. Notas Freqüências (fi) 3 2 4 3 5 4 6 5 8 2 9 3 10 1 Total = ∑ 20 4.1. Método de construção de uma distribuição por classes Para a construção de uma distribuição por classes devem ser seguidos os seguintes passos : 1º ) Determinar a amplitude total do ROL = ATR 2º ) Fixar um numero “K” de classes convenientes onde 3 ≤ k ≤ 20 3º ) Determinar o valor “h” que somado a ai nos dará bi , onde : h = K ATR , h > k Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 33 4.2. Intervalos e limites de classe Um símbolo que define uma classe, como por exemplo, 151 158, chama-se intervalo de classe, e os números extremos 151 e 158 são chamados limites inferior (Li) e limite superior (Ls) de classe, respectivamente. 4.3. Limites reais de classe: São obtidos adicionando-se o limite superior de uma classe ao limite inferior da classe seguinte e dividindo-se a soma por 2. EX 1ª classe 151 158 limites reais 150,5 158,5 2ª classe 159 166 limites reais 158,5 166,5 4.4. Amplitude de classe: ( h) É a diferença entre os limites reais superior e inferior da classe. Se todas as classes tiverem amplitudes iguais, esse valor é igual à diferença entre dois limites inferiores ou superiores consecutivos. Para o exemplo acima teríamos: 158,5 – 150,5 = 166,5 – 158,5 = 159 – 151 = 166 – 158 = 8 4.5. Ponto médio de classe (Xi) É a média aritmética entre os limites de classe, não se levando em consideração o tipo de intervalo usado, ou seja: Ponto médio, Xi = 2 biai 4.6. Freqüências relativas ( Fr ) É a relação existente entre a freqüência de cada classe e o total de freqüências,geralmente expressas em percentagem e cuja soma é igual a 1 ou 100%. Fr = N fi , onde ∑ Fr = 1 = 100% 4.7. Freqüências acumuladas É a freqüência total de todos os valores inferiores ao limite superior de uma dada classe, ou seja: F1 = f1 F2 = f1 + f2 F3 = f1 + f2 + f3 .................................. Fn = f1 + f2 + f3 + .........+ fn = N Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 34 4.8. Histograma e Polígono de freqüências São duas representações gráficas das distribuições de freqüências, a saber: HISTOGRAMA – é um gráfico formado por um conjunto de retângulos justapostos, muito usados para representar distribuições de freqüências, cujos dados foram agrupados em classes de mesma amplitude. O histograma tem: a) as bases sobre o eixo horizontal (eixo dos X ), com centro no ponto médio e as larguras iguais às amplitudes dos intervalos das classes. b) as áreas proporcionais às freqüências das classes. POLÍGONO DE FREQUÊNCIAS – é um gráfico de linhas em que as freqüências são locadas sobre perpendiculares levantadas nos pontos médios das bases dos retângulos do histograma. Pode-se também obtê-los ligando-se os pontos médios das bases superiores dos retângulos do histograma. Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 35 Resumindo: EXERCICIOS Ex 1: Os dados a seguir referem-se às alturas (em cm) de 76 alunos regularmente matriculados na PUCC , 10 ano básico da turma de 1977 à noite. Pede-se: a) construir uma distribuição de frequências por classes; b) determinar os pontos médios de classe; c) determinar as frequências relativas; d) determinar as frequências acumuladas; e e) Construir os seguintes gráficos: Gráfico de colunas Histograma Polígono de freqüências 172 180 174 182 176 167 160 162 162 164 167 174 169 155 155 156 163 169 155 180 176 171 179 167 173 180 172 163 168 165 172 176 172 174 173 165 165 163 181 156 180 168 150 166 178 178 168 181 184 166 177 167 166 173 160 180 186 185 169 179 183 189 178 164 172 164 154 165 170 168 169 180 174 175 191 191 Solução 1º Organizar os dados segundo um ROL 150 154 155 155 155 156 156 160 160 162 162 163 163 163 164 164 164 165 165 165 165 166 166 166 167 167 167 167 168 168 168 168 169 169 169 169 170 171 172 172 172 172 172 173 173 173 174 174 174 174 175 176 176 176 177 178 178 178 179 179 180 180 180 180 180 180 181 181 182 183 184 185 186 189 191 191 Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 36 2º ) Determinar o maior e o menor valor do conjunto Numero de elementos N = 76 Maior valor = 191 Menor valor = 150 ATR = 191 – 150 = 41 Numero de classes desejadas: K =7 Obs1: Existe uma fórmula de calcular o valor de k, que deve ser um número entre 3 e 20, ou seja: K = 1 + 3,3 lg N (onde lg pode ser calculado direto de uma calculadora) No nosso caso seria : K =1 + 3,3 lg(76) = 1=3,3(1,88) = 7,2 = 7 . O numero de classes não pode ser fracionário. Usei o arredondamento de dados visto anteriormente. Obs2: Para efeito de cálculo, é em geral conveniente que todos os intervalos de classe em uma distribuição de freqüências tenham iguais amplitudes. A fórmula que pode ser usada para determinar a amplitude aproximada das intervalos de classe é: Amplitude aproximada = ATR ÷ K = h No nosso caso h = 41 /7 = 5,85 = 6 (Arredondando para inteiro) a) Construir a distribuição por classes Alturas (cm) Freqüências fi Pontos médios Xi Frequências relativas Fr Frequências acumuladas Fa 150 ----- 156 5 153 0,065 = 6,5 % 5 156 ----- 162 4 159 0,053 = 5,3% 5+4 = 9 162 ----- 168 19 165 0,25 = 25,0% 9+19 = 28 168 ----- 174 18 171 0,237 =23,7% 28+18 = 46 174 ----- 180 14 177 0,184=18,4% 46+14 = 60 180 ----- 186 12 183 0,158 =15,8% 60+12 = 72 186 ----- 192 4 189 0,053 =5,3% 72+4 = 76 ∑------ 76 ----- 1 =100% ---- Obs: Como estamos trabalhando com alturas (variável contínua) usaremos um intervalo aberto à direita e à esquerda. Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 37 e) GRÁFICOS 1) Gráfico de colunas 2) Histograma Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 38 3) Polígono de Frequências Ou, Observações: 1. O polígono de frequências é uma figura geométrica, cuja área é igual à área da soma dos retângulos do histograma. 2. Para se construir o histograma e o polígono de frequências é necessário se acrescentar à distribuição uma classe inferior à primeira classe e superior à ultima classe, com frequência nula. Isto se faz necessário para que possamos fechar as laterais do gráfico de linhas e torná-lo um polígono. Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 39 A T I V I D A D E 1 Classifique os conjuntos abaixo em contínuos (C) ou discretos (D) a) Numero de pessoas, por domicilio, num edifício A R ______ b) O peso de cada remessa de artigos de uma fabrica R ______ c) O numero de peças defeituosas em um lote R ______ d) O tempo decorrido antes da primeira falha de um dispositivo R ______ e) 0 numero de faces de um dado R ______ A T I V I D A D E 2 Indicar como cada um dos seguintes valores seria arredondado: a) 5.789 (à centena mais próxima) R ____________ b) 6.501 (ao milhar mais próximo) R ____________ c) 130,055 ( à unidade mais próxima) R ____________ d) 28,65 ( ao décimo mais próximo) R ____________ e) 19,95 ( ao décimo mais próximo) R ____________ f) 32,505 ( a centésimo mais próximo) R ____________ Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 40 A T I V I D A D E 3 Exercício 3. Considere a distribuição de frequências de salários semanais de 100 operários de nível médio da empresa X. SALÁRIOS Num funcionários fi 140 ------ 159 7 160 ------ 179 20 180 ------ 199 33 200 ------ 219 25 220 ------ 239 11 240 ------ 259 4 Total 100 Pede-se: a). Amplitude total do ROL b). Amplitude de classe c). Tipo de intervalo de classe usado e porque? d). Limite inferior da 3ª classe e). Limite superior da 5ª classe f). Freqüência da 2ª classe g). Calcular os pontos médios de classe h). Calcular as freqüências relativas i). Calcular as freqüências acumuladas j). Construir um gráfico de colunas k). Construir um gráfico de barras l). Construir um gráfico de setores m). Construir um histograma e um polígono de freqüências n). Se você fosse apresentar um relatório com os dados acima, e tivesse que os representar através deum gráfico, qual (ou quais) você usaria e por que? Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 41 MM ee dd ii dd aa ss dd ee TT ee nn dd êê nn cc ii aa CC ee nn tt rr aa ll Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 42 MMeettaa:: Aprender a calcular as principais medidas de tendência central e separatrizes dos valores considerados para estudo. OObbjjeettiivvoo:: AAoo ffiinnaall ddeessttaa aauullaa vvooccêê ddeevveerráá sseerr ccaappaazz ddee:: Ao final deste capítulo o aluno deverá saber calcular: A média aritmética, a média ponderada, a moda e a mediana de um conjunto de valores; As medidas separatrizes: Quartis, Decis e Percentis; Relação de assimetria entre média, moda e mediana; e A Média geométrica e harmônica.. Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 43 5. MEDIDAS DE TENDÊNCIA CENTRAL 5.1. Índices ou notação por índices. O símbolo Xi ( leia-se X índice i ) representa qualquer um dos N valores X1, X2, X3,...., Xn, de uma variável X. A letra i, em Xi ,que pode representar qualquer dos números 1, 2, 3,,.....,N, é denominado índice. Evidentemente, podemos usar outra letra além de i , como j , k , p ou s. 5.2. Notação de Somatório O símbolo “ ∑ “ , é a letra grega maiúscula sigma , que indica soma, sendo usado para representar a soma de um conjunto de valores X. Se 5 1i X = x1 + x2 + x3 +x4 + x5 Por definição, se desejamos somar do primeiro ao ultimo termo, representaríamos: N i X 1 = x1 + x2 + x3 + x4 + .......+ xN , e quando não há possibilidade de confusão, indica-se a soma, de modo mais simples por ∑ X, ∑ Xi ou i Xi Exemplos: Ex1. N j XjYj 1 = X1Y1 + X2Y2+ ...........+ XNYN Ex2. N j aXj 1 = a.X1 + a.X2 +........+ a.XN = a (X1+X2+…….+XN) = a N j Xj 1 , em que “a” é uma constante . De maneira mais simples poderíamos escrever: ∑ a.X = a.∑ X Ex3. Se a, b, c, são constantes quaisquer, então: ∑ ( aX + bY – cZ ) = a ∑ X + b ∑ X – c ∑ X 5.3. Média Aritmética: A media é um valor representativo de um conjunto de dados. Como esse valor tende a se localizar em um ponto central, dentro de um conjunto de dados ordenado segundo suas grandezas, a média também é denominada de medida de tendência central. Logo, a média aritmética, ou média, de um conjunto de N valores X1,X2,....,XN é representada por X (leia-se “X barra”) e é definida por: X = N XXXX N .......321 = N Xi N i 1 = N X ..............................(1) Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 44 Exemplo: Calcular a média aritmética dos números 4, 7, 12, 6, 9. Aplicando (1), teremos: X = 5 961274 = 5 38 = 7,6 Se os números X1, X2, X3,.........,Xk ocorrem com freqüências f1, f2, f3,.....,fk , respectivamente, então o cálculo da média será dado pela relação: X = N XfXfXfXf kk .......332211 = k i k i fi Xifi 1 1 = f Xf = N Xf , Onde N = f é a freqüência total , isto é , o total de elementos a serem considerados para o cálculo. Exemplo: Se os valores 4, 7, 5, 9, 3, ocorrerem co freqüências 2, 4, 3, 1, 4, respectivamente, a média aritmética será: X = 14 )3)(4()9)(1()5)(3()7)(4()4)(2( = 14 12915288 = 14 72 = 5,14 5.4. Média aritmética Ponderada Se os valores X1, X2, X3,......,Xk ocorrem com pesos w1, w2, w3,....,wk, ou seja aos valores XK são dadas ponderações em função de sua importância, a média aritmética ponderada será dada pela relação: X = k kk wwww XwXwXwXw ... ....... 321 332211 = w Xw Exemplo: Se a prova final de um curso tem peso 3 e as provas mensais peso 1, qual a média final de um aluno que obteve nota final 8,5 e notas mensais 7,0 e 9,0. X = 311 )5,8)(3()0,9)(1()0,7)(1( = 5 5,41 = 8,3 5.5. Cálculo da média aritmética para dados agrupados em distribuições de freqüências. Quando os dados a serem estudados estão apresentados por uma distribuição de freqüências, todos os valores incluídos em um certo intervalo de classe são considerados coincidentes com o ponto médio do intervalo (classe). Nesse caso, os valores: Xi são os pontos médios de classe e os fi são as respectivas freqüências de classe. Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 45 5.5.1. Exempo: As alturas (em cm) de 100 estudantes do sexo masculino da Universidade XYZ, estão representadas na distribuição abaixo. Alturas (cm) Freqüências ( f ) Pontos médios (X) f . X 151 ----- 158 5 154,5 5(154,5) = 772,5 159 ----- 166 18 162,5 18(162,5) = 2.925,0 167 ----- 174 42 170,5 42(170,5) = 7.161,0 175 ----- 182 27 178,5 27(178,5) = 4.819,5 183 ----- 190 8 186,5 8(186,5) = 1.492,0 ∑ ........... 100 ------ 17.170,0 Pede-se: Calcular a média aritmética das alturas X = f Xf = N Xf = 100 0,170.17 = 171,70 cm, Ou seja, a altura média dos 100 estudantes, observados na pesquisa, é de 171,70 cm. 5.6. Mediana : Md A mediana de um conjunto de N valores x1, x2, x3,......,xn , ordenados segundo uma ordem de grandeza (ROL) , é o valor que divide o conjunto em duas partes iguais de elementos. a) se os valores de um conjunto estiverem apenas listados segundo um Rol, então: se N é um numero impar de valores, a mediana será o valor correspondente ao termo central, ou seja, se X = { x1, x2, x3, x4, x5, x6, x7} Md = x4 Exemplo: Rol={ 3, 4, 5, 6, 8, 8, 10} , N = 7 e Md = 6 (termo central) se N é um numero par de valores, a mediana será igual à média aritmética entre os dois termos centrais, ou seja, se X = { x1, x2, x3, x4, x5, x6, x7, x8} Md = 2 54 xx Exemplo: Rol = { 5, 5, 7, 9, 11, 13, 15, 18,18 21} , N = 10 e Md = 2 1311 = 12 b) Se os valores estão agrupados segundo uma distribuição de freqüências por classes, a mediana será dada pela relação: Md = Li + mf antfP )( . h , onde: Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 46 Li = limite inferior da classe mediana h = amplitude de classe fm = freqüência da classe mediana antf )( = soma das freqüências anteriores à classe mediana P = 2 N se N é par P = elemento mediano onde: P = 2 1N se N é impar Exemplo: Considerando a distribuição do exemplo 5.5.1, calcule a mediana das alturas. Alturas (cm) Freqüências ( f ) Frequênias Acumuladas Fa151 ----- 158 5 5 159 ----- 166 18 23 167 ----- 174 42 65 Classe mediana 175 ----- 182 27 92 183 ----- 190 8 100 ∑ ........... 100 ---- Como calcular: 1. Calcular o valor de P , onde P = 2 N = 2 100 = 50 2. Calcular as freqüências acumuladas da distribuição (coluna 3) 3. Verificar (na ordem da primeira classe para a ultima) em qual frequência acumulada se inclui o valor 50. No nosso exemplo está contido na 3ª classe 4. antf )( = 23 5. fm = 42 6. h = como o intervalo é fechado h = (174-167)+1 = 8 ou (174 – 166) = 8 7. Aplicar a fórmula: Md = 167 + 42 2350 x 8 = 172,14 172 Isto quer dizer que 50% dos alunos tem altura menor ou igual a 172 cm, e outros 50% tem altura maior ou igual a 172cm. 5.7. Medidas separatrizes: Qi, Di, Pi Um conjunto de dados, organizado em ordem de grandeza segundo um ROL, pode ser dividido em duas partes iguais de valores usando a mediana. Por extensão desse conceito, pode-se pensar nos valores que dividem o conjunto em quatro partes iguais, chamados de Quartis, representados por Q1, Q2 e Q3, chamados de primeiro, segundo e terceiro quartis. Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 47 De mesma maneira teríamos os “Decis” que dividem em 10 partes iguais de elementos, representados por D1, D2, D3,.......,D9, e os Percentis que dividem o conjunto em 100 partes iguais de elementos, representados por P1, P2, P3,....,P50,......,P99,. A fórmula para a determinação dessas medidas é igual à da mediana, variando apenas o valor de P, a saber: 5.7.1. Valores de P para as separatizes Quartis: P1 = 4 N , P2 = 4 2N , P3 = 4 3N Decis: P1 = 10 N , P2= 10 2N , P3 = 10 3N ,................., P8 = 10 8N , P9 = 10 9N Percentis: P1 = 100 N , P2 = 100 2N , P3 = 100 3N ,.................., P98 = 100 98N , P99 = 100 99N Logo, Qi = Di = Pi = Md = Li + mf antfP )( . h 0bs: A mediana (Md), o segundo quartil (Q2), o qüinto decil (D5) e o quinquagésimo percentil (P50), são iguais pois dividem o conjunto em duas partes iguais de elementos, ou seja: Md = Q2 = D5 = P50 ou seja, 2 N = 4 2N = 10 5N = 100 50N Exemplo: considerando a distribuição abaixo, pede-se: Alturas (cm) Freqüências ( f ) Frequênias Acumuladas Fa 151 ----- 158 5 5 P5 159 ----- 166 18 23 D2 ,P21 167 ----- 174 42 65 Q1 ,Q2 ,D5, 175 ----- 182 27 92 Q3, D7 183 ----- 190 8 100 P96 ∑ ........... 100 ---- 1) primeiro. segundo e terceiro quartis: Q1, Q2 e Q3 2) segundo, quinto e sétimo decil : D2, D5 e D7 3) quinto, vigésimo primeiro e nonagésimo sexto percentil.: P5,P21 e P96 Solução 1a) Calculo do 1º quartil Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 48 P = 4 N = 4 100 = 25 Q1 = Li + mf antfP )( . h = 167 + 42 2325 .8 = 167,38 = 167cm ou seja, 25% das alturas ≤ 167 cm = 1,67m 1b) Calculo do 2º quartil P = 4 2N = 4 200 = 50 Q2 = Li + mf antfP )( . h = 167 + 42 2350 .8 = 172,14 172cm = 1,72m ou seja, 50% das alturas ≤ 172 cm = 1,72m 1c) Calculo do 3º quartil P = 4 3N = 4 300 = 75 Q3 = Li + mf antfP )( . h = 175 + 27 6575 .8 = 177,96 178cm ou seja, 75% das alturas ≤ 178 cm =1,78m 2a) Calculo do 2º decil P = 10 2N = 10 200 = 20 D2 = Li + mf antfP )( . h = 159 + 18 520 .8 = 165,66 166cm ou seja, 20% das aturas ≤ 166 cm =1,66m 2b) Calculo do 5º decil P = 10 5N = 10 500 = 50 D5 = Li + mf antfP )( . h = 167 + 42 2350 .8 = 172,14 172cm ou seja, 50% das alturas ≤ 172 cm = 1,72m 2c) Calculo do 7º decil P = 10 7N = 10 700 = 70 D7 = Li + mf antfP )( . h = 175 + 27 6570 .8 = 176,48 176cm ou seja, 70% das alturas ≤ 176 cm = 1,76m 3a) Calculo do 5º percentil Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 49 P = 100 5N = 100 500 = 5 P5 = Li + mf antfP )( . h = 151 + 5 05 .8 = 159cm ou seja, 5% das alturas ≤ 159 cm = 1,59m 3b) Calculo do 21º percentil P = 100 21N = 100 2100 = 21 P21 = Li + mf antfP )( . h = 159 + 18 521 .8 = 166,11 166cm ou seja, 21% da alturas ≤ 166 cm = 1,66m 3c) Calculo do 96º percentil P = 100 96N = 100 9600 = 96 P96 = Li + mf antfP )( . h = 183 + 8 9296 .8 = 187 cm ou seja, 96% das alturas ≤ 187 cm = 1,87m 5.8. Moda: Mo A moda de um conjunto de valores X1, X2, X3, X4,.........,XN , ordenados segundo um Rol, é o valor de maior freqüência do conjunto. A moda pode não existir, mas caso exista poderá não ser única, ou seja, o conjunto pode ser; Amodal – quando os valores de um conjunto possuem todos a mesma freqüência: Ex1: X = { 3, 5, 8, 10, 15, 23,34 } → frequência 1 para todos os valores Ex2: X = { 3, 3, 6, 6, 8, 8, 10, 10, 11, 11} → freqüência 2 para todos os valores Unimodal – quando apenas um valor do conjunto possui freqüência máxima. Ex: X = { 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 18} → Mo = 9 , pois f(9) = 3. O conjunto se diz unimodal. Bimodal – quando apenas dois valores do conjunto possuem freqüência máxima. Ex: X = { 4, 4, 4, 5, 5, 6, 7, 9, 9, 10, 11, 11, 11, 15} → Mo1 = 4 e Mo2 = 11, pois f(4) = f(11) = 3, e o conjunto se diz bimodal. Como vimos a moda pode não existir, mas caso existe pode não ser única, ou seja o conjunto pode ser amodal, bimodal, trimodal e acima disso se diz plurimodal. No caso de dados agrupados por uma distribuição de freqüências, a moda será o valor (ou valores) de X correspondente à(s) classe(s) de maior freqüência. Nesse caso a moda pode ser obtida pela fórmula: Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 50 Moda = Mo = Li + h 21 1 , Onde, Li = limite inferior da classe modal ∆1 = diferença entre a freqüência da classe modal e a freqüência da classe imediatamente inferior ∆2 = diferença entre a freqüência da classe modal e a freqüência da classe imediatamente superior h = amplitude do intervalo da classe modal Exemplo1: Considerando a distribuição, calcule a sua moda: Alturas (cm) Freqüências ( f ) 151 ----- 158 5 159 ----- 166 18 167 ----- 174 42 Classe modal 175 ----- 182 27 183 ----- 190 8 ∑ ........... 100 Moda = Mo = Li + h 21 1 , = 167 + 8 1524 24 = 171,92 172 cm ∆1 = 42 – 18 = 24 ∆2 =42 – 27 = 15 Neste caso o conjunto é dito unimodal pois possui uma só moda. Exemplo 2: Considerando a distribuição, calcule a sua moda Alturas (cm) Freqüências ( f ) 151 ----- 158 8 159 ----- 166 30 Classe modal 1 167 ----- 174 17 175 ----- 182 30 Classe modal 2 183 ----- 190 15 ∑ ........... 100 Moda = Mo1 = Li + h 21 1 , = 159 + 8 1312 12 = 162,84 163 cm ∆1 = 30 – 18 = 12 ∆2 = 30 – 17 = 13 Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 51 Moda = Mo2 = Li + h 21 1 , = 175 + 8 1513 13 = 178,71 179 cm ∆1 = 30 – 17 = 13 ∆2 = 30 – 15 = 15 Neste caso o conjunto possui duas modas e é chamado de bimodal 5.9 . Medidas de assimetria a) Uma distribuição de freqüências por classes é dita simétrica quando: Média = Mediana = Moda ou X = Md = Mo b) Uma distribuição de freqüências por classes é dita Assimétrica à esquerda ou negativa, quando: Média < Mediana < Moda ou X < Md < Mo c) Uma distribuição de freqüências por classes é dita Assimétrica à direita ou positiva, quando: Média > Mediana > Moda ou X > Md > Mo Exemplo: Calcular os tipos de assimetria das distribuições abaixo: Distribição A Distribuição B Distribuição C Classes fi Classes fi Classes fi 2 ---- 6 6 2 ---- 6 6 2 ---- 6 6 6----10 12 6----10 12 6----10 30 10----14 24 10----14 24 10----14 24 14----18 12 14----18 30 14----18 12 18----22 6 18----22 6 18----22 6 Total 60 Total 78 Total 78 Solução: Distribuição A: X = 12 Md = 12 e Mo = 12 Distribuição B: X = 12,9 Md = 13,5 e Mo = 16 Distribuição C: X = 11,1 Md = 10,5 e Mo = 8 Calculando o tipo de assimetria Distribuição A: X = 12 = Md = 12 = Mo = 12 a distribuição é simétrica Distribuição B: X = 12,9 < Md = 13,5 < Mo = 16 a distribuição é assimétrica à esquerda ou negativa Distribuição C: X = 11,1 > Md = 10,5 > Mo = 8 a distribuição é assimétrica à direita ou positiva Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 52 5.10. Média Geométrica : G A média geométrica G de um conjunto de N números X1,X2,X3,....,XN é a raiz de ordem N do produto desses números. N NXXXXG ...... 321 Ex : Calcule a média geométrica dos valores: X = {2, 4, 8 } 3 )8)(4)(2(G = 3 64 = 4 Na prática G é calculada por meio de logaritmos, e pode-se usar uma máquina de calcular que dê esses valores. log G = N 1 log ( X1.X2.X3....XN) = N 1 { logX1+logX2+logX3 +........+ log XN} No exemplo acima teríamos: log G = 3 1 log {(2)(4)(8)} = 3 1 { log2+ log4 + log8} = log G = 3 1 {0,3010 + 0,6020 + 0,9030} = 3 1 1,806 = 0,602 G = 3,9994 = 4 Ou log G = 3 1 log 64 = 3 1 1,806 = 0,602 Obs: para se calcular o valor de G, basta entrar na calculadora com o valor 0,602, apertar a tecla SHIFT e em seguida apertar a tecla log. Quando os valores estiverem agrupados segundo uma distribuição de freqüências, a média geometria será dada pela relação: G = N f N fff NXXXX ....... 321 3 . 21 Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 53 Aplicando logaritmos , teríamos: log G = N 1 log NfNfff XXXX ......321 321 = N 1 ( f1 logX1 + f2 logX2 +.....+fN log XN) log G = Xifi N log 1 = N Xifi log Exemplo: calcular a média geometria da distribuição: Alturas (cm) Freqüências ( f ) Pontos médios Xi Log Xi fi logXi 151 ----- 158 5 154,5 2,1889 10,9445 159 ----- 166 18 162,5 2,2108 39,7944 167 ----- 174 42 170,5 2,2317 93,7314 175 ----- 182 27 178,5 2,2516 60,7932 183 ----- 190 8 186,5 2,2706 18,1648 ∑ ........... 100 ------- -------- 223,4283 log G = N Xifi log = 100 4283,223 = 2,234283 G = 171,50 cm = 172 cm = 1,72 m Obs: Usamos a tabela para fazer os cálculos, o que facilita o trabalho. 5.11. Média Harmônica: H 5.11.1-A média harmônica H, de um conjunto de N números X1, X2, X3,....,XN, é a recíproca da média aritmética das recíprocas dos valores, ou seja: H = N i XiN 1 11 1 = N I Xi N 1 1 = NXXXX N 1 ...... 111 321 Exemplo: Calcular a média harmônica do conjunto X = { 3, 5, 6, 6, 7, 10, 12} Solução: H = NXXXX N 1 ...... 111 321 = 12 1 10 1 7 1 6 1 6 1 5 1 3 1 7 = = 140 167 7 = 167 )140)(7( = 167 980 = 5,868 5,9 Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 54 Exemplo: As cidades A, B e C são eqüidistantes umas das outras. Um motorista viaja de A para B a 30 km/h, de B para C a 40 km/h e de C para A a 50 km/h. determinar sua velocidade média para todo o percurso d viagem? Solução: Como todas as distâncias são iguais , então: Vm = 50 1 40 1 30 1 3 = 0783,0 3 = 38,3 km/h 5.11.2 .Se X1, X2, X3,......, XN, ocorrem cm freqüências f1, f2, f3, ......., fN, então a média harmônica do conjunto de valores é dada por: H = N i Xi fi N 1 1 1 = N I Xi fi N 1 = N N X f X f X f X f N ...... 3 3 2 2 1 1 , onde, N = f1 + f2 + f3 +...+ fN = fi Exemplo: calcular a média harmônica da distribuição abaixo: Alturas (cm) Freqüências ( fi ) Pontos médios Xi Xi fi 151 ----- 158 5 154,5 5/154,5 = 0,03236 159 ----- 166 18 162,5 18/162,5 = 0,11076 167 ----- 174 42 170,5 42/170,5 = 0,24633 175 ----- 182 27 178,5 27/178,5 = 0,15126 183 ----- 190 8 186,5 8/186,5 = 0,04289 ∑ ........... 100 ------- 0,5836 H = N i Xi fi N 1 1 1 = N I Xi fi N 1 = 5836,0 100 = 171,35 cm = 1,71 m 5.12 . Relação entre as médias: aritmética, geométrica e harmônica H ≤ G ≤ X Exemplo: no exercício das alturas apresentado anteriormente, tivemos: X = 171,70 cm, H = 171,35 cm 171,35 ≤ 171,50 ≤ 171,70 G = 171,50 cm Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 55 A T I V I D A D E 1 As notas de um candidato nas provas de um concurso, foram: 8,4 9,1 7,2 6,8 8,7 7,2 Calcule: a) a média b) a mediana c) a moda d) tipo de assimetria A T I V I D A D E 2 Uma turma de 35 alunos apresentou as seguintes notasde matemática: 35 45 40 40 52 56 59 60 54 55 56 59 60 60 54 56 57 59 60 55 56 57 59 60 55 56 58 60 80 85 60 65 63 70 75 Pede-se: a) representar as notas por uma distribuição de frequências b) a amplitude total do rol c) média, moda e mediana d) 3º quartil, 2º decil, 9º decil, 20º percentil e 87º percentl Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 56 A T I V I D A D E 3 DEFINA ACIDENTE DO TRABALHO Uma amostra de 50 empresas foi extraída para se determinar o número médio de acidentes por mil homens/hora em uma indústria. Os dados foram tabelados na distribuição abaixo. Numero médio de acidentes por mil homens/hora Numero de empresas 1,5 ----1,7 3 1,8 --- 2,0 12 2,1 --- 2,3 14 2,4 --- 2,6 9 2,7 --- 2,9 7 3,0 --- 3,2 5 Total 50 Pede-se: a) a média b) a mediana c) a moda para esta amostra de 50 empresas d) o tipo de comportamento assimétrico os dados? e) a média harmônica f) a média geométrica A T I V I D A D E 4 Determinar a média aritmética, a média geométrica e a média harmônica dos dados e compare-as: { 2, 4, 8, 16, 32} Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 57 A T I V I D A D E 5 No exercício 3 acima, calcule: a) 1º e 3º quartil b) 3º e 7º decil c) 35º e 87º decil A T I V I D A D E 6 Os salários semanais de 100 operários estão relacionados na distribuição abaixo: Salário semanal Num de operários 140 --- 159 7 160 --- 179 20 180 --- 199 33 200 --- 219 25 220 --- 239 11 240 --- 259 4 Total 100 Pede-se: a) a média b) a moda c) a mediana dos salários d) média harmônica e) média geométrica f) qual a classificação dos dados em relação à sua assimetria Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 58 Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 59 MM ee dd ii dd aa ss dd ee DD ii ss pp ee rr ss ãã oo Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 60 MMeettaa:: Aprender a calcular as principais medidas de dispersão dos valores considerados para estudo OObbjjeettiivvoo:: AAoo ffiinnaall ddeessttaa aauullaa vvooccêê ddeevveerráá sseerr ccaappaazz ddee:: : Ao final deste capítulo o aluno deverá saber calcular: A Amplitude Total; O Desvio médio; A Variância; O Desvio padrão, e O Coeficiente de variação. Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 61 6. MEDIDAS DE DISPERSÃO O grau ao qual os dados numéricos tendem a dispersar-se em torno de um valor médio, chama-se de variação ou dispersão dos dados. Como a média aritmética é um valor facilmente influenciável por valores extremos, as medidas de dispersão nos ajudarão a ter uma melhor percepção do conjunto e da representatividade dessa média. Existem várias medidas de dispersão, mas no nosso curso estudaremos apenas aquelas mais usadas 6.1. Amplitude Total A amplitude total de um conjunto de números X1, X2, X3, ..... , XN , é a diferença entre o maior e o menor número do conjunto. At = Xmax - Xmin (X máximo menos X mínimo) Exemplo: X = { 3, 6, 8, 12, 15, 23 } At = 23 – 3 = 20 OBS: a) A At é a medida mais simples de dispersão; b) Ela leva em conta apenas os valores mínimo e máximo do conjunto, mas se ocorrer qualquer variação no interior do conjunto, ela não dá qualquer indicação dessa variação; c) Ela sofre a influência de valores “atípicos” no conjunto, ou seja, a presença de valor muito grande ou muito pequeno em relação ao conjunto. Ex: X = { 4, 6, 7, 7, 10, 25} , At = 25 – 4 = 21 O valor 25 distorce o conjunto. Exemplo: Um empresário deseja comparar a performance de dois empregados, com base na produção diária de determinada peça, durante cinco dias: Empregado A = { 70, 71, 69, 70, 70 } onde AX = 70 peças Empregado B = { 60, 80, 70, 62, 83} BX = 71 peças Solução: AtA = 71- 69 = 2 e AtB = 83- 60 = 13 Com base na média aritmética, diríamos que a performance de B foi melhor do que a de A, pois a media de B é maior. Mas se observarmos bem os dados, verificamos que a produção de A varia de 69 a 71 enquanto que a de B varia de 60 a 83, ou seja , a dispersão de B é maior do que a de A para o mesmo numero de dias, o que dá a A melhor performance. 6.2. Desvio Médio : DM 6.2.1- O desvio médio de um conjunto de N números X1, X2, X3, ..... , XN é definido por: DM = N XXXXXX N .........21 = N XXi N i 1 , Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 62 onde X é a media aritmética dos valores Xi, ou seja o desvio médio é a média das diferenças ,em módulo, dos valores Xi em relação à média X , dividido pelo total de elementos (N). Exemplo: Calcular o desvio médio do conjunto: X= 11,8,6,3,2 Solução: 1º ) Calcular a média: X = 5 118632 = 5 30 = 6 2º ) Calcular o desvio médio: DM = 5 6116866.6362 = 5 14 = 2,8 6.2.2- Se X1, X2, X3, ..... , XN, ocorrem com freqüências f1, f2, f3,....., fN , respectivamente, o desvio médio será dado pela relação: DM = N NN ffff XXfXXfXXf ......... ......... 321 2211 = N i N i fi XXifi 1 1 = N XXifi Obs: Para os dados agrupados numa distribuição de freqüências, os valores Xi são os pontos médios de classe. Exemplo: Considere o conjunto das alturas dos 100 estudantes, visto no capitulo anterior: Calcular o desvio médio do conjunto. (4) (5) Alturas (cm) Freqüências ( f ) Pontos médios (X) XXi = 70,171Xi fi XXi 151 ----- 158 5 154,5 17,2 86,0 159 ----- 166 18 162,5 9,2 165,6 167 ----- 174 42 170,5 1,2 50,4 175 ----- 182 27 178,5 6,8 183,6 183 ----- 190 8 186,5 14,8 118,4 ∑ ........... 100 ------ ------- 604,0 Solução: 1º) A média foi calculada em 171,70cm 2º) Calcular os valores XXi = 70,171Xi (coluna 4) 3º) calcular os valores fi XXi ( Coluna 5) 4º) Aplicando a fórmula teríamos: Av. Maracanã, 229 – Maracanã - CEP 20.271-110 – Rio de Janeiro- R –Tel. 2256-3164p. 63 DM = N XXifi = 100 0,604 = 6,04 cm 6.3. Variância 6.3.1- A Variância é idêntica ao desvio médio
Compartilhar