Baixe o app para aproveitar ainda mais
Prévia do material em texto
Fabíola Eugênio Arrabaça Moraes Estatística descritiva © 2017 by Universidade de Uberaba Todos os direitos reservados. Nenhuma parte desta publicação poderá ser reproduzida ou transmitida de qualquer modo ou por qualquer outro meio, eletrônico ou mecânico, incluindo fotocópia, gravação ou qualquer outro tipo de sistema de armazenamento e transmissão de informação, sem prévia autorização, por escrito, da Universidade de Uberaba. Universidade de Uberaba Reitor Marcelo Palmério Pró-Reitor de Educação a Distância Fernando César Marra e Silva Editoração Produção de Materiais Didáticos Capa Toninho Cartoon Edição Universidade de Uberaba Av. Nenê Sabino, 1801 – Bairro Universitário Catalogação elaborada pelo Setor de Referência da Biblioteca Central UNIUBE Moraes, Fabíola Eugênio Arrabaça. M791e Estatística descritiva / Fabíola Eugênio Arrabaça Moraes. – Uberaba: Universidade de Uberaba, 2017. 148 p.: il. Programa de Educação a Distância – Universidade de Uberaba. ISBN 978-85-7777-591-0 1. Estatística. 2. Pesquisa. I. Universidade de Uberaba. Programa de Educação a Distância. II. Título. CDD 519.5 Fabíola Eugênio Arrabaça Moraes Mestre em Estatística pela Universidade Federal de São Carlos (UFSCar). Graduada em Matemática pela Faculdade de Educação São Luís de Jabotica bal (FESL). É docente nos cursos de graduação, na modalidade presencial e à distância, da Universidade de Uberaba (Uniube), nas áreas afins de Matemática, Estatística e Bioestatística. Sobre os autores Sumário Apresentação .......................................................................................... Capítulo 1 Estatística Descritiva: a importância da estatística no dia a dia ... 1 1.1 A importância da Estatística no dia a dia ..................................................................4 1.2 Estatística descritiva – parte I ..................................................................................7 1.2.1 O que é população e o que é amostra? ........................................................8 1.2.2 Situações problema envolvendo a questão da representatividade .................11 1.2.3 Apresentação dos dados .............................................................................14 1.2.4 Representação tabular .................................................................................15 1.2.5 Distribuição de frequência ............................................................................17 1.2.6 Dados brutos ................................................................................................17 1.2.7 Rol ................................................................................................................18 1.2.8 Distribuição de frequência para variável discreta (tabela de frequência) ...18 1.2.9 Distribuição de frequência para variável contínua (intervalo de classe) .....19 1.3 Representação gráfica ............................................................................................24 1.4 Estatística descritiva – parte II ................................................................................28 1.4.1 Medidas de tendência central ......................................................................28 1.5 Medidas de variabilidade ........................................................................................48 1.5.1 Amplitude total ou intervalo total ..................................................................48 1.5.2 Desvio padrão ..............................................................................................49 1.5.3 Variância .......................................................................................................50 1.5.4 Coeficiente de variação ................................................................................50 Capítulo 2 Conhecendo o cálculo da probabilidade ............................ 61 2.1 Definições e notações básicas ...............................................................................64 2.2 Probabilidade ..........................................................................................................67 2.2.1 Definição clássica ........................................................................................68 2.2.2 Definição frequentista ...................................................................................69 2.2.3 Definição subjetiva .......................................................................................71 2.3 Axiomas da probabilidade .......................................................................................72 2.3.1 Alguns dos principais teoremas de probabilidade .......................................73 2.3.2 Probabilidade condicional ............................................................................74 2.3.3 Teorema do produto .....................................................................................76 2.3.4 Independência estatística ............................................................................77 2.3.5 Teorema da probabilidade total ....................................................................79 2.3.6 Teorema de Bayes .......................................................................................80 Capítulo 3 Distribuições de probabilidade ................................................. 85 3.1 Distribuições de probabilidade ................................................................................87 3.2 Variável aleatória .....................................................................................................90 3.2.1 Variável aleatória discreta ............................................................................91 3.2.2 Variável aleatória contínua ...........................................................................92 3.2.3 Algumas características numéricas importantes em uma distribuição de probabilidade ................................................................................................93 3.3 Distribuições discretas de probabilidade ................................................................94 3.3.1 Distribuição binomial ....................................................................................95 3.3.2 Distribuição de Poisson ................................................................................97 3.4.1 Distribuição normal ....................................................................................100 3.4 Distribuições contínuas de probabilidade .............................................................100 Capítulo 4 Amostragem ..................................................................... 123 4.1 Noções sobre amostragem ..................................................................................126 4.2 Noções de planejamento amostral .......................................................................126 4.3 Formulação de hipóteses .....................................................................................128 4.4 Coleta de dados ....................................................................................................128 4.5.1 Amostra casual simples .............................................................................130 4.5 Principais métodos amostrais ...............................................................................130 4.5.2 Amostra aleatória sistemática ....................................................................134 4.5.3 Amostra aleatória estratificada ...................................................................135 4.5.4 Amostra por conglomerados.............................................................................136 Quando ouvimos falar em Estatística, sempre vem ao nosso pensamento números divulgados no dia a dia. A média de gols marcados por partida do campeonato brasileiro de futebol noticiada por um comentarista de um programa esportivo; a porcentagem das intenções de voto que um candidato à Presidência da República reúne, divulgada no noticiário da televisão; a quantidade de automóveis vendidos nos últimos doze meses, publicada no jornal; o número de pessoas infectadas por gripe nas regiões metropolitanas do país. Eis alguns exemplos de números contidos nas informações que diariamente chegam até nós. O que a Estatística significa para você? A Estatística apenas se resume a números? A Estatística é muito mais do que isso. Segundo o Instituto Brasileiro de Geografia e Estatística – IBGE, Estatística é o “conjunto de técnicas e métodos de pesquisa que entre outros tópicos envolve o planejamento do experimento a ser realizado, a coleta qualificada dos dados, a inferência, o processamento, a análise e a disseminação das informações”. Este volume compreende o ramo da Estatística conhecido por Estatística descritiva. A Estatística descritiva aborda a coleta, a classificação, o resumo, a organização, a análise e a interpretação de dados. Tudo isso com a finalidade de gerar informações. No decorrer dos estudos deste livro, você aprenderá a organizar dados, a descrevê-los, a calcular suas medidas representativas e a interpretá-los. A área de aplicação da Estatística é, portanto, imensa. Abrange os mais variados campos do saber, como as ciências biológicas e da saúde, as ciências humanas, as ciências sociais aplicadas e as ciências exatas. Os profissionais que sabem utilizá-la reconhecem sua importância na formulação do raciocínio crítico no estudo, no trabalho e na vida diária. Por isso, desejamos a você bons estudos. Apresentação Introdução Estatística Descritiva: a importância da estatística no dia a dia Capítulo 1 Neste capítulo, iniciaremos nosso percurso de Estatística. Em particular, no primeiro momento, vamos refl etir sobre a aplicação de estatística no seu dia a dia, visando a compreensão dos conceitos de forma clara e concisa. Faremos uma introdução à Estatística Descritiva, que, em geral, se ocupa do levantamento, organização, classifi cação e descrição de dados em estudo. Você verifi cará que a descrição dos dados facilitará a compreensão dos fatos envolvidos no estudo. A descrição se apresenta por meio de tabelas, gráfi cos ou outros recursos visuais, além abranger o cálculo de parâmetros representativos desses dados. É sabido que parâmetro (MORETTIN, 2009 p. 183) é a medida usada para descrever uma característica numérica populacional. Genericamente representaremos um parâmetro por θ (lê-se theta). Especifi camente, representaremos a média por µ (lê-se mi), a variância por σ2 (lê-se sigma ao quadrado) e o coefi ciente de correlação por ρ (lê-se rô), os quais são alguns exemplos de parâmetros populacionais. Estudaremos os procedimentos estatísticos descritivos, os quais permitem elucidar dúvidas, obter conclusões ou mesmo possibilitar a tomada de decisões a respeito de características de interesse. Por exemplo, imagine que no local em que você reside foi realizado um estudo ambiental, e este estudo revelou a presença de um 2 UNIUBE perigoso poluente no ar. Esta revelação, com certeza geraria muitas dúvidas, quanto aos malefícios para a população! Você, certamente, irá buscar mais explicações respeito. Dependendo das conclusões do estudo, você, ou mesmo as autoridades responsáveis pelo local, terão de tomar decisões a respeito dos malefícios deste perigoso poluente para a sua família ou para a população. Certo? Com base nos dados obtidos a respeito da concentração de poluentes, talvez você tenha que decidir pela saída imediata de sua família deste local por certo tempo. Por isso mencionamos, que os procedimentos descritivos também possibilitam a tomada de decisões sobre as características de interesse. Este exemplo e outros que estudaremos mostrarão o quanto a Estatística está presente no seu cotidiano. Os exemplos estão em todos os contextos e mostram a importância que a Estatística assume cada vez mais em todas as áreas do conhecimento. De modo geral, este capítulo permitirá a você se familiarizar com os conceitos abordados por meio de exemplos, situações problema e exercícios que enfocam a aplicação da estatística nas diversas áreas do conhecimento. Ao final deste capítulo, esperamos que você seja capaz de: • determinar situações práticas nas quais a Estatística poderá ser aplicada com propriedade, combinando as possíveis interpretações e análises do fenômeno estatístico; • expressar dados mediante representação tabular e representação gráfica; • estabelecer intervalos de diferentes tipos e medidas; • calcular as principais medidas de posição e de variabilidade, tanto para dados agrupados como para dados não agrupados; • usar o método de resolução das várias situações problema mediante a descrição, demonstração, aplicação, análise, desenvolvimento e julgamento. Objetivos UNIUBE 3 Para melhor entender a Estatística no âmbito dos principais tópicos que serão abordados neste capítulo, acompanhe o esquema na Figura 1. Esquema Qual é a importância da Estatística no seu dia a dia? Discuta com seus colegas, busque ouvir outras opiniões! Acreditamos que isso será muito importante para você! TROCANDO IDEIAS! Aplicação da Estatística População Alvo Amostra Representativa Resultados Inferidos Análise Exploratória dos Dados Resultados Descritivos R es um o R ef er ên ci as Figura 1: Esquema do capítulo. 4 UNIUBE A importância da Estatística no dia a dia1.1 A utilização da Estatística é cada vez mais acentuada em qualquer atividade profissional na vida moderna. Nos seus mais diversificados ramos de atuação, as pessoas estão frequentemente expostas à Estatística, utilizando a com maior ou menor intensidade. Isso se deve às múltiplas aplicações que o método estatístico proporciona àqueles que dele necessitam. Desde as ciências sociais de Psicologia e Sociologia até áreas como educação, ciências humanas e físicas, ciências da saúde, Administração, ciências contábeis, Economia, Engenharia, negócios, Jornalismo, comunicações e artes de forma geral. A seguir, você vai conferir alguns exemplos práticos, indicando a importância da Estatística no seu dia a dia e como ela tem assumido um papel bem mais abrangente nas últimas décadas. Exemplo 1.1 Os institutos de pesquisa de opinião regularmente fazem pesquisas para determinar o índice de popularidade de um governo em exercício. Suponha que a pesquisa será conduzida na próxima semana com 2.500 indivíduos e eles serão questionados se o governo está fazendo uma boa ou má administração. Exemplo 1.2 Imagine que um nutricionista trabalha em uma escola e deseja conhecer os hábitos alimentares das crianças em idade pré-escolar. Exemplo 1.3 Suponha que você e seu sócio desejam decidir um negócio e se deparam com uma análise de incerteza, ou seja, quais as chances de as vendas de certo produto decrescerem se aumentarem os preços? Exemplo 1.4 O engenheiro civil responsável pela concretagem de um complexo industrial, suspeita que o concreto esteja fora das especificações quanto à resistência, em determinado momento da usinagem. Este problema o levará a indícios de falha no sistema de produção. Isso dará ao engenheiro oportunidade para formular algumas hipóteses. Por exemplo, quanto aos componentes usados na mistura, as máquinas utilizadas, ou, ainda, uma possível falha humana, entre outras. Observe que, neste Exemplo 1.4, a hipótese exemplificada e a necessidade do engenheiro de pesquisar o problema surgiram a partir de um fato encontrado em dados observados. EXEMPLIFICANDO! UNIUBE 5 O que é Estatística para você?Registre as suas ideias e continue os seus estudos, pois, a seguir, preparamos várias informações e fatos curiosos do seu dia a dia que estão intimamente relacionados à Estatística. Será que você já não se deparou com alguns destes fatos? PARADA PARA REFLEXÃO A Estatística é uma área do conhecimento que utiliza teorias probabilísticas para explicação de eventos, estudos e experimentos. Tem por objetivo obter, organizar e analisar dados, determinando as correlações que apresentem, tirando delas suas consequências para descrição e explicação do que passou, apresentando uma previsão e organização do futuro. A Estatística também é considerada uma ciência e prática de desenvolvimento de conhecimento humano através do uso de dados empíricos. Baseia se na teoria estatística um ramo da Matemática aplicada. Na teoria estatística, a aleatoriedade e incerteza são modeladas pela teoria da probabilidade. Algumas práticas estatísticas incluem, por exemplo, o planejamento, a sumarização e a interpretação de observações. Porque o objetivo da Estatística é a produção da “melhor” informação possível a partir dos dados disponíveis; alguns autores sugerem que a Estatística é um ramo da teoria da decisão. Fique atento! Após as considerações já mencionadas você percebeu que, frequentemente, nos deparamos com terminologias e expressões específicas da ciência em estudo. Portanto, torna-se impreterível aguçar o seu interesse e compromisso em conhecer vocábulos ou expressões até então desconhecidos, porém necessários aos seus estudos. IMPORTANTE! Sugerimos acessar o link a seguir para a profundar o seu conhecimento: <http://www.ibge.gov.br/home/> PESQUISANDO NA WEB 6 UNIUBE Com as situações propostas a você até aqui, juntamente com as suas experiências de vida, seu dia a dia com sua família, na ida para o seu trabalho, a fila do caixa no supermercado, em seu momento de lazer, acreditamos que você está refletindo em relação aos conhecimentos em Estatística. Por exemplo, você poderá, em algum momento, se deparar ou até concordar com a seguinte ideia: Podemos, então, comparar a Estatística a um grande baú! Com muita calma, é possível aprender e conquistar tudo o que ela pode nos proporcionar, já que nos seus mais diversificados ramos de atuação, nós estamos frequentemente expostos a ela, utilizando a com maior ou menor intensidade! Conheça, a seguir, um pouco da história da origem do termo Estatística. O termo Estatística surgiu da expressão em latim statisticum collegium, palestra sobre os assuntos do estado, de onde surgiu a palavra em língua italiana Statista, que significa “homem de Estado”, ou político, e a palavra alemã Statistik, designando a análise de dados sobre o Estado. A palavra foi proposta pela primeira vez no século XVII, em latim, por Schmeitzel, na Universidade de Lena, e adotada pelo acadêmico alemão Gottfried Achenwall. Apareceu como vocabulário na enciclopédia Britânica, em 1797, e adquiriu um significado de coleta e classificação de dados no início do século XIX. Para saber um pouco mais sobre a história da Estatística e seus principais componentes acesse o link: <http://www.mat.ufrgs.br/~vigo/historia.html>. SAIBA MAIS Em 1085, Guilherme, O Conquistador, ordenou que se fizesse um levantamento estatístico da Inglaterra. Esse levantamento deveria incluir informações sobre terras, proprietários, uso da terra, empregados e animais, e serviria, também, de base para o cálculo de impostos. Tal levantamento originou um volume intitulado Domesday Book. Com este fato talvez seja mais fácil entender que o significado de Doomsday é Dia do juizo final! CURIOSIDADE UNIUBE 7 Outro fato curioso são as Tábuas de mortalidade. Você sabia que as Tábuas de mortalidade usadas na atualidade pelas companhias de seguro originaram-se de estudos realizados no século XVIII? Sim, e isso por causa dos estudos de John Graunt (1620-1674) e William Petty (1623-1687), aritméticos políticos mais destacados na época pela busca de leis quantitativas que pudessem explicar o estudo numérico dos fenômenos sociais e políticos. “Dessa forma, a escola dos aritméticos políticos pode ser considerada o berço da Demografia”. Fonte: Disponível em: <http://www.mat.ufrgs.br/~vigo/historia.html > Acesso em jun. 2016. Acompanhe, a seguir, algumas noções gerais de Estatística descritiva. Estatística descritiva – parte I 1.2 De início, propomos a você uma reflexão: o que um analista que dispuser de dados de uma pesquisa deve fazer para extrair as informações de que precisa? Neste momento, acreditamos que você esteja construindo conhecimentos a partir de várias curiosidades e indagações, o que será ótimo para sua formação pessoal e profissional. Supõe se que você poderá em algum momento se deparar ou até concordar com a seguinte ideia: Os dados de uma pesquisa devem ser reduzidos até o ponto em que se possa interpretá los mais claramente! De onde vem o termo Estatística descritiva? O que ela descreve? Pois bem, até aqui, acreditamos que você está conduzindo muito bem o seu estudo! Está refletindo sobre as terminologias apresentadas. Ou seja, nesse contexto, você começa a desenvolver a linguagem e o raciocínio estatísticos. Em outras palavras, você está sendo professor de você mesmo. Em definição, a Estatística descritiva é o ramo da Estatística que se preocupa em descrever os dados observados da amostra sem se preocupar em fazer previsões sobre os parâmetros do universo. A Estatística descritiva trata da coleta, da organização e da descrição dos dados. Então, vamos entender o que é população e o que é amostra. 8 UNIUBE 1.2.1 O que é população e o que é amostra? As pessoas de uma comunidade podem ser estudadas sob diversos pontos de vista. Por exemplo, podem ser classificadas quanto ao sexo (masculino ou feminino), quanto à estatura (baixa, média ou alta), quanto à renda (pobres ou ricas), entre outras. Portanto, sexo, estatura e renda são variáveis, isto é, são propriedades às quais podemos associar conceitos ou números e, assim expressar, de certa forma, informações sob forma de medidas. E, para você, nome e sexo são formas de medida? Reflita sobre essa questão! Em seguida, vamos para mais um desafio. Exercite suas habilidades sobre o conceito de medida desenvolvendo a atividade proposta a seguir. PARADA PARA REFLEXÃO Atividade 1.1 Para a realização dessa atividade escolha uma relação das pessoas que convivem com você, por exemplo, em sua residência, na residência do seu vizinho, ou em seu ambiente de trabalho. Agora, associe o nome das pessoas que você escolheu ao sexo, de forma que isso se transforme em medida. AGORA É A SUA VEZ Antes de propormos a atividade anterior, fazíamos referências às variáveis, isto é, às propriedades para as quais podemos associar conceitos ou números e, assim expressar, de certa forma, informações sob forma de medidas. Logo, qualquer conjunto de informações que tenham, entre si, uma característica em comum denotamos por população (representaremos população por N maiúsculo). Portanto, uma população é um conjunto de unidades (geralmente pessoas, objetos, transações ou eventos) que nos interessa estudar (MCCLAVE et al., 2009). UNIUBE 9 São exemplos de população: • todas as lâmpadas produzidas por uma indústria no primeiro trimestre de determinado ano; • todos os pacientes atendidos no PS do HUMP no primeiro ano de sua inauguração (Pronto Socorro do Hospital Universitário Mário Palmério, destinado ao atendimento da população de Uberaba e região); • todos os animais, de uma determinada espécie, prontos para abate; • o número de unidades produzidas por um empregado de certa linha de produção, durante os trinta dias que antecederam à pesquisa. Os motivos de se estudar uma população são vários. Por exemplo, um engenheiro agrônomo pode estar interessado em determinar o peso médio de certa variedade de cana de açúcar cultivada em um determinado estado do Brasil;ou um engenheiro de materiais pode desejar estudar os tipos de polímeros adequados para a confecção de canos plásticos (PVC), cujo intuito é aumentar a durabilidade com menor custo; ou um ecologista pode ter o interesse de conhecer características de uma população constituída por todas as áreas de reservas extrativistas. O estudo de uma população muito grande, por exemplo, o conjunto de todas as estaturas de uma comunidade, será um trabalho difícil de executar. Nesse caso, o pesquisador terá um grande trabalho para estudá-la além de, em alguns casos, ocorrerem falhas nos resultados. PARADA PARA REFLEXÃO A partir dessa ideia vamos aprender outro conceito. Nos casos de populações muito grandes, o pesquisador recorre, basicamente, a uma redução da população a dimensões menores, sem perda das características essenciais, ou seja, extrai uma amostra (representaremos amostra por n minúsculo) desta população. Por exemplo, imaginemos uma pesquisa com 400 jogadores (no caso, representando a população N em estudo) participantes do Campeonato Brasileiro 2009, famoso Brasileirão. Esse estudo deseja verificar qual é a estatura média destes jogadores. Para simplificar o trabalho 10 UNIUBE colhemos uma amostra (n) de 40 jogadores, por exemplo, e estudamos o comportamento da variável estatura somente destes 40 jogadores. Assim, como escolhemos a variável estatura, poderíamos escolher outras variáveis como, por exemplo, renda familiar, número de irmãos, inteligência, tipo sanguíneo, grau de escolaridade, preferência musical, entre outras. Uma amostra para ser boa, necessariamente, tem que ser representativa da população em estudo, ou seja, deve conter, em proporção, tudo o que a população possui qualitativa e quantitativamente. Todos os elementos da população devem ter igual oportunidade de fazer parte da amostra. No exemplo dado, não poderíamos escolher quem quiséssemos para a amostra. Portanto, para garantir a representatividade e a imparcialidade de urna amostra, é necessário seguir algumas regras. Veja estas regras a seguir. Regras a serem seguidas objetivando uma boa amostra: I. Para assegurar a representatividade de uma amostra, devemos analisar a população para ver se seus elementos distribuem se homogeneamente ou se formam grupos com características peculiares. Caso observarmos isso, devemos respeitar as proporções com que esses grupos integram a população. II. A imparcialidade em uma amostra é obtida por sorteio dos elementos que farão parte desta amostra, mediante a utilização de uma máquina geradora de números aleatórios ou de uma tabela de números aleatórios. No decorrer dos seus estudos em Estatística, você aprenderá mais sobre a utilização de uma tabela de números aleatórios. Essas tabelas são construídas de modo a garantir que cada dígito, cada par de dígitos consecutivos, cada tema de dígitos consecutivos, e assim por diante, apareçam com a mesma frequência em uma longa sequência de números. UNIUBE 11 1.2.2 Situações problema envolvendo a questão da representatividade Voltemos ao exemplo da mensuração da estatura média de 40 jogadores participantes do Campeonato Brasileiro 2009. Sabe se que a amostra n só traz informações sobre a população da qual foi retirada, ou seja, da população de 400 jogadores participantes do referido campeonato. Para verificar o seu aprendizado sobre o significado prático da representatividade, reflita sobre a questão a seguir. Lembre-se: não é aconselhável seguir seus estudos com dúvidas a respeito de quaisquer dos conceitos abordados! Faz sentido para você estudar a estatura dos jogadores participantes do Campeonato Brasileiro de determinado ano e considerar que as informações deste estudo se aplicam para descrever a estatura de jogadores participantes do campeonato italiano de futebol? A resposta é não. Não faz sentido, pois as amostras em estudo integram populações diferentes. PARADA PARA REFLEXÃO Após a reflexão estabelecida, observe que temos uma amostra representativa da população inicial. As pessoas (na situação problema, os jogadores) passam, a partir desse momento, a ser tratadas como dados (estaturas) e podem dar origem ao estudo de diversas relações estatísticas, como, por exemplo, a média aritmética, a mediana, a moda, a variância, o desvio padrão, entre outras que, mais adiante, farão parte de seus estudos. Essas relações estatísticas possibilitam descrever, sob diversos ângulos, o conjunto de dados representados pela amostra. Por essa razão, constituem o campo da Estatística descritiva. Lembre-se: o interesse do pesquisador está voltado para a população da qual se originou a amostra. Ele estuda as características da amostra pelo uso das relações estatísticas com o objetivo de atribuir estas características à população, generalizando suas conclusões. 12 UNIUBE A parte da Estatística em que o interesse está nas generalizações por meio das transferências de conclusões das amostras para as populações chama-se Estatística inferencial. Nessas transferências de conclusões, o pesquisador se vale de um poderoso recurso que é a teoria das probabilidades, que lhe permite avaliar e controlar o quão ele pode “errar” nessas generalizações, ou seja, nas inferências. IMPORTANTE! Você certamente está se perguntando: como o pesquisador pode cometer “erros” nessas inferências? Será que não tem como o pesquisador “controlar” esses erros? Antes de respondermos a essas questões, você se lembra da comparação que fizemos entre a Estatística e um grande baú? E que com muita calma é possível aprender e conquistar tudo o que ela pode nos proporcionar? Muito bem! Então saiba que o pesquisador tem como aplicar recursos para manter o erro sob controle. Em seus estudos subsequentes, você irá aprender como o pesquisador controla esses erros. Vale a pena conferir. É muito interessante! Atividade 1.2 Sobre o conteúdo até agora estudado, classifique em verdadeiro ou falso as seguintes afirmações. Apresente um argumento para a sua escolha. Se for verdadeiro, incremente mais informações ou exemplos. Se for falso, reescreva a questão corretamente. a) Estatística é um conjunto de técnicas destinadas a organizar um conjunto de valores numéricos. b) Uma população pode ser constituída de todo solo pertencente a uma área bem definida. c) A Estatística descritiva fornece uma maneira adequada de tratar um conjunto de valores, numéricos ou não, com a finalidade de conhecermos o fenômeno de interesse. AGORA É A SUA VEZ UNIUBE 13 d) No fenômeno coletivo da eleição para governador no Estado de Minas Gerais, a amostra é o conjunto de todos os eleitores habilitados nesse Estado. e) Qualquer amostra representa, de forma adequada, uma população. A seguir, vamos ressaltar a diferença entre dados e variáveis, e estudar como a descrição dos dados facilitará a compreensão dos fatos envolvidos no estudo, assim como apresenta-los por meio de tabelas ou gráficos. Qual é a diferença entre dados e variáveis? Antes de prosseguir com seus estudos, reflita sobre esta questão. Acompanhe a ideia principal dessa diferença por meio do exemplo a seguir. Exemplo 1.5 O gerente de certa empresa de transporte coletivo deseja saber a opinião dos usuários sobre a qualidade dos serviços de transportes diários que presta à comunidade. De acordo com a situação proposta, identifique qual é a variável em estudo e quais são os dados neste caso. Resolução: denomina-se variável uma característica de interesse da população em estudo. Portanto, no exemplo proposto, a variável de interesse é a opinião dos usuários de transporte coletivo. E como sabemos, os dados representam os valores da variável em estudo. Nesse caso, suponhamos que o gerente, ao realizar a pesquisa, peça aos usuários que deem uma nota de zero a três a cada serviço utilizado. Os dados coletados poderão ser, por exemplo, precisão no horário de ônibus (nota 2), composição das linhas e itinerários (nota 1), quadrofuncional (motorista, cobrador, atendimento ao usuário etc.) (nota 2), entre outros. EXEMPLIFICANDO! Agora que você já sabe a diferença entre dados e variáveis, saiba como os dados devem ser apresentados. 14 UNIUBE 1.2.3 Apresentação dos dados Para melhor entendermos a apresentação dos dados, primeiro preparamos um esquema simples, conforme apresentado na Figura 2. Em seguida, confira, em detalhes, os conceitos necessários e exemplos. De acordo com a Figura 2, temos: • Em I, os dados são classificados em dois tipos: – Dados quantitativos ou numéricos – denotam as variáveis que assumem valores numéricos. – Dados qualitativos ou categóricos – denotam as variáveis que assumem apenas valores categoriais. • Em II, as variáveis podem ser classificadas, segundo sua natureza, em discreta ou contínua. – Variável discreta – (o domínio assume valores no conjunto dos números naturais N ) – pode assumir apenas valores pertencentes a um conjunto enumerável. Exemplo: o número de estudantes entre os habitantes de uma cidade, a frequência cardíaca (batimentos/minuto) etc. – Variável contínua – (o domínio assume valores no conjunto dos números reais R ) – pode assumir qualquer valor em certo intervalo de variação. Exemplo: a idade das pessoas residentes em um município, o nível de glicemia (mg / 100 ml) etc. Ti po s de D ad os Quantitativo ou Numérico Qualitativo ou Categórico Discreto II I III Contínuo Nominal Ordinal Figura 2: Esquema de apresentação dos dados. UNIUBE 15 • Em III, as variáveis podem ser de natureza nominal ou ordinal. – Variável nominal – quando, entre as categorias possíveis, apenas podem-se estabelecer relações de igualdade ou diferença. Exemplo: a variável “sexo”, a qual é composta de duas categorias possíveis: “masculino” e “feminino”. – Variável ordinal – quando, entre as categorias, podem se estabelecer relações de ordem. Exemplo: (relação de idêntico, maior ou menor) a variável “nível socioeconômico”, com três categorias: “baixo”, “médio” ou “elevado”. Conforme já mencionamos, a descrição dos dados facilitará a compreensão dos fatos envolvidos no estudo. Agora, vamos estudar como apresentá los por meio de tabelas ou gráficos. Fique atento(a) para a apresentação e construção de tabelas! Você já verificou a diferença entre construir um quadro e uma tabela? Confira! IMPORTANTE! 1.2.4 Representação tabular A representação tabular consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado. A elaboração de tabelas obedece à Resolução n. 886, de 26 de outubro de 1966, do Conselho Nacional de Estatística. As normas de apresentação são editadas pelo Instituto Brasileiro de Geografia e Estatística – IBGE. Na sequência, você acompanha o esquema de uma representação tabular, com as denominações de seus elementos, e, logo após, um glossário especificando um a um esses elementos. 16 UNIUBE Representação esquemática Título Cabeçalho Corpo Rodapé Elementos de uma tabela Título: o título deve responder às seguintes questões: • O quê? (Assunto a ser representado – fato). • Onde? (O lugar onde ocorreu o fenômeno – local). • Quando? (A época em que se verificou o fenômeno – tempo.) Cabeçalho: parte da tabela na qual é designada a natureza do conteúdo de cada coluna. Corpo: parte da tabela composta de linhas e colunas. • Linhas: parte do corpo que contém uma sequência horizontal de informações. • Colunas: parte do corpo que contém uma sequência vertical de informações. Coluna indicadora: coluna que contém as discriminações correspondentes aos valores distribuídos pelas colunas numéricas. Casa ou célula: parte da tabela formada pelo cruzamento de uma linha com uma coluna. Rodapé: é o espaço aproveitado em seguida ao fecho da tabela, onde são colocadas as notas de natureza informativa (fonte, notas e chamadas). • Fonte: refere se à entidade que organizou ou forneceu os dados expostos. • Notas e chamadas: denotam esclarecimentos contidos na tabela (nota – conceituação geral; chamada – esclarecer minúcias em relação a uma tabela). UNIUBE 17 1.2.5 Distribuição de frequência Agora, os dados referentes a determinado fenômeno são apresentados por meio de gradações, em que são feitas a correspondência entre categorias ou valores possíveis e as respectivas frequências. A definição de alguns conceitos será importante para o uso da linguagem apropriada ao elaborarmos e analisarmos as distribuições de frequências. Vamos estudar as definições de dados brutos, rol, distribuição de frequência para a variável discreta (tabela de frequência) e distribuição de frequência para a variável contínua (intervalo de classes). 1.2.6 Dados brutos Como primeiro resultado de uma pesquisa, obtém se dados brutos, um conjunto de números ainda sem nenhuma organização. Esse material é então ordenado de forma crescente ou decrescente, com a indicação da frequência, dando origem ao que chamamos de rol. Exemplo 1.6 Uma pesquisa foi realizada numa cidade, do interior de Minas Gerais, cujo intuito é saber o número de pessoas por residência. A amostra é de 30 residências e as primeiras informações seguem no Quadro 1. Quadro 1 – Número de pessoas por residência. 6 5 3 3 2 3 3 3 4 4 6 3 2 4 3 5 4 4 3 3 4 2 4 3 4 2 1 3 3 4 EXEMPLIFICANDO! Antes de prosseguir com seus estudos, é muito importante e aconselhável que você tenha sempre uma calculadora para efetuar os cálculos que forem necessários. IMPORTANTE! 18 UNIUBE 1.2.7 Rol O rol dos dados do Quadro 1 se apresenta arranjado no Quadro 2, a seguir. Quadro 2 – Número de pessoas por residência. 1 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 5 5 6 6 O Quadro 2 apresenta vantagens concretas em relação aos dados brutos no Quadro 1. O rol (crescente) torna possível visualizar, de forma bem ampla, as variações dos dados, uma vez que os valores extremos são percebidos de imediato. Porém, a análise pelo uso desse tipo de disposição começa a se complicar quando o número de observações tende a crescer. 1.2.8 Distribuição de frequência para variável discreta (tabela de frequência) Tabela 1 – Distribuição de frequência da variável número de pessoas por residência numa cidade do interior de Minas Gerais. Xi 1 2 3 4 5 6 Total (n) ƒi 1 4 12 9 2 2 30 Em que: Xi: denota os elementos da amostra (no caso, número de pessoas por residência); ƒi: denota a frequência ou peso de cada valor da amostra (n). Conforme podemos observar no Quadro 1, os valores estão dispostos de forma desordenada. Em razão disso, pouca informação conseguimos obter analisando os dados apresentados. Mesmo um a informação simples, como saber os valores mínimos e máximos do número de pessoas por residência, requer certo exame dos dados coletados. UNIUBE 19 1.2.9 Distribuição de frequência para variável contínua (intervalo de classe) Para estudarmos este outro conceito, vamos continuar com a mesma pesquisa, ou seja, depois de elaborar o rol é necessário determinar quantas faixas etárias terá a tabela de frequência. O passo seguinte é subdividir os dados por classe ou categoria (no caso, o número de pessoas por residência) e determinar o número de pessoas pertencentes a cada uma, resultando na frequência de classe. Seja: k: número de classes que a tabela de classe deverá conter. n: número de elementos da amostra. Portanto, se você tem uma amostra com 30 dados, pode organizá los em uma tabela de distribuição de frequência, sendo k o número de classes. Para encontrarmos o número de classe k, usamos o critério da raiz, como é conhecido k n≅ , ou pelo uso da fórmula de Sturges em que log1 log 2 nk = + , em que n é o número de elementos da amostra. Usando a fórmula de Sturges, encontramos: log301 5,9 6 log 2 k k≅ + ≅ => = Portanto, determinamos que a distribuição será composta de 6 classes. Após encontrar o valor de k, é preciso determinar o intervalo de classes, isto é, o tamanho que cada classedeverá ter. A determinação desta amplitude de classe será denotada por h, a qual será constante, isto é, todas as k classes deverão ter a mesma amplitude. Como calcular h? É simples. Fazemos minimomáximoA X X= − . Logo, Ah k = , em que, A : denota a amplitude total, isto é, a diferença entre o maior e o menor valor observado da variável em estudo. máximoX : denota o maior valor observado da variável em estudo. mínimoX : denota o menor valor observado da variável em estudo. h : denota a amplitude do intervalo de classe. 20 UNIUBE No exemplo apresentado, de acordo com o Quadro 2, temos, minimo 6 1 5.máximoA X X= − = − = Portanto, 5 0,83 1 6 Ah k = = = ≅ . Em seguida, o pesquisador determina os limites de cada classe, ou seja, o limite superior (lsup) e o limite inferior (linf), aplicando um dos quatro conceitos de intervalo que já estudamos. Escolhe se um ponto de partida, de acordo com os interesses da pesquisa. Por exemplo, decidimos que o limite inferior será de zero. E, a partir dele, serão construídas as classes da tabela de frequência, que deverá abranger todos os elementos do rol. No caso da não abrangência de todos os elementos do rol, devemos aumentar a amplitude do intervalo de classes (h) ou o número de classes (k). Desta forma, se 6k = e 1h = , com a primeira classe iniciada por zero, temos a adição de h , a cada classe: Tabela 2 – Intervalo de classes. k Classes infl supl if 1 1 |--- 2 1 4 12 9 2 2 2 2 |--- 3 3 3 |--- 4 4 4 |--- 5 5 5 |--- 6 6 6 |--- 7 ∑ ---------- 30 UNIUBE 21 Em que: ∑: lê-se somatório. É uma letra grega (correspondente ao S latino) usada para indicar a adição dos termos de uma série; assume a mesma ideia do uso de total ( )n . Vamos juntos recordar as ideias principais em relação à construção de tabelas de distribuição de frequência abrangendo os intervalos de classes. • Dado o tamanho da amostra , deve-se encontrar o valor de k , que representa o número de classes. • Na sequência, calcular a amplitude total A, isto é, a diferença entre o maior e o menor valor observado da variável em estudo. • Encontrar o valor de h , amplitude do intervalo de classes. • E, por fim, escolhe-se um ponto de partida, de acordo com os interesses da pesquisa. Acompanhe, agora, algumas regras importantes abrangendo a construção dos intervalos de classe. 1. Geralmente, os intervalos de classe devem ser escritos de acordo com a Re solução n. 886/66 do IBGE. Para representar uma classe, utiliza-se o símbolo ׀— indicando a inclusão do limite inferior (linf) e exclusão do superior (lsup). Ou lê-se também um intervalo fechado à esquerda e aberto à direita. Portanto, de acordo com a Tabela 2, uma residência com 4 pessoas está incluída na quarta classe (linf = 4) e não na terceira. 2. De acordo com o item “1”, é importante observar se os elementos estão in cluídos ou excluídos. 3. Sempre que possível, deve-se evitar classe com frequência nula, principal mente em relação aos valores da primeira e última classe, ou com frequência relativa muito elevada. 22 UNIUBE Todavia, mesmo em meio às ideias principais e algumas regras que acaba mos de apresentar; saiba que, às vezes, ainda é preciso algo mais! Como por exemplo, “agir com bom senso” ou “levar em conta a experiência pessoal no assunto”. Caso contrário, só as expressões e/ou as regras podem não nos levar a uma decisão final mais sensata! Mas fique tranquilo, isso é natural nos estudos estatísticos, e se deve à natureza dos dados em estudo, da unidade utilizada para expressá-los e, principalmente, do objetivo que se tem em vista alcançar com a pesquisa. Veja mais alguns cálculos e suas respectivas expressões utilizadas na distribui ção de frequência para variável contínua (intervalo de classe). • Ponto médio (representaremos por iPm a primeira letra maiúscula e a segunda minúscula) iPm – surge da necessidade de definir um número para representar cada classe, em geral denominado ponto médio ( )iPm , ou seja, a média entre os valores dos limites de classe. Logo, sua expressão é denotada por: inf sup 2 + =i l l Pm • Frequência relativa (representaremos por f “índice r” ambos minúsculos) – a frequência relativa denota qual proporção cada classe representa em rela ção ao total ( )n e é obtida dividindo-se cada uma das frequências absolutas ( )if pelo tamanho da amostra ( )n . A frequência relativa é representada pela expressão: A soma das frequências relativas sempre deverá ser igual a 1. Caso os valores aproximados contradigam essa regra, basta arredondar algum desses valores (para mais ou para menos) de modo a obter a soma necessária. IMPORTANTE! UNIUBE 23 • Frequência percentual (representaremos por f p “índice p” ambos minúsculos) – como o próprio nome sugere, a frequência porcentual indica a porcentagem de cada classe e, para obtê-la, basta multiplicar rf por 100 (assim a soma da frequência porcentual deverá ser igual a 100%). Sendo assim, temos: 100p rf f= ⋅ • Frequência acumulada (representaremos por F maiúsculo). A frequência acumulada corresponde à soma da frequência absoluta ( )if de sua classe, mais a frequência acumulada das classes anteriores, caso existir. Dessa forma, sua expressão é representada por: = + atuali anterior F f F sendo, 1,2, , ki = O valor da frequência acumulada F representado na última classe deverá ser igual ao valor de n , ou seja, ao total de elementos da amostra. IMPORTANTE! Com base no Exemplo 1.6 da pesquisa realizada numa cidade do interior de Minas Gerais, cujo intuito é saber o número de pessoas por residência, pode mos construir uma nova tabela de frequência (ver Tabela 3), incluindo todos os cálculos relacionados anteriormente. Tabela 3 – Cálculos em função das frequências observadas quanto ao número de pessoas por residência, numa cidade, do interior de Minas Gerais. k Classes fi i r ff n = inf sup 2 l l Pm + = atuali anteriorF f F= + infl supl 1 1 --- 2 1 0,03 3 1,5 1 2 2 --- 3 4 0,13 13 2,5 5 3 3 --- 4 12 0,40 40 3,5 17 4 4 --- 5 9 0,30 30 4,5 26 5 5 --- 6 2 0,07 7 5,5 28 6 6 --- 7 2 0,07 7 6,5 30 ∑ ---------- 30 1,00 100% ---- ---- ( )100 %p rf f= ⋅ 24 UNIUBE Atividade 1.3 Os funcionários da empresa FAJU-CAMADE estão em um sistema de horário flexí vel; eles podem iniciar sua entrada no trabalho a partir das 7h até às 9h. Os dados seguintes representam uma amostra estatística do horário de preferência, escolhido pelos funcionários. 7h 7h15 8h 8h45 7h 9h 7h 7h15 8h 8h 7h 8h 8h15 7h45 7h30 8h30 8h 8h15 7h45 9h 8h15 9h 8h30 7h 8h 7h15 7h 9h 7h30 7h45 Com base nas informações apresentadas responda as letras a seguir: a) Construa uma tabela de distribuição de frequências simples, relativa, percentual e acumulada (utilize as Normas da ABNT para a construção da tabela) b) Pode-se afirmar que 20% dos funcionários tem preferência para a entrada no trabalho às 8 horas. Em caso afirmativo ou não, apresente os cálculos necessários para sua conclusão. AGORA É A SUA VEZ Representação gráfica1.3 A representação gráfica da distribuição de uma variável tem a vantagem de, rápida e concisamente, informar sobre sua variabilidade. Entre os vários tipos de representações gráficas, os melhores gráficos são os que primam pela sim plicidade e clareza. Uma vez elaborada a tabela de frequência, prossegue-se com o desenho do gráfico, um recurso de visualização dos dados constantes na tabela. Entre os tipos de gráfico, temos o histograma, o polígono de frequência e o polígono de frequências acumuladas (ogivas de Galton). UNIUBE 25 De acordo com as informações anteriores, o desenho gráfico é um recurso de visualização dos dados constantes na tabela, certo? O exemplo a seguir irá orientá lo e será muito importante para você concluir o que lhe será proposto mais adiante. Confira! Figura 3: Percentuaissegundo o sexo versus doenças de notificação compulsória. Nota: notificação compulsória é a notificação obrigatória de casos de doenças da listagem de doenças de notificação compulsória. Além das DNC todo e qualquer surto ou epidemia, assim como a ocorrência de agravo inusitado, independente de constar na lista de doenças de notificação compulsória, deve ser notificado aos órgãos competentes. Você tem conhecimento do Microsoft Office Excel? É um programa de planilha eletrônica, e seus recursos incluem uma interface intuitiva, além de capacitadas ferramentas de cálculo e de construção gráfica. Confira! Afinal, além de prepararmos os conteúdos básicos para sua base nos estudos estatísticos, também cuidamos para que você se intere das possibilidades deste software para a resolução de problemas estatísticos. Pois, independente da área de atuação, o mercado de trabalho almeja por profissionais cada vez mais qualificados! DICAS Exemplo 1.7 Interprete as informações seguintes, de acordo com o contexto em estudo. Na Figura 3, estão representados os casos suspeitos ou confirmados de uma lista parcial de distribuição das Doenças de Notificação Compulsória (DNC), notificadas ao Serviço de Epidemiologia do Hospital dos Servidores do Estado (H.S.E.) do Rio de Janeiro, segundo o sexo. EXEMPLIFICANDO! 65 Rú be ol a In to xic aç ão al im en ta r H. I.V ./A ID S M en in gi te He pa tit e C De ng ue Tu be rc ul os e 35 100% 80% 60% 40% 20% 0% 73,4 26,6 40,7 27,3 46,9 53,5 49,4 M F 69,3 72,7 63,1 46,5 60,6 Doenças de Notificação Compulsória Fr eq uê nc ia (% ) 26 UNIUBE Apresentamos, a seguir, uma argumentação básica para o exemplo proposto e ressaltamos que você certamente irá apresentar outras respostas, ou análises escritas diferentes, como, por exemplo, iniciar sua análise pelo sexo feminino. O importante é identificar o conteúdo e a coerência da argumentação apresentada. Resolução: de acordo com a análise gráfica, podemos notar maior incidência de casos suspeitos ou confirmados de várias das Doenças de Notificação Compulsória (DNC) no sexo masculino. Como, por exemplo, em intoxicação alimentar e meningite; é possível observar que aproximadamente 72% dos casos são do sexo masculino, contra aproximadamente 26% do sexo feminino. Logo depois, ainda com maior incidência no sexo masculino, aparecem as demais doenças, como mostram as respectivas porcentagens: Rubéola (65%), H.I.V./AIDS (59,3%), Hepatite C (53,1%) e Tuberculose (50,6%). A incidência de casos suspeitos no sexo feminino se dá com as seguintes porcentagens: Rubéola (35%), H.I.V./AIDS (40,7%), Hepatite C (46,9%) e Tuberculose (49,4%). Apenas a Dengue ocorreu em maior número de casos suspeitos ou confirmados no sexo feminino, em torno de 53,5% contra 46,5% dos casos no sexo masculino. Exemplo 1.8 Note que para resolver o exemplo proposto você poderá fazer uma regra de três simples ou utilizar os conceitos de frequências (simples, relativa e percentual). O exemplo retrata um gráfico em colunas para representar o tempo (em dias) de completo fechamento em cortes provenientes de cirurgia Por exemplo, no final dessa coluna referente ao tempo de 17 dias (eixo x) de completo fechamento em cortes, observamos uma frequência igual a 7 (eixo y), ou seja, 7 pacientes demoraram esse tempo para completo fechamento em cortes. Dessa mesma forma realizamos a leitura dos demais tempos. Para responder a letra B, observe o valor da frequência (5 pacientes) para 14 dias de completo fechamento em cortes, num total de 30 pacientes (soma de todas as frequências: 5 + 7 + 6 + 7 + 5 = 30). 14 8 7 6 5 4 3 2 1 0 15 16 17 18 Tempo(em dia) Fr eq uê nc ia UNIUBE 27 Atividade 1.4 Procure, em jornais e revistas especializados, dois exemplos de histograma, polígono de frequência e polígono dê frequências acumuladas. Reflita sobre os resultados observados. Depois, analise os gráficos de acordo com o conteúdo estudado. Agora, você vai conhecer as principais e mais importantes medidas de posição, entre elas a média, mediana e moda, e de variabilidade, como a variância, coeficiente de variação e medidas separatrizes; tanto para dados organizados em classes como para dados não organizados em classes ou organizados em distribuição de frequências. É importante entender como as fórmulas retratam ora uma medida de posição ora de variação, e saber realizar os seus cálculos para encontrar os valores procurados. Mais do que isso, você necessita compreender e interpretar esses valores. AGORA É A SUA VEZ Com base nas informações apresentadas responda as letras a seguir: a) Analisando os resultados do gráfico, observamos que um número maior tempo (em dia) de completo fechamento em cortes provenientes de cirurgia é de 15 dias e de 17 dias, em ambos os casos observamos uma frequência de 7 pacientes cada? Em caso afirmativo ou não, apresente a sua análise por extenso. Resposta: Sim, é verdadeira conforme a análise das colunas referentes aos dias 15 e 17, e o valor correspondente das frequências, em ambos os casos observamos uma frequência de 7 pacientes cada. b) Pode-se afirmar que 20% dos pacientes tiveram o completo fechamento em cortes provenientes de cirurgia em 14 dias. Em caso afirmativo ou não, apresente os cálculos necessários e descreva, por extenso, a análise para o resultado encontrado. Resposta: 5 0,17.100 0,17 ou 16,67% 30 = = . Portanto é falsa a afirmação, do total de 30 pacientes, pode-se afirmar que 14 dias de completo fechamento em cortes provenientes de cirurgia ocorreu com aproximadamente 16,675 dos pacientes, conforme apresentado nos cálculos acima. 28 UNIUBE Estatística descritiva – parte II1.4 Como você pôde observar até o momento, resumimos os valores que uma variável pode assumir em forma de tabelas, distribuição de frequências e gráficos. Agora, vamos aprender o cálculo de medidas que possibilitam representar um conjunto de dados relativos à observação de determinado fenômeno de forma resumida. São elas: medidas de tendência central e medidas de variabilidade que serão abordadas a seguir. 1.4.1 Medidas de tendência central As medidas de tendência central são também chamadas de medidas de posição e estabelecem o valor em torno do qual os dados se distribuem. Podem ser utilizadas em conjunto para auxiliar a análise dos dados ou, em determinadas situações, uma pode ser mais conveniente do que a outra. Por exemplo, se um ou mais valores são muito discrepantes em relação aos demais valores observados, a média será muito influenciada por esse valor discrepante, tornando se, assim, inadequada para representar o conjunto de dados em estudo. Para o cálculo dessas medidas, é necessário que a variável seja quantitativa IMPORTANTE! 1.4.1.1 Média aritmética A média aritmética representa o ponto de concentração dos valores de um conjunto de dados ou uma sequência numérica. Entre as medidas de tendência central, é a mais comumente utilizada para descrever resumidamente uma distribuição de frequência. Observe, no Quadro 3, as médias apresentadas, suas respectivas expressões e, na sequência, as aplicações destes conceitos. UNIUBE 29 Quadro 3 – Expressão para a média aritmética em relação ao tipo de dados analisados. Média Tipos de dados analisados Expressão Média aritmética simples Dados brutos ou em rol 1 n i i x X n == ∑ Média aritmética ponderada Dados não organizados em classes ou organizados em distribuição de frequências 1 . n i i i x f X n == ∑ Média Dados organizados em classes 1 . n i i i Pm f X n == ∑ Em que: X : denota a média aritmética ( X – lê-se “X barra”). ix : denota o valor genérico da observação. n : denota o tamanho da amostra (número de observações, ou seja, in f= ∑ ). if : denota a frequência ou peso de cada valor da amostra ( )n . Os valores 1 2, , , nx x x serão ponderados pelas respectivas frequências absolutas 12, , , nf f f no cálculo da média aritmética ponderada. iPm : denota o ponto médio, ou seja, a média entre os valores dos limites de classe. Expressão denotada por inf sup 2 + =i l l Pm . 30 UNIUBE Situação-problema 1.1 Especialistas em Engenharia de Trânsito, ao realizar consultoria solicitada por órgãos públicos, coletaram o número de acidentes de trânsito verificados em certo cruzamento, no primeiro semestre de 2009, conforme indicados no Quadro 4. Determine a média do número de acidentes de trânsito mensais registrados pelos especialistas. Interprete o resultado obtido. Quadro 4 – Registros de acidentes de trânsito. Acidentes/mês 6 5 7 8 4 6 Resolução: 1 6 5 7 8 4 6 36 6 6 6 n i i x X n = + + + + += = = = ∑ Portanto, em média, o número de acidentes de trânsito mensais registrados pelos especialistas, no primeiro semestre de 2009, foi de 6 acidentes. Na situação-problema 1.2 a seguir, observe que nos registros das observações, mostrados no Quadro 5, ocorrem muitos valores repetidos. Em um caso desses, o mais indicado é utilizar a média aritmética ponderada, em que os valores 1 2, , , nx x x serão ponderados pelas respectivas frequências absolutas 1 2, , , nf f f . Confira a resolução detalhada! Situação problema 1.2 Quadro 5 – Registro do número de peixes mortos por semana. 8 6 9 7 6 6 8 7 8 9 10 8 7 7 5 6 7 9 9 10 9 8 7 11 10 Resolução: De acordo com o conjunto de dados do Quadro 5 é aconselhável a construção de uma tabela de frequência, como a seguir: EXEMPLIFICANDO! UNIUBE 31 Tabela 4 – Cálculos parciais para encontrar a média de peixes mortos por semana. ix if i ix f⋅ 5 1 5 6 4 24 7 6 42 8 5 40 9 5 45 10 3 30 11 1 11 ∑ 25 197 Assim, a média para esta situação será: 1 . 197 7,88 25 n i i i x f X n == = = ∑ Portanto, em média, morrem aproximadamente 8 peixes por semana. Situação-problema 1.3 Suponha que você seja gestor de Recursos Humanos (RH) de uma Indústria e Comércio de Embalagens Hospitalares e necessite alinhar as políticas de RH com a estratégia da organização. Como consequência, você deverá recrutar candidatos com determinada faixa etária para o setor de Controle de Qualidade. A distribuição de frequência apresentada na Tabela 5 descreve a faixa etária dos candidatos à procura de emprego de auxiliar de controle qualidade, cuja função é de revisar embalagens hospitalares. Aponte, em média, a idade dos candidatos à procura deste cargo. Apresente os cálculos necessários e descreva, por extenso, a análise para o resultado encontrado. Tabela 5 – Faixa etária dos candidatos. Faixa etária if 22 | --- 25 1 25 | --- 28 10 28 | --- 31 8 31 | --- 34 1 32 UNIUBE Resolução: Para facilitar a resolução do problema, sugerimos que você reescreva a Tabela 5. Para isso, basta acrescentar as colunas necessárias para desenvolver os cálculos. É bem prático calcular o ponto médio numa coluna, depois na coluna seguinte calcular o produto deste valor pela frequência; assim a somatória dessa coluna é um dos valores procurados, 1 . n i i i Pm f = ∑ . Verifique com atenção como realizamos a resolução. Observe a Tabela 6. Tabela 6 – Cálculos parciais para a média da faixa etária dos candidatos. Classes Faixa etária if iPm i iPm f⋅ 1 22 |--- 25 1 23,5 23,5 2 25 |--- 28 10 26,5 265 3 28 | --- 31 8 29,5 236 4 31 |--- 34 1 32,5 32,5 Total ( )n – 20 – 557 Observe que foi introduzida na Tabela 6 a coluna do ponto médio da classe ( )iPm . Recordar conteúdos estudados fortalece o seu aprendizado. Você se recorda do cál culo do ponto médio? O ponto médio da classe expresso pela fórmula inf sup 2 + =i l l Pm . Calculando a média, encontramos: 1 . 557 27,85 20 n i i i Pm f X n == = = ∑ Concluímos que a idade média dos candidatos assume o valor de 27,85 anos, indicando que este é o valor em torno do qual as idades destes candidatos se concentram, isto é, de aproximadamente 28 anos. 1.4.1.2 Mediana A mediana corresponde ao valor que ocupa a posição central numa sequência de números. Representaremos a mediana por Md . UNIUBE 33 Supondo uma sequência numérica 1 2, , , , ,j nx x x x , o elemento xj representa a mediana, caso o número de elementos que o antecedem seja igual ao nú mero de elementos que o sucedem. Para calcular a mediana, atente-se para as situações apresentadas no Quadro 6: Quadro 6 – Cálculo da mediana em relação ao tamanho da amostra assume valor ímpar ou par. Valor da amostra Mediana Se n é ímpar, temos que o rol admite apenas um termo central ocupando a posição: 1 2 n + . O valor do elemento que ocupa esta posição é a mediana. Se n é par, temos que o rol admite dois termos centrais: e 1 2 2 n n + . O valor da mediana será expresso através da média, destes dois termos centrais. Para os dados brutos ou rol, primeiro organizamos a sequência numérica em ordem crescente ou decrescente. Depois, verificamos se o número de elementos da amostra é par ou ímpar e adotamos os seguintes procedimentos, conforme apresentados a seguir. IMPORTANTE! Exemplo 1.8 Seja a sequência numérica: 4, 12, 9, 1, 17, 14, 5, 15, e 3. Primeiro, ordenamos os dados em ordem crescente (ou rol crescente): 1, 3, 4, 5, 9, 12, 14, 15, 17. Como 9n = temos, 1 9 1 5 2 2 n + + = = . Logo, o valor na sequência numérica que representa o 5º elemento, em ordem crescente, é o valor 9. Portanto, 9Md = . Isso implica que 50% dos dados assume valor igual ou superior a 9, e 50% dos dados assume valor igual ou inferior a 9. EXEMPLIFICANDO! 34 UNIUBE Situação-problema 1.4 O chefe do departamento de marketing de uma empresa compilou, no Quadro 7, os dados mensais (em milhares de reais) das despesas com propaganda, e deseja saber o valor mediano dessas despesas durante um ano. Desenvolva os cálculos necessários para apresentar, por extenso, a conclusão encontrada. Quadro 7 – Dados mensais (em milhares de reais) das despesas com propaganda. 221 225,5 235 238 238 239 242 244 245 255 263 282,5 Resolução: Observe que os dados já se encontram em ordem crescente (ou rol crescente). Como 12n = , temos 12= =6 e 1 6 1 7 2 2 2 n n + = + = que a mediana situa-se entre o 6º e 7º elementos na amostra, ou seja, entre os valores 239 e 242 (em negrito, no Quadro 7). Logo, 239 242 481 240,5 2 2 Md += = = Portanto, o chefe do departamento de marketing concluirá que o valor mediano das despesas com propaganda, durante um ano, foi de $ 240,5 milhares de reais. Observe uma situação-problema para os dados agrupados em intervalos (variável contínua). Situação-problema 1.5 Uma comissão criada por donas de casa, Estamos de olho no preço, faz a cotação e divulga entre os moradores do bairro onde residem os preços de produtos em geral. A Tabela 7 apresenta os dados referentes à variação de preço do macarrão em 19 supermercados ou lojas do gênero, pesquisados durante 6 meses. A partir dos dados registrados na tabela, a que conclusão a comissão de donas de casa chegou a respeito do preço mediano do pacote de macarrão? Desenvolva os cálculos necessários e descreva, por extenso, a análise para o resultado encontrado. EXEMPLIFICANDO! UNIUBE 35 Tabela 7 – Intervalo de classes em função do preço do pacote de macarrão. Classes Preço if iF 1 1,32 |--- 1,34 2 2 2 1,34 |--- 1,36 5 7 3 1,36 |--- 1,38 8 15 4 1,38 |--- 1,40 3 18 5 1,40 |--- 1,42 1 19 Total ( )n – 19 – Resolução: Usaremos a expressão inf 2 amterior i n F Md l h f − = + ⋅ , em que: infl : denota o limite inferior da classe da mediana. anteriorF : denota a frequência acumulada anterior à classe da mediana, ou seja, a soma dos valores de i anteriores à classe da mediana. h : denota a amplitude da classe mediana. if : denota a frequência da classe da mediana. Temos 1 19 1 10 2 2 n + + = = (10º elemento). A seguir, identificamos a classe da mediana através da F e, como podemos observar, o 10º elemento pertence a 3ª classe(os valores foram destacado em negrito na tabela). Em seguida, substitui-se os valores conhecidos na expressão da mediana, isto é: 1,37Md = Portanto, a comissão de donas de casa concluiu que 50% dos preços do pacote de macarrão pesquisado se apresentam igual ou menor que R$1,37, e 50% dos preços de macarrão pesquisados se apresentam igual ou maior que R$1,37. ( ) inf 2,59,5 72 1,36 0,02 1,36 0,02 1,36 0,01 8 8 anterior i n F Md l h f − − = + ⋅ = + ⋅ = + ⋅ = + 36 UNIUBE Situação-problema 1.6 O rótulo em uma embalagem de detergente líquido afirma que a embalagem contém 500 ml. O controle de qualidade do fabricante, ao inspecionar a linha de produção, seleciona uma amostra de 12 recipientes desse produto, para verificar se os recipientes estão dentro das normas especificadas no rótulo da embalagem. Os dados obtidos estão registrados no Quadro 8. Sabendo-se que o controle de qualidade aceita uma produção que esteja dentro de 500,02 ml do valor de mililitros especificados no rótulo do recipiente, desenvolva os cálculos necessários para apresentar o valor médio e mediano dos dados amostrais. Descreva, por extenso, as análises para os resultados encontrados. Quadro 8 – Dados de milimitros de embalagens de detergente líquido. 500,03 500,00 500,04 500,02 500,02 500,05 500,03 500,00 500,02 500,03 500,00 500,02 De acordo com a situação-problema 1.6, vamos juntos refletir para outros aspectos importantíssimos com relação aos resultados desses valores médios e medianos. Sabe-se que o controle de qualidade aceita uma produção que esteja dentro de 500,02 ml do valor de mililitros especificados no rótulo do recipiente, e que, em média, o valor obtido está dentro do valor de aceitação. Que tal fazermos neste momento uma reflexão a respeito de dois pontos de vista distintos nesta situação? Olhar do consumidor: quais benefícios você observa nessa realidade apresentada? Olhar do gestor: quais impactos positivos e negativos você nota quando analisa essa situação pelo ponto de vista da empresa? Acompanhe, em detalhes, a resolução do cálculo da média dos dados de mililitros de embalagens de detergente líquido. De acordo com os dados do Quadro 8, a construção de uma tabela irá auxiliar no desenvolvimento dos cálculos. Lembre-se desta dica. UNIUBE 37 Tabela 8 – Cálculos parciais da média em mililitros. ix if .i ix f iF 500,00 3 1500,00 3 500,02 4 2000,08 7 500,03 3 1500,09 10 500,04 1 500,04 11 500,05 1 500,05 12 Total 12 6000,26 – Assim, a média para esta situação será: 1 . 6000,26 500,02 12 n i i i x f X n == = ≅ ∑ Portanto, em média, o valor de mililitros por embalagem de detergente é de aproxima damente 500,02 ml, embora o rótulo da embalagem de detergente líquido afirme que o conteúdo é de 500 ml por embalagem. E, sabendo-se que o controle de qualidade aceita uma produção que esteja dentro de 500,02 ml do valor de mililitros especifi cados no rótulo do recipiente, conclui -se que através da média o resultado satisfaz o volume aceito pelo controle de qualidade. Acompanhe em detalhes o cálculo da mediana. Sempre ordene os valores. Assim, em ordem crescente temos: 500; 500; 500; 500; 02; 500,02; 500,02; 500,02; 500,03; 500,03; 500,03; 500,04; 500,05. Como 12n = temos, 12= =6 e 1 6 1 7. 2 2 2 n n + = + = Logo, a mediana apresenta -se en tre o 6º e 7º elementos, ou seja, entre 500,02 e 500,02. Assim, o valor mediano é: 500,02 500,02 500,02 2 Md += = 38 UNIUBE Portanto, concluiu-se que 50% do valor de mililitros por embalagem de detergente apresentam-se menores ou iguais a 500,02 ml e 50% dos preços do valor de mililitros por embalagem de detergente são maiores ou iguais a 500,02. 1.4.1.3 Moda A moda de um conjunto de dados é o valor que ocorre com maior frequência, ou seja, é o valor que aparece mais vezes. Representaremos a moda por Mo . A moda pode não existir e, mesmo que exista, pode não ser única. Situação 1. Dados brutos ou em rol Exemplo 1.9 Seja a amostra: 2, 3, 3, 4, 5, 5, 5, 7 e 10. O elemento de maior frequência é o número 5, portanto a moda 5Mo = , daí a série ser chamada de unimodal. Exemplo 1.10 Seja a amostra 4, 6, 9, 11,13, e 14. Observe que todos os elementos apresentam a mesma frequência, logo a amostra é amodal. No exemplo 1.11, a moda existe e não é única. Observe. Exemplo 1.11 Na série 6, 6, 7, 7, 9, e 10, os elementos de maior frequência são os números 6 e 7, portanto temos Mo = 6 e Mo = 7, daí a série ser chamada de bimodal. Situação 2. Dados não organizados em classes ou organizados em distribuição de frequências Nesta situação, basta identificar o elemento de maior frequência. Observe a exemplificação da Tabela 9, com o correspondente valor da moda. Tabela 9 – Distribuição de frequência. xi 1 5 6 8 13 fi 1 3 5 2 4 EXEMPLIFICANDO! UNIUBE 39 Portanto, a moda, 6Mo = . Isso implica que o valor 6 é o valor com maior frequência, ou seja, ele se repete por 5 vezes. Situação 3. Dados organizados em classes Nesta situação, primeiro identificamos a classe modal, ou seja, aquela que possui maior frequência. Em seguida, aplicamos a fórmula. Acompanhe o exemplo da Tabela 10. Tabela 10 – Intervalo de classes. Classe Amostra fi 1 0 |-------10 1 2 10 |------ 20 3 3 20 |------ 30 6 4 30 |------ 40 2 Total – 12 Pela fórmula temos, em que: infl : denota o limite inferior da classe modal 1∆ : denota a diferença entre a frequência ( )if da classe modal e a imediatamente anterior. 2∆ : denota a diferença entre a frequência ( )if da classe modal e a imediatamente posterior. h : denota a amplitude da classe. Identificamos na Tabela 10 que a classe modal é a 3ª classe (em negrito), ou seja, a terceira classe é a que exibe a maior frequência simples, isto é, 6if = . Portanto, inf 1 1 2 320 10 20 0,43 10 24,3 24,3 3 4 Mo l h Mo∆= + ⋅ = + ⋅ = + ⋅ = ⇒ = ∆ + ∆ + . inf 1 1 2 .Mo l h∆= + ∆ + ∆ 40 UNIUBE 1.4.1.4 Medidas separatrizes As medidas separatrizes representam números reais que separam o rol ou a distribuição de frequências em partes iguais. Assim, a mediana, que divide a sequência ordenada em duas partes, cada uma delas contendo 50% dos valores da sequência, é também uma medida separatriz. Além da mediana, estudaremos outras medidas separatrizes denominadas quartis ( ), sendo 1,2,3,4iQ i = , quintis ( ), sendo 1,2,3,4,5ik i = , decis ( ), sendo 1,2, ,10iD i = e percentis ( ), sendo i 1, 2, ,100iP = . Observe, com atenção, a representação esquemática de uma sequência ordenada e, a seguir, relacione-a com o enun ciado denominado para cada divisão desta sequência. Figura 4: Representação esquemática de uma sequência ordenada. Decis: série ordenada dividida em 10 partes, cada uma ficará com 10% de seus elementos. Quartis: série ordenada dividida em 4 partes, cada uma ficará com 25% de seus elementos. Percentis: (ou centis): série ordenada dividida em 100 partes, cada uma ficara com 1% de seus elementos. Quintis: série ordenada dividida em 5 partes, cada uma ficará com 20% de seus elementos. P25 D1 D2 P20 P40 P60 P80 K1 K2 K3 K4 ... ... ... ......... D3 D7 D8 D9 Q1 25% 0% 10% 20% 30% 40% 60% 70% 80% 90% 100% 50% 75% Q2 Q3 P50 P15 UNIUBE 41 em que: 1Q : denominado primeiro quartil, separa a sequência ordenada deixando 25% de seus elementos à esquerda e 75% de seus elementos à direita. 2Q : denominado segundo quartil, separa a sequência ordenada deixando 50% de seus elementos à esquerda e 50% de seus elementos à direita. Observe que o 2Q é a mediana da série. IMPORTANTE! 3Q : denominado terceiro quartil, separa a sequência ordenada deixando 75% de seus elementos à esquerda e 25% de seus elementos à direita. 1K : denominado primeiro quintil, separa a sequência ordenada deixando 20% de seus elementos à esquerda e 80% de seus elementos à direita. ... 1D : denominado primeiro decil, separa a sequência ordenada deixando 10% de seus elementos à esquerda e 90% de seus elementosà direita. ... 1P : denominado primeiro centil ou primeiro percentil, separa a sequência ordenada deixando 1% de seus elementos à esquerda e 99% de seus elemen tos à direita. ... 20P : denominado vigésimo centil ou vigésimo percentil, separa a sequência ordenada deixando 20% de seus elementos à esquerda e 80% de seus ele mentos à direita. 42 UNIUBE Observe que o 4Q , 5K , 10D e 100P separa a sequência ordenada deixando 100% de seus valores à esquerda e correspondem diretamente ao último valor da sequência. Mais ainda: podemos estabelecer a fórmula de cálculo de percentis onde todas as outras medidas podem ser identificadas como percentis, basta observarmos que os quartis, quintis e decis são múltiplos dos percentis. Dessa forma, observe as correspondentes colunas que apresentamos a seguir: SAIBA MAIS Para fixarmos melhor o estudo das medidas separatrizes, entre elas, o quartil, o quintil, o decil e o percentil (ou centil); vamos aprender a calcular essas medidas por meio da equação geral quartílica. Acompanhe o cálculo dessas equações: • Quartis ( )iQ – Genericamente, para encontrar a ordem ou posição do quartil Qi a ser calculado usaremos a expressão . 4iQ i nE = em que: iQ E : denota o elemento quartílico. i : denota o número do quartil a ser calculado, sendo 1,2,3,4i = . n : denota o número de observações. 1 25 1 20 1 10 2 50 2 40 2 20 3 75 3 60 3 30 4 80 4 40 5 50 Q P K P D P Q P K P D P Q P K P D P K P D P D P = = = = = = = = = = = = 6 60 7 70 8 80 D P D P D P = = = UNIUBE 43 • Quintis ( )iK – De maneira geral, para encontrar a ordem ou posição do Quintil ( )iK a ser calculado usaremos a expressão: . 5iK i nE = em que: iK E : denota o elemento quintílico. i : denota o número do quintil a ser calculado, sendo 1,2, ,5i = . n : denota o número de observações. • Decis ( )iD – De maneira geral, para encontrar a ordem ou posição do Decil ( )iD a ser calculado usaremos a expressão: . 10iD i nE = em que: iD E : denota o elemento decílico. i : denota o número do decil a ser calculado, sendo 1,2, ,10i = . n : denota o número de observações. • Percentis ou Centis ( )iP – Para encontrar a ordem ou posição do percentil ou Centil ( ) a ser calculado usamos a expressão: . 100iP i nE = em que: iP E : denota o elemento percentílico. i : denota o número do percentil (ou centil) a ser calculado, sendo 1,2, ,10i = . n : denota o número de observações. Para o caso do . 100i n for um número inteiro ou não, temos: – se . 100i n for um número inteiro ⇒ iP é um dos valores da sequência ordenada. – se . 100i n não for um número inteiro ⇒ iP é definido como a média dos valores que ocupam as posições aproximadas, pois iP é um elemento inter mediário entre os elementos que ocupam estas posições. 44 UNIUBE Para dados organizados em classes, encontraremos os quartis de maneira semelhante à usada para o cálculo da mediana: inf iQ anterior i i E F Q l h f − = + ⋅ em que: iQ : denota o Quartil i , sendo 1,2,3i = . infl : denota o limite inferior da classe que contém o quartil desejado ( )iQ iQ E : denota o elemento quartílico. anteriorF : denota a frequência acumulada até a classe anterior à classe mediana. h : denota a amplitude do intervalo de classe. if : denota a frequência absoluta simples da classe quartílica. Importante! Observe na expressão para dados organizados em classes que primeiro é preciso encontrar a equação geral quartílica desejada. Após o resultado encontrado na equação em estudo, devemos ir para a frequência acumulada F , e verificar em qual classe (ou linha do quadro ou tabela) se encontra esse valor obtido na equação quartílica. Isso implica que nessa classe, no geral, se encontra o valor da medida separatriz desejada. Dessa forma para os dados organizados em classes, encontraremos as outras medidas separatrizes, ou seja, os quintis, decis e percentis de maneira semelhante à usada acima. Note que a mudança irá ocorrer apenas na notação da medida separatriz ( iQ , iK , iQ e iP e na equação geral quartílica desejada ( iQE , iKE , iD E e iP E ) . Exemplo 1.13 Os dados do Quadro 9 informam a produção de barris de petróleo bruto por mês de 16 poços de petróleo. Quadro 9 – Dados da produção de barris de petróleo bruto por mês. 390 420 390 510 420 450 410 510 430 420 400 520 450 420 450 510 EXEMPLIFICANDO! UNIUBE 45 Com base nas informações responda as letras a seguir: a) Desenvolva os cálculos e apresente o valor do 1º quartil. Em seguida apresente, por extenso, a análise para esse resultado sobre a produção de barris de petróleo bruto por mês. b) Desenvolva os cálculos e apresente o valor do 2º decil. Em seguida apresente, por extenso, a análise para esse resultado sobre a produção de barris de petróleo bruto por mês. Resolução: a) Ordenando a sequência, em rol crescente, temos: 390, 390, 400, 410, 420, 420, 420, 420, 430, 450, 450, 450, 510, 510, 510, 520. Como sabemos, 1 25Q P= , assim calculamos 25% de 16 ( )16n = , obtendo: 25 16 4 100 100iP i nE ⋅ ⋅= = = ⇒ 25P é o 4º elemento do rol crescente, ou seja, o valor 4 indica a posição do vigésimo quinto percentil ( )25P que corresponde ao primeiro quartil ( )1Q , ( )1 25Q P= , pedido na letra a. A seguir, observando o rol crescente concluímos que o 4º elemento corresponde ao valor 410. Portanto, 1 25 410Q P= = , ou seja, 25% dos poços de petróleo produzem valores menores ou iguais a 410 barris de petróleo bruto por mês, e 75% desses poços produzem valores maiores ou iguais a 410. b) Ordenando a sequência, em rol crescente, temos: 390, 390, 400, 410, 420, 420, 420, 420, 430, 450, 450, 450, 510, 510, 510, 520. Como sabemos, 1 10D P= , assim calculamos 10% de 16 ( )16n = , obtendo: 10 16 1,6 2 100 100iP i nE ⋅ ⋅= = = ≅ ⇒ 10P é o 2º elemento do rol crescente, ou seja, o valor 2 indica a posição do décimo percentil ( )10P que corresponde ao primeiro decil ( )1D , ( )1 10D P= , pedido na letra b. 46 UNIUBE IMPORTANTE! Observe que o valor 390 é inferior ao valor 410, pois por se tratar de medidas de posição, 10% dos dados ocupam valores inferiores a 25% dos dados. Exemplo 1.14 A Tabela 11 informa a distribuição de frequência da dimensão, em milímetros ( )mm , de uma determinada peça. INFORMAÇÃO! Antes de iniciar os cálculos fixe a calculadora em 2 casas decimais. Tabela 11 – Distribuição de frequência da dimensão, em milímetros, de uma determinada peça. Dimensão ( )mm Nº de peças ( )if 9,2 |--- 9,7 2 9,7 |--- 10,2 5 10,2 |--- 10,7 12 10,7 |--- 11,2 17 11,2 |--- 11,7 14 11,7 |--- 12,2 6 12,2 |--- 12,7 3 12,7 |--- 13,2 1 Após as informações sobre a distribuição de frequência da dimensão das peças, desenvolva e apresente os cálculos necessários para encontrar o valor do terceiro quartil. Descreva, por extenso, a conclusão para o resultado encontrado. Resolução: Usaremos a expressão inf i Q amterior i i E F Q l h f − = + ⋅ , em que: infl : denota o limite inferior da classe da quartílica. A seguir, observando o rol crescente concluímos que o 2º elemento corresponde ao valor 390. Portanto, 1 10 390D P= = , ou seja, 10% dos poços de petróleo produzem valores menores ou iguais a 390 barris de petróleo bruto por mês, e 90% desses poços produzem valores maiores ou iguais a 390. UNIUBE 47 anteriorF : denota a frequência acumulada anterior à classe quartílica, ou seja, a soma dos valores de if anteriores à classe quartílica. h : denota a amplitude da classe quartílica. if : denota a frequência da classe quartílica. Temos 3 3 . 3.60 3.60 45 4 4 4iQ Q Q i nE E E= ⇒ = ⇒ = = (45º elemento da F , frequência acumulada). A seguir, identificamos a classe quartílica
Compartilhar