Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística para os cursos de: Economia Administração e Ciências Contábeis BPDEA -w SEA w A Associação Bras~leim para a Proteçao dos Direitos Editoriais e Automis R E S P E I T E O A U T O R N AO F A Ç A C ~ P I A - EDITORA ATLAS S.A. Rua Conselheiro Nébias, 1384 (Campos Elísios) 01203-904 São Paulo (SP) Tel.: (O 11) 3357-9144 Ermes da Silva Elio da Silva Walter Gonçalves Afrânio Carlos Murolo Estatística para os cursos de: Economia Administração e Ciências Contábeis Volume 1 PAULO EDITORA ATLAS S.A. -- 1999 André e Vilmara Pencil André e Vilmara Pencil André e Vilmara Cross-Out 1 994 by EDITORA ATLAS S.A. ed. 1995; 2. ed. 1996; 3. ed. 1999; Capa: Aldo Composição: Formato Serviços de Editoração Ltda. Dados Internacionais de Catalogação na Publicação (CIP) (Câmara Brasileira do Livro, SP, Brasil) Estatística Ermes da Silva ... let - 3. ed. São Paulo: Atlas, 1999. Outros autores: Walter Gonçalves, Elio da Silva, Afrânio Carlos Murolo. ISBN 85-224-2236-2 Estatística I. Silva, Ermes Medeiros. Gonçalves, Walter, 1942- 111. Silva, Elio da. Murolo, Afrânio Carlos. V. Título. 94-41 77 CDD-519.5 índice para catálogo sistemático: 1. Estatística 51 9.5 TODOS OS DIREITOS RESERVADOS - É proibida a reprodução total ou parcial, de qualquer forma ou por qualquer meio. A violação dos direitos de autor (Lei 9.61 0198) é crime estabelecido pelo artigo 184 do Código Penal. Depósito legal na Biblioteca Nacional conforme Decreto de 20 de dezembro de 1907. Impresso no ín Brazíl Sumário t CONCEITOS BASICOS, 11 1.1 Introdução, 11 1.2 Conceitos Fundamentais, 12 1.2.1 Objetivo, 12 1.2.2 População e Amostra, 12 1.3 Processos Estatísticos de Abordagem, 12 1.4 Dados Estatísticos, 14 1.5 Estatística Descritiva, 14 1.6 Dados Brutos, 15 1.7 Rol, 16 1.8 Exercícios Propostos, 17 SÉRIES ESTAT~STICAS, I 8 2.1 Apresentação de Dados Estatísticos, 18 2.2 Distribuição de Frequência - Variável Discreta, 18 2.3 Distribuição de Frequência - Variável Contínua, 19 2.4 Construção da Variável Discreta, 20 2.5 Construção da Variável Contínua, 21 2.6 Exercícios Propostos, 26 2.7 Distribuição de Frequências - Variável Discreta, 29 2.7.1 Frequência Relativa de um Elemento da Série - fr, 29 2.7.2 Frequência Acumulada de um Elemento da Série - Fi, 30 2.7.3 Frequência Acumulada Relativa de um Elemento da Série - FR,, 31 2.8 Distribuição de Frequências - Variável Contínua, 32 2.8.1 Frequência Relativa de uma Classe - fh 32 2.8.2 Frequência Acumulada de uma Classe - Fi, 33 2.8.3 Frequência Acumulada Relativa de uma Classe - FR, 34 2.9 Exercícios Propostos, 35 6 Sumário 2.1 0 Representação Gráfica de Séries Estatísticas, 38 2.1 0.1 Histograma - Variável Discreta, 39 2.1 0.2 Histograma - Variável Contínua, 40 2.1 1 Exercícios Propostos, 42 3 MEDIDAS DE TENDÊNCIA CENTRAL, 46 3.1 Introdução, 46 3.2 Somatório - Notação Sigma (C ), 46 3.3 Exercícios Propostos, 51 3.4 . Médias, 54 3.4.1 Média Aritmética Simples, 54 3.4.2 Média Aritmética Ponderada, 54 3.4.3 Média Geométrica Simples, 55 3.4.4 Média Geométrica Ponderada, 55 3.4.5 Média Harrnônica Simples, 55 3.4.6 Média Harmônica Ponderada, 56 3.5 Cálculo da Média Aritmética, 57 3.6 Exercícios Propostos, 60 3.7 Mediana, 66 3.8 Cálculo da Mediana, 66 3.9 Exercícios Propostos, 71 3.1 0 Moda, 74 3.11 Cálculo da Moda, 74 3.12 Utilização das Medidas de Tendência Central, 83 3.1 3 Exercícios Propostos, 85 4 MEDIDAS SEPARATRIZES, 89 4.1 Conceitos, 89 4.2 Cálculo das ~edidasseparatrizes, 90 4.3 Exercícios Propostos, 95 5 MEDIDAS DE DISPERSÃO, 100 5.1 Introdução, 100 5.2 Medidas de Dispersão Absoluta, 101 5.3 Amplitude Total, 101 5.4 Cálculo da Amplitude Total, 101 5.5 Exercícios Propostos, 102 5.6 Desvio Médio Simples, 103 Sumário 7 5.7 Cálculo do Desvio Médio Simples, 103 5.8 Exercícios Propostos, 108 5.9 Variância e Desvio Padrão, 109 5.1 0 Cálculo da Variância e Desvio Padrão, 110 5.11 Interpretação do Desvio Padrão, 116 5.1 2 Exercícios Propostos, 11 8 5.1 3 Medidas de Dispersão Relativa, 121 5.1 4 Exercícios Propostos, 122 i MEDIDAS DE ASSIMETRIA E CURTOSE, 124 6.1 Introdução, 124 6.2 Medidas de Assimetria, 125 6.2.1 Coeficiente de Pearson, 125 6.2.2 Coeficiente de Bowley, 125 6.3 Medida de Curtose, 126 6.4 Exercícios Propostos, 132 - PROBABILIDADES, 143 7.1 Introdução, 143 7.1.1 Fenômenos Aleatórios, 143 7.2 Teoria das Probabilidades - Espaço Amostral, 145 7.3 Eventos, 147 7.4 Operações com Eventos, 148 7.5 Exercícios Propostos, 149 7.6 Função de Probabilidade, 151 7.7 Definição de Probabilidade, 151 7.8 Exercícios Propostos, 155 7.9 Probabilidade de um Evento, 158 7.1 0 Exercícios Propos'tos, 159 7.11 Axiomas de Probabilidade, 162 i CÁLCULO DE PROBABILIDADES, 163 8.1 Teoremas Fundamentais, 163 8.1.1 Probabilidade do Conjunto Vazio, 163 8.1 -2 Probabilidade do Complementar, 163 8.1.3 Probabilidade da Reunião, 163 8.1.4 Exercícios Propostos, 1 65 8.1.5 Probabilidade Condicional, 165 8 Sumário 8.1.6 Exercícios Propostos, 170 8.1.7 Teorema da Probabilidade Total, 172 8.1.8 Exercícios Propostos, 174 8.1.9 Teorema de Bayes, 176 8.1.1 0 Exercícios Propostos, 178 8.2 Exercícios Gerais, 179 Bibliografia, 189 Prefácio Estamos colocando a disposição dos colegas professores e aos inte- ?ssados em estatística de modo geral uma coleção de livros da qual este é o primeiro volume. O conteúdo deste volume apresenta os conceitos básicos iniciais de um curso de estatística, isto é, enfoca a estatística descritiva, as medidas sobre uma distribuição, e coloca os principais estimadores necessá- rios ao desenvolvimento posterior de inferência estatística. Encerra o volume o estudo do cálculo de probabilidades. Este conteúdo foi escolhido por alguns motivos. A nossa experiência ao desenvolver cursos nesta área nos conven- zu de que este conteúdo pode ser desenvolvido com bom aproveitamento um curso anual de 72 horas ou em curso semestral equivalente. Além disso, conteúdo está adequado ao novo currículo dos cursos de administração de empresa que estão sendo implantados nas diversas faculdades. Entretanto, o que nos parece mais importante é a maneira como o assunto foi desenvolvido. Uma crítica frequente de professores e alunos com respeito aos textos de estatística é que eles apresentam os conceitos estatísti- cos do ponto de vista matemático, com ênfase nos cálculos das medidas. A conseqüência deste enfoque é que os estudantes, embora possam desenvol- ver os cálculos necessários a solução de problemas não são capazes de realizar o que nos parece fundamental em estatística, que é o conhecimento e as possíveis interpretações do fenômeno estatístico envolvido. Para atingir este objetivo procuramos desenvolver os conceitos dando anfase a interpretação das medidas sobre o fenômeno estatístico. Desta for- ia, a apresentação de cada conceito é seguida de sua interpretação específi- a, completada por questões teóricas e práticas que fixem esse conhecimen- ,a. A idéia é que fique claro o que o conceito significa do ponto de vista estatístico e quais são as possíveis utilidades que ele pode ter, principalmente no campo da Administração. Tendo em vista este objetivo, muitas vezes restringimos a abrangência do conceito com a finalidade de torná-lo acessível ao estudante. Desta forma, os professores da área certamente notarão alguns conceitos particularizados ou pouco abrangentes. Achamos necessária esta restrição para não desviar o enfoque do significado do conceito e sua interpretação. 10 Prefácio Acreditamos que a medida que o estudante for adquirindo experiência nesta área, a generalização dos conceitos ocorrerá de maneira natural. Com a finalidade de fixar os conceitos elaboramos grande quantidade de exercícios. O leitor deverá notar que tivemos o cuidado de apresentar problemas enfocandoa aplicação da estatística a diversas áreas da adminis- tração de empresas; cumprindo desta forma uma de suas finalidades que é de disciplina de apoio as áreas profissionais deste campo. Esperamos que este texto e os demais que o seguirão sejam de utili- dade para professores e estudantes que necessitam de estatística em sua vida profissional. Gostaríamos de receber sugestões e críticas dos colegas. Essa aten- ção para com nosso trabalho nos farão agradecidos e certamente colaborarão para a correção de rumo, aumentando a adequação, utilidade e competência desta obra. São Paulo, outubro de 94. Os Autores 1/ Conceitos Básicos 1 .I Introdução O termo Estatística provém da palavra Estado e foi utilizado original- mente para denominar levantamentos de dados, cuja finalidade era orientar o Estado em suas decisões. Neste sentido foi utilizado em épocas remotas para determinar o valor dos impostos cobrados dos cidadãos, para determinar a estratégia de uma nova batalha em guerras que se caracterizavam por uma sucessão de bata- lhas. (Era fundamental aos comandantes saber de quantos homens, armas, cavalos etc. dispunham após a última batalha.) Atualmente, a estatística é definida da seguinte forma: Estatística é um conjunto de métodos e processos quantitativos que serve para estudar e medir os fe- nômenos coletivos. A estatística teve acelerado desenvolvimento a partir do século XVII, com os estudos de BERNOULLI, FERMAT, PASCAL, LAPLACE, GAUSS, GALTON, PEARSON, FISHER, POISSON e outros que estabeleceram suas características atuais. Ela não alcançou ainda um estado definitivo. Continua a progredir na razão direta do desejo de investigação dos fenômenos coletivos. A Estatística é considerada por alguns autores como Ciência no senti- do do estudo de uma população. É considerada como método quando utiliza- da como instrumento por outra Ciência. A Estatística mantém com a Matemática uma relação de dependência, solicitando-lhe auxílio, sem o qual não poderia desenvolver-se. Com as outras Ciências mantém a relação de complemento, quando utilizada como instrumento de pesquisa. 12 Estatística 1 Em especial esta última é a relação que a Estatística mantém com a Administração, Economia, Ciências Contábeis, servindo como instrumento au- xiliar na tomada de decisões. 1.2 Conceitos Fundamentais 1.2.1 OBJETIVO Estatística tem como objetivo o estudo dos fenômenos coletivos. 1.2.2 POPULAÇAO E AMOSTRA Conceituaremos População como sendo o conjunto de todos os itens (pessoas, coisas, objetos) que interessam ao estudo de um fenômeno coletivo segundo alguma característica. Entenderemos por Amostra, qualquer subconjunto não vazio de uma população. Uma característica numérica estabelecida para toda uma população é denominada parâmetro. Uma característica numérica estabelecida para uma amostra é deno- minada estimador. Por exemplo: no fenômeno coletivo eleição para governador no Estado de São Paulo, a população é o conjunto de todos os eleitores habilitados no Estado de São Paulo. Um parâmetro é a proporção de votos do candidato A. Uma amostra ,é um grupo de 1000 eleitores selecionados em todo o Estado. Um estimador é a proporção de votos do candidato A obtida na amostra. Em aplicações efetivas, o número de elementos componentes de uma amostra é bastante reduzido em relação ao número de elementos componen- tes da população. 1.3 Processos Estatísticos de Abordagem Quando solicitados a estudar um fenômeno coletivo podemos optar entre os seguintes processos estatísticos: a) Estimação. b) Censo. Conceitos Básicos 13 Censo: é uma avaliação direta de um parâmetro, utilizando-se todos 9s componentes da população. Estimação: é uma avaliação indireta de um parâmetro, com base em IJm estimador através do cálculo de probabilidades. Propriedades Principais do Censo: i Admite erro processual zero e tem confiabilidade 100%. i É caro. i É lento. É quase sempre desatualizado. i Nem sempre é viável. Propriedades Principais da Estimação: i Admite erro processual positivo e tem confiabilidade menor que 100%. i É barata. i É rápida. i É atualizada. i É sempre viável. COMENTÁRIO: estatisticamente, a precisão de um valor numérico é avalia- da através do binômio: confiança e erro processual. Se admitirmos que podemos retirar do Censo todo tipo de erro de natureza humana (erro de cálculo de avaliação, de anotação etc.), restará apenas outro tipo de erro devido ao procedimento empregado. Este erro é chamado erro processual. No caso de um Censo, o erro processual é zero, pois avaliamos um por um, todos os elementos componen- tes da População. Como o erro processual na avaliação é zero, a confiabilidade no parâ- metro obtido é 100%. A precisão, no Censo é total. Na estimação, como avaliamos apenas parte e não todos os elemen- tos que compõem a população, admitimos um erro processual positivo na avaliação do valor numérico e por conseqüência uma confiabilidade menor que 100%, sendo, portanto, menos precisa que o Censo. Como o número de elementos que compõem uma amostra é conside- ravelmente menor que o número de elementos que compõem uma População, a Estimação é sempre bem mais barata que o Censo, é concluída mais rapidamente que o Censo e, portanto, mais atualizada. 14 Estatística 1 Se a maneira de avaliar um elemento é um teste destrutivo, o Censo se torna um processo inviável, pois destruiria a população objeto do estudo. Entretanto, na maioria das vezes em que o Censo é considerado inviá- vel é por razões econômicas e de tempo. Na sociedade moderna, a maioria dos problemas exigem decisões de curto prazo. Por isso, as informações estatísticas úteis a resolução destes problemas devem ser obtidas rapidamente. Pela rapidez e facilidade da obtenção destas informações, a estimação tem sido cada vez mais utilizada como procedimento estatístico. 1.4 Dados Estatísticos Normalmente, no trabalho estatístico o pesquisador se vê obrigado a lidar com grande quantidade de valores numéricos resultantes de um Censo ou de uma estimação. Estes valores numéricos são chamados dados estatisticos. No sentido de disciplina, a Estatística ensina métodos racionais para a obtenção de informações a respeito de um fenômeno coletivo, além de obter conclusões válidas para o fenômeno e também permitir tomada de decisões, através de dados estatisticos observados. Desta forma, a estatística pode ser dividida em duas áreas: a) Estatística Descritiva - é a parte da Estatística que tem por obje- to descrever os dados observados. b) Estatística Indutiva - é a parte da Estatística que tem por objetivo obter e generalizar conclusões para a população a partir de uma amostra, através do cálculo de probabilidade. O cálculo de probabilidade é que viabiliza a inferência estatística. 1.5 Estatística Descritiva A Estatística Descritiva, na sua função de descrição dos dados, tem as seguintes atribuições: a) A obtenção dos dados estatísticos. b) A organização dos dados. c) A redução dos dados. d) A representação dos dados. Conceitos Básicos 15 e) A obtenção de algumas informações que auxiliam a descrição do fenômeno observado. i A obtenção ou coleta de dados é normalmente feita através de gm questionário ou de observação direta de uma população ou amostra. i A organização dos dados consiste na ordenação e crítica quanto a correção dos valores observados, falhas humanas, omissões, abandono de dados duvidosos etc. i Redução dos dados - O entendimento e compreensão de grande quantidade de dados através da simples leitura de seus valores individuais é uma tarefa extremamente árdua e difícil mesmo para o mais experimentado pesquisador. A Estatística descritiva apresenta duas formas básicas para a redução do número de dados com os quais devemos trabalhar, chamadas variável discreta e variável contínua. i A representação dos dados - 0 s dados estatísticos podem ser maisfacilmente compreendidos quando apresentados através de uma repre- sentação gráfica, o que permite uma visualização instantânea de todos os dados. Os gráficos, quando bem representativos, tornam-se importantes ins- trumentos de trabalho. É ainda atributo da Estatística Descritiva a obtenção de algumas infor- mações como médias, proporções, dispersões, tendências, índices, taxas, coeficientes, que facilitam a descrição dos fenômenos observados. Isto encer- ra as atribuições da Estatística Descritiva. Completando o processamento estatístico, no caso de uma Estimação, a Estatística Indutiva estabelece parâmetros a partir de estimadores usando o cálculo de probabilidade. Esta última etapa será desenvolvida posteriormente. 1.6 Dados Brutos Quando fazemos n observações diretas em um fenômeno coletivo ou observamos as respostas a uma pergunta em uma coleção de n questioná- rios, obtemos uma sequência de n valores numéricos. Tal sequência é denominada dados brutos. 16 Estatística 1 Representando por X a característica observada no fenômeno coletivo ou na pergunta dos questionários, então x, representa o valor da característi- ca obtida na primeira observação do fenômeno coletivo ou o valor da caracte- rística observado no primeiro questionário; x2 representa o valor da caracterís- tica X na segunda observação do fenômeno coletivo ou o valor da característi- ca Xobservada no segundo questionário e assim sucessivamente. Desta forma, os dados brutos podem ser representados por X: x,, x2, x3, ..., X". Esta sequência de valores assim obtida apresenta-se completamente desordenada. De modo geral, podemos afirmar que: Dados brutos é uma. sequência de valores numéri- cos não organizados, obtidos diretamente da obser- vação de um fenômeno coletivo. 1.7 Rol Quando ordenamos na forma crescente ou decrescente, os Dados Brutos passam a se chamar Rol. Portanto: Rol é uma sequência ordenada dos Dados Brutos. Exemplo: No final do ano letivo, um aluno obteve as seguintes notas bimestrais em Matemática: 4; 8; 7,5; 6,5. Neste exemplo, X representa nota bimestral e pode ser apresentada na forma: X 4;, 8; 7,5; 6,5. (Dados Brutos) OU X 4; 6,5; 7,5; 8. (Rol) OBSERVAÇÃO: Após uma atenta leitura desta parte inicial, o interessado deve responder as seguintes questões: Conceitos Básicos 17 1.8 Exercícios Propostos '. O que é Estatística? 2. O que é População? . O que é Amostra ? . O que é Parâmetro? 5. O que é Estimador? 3. Quais são os processos estatísticos de abordagem para o estudo de um fenôme- no coletivo? : O que é Censo? 2. O que é Estimação? 3. Explique as propriedades principais do Censo. ' O . Explique as propriedades principais da Amostragem. 1. O que é Dado Estatístico? '2. O que é Estatística Descritiva e quais são suas tarefas? '3. O que é Estatística Indutiva? '4 . O que são Dados Brutos? '5. O que é Rol? '6. Construa o Rol para sequência de dados brutos: a) X :2 4, 12, 7, 8, 15, 21, 20. b) Y:3, 5, 8, 5, 12, 14, 13, 12, 18. c) Z: 12,2; 13,9; 14,7; 21,8; 12,2; 14,7. d) W:8, 7,8, 7,8, 7, 9. RESPOSTAS ?f Séries Esta tis ficas 2.1 Apresentação de Dados Estatísticos Quando lidamos com poucos valores numéricos, o trabalho estatístico fica sensivelmente reduzido. No entanto, normalmente teremos que trabalhar com grande quantidade de dados. Um dos objetivos da Estatística Descritiva neste caso, é obter uma significativa redução na quantidade de dados com os quais devemos operar diretamente. Isto pode ser conseguido modificando-se a forma de apresenta- ção destes dados. Suponha que observamos as notas de 30 alunos em uma prova e obtivemos os seguintes valores: Se entendermos como frequência simples de um elemento o número de vezes que este elemento figura no conjunto de dados, podemos reduzir significativamente o número de elementos com os quais devemos trabalhar. Para isto organiza-se o conjunto de dados na forma de uma série estatística chamada variável discreta. 2.2 Distribuição de Frequência - Variável Discreta É uma representação tabular de um conjunto de valores em que colo- camos na primeira coluna em ordem crescente apenas os valores distintos da série e na segunda coluna colocamos os valores das frequências simples correspondentes. Se usarmos f para representar frequência simples, a sequência (1) pode ser representada pela tabela: Séries Estatísticas 19 OBSERVAÇOES: (1) Note que a colocação de um índice i para x e para f tem a finalidade de referência. Deste modo, x, repre- senta o primeiro valor distinto da série, x2 representa o segundo valor distinto da série, f, representa a fre- quência simples do primeiro valor distinto da série, f2 representa a frequência simples do 2Qalor distinto da série e assim sucessivamente. (2) Note que conseguimos reduzir de 30 elementos que constituíam a série original para apenas 12 elementos. (3) Note também que a variável discreta só é uma forma eficiente de redução dos dados, quando o número de elementos distintos da série for pequeno. Devemos optar por uma variável discreta na repre- sentação de uma série de valores quando o número de elementos distintos da série for pequeno. 2.3 Distribuição de Frequência - Variável Contínua Suponha que a observação das notas de 30 alunos em uma prova nos :3nduzisse aos seguintes valores: Observando estes valores notamos grande número de elementos dis- ??tos, O que significa que neste caso a variável discreta não é aconselhável -a redução de dados. 20 Estatística 1 Nesta situação é conveniente agrupar os dados por faixas de valores, ficando a série com a seguinte apresentação: Esta apresentação da série de valores é denominada variável contí- nua. Devemos optar por uma variável contínua na repre- sentação de uma série de valores quando o número de elementos distintos da série for grande. fi 4 12 10 4 Classe 1 2 3 4 2.4 Construção da Variável Discreta Notas 2 1 4 4 1 6 6 1 8 8 1 1 O A construção de uma variável discreta é bastante simples. Basta ob- servar quais são os elementos distintos da sequência, ordená-los, e colocá-los na primeira coluna da tabela. Em seguida computar a frequência simples de cada elemento distinto e colocá-la na segunda coluna da tabela. Exemplo de construção de uma variável discreta: A sequência abaixo representa a observação do numero de acidentes por dia, em uma rodovia, durante 20 dias. x: 0,2,0,1,1,0,0,0,3,2 1,0,1,2,0,1,3,2,2,0. Os valores distintos da sequência são: O, 1, 2, 3. As frequências simples respectivas são: 8, 5, 5, 2. Portanto, a variável discreta representativa desta sequência é: Séries Estatísticas 21 .5 Construção da Variável Contínua A construção da variável contínua requer o conhecimento de alguns ~nceitos que vamos estabelecer aproveitando a tabela abaixo como exempli- :ação: 1. AMPLITUDE TOTAL DE UMA SEQUÊNCIA é a diferença entre o riaior e o menor elemento de uma sequência. Classe Representando a amplitude total por A,, o maior elemento da sequên- cia Xpor XmA, e o menor elemento por Xmín, a amplitude total é denotada por: No exemplo da sequência que deu origem a tabela (2), Xmáx = 9,5 e Xmín = 2, portanto: Intervalo de classe A amplitude total representa o comprimento total da sequência e é dada na mesma unidade de medida dos dados da sequência. fi 2. INTERVALO DE CLASSE é qualquer subdivisão da amplitude to- tal de uma série estatística. No exemplo da tabela (2) subdividimos a amplitude total em quatro classes, obtendo os intervalos de classe 2 1- 4, 4 1- 6, 6 1- 8, 8 1- 10. Note que na realidade não trabalhamos com a At = 7,5 e sim com a amplitude total ajustada para 8 como justificaremos adiante. 3. LIMITE DE CLASSE: cada intervalo de classe fica caracterizado 9or dois números reais. O menor valor é chamado limite inferior da classe e será indicado por I. O maior valor é chamado limite superior da classe e será Indicado porL. Por exemplo, na Classe 2 1- 4, I = 2 e L = 4. 22 Estatística 1 4. AMPLITUDE DO INTERVALO DE CLASSE é a diferença entre o limite superior e o limite inferior da classe. Se usarmos h para representar a amplitude do intervalo de classe podemos estabelecer: OBSERVAÇOES: (1) Na realidade, as classes não precisam necessariamen- te ter a mesma amplitude como no exemplo acima. Porém, sempre que possível, devemos trabalhar com classes de mesma-amplitude. Isto facilita sobremaneira os cálculos posteriores. (2) Note que usamos para representar as classes, interva- los reais semiabertos a direita. Isto significa que o in- tervalo contém o limite inferior, masnão contém o limi- te superior, ou seja, o intervalo de classe 2 1- 4 con- tém os valores reais maiores ou iguais a 2 e menores que 4. Desta forma, o último intervalo da série que é 8 1- 10 não contém o valor 10. É por isso que não utilizamos a amplitude 7,5, pois se isto fosse feito, o limite superior da última classe seria 9,5 e como o limite superior não deve pertencer a classe, o elemento 9,5 da sequência estatística original ficaria sem classificação. Como vamos utilizar este critério, precisaremos ajustar sempre o valor máximo da série ao definir a amplitude total. Outros critérios poderiam ser adotados como o interva- . lo real semiaberto a esquerda ou mesmo o intervalo real aberto, mas nenhum destes critérios é melhor que o critério adotado. 5. NÚMERO DE CLASSES: o número de classes a ser utilizado depende muito da experiência do pesquisador e das questões que ele preten- de responder com a variável contínua. Isto pode ser verificado facilmente pelo próprio interessado ao longo desta exposição. Para efeito de nossos exemplos, utilizaremos o critério da raiz para a determinação do número de classes. Séries Estatísticas 23 ) CRITÉRIO DA RAIZ Se a sequência estatística contém n elementos e se indicarmos por K número de classes a ser utilizado, então pelo critério da raiz: Como o número K de classes deve ser necessariamente um número iteiro e como dificilmente 6, é um número inteiro, deixaremos como opção ara o valor de K o valor inteiro mais próximo de fi, uma unidade a menos ou mais que este valor. . No exemplo da tabela (2), n = 30 e conseqüentemente k = 1130 = ,477, portanto o valor inteiro mais próximo de v% é 5. As opções para k ntão são: 4 ou 5 ou 6. A amplitude do intervalo de classe que designamos por h é determina- da da seguinte forma: 8 o portanto h = - = 2. 4 observe que a opção por quatro classes, foi feita em função de um valor de h mais fácil de se operar. Se tivéssemos optado por cinco classes, o valor de h seria 8/5 = 1,6; se véssemos optado por seis classes, o valor de h seria 8/6 = 1,3333 ... Veja que o melhor valor para se trabalhar em cálculos é o h = 2. Foi ?or isto que optamos por quatro classes. Conhecendo-se o valor Xmin = 2 e a amplitude de classe h = 2, conclui- 70s que o limite superior da primeira classe é 4. Portanto, a primeira classe é r! intervalo 2 1- 4. O limite inferior da segunda classe é 4. Somando-se a zrnplitude de classe obteremos 6. Portanto, a segunda classe é 4 1- 6. A :srceira classe por analogia é 6 1- 8 e a quarta classe é 8 1- 10. 6. FREQUÊNCIA SIMPLES DE UMA CLASSE fi: chama-se frequên- ::a simples de uma classe ao número de elementos da sequência que são ai ores ou iguais ao limite inferior desta classe e menores que o limite supe- -3r desta classe. 24 Estatística 1 No exemplo 2, a frequência simples da primeira classe é o número de elementos da sequência que são maiores ou iguais a 2 e menores que 4. Note que os valores da sequência nestas condições são os valores 3, 2,5, 2, 3,5. Portanto, a frequência simples da primeira classe é 4. Da mesma forma determinamos as frequências simples das demais classes, completando o quadro representativo da variável contínua. COMENTÁRIO: Existem outros critérios para a determinação do número de classes, como por exemplo a fórmula de STURGES. Segundo STURGES, O número Kde classes é dado por: Para valores de n muito grandes, esta fórmula apresenta mais vanta- gens que o critério da raiz, embora apresente o mesmo problema de aproxi- mação do valor de K. Como acreditamos que na prática a experiência do pesquisador é que na verdade vai determinar o número de classes, optamos pelo método mais simples que é o critério da Raiz. EXEMPLO DE CONSTRUÇÃO DE UMA VARIÁ VEL CONT~NUA Um teste para aferir o Quociente de Inteligência em determinada clas- se de alunos de uma Faculdade deu origem a sequência de valores Para a construção da variável contínua, devemos determinar o número de elementos da sequência. Verificamos que a sequência possui n = 70 ele- mentos. Séries Estatísticas 25 Pelo critério da raiz K = fi. No caso, K = .\170 = 8,37. O valor inteiro iis próximo é 8. Portanto, temos opção para construir a variável contínua m 7 ou 8 ou 9 classes. O maior valor da sequência é X,,, = 139 e o menor valor da sequên- [ é Xmí, =61. Portanto, a amplitude total da sequência é At = 139 - 61 = 78. No tanto, sabemos que pelo fato de o critério adotado do intervalo de classe r semi-aberto a direita, devemos ajustar o valor X,,. Se ajustássemos 'máx para 140, a amplitude ajustada passaria a ser At = 140 - 61 = 79. Este !alar não é divisível de forma inteira nem por 7 nem por 8 e nem por 9, que áo nossas opções de classes. Nesta situação devemos ajustar Xmáx para 141 obtendo a At = 141 - 31 = 80 que é divisível exatamente por 8, obtendo-se ama amplitude do -itervalo de classe h dada por: Observe que o ajuste do valor Xmáx foi de duas unidades, passando de '39 para 141. A experiência do pesquisador, nesta situa~ão, o levaria a distribuir este srro de duas unidades, iniciando a representação da série em 60 e terminan- 29 em 140. A amplitude total ajustada para a série é: At = 140 - 60 = 80. O comprimento do intervalo de classe é h = 10 e o número de classes i K = 8 . Computando as frequências simples de cada classe, construímos a :ariável contínua representativa desta série. A variável contínua é conceituada como uma representação tabular em x e colocamos na primeira coluna os intervalos de classe e na segunda zz~luna os valores das frequências simples correspondentes. Classe 1 2 3 4 5 6 7 8 Intervalo de classe 60 1 70 70 1 80 80 1 90 90 1 1 O0 100 1 110 110 1 120 120 1 130 130 1 140 fi 1 5 6 10 12 19 14 3 26 Estatística 1 A coluna "classe" tem a finalidade apenas de facilitar a referência as classes, não fazendo parte da variável contínua. O quadro final tanto da variável discreta como da variável contínua recebe o nome de distribuição de frequência. 2.6 Exercícios Propostos 1. Qual é o objetivo de agrupar os dados por frequência? 2. O que é uma variável discreta? 3. Qual é a característica de um conjunto de dados que indique o uso de uma variável discreta ao se agrupar os dados por frequência? 4. O que é uma variável contínua? 5. Qual é a característica de um conjunto de dados que indique o uso de uma variável contínua ao se agrupar os dados por frequência? 6, Uma pesquisa sobre a idade, em anos de uma classe de calouros de uma faculda- de, revelou os seguintes valores: 18, 17, 18, 20, 21, 19, 20, 18, 17, 19 20, 18, 19, 18, 19, 21, 18, 19, 18, 18 19, 19, 21, 20, 17, 19, 19, 18, 18, 19 18, 21, 18, 19, 19, 20, 19, 18, 19, 20 18, 19, 19, 18, 20, 20, 18, 19, 18, 18 Agrupe, por frequência, estes dados. 7. Uma auditoria em uma grande empresa observou o valor de 50 notas fiscais emitidas durante um mês. Esta amostra apresentou os seguintes valores em dóla- res: 15.315,OO 23.440,OO 6.551,OO 13.253,OO 25.312,OO 35.780,OO 42.320,OO 34.782,OO 27.435,OO 17.661,OO 20.4 14,OO 23.3 13,OO 26.432,OO 30.5 15,OO 27.6 1 O, O0 8.598,OO 12.417,OO 22.300,OO 25.400,OO 21.200,OO 16.820,OO 38.000,00 40.300,OO 15.800,OO 18.300,OO 21.780,OO 32.414,OO32.000,OO 18.700,OO 19.600,00 22.540,OO 22.010,OO 30.000,OO 21.380,OO 24.780,OO 29.000,OO 30.400,OO 12.3 19,OO 36.728,OO 36.483,OO 27.312,OO 35.318,OO 18.620,OO 38.661,OO 40.681,OO 19.302,OO 23.300,OO 21.350,OO 28.412,OO 21.313,OO Agrupe, por frequência, estes dados. 8. Uma empresa automobilística selecionou ao acaso, uma amostra de 40 revende- dores autorizados em todo o Brasil e anotou em determinado mês o número dc unidades adquiridas por estes revendedores. Obteve os seguintes dados: Séries Estatísticas 27 10 15 25 21 6 23 15 21 26 32 9 14 19 20 32 18 16 26 24 20 7 18 17 28 35 22 19 39 18 21 15 18 22 20 25 28 30 16 12 20 Agrupe, por frequência, estes dados. 9. Uma indústria embala peças em caixas com 100 unidades. O controle de qualida- de selecionou 48 caixas na linha de produção e anotou em cada caixa o número de peças defeituosas. Obteve os seguintes dados: 2 0 0 4 3 0 0 1 0 0 1 1 2 1 1 1 1 1 1 0 o 0 3 0 0 0 2 0 0 1 1 2 0 2 0 0 0 0 0 0 o 0 0 0 0 0 1 0 Agrupe, por frequência, estes dados. 10. Um banco selecionou ao acaso 25 contas de pessoas físicas em uma agência, em determinado dia, obtendo os seguintes saldos em dólares: 52.500,OO 18.300,OO 35.700,00 43.800,OO 22.150,OO 6.830,OO 3.250,OO 1 7.603,OO 35.600,OO 7.800,OO 16.323,OO 42.130,OO 27.606,OO 18.350,OO 12.521,OO 25.300,OO 3 1.452,OO 39.6 1 O, O0 22.450,OO 7.380,OO 28.000,OO 21.000,OO 14.751,OO 39.512,OO 17.319,OO Agrupe, por frequência, estes dados. '. Uma solução com uma margem de erro mínima é: I (anos) xi 17 18 19 20 21 Número de alunos fl 3 18 17 8 4 Classe 1 2 3 4 5 6 7 Valor da nota US$ 6.551 ,O0 1- 1 1.661 ,O0 11.661 ,O0 1- 16.771 ,O0 16.771 ,O0 1- 21.881 ,O0 21 .E81 ,O0 1- 26.991 ,O0 26.991 ,O0 1- 32.101 ,O0 32.1 O1 ,O0 1- 37.21 1 ,O0 37.21 1 ,O0 1- 42.321 ,O0 Número de notas r, 2 5 13 1 O 9 6 5 28 Estatística 1 A, = 42.320,OO - 6.55 1,00 = 35.769,OO A, ajustada = 42.321.00 - 6.551,00 = 35.770,OO K = v% 7 A melhor opção para dividir 35.770 é 7 * A = 5.110 t 8. Uma solução com uma margem de erro mínima é: A,=39-6=33 A, ajustada = 40 - 6 = 34, o que não é exatamente divisível por 6, nem por 7, nem por 8. Ajustamos a amplitude para 40 - 5 = 35 para distribuir o erro. Assim, A, ajustada é 35. Podemos optar por 5 ou por 7 classes. Obviamente, a melhor opção é por sete classes. Classe 1 2 3 4 5 6 7 Classe Número de contas 3.249,,00 I- 15.562,OO 2 15.562,OO I- 27.875,OO 10 3 27.875,OO 1- 40.1 88,OO 4 40.188.00 1- 52.501 ,O0 3 Número de carros 5 1- 1 o 10 1- 15 15 1- 20 20 1- 25 25 1- 30 30 1- 35 35 1- 40 Número de peças defeituosas por caixa x/ O . 1 2 3 4 A, ajustada 52.501 - 3.250 = 49.251, que não é divisível por forma inteira nem por 4, nem por 5 e nem por 6. Neste caso, consideramos a A, ajustada 52.501 - 3.249, para distribuir o erro. Assim: Número de revendedores f/ 3 3 12 11 6 3 2 Número de caixas fi 28 12 5 2 1 Séries Estatísticas 29 2.7 Distribuição de Frequências - Variável Discreta Uma vez que o interessado tenha colocado os dados na forma de uma distribuição de frequência, ele poderá rapidamente obter algumas informações adicionais e úteis para a compreensão da série, se considerar os seguintes conceitos: 2.7.1 FREQUÊNCIA RELATIVA DE UM ELEMENTO DA SÉRIE - f, É a divisão da frequência simples deste elemento pelo número total de elementos da série. Exemplo: Considere a variável discreta: O total de elementos desta série é 25. Portanto, a frequência relativa 30 primeiro elemento distinto da série, que é 2, vale: A frequência relativa do segundo elemento distinto, que é 3, vale: Da mesma forma determinamos a frequência relativa dos elementos seguintes da série: 30 Estatística 1 Note que estes valores representam a participação percentual de cada elemento distinto na série. Assim, podemos fazer a interpretação: 12% dos valores da série são iguais a 2; 28% dos valores da série são iguais a 3; 32% dos valores da série são iguais a 4; 24% dos valores da série são iguais a 6; e 4% dos valores da série são iguais a 7. É a soma da frequência simples deste elementocom as frequências simples dos elementos que o antecedem. Desta forma, a frequência acumulada para os elementos 2, 3, 4, 6 e 7 valem respectivamente: Estes valores podem ser interpretados da seguinte forma: - 3 elementos componentes da série são valores menores ou iguais a 2. - 10 elementos componentes da série são valores menores ou iguais a 3. - 18 elementos componentes da série são valores menores ou iguais a 4. Séries Estatísticas 31 - 24 elementos componentes da série são valores menores ou iguais a 6. - 25 elementos componentes da série são valores menores ou iguais a 7. 7.3 FREQUÊNCIA ACUMULADA RELATIVA DE UM ELEMENTO DA SÉRIE - FR. I É a divisão da frequência acumulada deste elemento, pelo número al de elementos da série: Assim, a frequência acumulada relativa dos elementos 2, 3, 4, 6 e 7 Aem respectivamente: Estes valores podem ser interpretados da seguinte forma: - 12% dos valores da série são menores ou iguais a 2. - 40% dos valores da série são menores ou iguais a 3. - 72% dos valores da série são menores ou iguais a 4. - 96% dos valores da série são menores ou iguais a 6. - 100% dos valores da série são menores ou iguais a 7. Quando acrescentamos estes valores a tabela original, esta passa a :e chamar distribui~áo de frequências. Para o exemplo estabelecido, a distri- I - S o de frequências é: 32 Estatística 1 2.8 Distribuição de Frequências - Variável Contínua No caso da variável contínua, pelo fato de termos utilizado intervalos de classe, semi-aberto a direita, as interpretações são diferentes. Portanto, redefiniremos estes tipos de frequência. 2.8.1 FREQDÊNCIA RELATIVA DE UMA CLASSE - f , I É a divisão da frequência simples desta classe pelo número total de elementos da série. Exemplo: Considere a distribuição de frequência: O total de elementos desta série é 40. Portanto, a frequência relativa da primeira classe é: Classe 1 2 3 4 Int. cl. 2 1 4 41 6 6 1 8 8 1 1 O fi 6 18 10 6 Séries Estatísticas 33 A frequência relativa da segunda classe é: A frequência relativa da terceira classe é: f3 10 f = - = - = 0,25 ou 25% e a frequência relativa da quarta classe é: r3 n 40 Observe que estes valores representam a participação percentual dos elementos por classe. A interpretação para estes valores é: - 15% dos valores da série são maiores ou iguais a 2 e menores que 4. - 45% dos valores da série são maiores ou iguais a 4 e menores que 6. - 25% dos valores da série são maiores ou iguais a 6 e menores que 8. - 15% dos valores da série são maiores ou iguais a 8 e menores que 10. 2.8.2 FREQUÊNCIA ACUMULADA DE UMA CLASSE - Fj É a soma da frequência simples desta classe com as frequências simples das classes anteriores. Desta forma, as frequências acumuladas para estas classes são: 34 Estatística 1 Estes valores podem ser interpretados da seguinte forma, lembrando que são todos maiores ou iguais a 2. - 6 elementos da série são valores menores que 4. - 24 elementos da série são valores menores que 6. - 34 elementos da série são valores menores que 8. - 40 elementos da série são valores menores que 10. 2.8.3 FREQUÊNCIA ACUMULADA RELATIVA DE UMA CLASSE - FR. I É a divisão da frequência acumulada desta classe pelo número total de elementos da série: Deste modo, a frequência acumulada relativa para cada classe é: Estes valores podem ser interpretados da seguinte forma, lembrando que são todos maiores ou iguais a 2: - 15% dos valores da série são menores que 4. - 60% dos valores da série são menores que 6. - 85% dos valores da série são menores que 8. - 100% dos valores da série são menores que 10. Quando acrescentamos estes valores a tabela original, esta passa a se chamar distribui~ãode frequências. Para o exemplo estabelecido, a distri- buição de frequências é: Séries Estatísticas 35 ~ - ~ p Exercícios Propostos O que é amplitude total de uma sequência de dados? O que é limite inferior de uma classe? O que é frequência simples de um elemento? O que é frequência relativa de um elemento? O que é frequência acumulada de um elemento? O que é frequência acumulada relativa de um elemento? O que é frequência simples de uma classe? O que é frequência relativa de uma classe? O que é frequência acumulada de uma classe? O que é frequência acumulada relativa de uma classe? Construa a distribuição de frequências para a série representativa da idade de 50 unos do primeiro ano de uma Faculdade. F % Ri 15 60 85 1 O0 Classe 1 2 3 4 I --cprefe os valores colocados na 3Vinha da distribui~ão de frequências do i --Yema anterior. - - - - - 1 molete o quadro. fi 6 18 10 6 Int. cl. 2 1 4 4 1 6 6 1 8 8 1 10 idade (anos) Xi 17 18 19 20 2 1 Número de alunos fi 3 18 17 8 4 f % ' i 15 45 25 15 5 6 24 34 40 36 Estatística 1 15. Interprete todos os valores da segunda linha da distribuição de frequências do problema anterior. 16. Construa a distribuição de frequências para a série abaixo que representa uma amostra dos salários de 25 funcionários selecionados em uma empresa. Número de acidentes por dia xi O 1 2 3 4 Número de dias fi 30 5 3 1 1 17. Interprete os valores obtidos na quarta linha da distribuição de frequências do problema anterior. 18. Construa a distribuição de frequências para a série abaixo que representa o saldo de 25 contas de pessoas fíçicas em uma agência em determinado dia. Classe 1 2 3 4 5 Classe Número de funcionlrios o I- 10.000,00 10.000,00 1- 20.000,00 3 20.000,OO 1- 30.000,OO 4 30.000,OO 1- 40.000,OO 2 19. Interprete os valores da terceira linha da distribuição de frequências do problema anterior. 20. Complete o quadro de distribuição de frequências. Salários US$ 1.000,00 1- 1.200,oo 1.200,OO 1- 1.400,OO 1.400,OO 1- 1.600,OO 1.600,OO 1- 1.800,OO 1.800,OO 1- 2.000,OO Número de funcionários fi 2 6 1 O 5 2 Classe 1 2 3 4 5 Int. cl. 6 1- 10 10 1- 14 14 1- 18 18 1- 22 22 1- 26 fi 1 2 f, YO 25 Fi 14 FR % 90 Séries Estatísticas 37 '2. Interpretações: 19 - Há alunos nesta classe com 19 anos. 17 - Há 17 alunos nesta classe com 19 anos. 34 - 34% dos alunos desta classe têm 19 anos. 38 - Nesta classe há 38 alunos com 19 anos ou menos. 76 - 76% dos alunos desta classe têm 19 anos ou menos. '3. Idade (anos) xi 17 18 19 20 2 1 frl % 6 36 34 16 8 Número de alunos fl 3 18 17 8 4 40 $5. Interpretações: 1 - Há dias em que ocorre um acidente por dia neste cruzamento. 5 - Em cinco dias dos 40 observados, ocorreu um acidente por dia. 12,5 - 12,5% dos dias observados ocorreu um acidente por dia. 35 - Em 35 dias dos 40 observados ocorrereu um ou nenhum acidente por dia neste cruzamento. 87,5 - 87,5 % dos dias observados ocorreram um ou nenhum acidente por dia neste cruzamento. ' 6. Número de acidentes por dia: xl - O 1 2 3 4 FI 3 21 38 46 50 FRI % 6 42 76 92 1 O0 Número de dias fl 30 5 3 I 1 FRl % 8 32 72 92 1 O0 Classe 1 2 3 4 5 frl % 75 12,5 7 3 2,s 2.5 Salários US$ 1.000,OO 1- 1.200,OO 1.200,OO 1- 1.400,OO 1.400,OO 1- 1.600,OO 1.600,OO I- 1.800,OO 1.800,OO 1- 2.000,OO FI 30 35 38 39 40 FRi % 75 87,5 95 97,5 1 O0 Número de funcionários fi 2 6 1 O 5 2 frl % 8 24 40 20 8 FI 2 8 18 23 25 38 Estatística 1 17. Interpretações: 4 - Estamos enfocando na ordem crescente a quarta classe de salários desta empresa. 1.600,00 1- 1.800.00 - 0 s salários desta classe são maiores ou iguais a US$ 1.600,00 e menores que US$1.800,00. 5 - Há cinco funcionários com salários maiores ou iguais a US$ 1.600,00 e menores que US$ 1.800,OO. 20 - 20% dos funcionários selecionados têm salários maiores ou iguais a US$1.600,00 e menores que US$ 1.800,OO. 23 - Há 23 funcionários entre os selecionados com salários menores que US$1.800,00. 92 - 92% dos funcionários selecionados têm salários menores que US$ 1.800,OO. 18. 19. Interpretações: 3 - Estamos enfocando, na ordem crescente, a terceira faixa de saldos nas contas das pessoas físicas. 20.000,OO 1- 30.000,OO - Os valores desta faixa compreendem valores maiores ou iguais a US$ 20.000,OO e menores que US$30.000,00. 8 - Há oito contas entre as pesquisadas com saldos maiores ou iguais a US$20.000,00 e menores que US$30.000,00. 32 - 32% das contas pesquisadas têm saldos maiores ou iguais a US$20.000,00 e menores que US$ 30.000,OO. Classe 1 2 3 4 23 - Há 23 contas entre as pesquisadas com saldos menores que US$30.000,00. 92 - 92% das contas pesquisadas têm saldos menores que US$30.000,00. Número de contas f, 5 1 O 8 2 Saldos US$ o I- 1 o.ooo,oo 10.000,OO 1- 20.000,OO 20.000,OO 1- 30.000,OO 30.000,OO 1- 40.000,OO Int. cl. 10 1- 3 14 1- 18 8 40 4 18 1- 22 4 20 5 22 1- 26 2 1 O 2.1 0 Representação Gráfica de Séries Estatísticas Existem muitas formas de se representar graficamente uma série es- tatística. Podemos citar entre elas: gráfico em linhas; em colunas; em barras, em setores; em porcentagens complementares; gráficos polares; gráficos pictóri- cos, cartogramas etc. FRi % 20 60 92 1 O0 fr, % 20 40 32 8 FI 5 15 23 25 Séries Estatísticas 39 -10 entanto, a maioria deles são simplesmente gráficos de apresenta- cão, que o interessado com pequeno esforço poderá facilmente compreender. Nosso interesse estará completamente voltado para os gráficos de análise da série estatística que são: Histograma, Polígono de frequência e a curva polida de frequência. Estas representações gráficas assumem aspectos diferenciados para variável discreta e variável contínua. É um conjunto de hastes, representadas em um sistema de coordena- das cartesianas que tem por base os valores distintos da série (xi) e por altura, valores proporcionais as frequências simples correspondentes destes elemen- tos (fí). Exemplo: Se considerarmos a série: então o histograma assume a forma: fi t 40 Estatística 1 É um conjunto de retângulos justapostos, representados em um siste- ma de coordenadas cartesianas, cujas bases são os intervalos de classe e cujas alturas são valores proporcionais as frequências simples corresponden- tes. Exemplo: Se considerarmos a série: então o histograma assume a forma: ' i f Classe 1 2 3 4 5 i Observe que não colocamos o zero no eixo horizontal na origem do sistema por uma questão de clareza da representação gráfica. Deixamos, intencionalmente, um espaço igual a um intervalo de classe no início e no final da representação gráfica. Int. cl. o 1 2 2 1 4 4 1 6 6 1 8 8 1 1 O Se considerarmos este espaçamento inicial e final como sendo classes fictícias com frequência zero e unirmos os pontos médios das bases supe- riores destes retângulos, obtemos uma nova figura chamada polígono de frequência. f,. 3 6 8 5 2 Séries Estatísticas 41 fi t 0 2 4 6 8 1 0 lnt. cl. i Observe que a área do polígono de frequência é a mesma área do -,i~tograma. i Quando estamos lidando com um censo, o histograma representa !;retamente a distribuição de frequência da população, mas quando estamos dando com uma amostra, a histograma representa apenas a distribuição de -equência da amostra e não da população. No entanto, se imaginarmos o número n de elementos da amostra iumentando progressivamente, o número de classes iria aumentando pro- :ressivamente e a amplitude do intervalo de classe iria diminuindo, o que -ansformaria o polígono de frequência praticamente em uma figura polida, :+amada curva polida de frequência. Esta figura nos dará uma noção da distribuição de frequênciada popu- 3920. 0 2 4 6 8 1 0 lnt. cl. 42 Estatística 1 2.1 1 Exercícios Propostos 1. Conceitue histograma para uma variável discreta. 2. Conceitue histograma para uma variável contínua. 3. Quando a série representa uma amostra qual é o principal objetivo da construção do histograma ? 4. Construa um histograma para a distribuição de frequência: 5. Construa um histograma para a série representativa da idade de 50 alunos do primeiro ano de uma Faculdade: 6. Construa um histograma para a série representativa do número de acidentes por dia observados em determinado cruzamento, durante 40 dias: Idade (anos) Xl 17 18 19 20 21 Número de alunos fl 3 18 17 8 4 7. Construa um histograma para a série representativa de uma amostra dos salários de 25 funcionários selecionados em uma empresa. Número de acidentes por dia Xl O 1 2 3 4 Número de dias fi 30 5 3 1 1 8. Construa o polígono de frequência para a distribuição do problema anterior. Classe 1 2 3 4 5 Salários US$ 1.000,oo 1- 1.200,oo 1.200,OO 1- 1.400,OO 1.400,OO 1- 1.600,OO 1.600,OO 1- 1.800,OO 1.800,OO 1- 2.000,OO Número de funclon~rios fl 2 6 10 5 2 Séries Estatísticas 43 Construa um histograma para a série representativa do saldo de 25 contas de pessoas físicas em uma agência em determinado dia. Classe Número de contas o I- 1 o.ooo,oo 10.000,00 1- 20.000,00 20.000,OO 1- 30.000,OO 4 30.000,OO 1- 40.000,OO 2 - 7 Construa o polígono de frequência para a distribuição do problema anterior. 44 Estatística 1 I .ooo,oo I .200,00 I .400,00 I .600,00 I .aoo,oo 2.000,00 Salários I .I oo,oo 1.300,oo 1.500,oo 1.700,oo 1.900,oo Salários Séries Estatísticas 45 o I o.ooo,oo 20.oo0,oo 30.000,OO 40.000,OO Saldos 3f Medidas de Tendência Central 3.1 Introdução No estudo de uma série estatística é conveniente o cálculo de algumas medidas que a caracterizam. Estas medidas, quando bem interpretadas, podem fornecer-nos infor- mações muito valiosas com respeito a série estatística. Em suma, podemos reduzi-la a alguns valores, cuja interpretação for- nece-nos uma compreensão bastante precisa da série. Um destes valores é a medida de tendência central. É um valor intermediário da série, ou seja, um valor compreendido entre o menor e o maior valor da série. É também um valor em torno do qual os elementos da série estão distribuídos e a posiciona em relação ao eixo horizontal. Em resumo, a medida de tendência central procura estabelecer um número no eixo horizontal em torno do qual a série se concentra. As principais medidas de tendência central são: média, mediana e moda. No cálculo de várias medidas estatísticas, vamos utilizar somas de um grande número de parcelas. Para facilitar a representação destas somas, introduziremos o conceito de somatório. 3.2 Somatório - Notação Sigma (C ) Quando queremos representar uma soma de n valores do tipo x, + x2 + ... + x,, podemos codificá-la através da expressão: Medidas de Tendência Central 47 1 ide: X - é utilizada para representar as operações de adição entre as parcelas. xi - é a parcela genérica A parcela genérica é obtida tomando-se os termos constantes em -:das as parcelas, no caso x. Para representar a parte variável em cada zsrcela, no caso os índices, utilizamos a letra i e indicamos a variação de i. 'do exemplo i varia, segundo números inteiros consecutivos de 1 até n.) n A expressão C xi deve ser lida "soma dos valores xi, para i varian- ) de 1 até n." i= 1 Para que uma soma possa ser representada por esta notação é funda- ~ e n t a l que i assuma todos os valores inteiros consecutivos entre dois valores 2sdos. Assim, a soma: 4 X, + X2 + X4 # C Xi i= 1 Exemplos: 48 Estatística 1 Da mesma forma que codificamos a soma através da notação Sigma, podemos decodificar obtendo as parcelas componentes. 4 Para obter a primeira parcela da soma: C (3xJ i = 2 basta substituir na parcela genérica 3x, a variável i pela valor indicado no extremo inferior, i = 2. A primeira parcela da soma é 3x2. Para obter a segunda parcela, basta substituir na parcela genérica 3x, a variável i por 3. A segunda parcela vale 3x3. A última parcela da soma é obtida quando substituímos na parcela genérica 3xi o valor de i por 4, que é o valor indicado no extremo superior. A última parcela é 3x4. 4 Portanto, C (3x> = 3x2 + 3x3 + 3x4. i = 2 Exemplos: 3 3 3 3. C (x, b) = (x, - b) + (x2 - b13 + (x3 - b13 , i = 1 Apesar de ser apenas um código e não uma operação, a notação Sigma tem algumas propriedades que podem simplificar operações. Entre elas destacamos: Medidas de Tendência Central 49 1. O somatório de uma soma é a soma dos somatórios. n De fato, se desenvolvermos C (xi + yi) obtemos: i= 1 n 2. O somatório de uma diferença é a diferença dos somatórios. A demonstração é análoga a anterior. 3. O somatório do produto de uma constante por uma variável é o produto da constante pelo somatório da variável. n Considerando a um número real qualquer e desenvolvendo ( a . x,), obtemos: i= I 50 Estatística 1 n C ( a . x i ) = ax, +ax2+ax3+ ... +axn = i = 1 n = a . (x1 +x2+x3+. . . + x n ) = a . C xi i= 1 4, O somatório da divisão de uma variável por uma constante é a divisão do somatório da variável pela constante. n De fato, desenvolvendo Um caso particular da notação Sigma é a representação de uma soma cujas parcelas são todas iguais. Neste caso, as parcelas são constituídas por valores constantes e a variável iserá utilizada apenas para estabelecer o número de parcelas. O número de parcelas é determinado pela diferença entre o valor de i indicado no extremo superior e o valor indicado no extremo inferior, adicionan- do-se uma unidade. Assim, a soma 15 + 15 + 15 + 15 pode ser representado por: 4 5 6 15 oupor C 15 o u x 15 i = 1 i = 2 -- i = 3 1 Notéque em todos os casos a diferença entre o valor de i indicado no extremo superior e o valor de i indicado no extremo inferior, acrescida de uma I unidade conduz a 4, que é o número de parcelas. Medidas de Tendência Central 51 Desta forma, 3 é constituída de (7 - 2) + 1 = 6 parcelas. Portan- to: i = 2 i Nas aplicações estatísticas estaremos sempre interessados na soma de todos os valores da série. Portanto, i varia sempre de 1 a n e conseqüentemente não precisaremos indicar na notação sigma a variação de i. Desta forma, identificaremos: Isto facilita a apresentação das fórmulas de cálculos. 3.3 Exercícios Propostos I . Escreva na notação Sigma, as somas: a) x l+x2+x3+x4+x5 6) x3+x4+x5+xs c) (x, + 2) + (x* + 2) + (x3 + 2) d) (x,- 10)+(x2- 10)+(x3- 10)+(x4- 10) e) (xI - 3)2 + (x2 - 312 + (x3 - 3)' (x,-15ff,+(x2-15ff2+(x3-15ff3 2. Escreva as parcelas da soma indicada. 52 Estatística 1 3. Calcule para a tabela abaixo, o valor numérico das somas indicadas: I 4. Usando as propriedades do somatório, desenvolva: 5. Usando a tabela do problema 3, verifique que: Medidas de Tendência Central 53 SESPOSTAS 3. a) C xi f i = 60 C xi C f i = 252. Portanto, xi f i # C xi f i c) C 4 = 125 (C x$ = 441. Portanto, 4 + (C xj2 54 Estatística 1 3.4 Médias Do ponto de vista teórico, vários tipos de média podem ser calculados para uma massa de dados. Focalizaremos neste estudo as médias aritméticas geométricas e har- mônicas. 3.4.1 MÉDIA ARITMETICA SIMPLES Para uma sequência numérica X x,, x2, ......, x,, a média aritmética simples, que designaremos por X é definida por: 2 + 0 + 5 + 3 Exemplo: Se X 2, 0, 5, 3, então X = - 4 Para uma sequência numérica X x,, x2: ...... , xn afetados de pesos p,, p2, ......., pn, respectivamente, a média aritmetica ponderada, que designare- mos por X, é definida por: Exemplo: Se X: 2, 4, 5, com pesos 1, 3, 2 respectivamente, então: Medidas de Tendência Central 55 3.4.3 MÉDIA GEOMÉTRICA SIMPLES Para uma sequência numéricaX xl, x2, ......, xn, a média geométrica simples, que designaremos por % é definida por: Exemplo: Se X: 2, 4, 6, 9, então: 3.4.4 MÉDIA GEOMÉTRICA PONDERADA Para uma sequência numérica X: xl,x2, ..., X, afetados de pesos pl, c)2,..2 pn respectivamente, a média geométrica ponderada que designaremos por Xg é definida por: Exemplo: Se X: 1, 2,5 com pesos 3, 3, 1 respectivamente, então: 3.4.5 MÉDIA HARMONICA SIMPLES Para uma sequência numérica de elementos não nulos X: x,, x2, ..., x,, a média harmônica simples, que designaremos por %, é definida por: Note que a média harmônica é o inverso da média aritmética dos inversos dos elementos. Exemplo: Se X: 2, 5, 10, então: 3.4.6 MÉDIA HARMONICA PONDERADA Para uma sequência numérica de elementos não nulos X: xl, x2, ..., xn afetados de pesos pl, p2, ... p,,, respectivamente, a média harmônica pondera- . . da que designaremos por xh é definida por: Medidas de Tendência Central 57 Exemplo: Se X: 2, 4, 12 com pesos 3, 2,2 respectivamente, então: Observando-se que: 1. A média harmônica aplica-se naturalmente quando se quer a ob- tenção de uma média cuja unidade de medida seja o inverso da unidade de medida dos componentes da sequência original. 2. A média geométrica só é indicada para representar uma série de valores aproximadamente em progressão geométrica. 3. Os casos anteriores não são muito frequentes nas aplicações. Va- mos restringir o desenvolvimento de médias ao caso de média aritmética, que é a média mais utilizada nas aplicações. 3.5 Cálculo da Média Aritmética I fTaso - DADOS BRUTOS OU ROL Neste caso, devemos utilizar uma média aritmética simples: Exemplo: Calcule a média da variável X: 3, 5, 8, 12, 7, 12, 15, 18, 20, Interpretagão: O valor médio desta série é 12, ou seja, os valores desta série concentram-se em torno do valor 12. 58 Estatística 1 2Taso - VARIÁVEL DISCRETA Se os dados estão apresentados na forma de uma variável discreta, utilizaremos a média aritmética ponderada, considerando as frequências sim- ples fi como sendo as ponderações dos elementos xi correspondentes. C x, P, A fórmula de cálculo de Xque originalmente era 2 = 7 rn passa a ser escrita como: L ri Exemplo: Determinar a média da distribuição: Solução: Inicialmente devemos somar a coluna de frequências simples para obter o número total de elementos da série: C f i = 10 elementos. Em seguida, utilizamos a própria disposição da tabela para efetuar os produtos xi f , acrescentando estes valores dispostos em uma nova coluna. Em seguida somamos os valores desta coluna. Na sequência substituímos estes valores na expressão Xobtendo: Medidas de Tendência Central 59 Interpreta~ão: O valor médio da série é 5,6, isto é, 5,6 é o ponto de ::~centração dos valores da série. F Caso - VARIÁVEL CONT~NUA Se os dados estão apresentados na forma de uma variável continua, -:-izaremos a média aritmética ponderada, considerando as frequências sim- : ss das classes como sendo as ponderações dos pontos médios destas : asses. O ponto médio, de cada classe é definido por: 2 Xi Pi A fórmula de cálculo de Rque originalmente era 2 = - passa a s r escrita como: L Pi Exemplo: Determinar a média da distribuição: Solu~ão: Inicialmente, devemos somar a coluna das frequências sim- ples, obtendo f j . = 20. Classe 1 2 3 4 Na sequência, calculamos os pontos médios de classe: o ponto médio da primeira classe é = 3,5; O ponto médio da segunda classe é = 6,5; o ponto médio da terceira classe é = 9,5 e o ponto médio da 2 11+14 - quarta classe é 2- - 12,5. Int. cl. 2 1 5 5 1 8 8 1 11 11 I 14 fi 1 10 8 1 60 Estatística 1 Estes valores serão dispostos em uma nova coluna na tabela. Como no caso anterior, usaremos a própria tabela para a sequência de cálculos. - xj fi - C f i 157 - 7,85 Portanto, X = - - - - 20 Classe 1 2 3 4 Interpretação: O valor médio desta série é 7,85, isto é, 7,85 é o valor em torno do qual os elementos desta série se concentram. COMENTÁRIO: Quando agrupamos os dados na disposição de uma variável contínua, passamos a trabalhar com os dados sem conhecimento de seus valores individuais. Note no exemplo acima, que o máximo que podemos afirmar com respeito ao menor valor desta série é que ele é um valor maior ou igual a 2 e menor que 5. Mas não conhecemos seu valor individualizado. O mesmo ocorre com todos os outros valores da série. Este fato é que nos leva a substituir as classes pelos seus pontos médios ao calcular a média da série. 3.6 Exercícios Propostos Int. cl. 2 1 5 5 1 8 8 1 11 11 I 14 1. Calcule a média aritmética da série: (a)X: 1,2,8, 10, 12, 16,21,30. (b) Y: 5, 6, 6, 10, 11, 11, 20. (c) Z: 3,4; 7,8; 9,23; 12,15. 2. Um produto é acondicionado em lotes contendo cada um deles 10 unidades. O lote só é aprovado se apresentar um peso superior a 40 quilos. Se as unidades que compõem determinado lote pesam: 3; 4; 3,5; 5,O; 3,5; 4; 5; 5,5; 4; 5, este lote será aprovado? Qual o peso médio do produto? 3. Calcule a média geométrica para as séries: X: 1, 2, 4, 7, 16 Y: 81, 26, 10, 3, 1 fi 1 10 8 1 xi 3,5 6,5 9,5 12,5 xi fi 3,5 65 76 12,5 vitor Seta vitor Seta Medidas de Tendência Central 61 2 Calcule a média harmônica da série: I Um produto é vendido em três supermercados por $ 13,00/kg, $ 13,20/kg e $ 13,50/kg. Determine quantos $/kg se paga em média pelo produto. I Um produto é vendido em três supermercados por $ 130/kg, $ 132/kg e $ 135/kg. Determine, em média quantos quilos do produto se compra com $1,00. - Calcule a média harmônica da série 130, 132, 135. ? Calcr~le a média aritmética da série: I . Calcule a média geométrica da série anterior. ' :. Calcule a média harmônica da série anterior. - Verifique pelos cálculos anteriores qual relação é válida entre estas médias. '2. Uma loja vende cinco produtos básicos A, B, C, D, E. O lucro por unidade comer- cializada destes produtos vale respectivamente $200,00; $300,00; $500,00; $ 1.000,OO; $ 5.000,OO. A loja vendeu em determinado mês 20; 30; 20; 10; 5 unidades respectivamente. Qual foi o lucro médio por unidade comercializada por esta loja? -3. Um caminhão cujo peso vazio é 3.000 kg será carregado com 480 caixas de 10 kg cada, 350 caixas de 8 kg cada, 500 caixas de 4 kg cada e 800 caixas de 5 kg cada. O motorista do caminhão pesa 80 kg e a lona de cobertura da carga pesa 50 kg. (a) Se este caminhão tem que passar por uma balança que só permite passa- gens a caminhões com peso máximo de 15 toneladas, este caminhão passará pela balança? (b) Qual o peso médio das caixas carregadas no caminhão? 1 I ' 2 . Calcule a idade média dos alunos de uma classe de primeiro ano de determinada Faculdade, em anos. vitor Nota sinalizadora 11) D vitor Seta vitor Seta vitor Seta vitor Seta vitor Seta 7- 62 Estatística 1 15. Calcule o número médio de acidentes por dia em uma determinada esquina. Idade (anos) Xl 17 18 19 20 2 1 NQ de alunos fl 3 18 17 8 4 16. O salário de 40 funcionários de um escritório está distribuído segundo o quadro abaixo. Calcule o salário médio destes funcionários. N q e acidentes por dia: x, O 1 2 3 4 NQ de dias fr 30 5 3 1 1 17. Uma imobiliária gerencia o aluguel de residências particulares, segundo o quadro abaixo: Classe 1 2 3 4 5 6 Calcule o aluguel,médio para estas residências. Salários $ 400,OO 1- 500,OO 500,OO 1- 600,OO 600,OO 1- 700,OO 700,OO 1- 800,OO 800,OO 1- 900,OO 900,OO 1- 1.000,OO Classe 1 2 3 4 5 18. Uma empresa de aviação observou em seus registros recentes, o tempo de mão- de-obra gasto na revisão completa de um motor de jato. NQ de funcionhrios r, 12 15 8 3 1 1 O seguinte quadro foi obtido: Aluguel $ O I- 200,OO 200,OO 1- 400,OO 400,OO 1- 600,OO 600,OO 1- 800,OO 800,OO 1- 1 .OOO,OO NQ de casas fl 30 52 28 7 3 Classe 1 2 3 4 5 Tempode mão-de-obra (horas) o I- 4 4 1- 8 8 I- 12 12 1- 16 16 1- 20 No de motores f~ 1 5 1 O 12 4 vitor Seta vitor Seta Medidas de Tendência Central 63 a) Determine o número médio de horas de mão-de-obra necessário para a revi- são de cada motor. b) Com base nesta informação, qual deve ser o tempo total de mão-de-obra para a revisão de dez motores que aguardam revisão? c) Se a empresa dispõe no momento de dois homens trabalhando 12 horas por dia nestas revisões conseguirá provavelmente revisar estes dez motores em quatro dias? ?. Uma empresa de âmbito nacional, fornecedora de supermercados, fez um levanta- mento do consumo de seu principal produto em vários supermercados obtendo em determinado mês, a tabela: Determine o consumo médio deste produto'por supermercado pesquisado. Classe 1 2 3 4 5 6 13. Uma pesquisa para determinar a eficiência de uma nova ração para animais, em termos de ganho de peso, mostrou que após um mês em que a ração normal foi substituída pela nova ração, os animais apresentaram um aumento de peso se- gundo a tabela: Número de unidades consumidas O I- 1.000 1.000 1- 2.000 2.000 1- 3.000 3.000 1- 4.000 4.000 1- 5.000 5.000 I- 6.000 a) Calcular o aumento médio de peso por animal. b) Se a ração antiga proporcionava em iguais circunstâncias um aumento médio de peso de 3.100 kg/animal, esta nova ração pode a princípio ser considerada mais eficiente? No de supermercados fi 1 o 50 200 320 150 30 1'. Refaça o problema anterior acrescentando a todos os limites de classe mais 2 kg. Compare a média com a média anterior, Ng de animais fi 1 5 35 37 28 Classe 1 2 - 1 =xercicios Especiais Aumento de peso em kg o 1- 1 1 I- 2 2. Prove que se X: x,, x2 ,,.., xn e a E R, então x + a = X + a 13. Prove que se X: x,, x2 ,..., xn e a E R, então x - a = x - a 22. Prove que se X: x,, x2 ,..., xn e a E R, então CX = a . F 25. Prove que se X: x,, x2 ,..., xn , a E R e a # 0, então = 'Ya 2 I- 3 3 1- 4 4 1- 5 64 Estatística 1 n 26. Mostre que a média geométrica simples X = 4 x, x2 . . . xn também pode ser calculada por 9 Z ln x - i - X = e n 9 C f i 27. Mostre que a média geométrica ponderada kg = 4 x, '1 x,% . . . xnfn também pode ser calculada por: Z ( f , ln X ) - X = e "'i 9 z xifi 28. Mostre que a média ponderada 2 = - pode também ser calculada no caso de uma variável continua pela fórmula: ' fi onde: xo é o ponto médio de classe de uma classe qualquer escolhida. I ai são valores de uma nova variável obtidos pela transformação ai = - h Esta fórmula é chamada Processo Breve do Cálculo da Média. 29. Calcule a média da tabela do problema 16, usando o Processo Breve. 30. Calcule a média da tabela do problema 17, usando o Processo Breve. RESPOSTAS 1. a) 12,5 b) 9,857 c) 8,145 2. Sim. = 4,25 3. a) 3,8946 b) 9,1225 4. a) 9,6 b) 3,36 5. 13,33/kg 6. O, 0075585 kg/$ 7. 132,3015kg 8. 3,6 9. 3,478 1 O. 3,352 17. d 12. 682,35/peça 13. a) Não b) 6,385 kg 14. 18,84 anos/aluno 15. 0,45 ac/dia 1 6. $572,5/f 17. $335/res 18. a)11,625h b) 116,25h C) não 19. 3.342,l unid. 20. a) 3.37 7 kg b) Sim. 21. a) 5,311 kg. A m6dia da nova série é a média da série antiga acrescida de duas unidades. b) Sim. vitor Seta vitor Seta vitor Seta vitor Seta vitor Seta vitor Seta vitor Seta vitor Seta vitor Seta Medidas de Tendência Central 65 L xi na C xi - - - + - = - + a = F + a n n n Da mesma forma demonstram-se, usando propriedades do somatório, os próximos exercícios. - n X = 4 xl 3 . . . x, . Portanto, - 1 In Xg = In (x, 3 . . . x,) n . Usando as propriedades do logaritmo: 1 ln Xg = - (ln x,+In % + . . . + h x,) n - C l n x i I n X =- n . Aplicando a operação antilogaritmo, obtemos: - C' i - - . x = 4 x, '1 3% ... xntn . portanto, 9 - ln Xg = ln (x, '1 $5 . . . x,'n)q . Usando as propriedades do logaritmo: - 1 f ln X = - ln ( x l f i ~ 5 ... x,n) = g C' i - 1 f f In X g = - ( I n x, l+In x22+ ...+ Inx,'n)= C 'i - 1 ln X = - (f, In x, f, + In x2 + ... + f, ln x,) = g C f , - C f i I n x j I n X =- . Aplicando a operação antilogaritmo obtemos: g C ' i - Z a, 5 xj - xo 23. X = xo + - . h . Como q = - h , substituindo-se, obtém-se: L r; 1 - [ f x O C ~ + - C ( x j - x J f , h X = x o + h . h = h C f , C f , 66 Estatística 1 3.7 Mediana É um valor real que separa o rol em duas partes deixando a sua esquerda o mesmo número de elementos que a sua direita. Portanto, a me- diana é um valor que ocupa a posição central em uma série. Notação: A mediana será denotada por md 3.8 Cálculo da Mediana 1" Caso - DADOS BRUTOS OU ROL Inicialmente devemos ordenar os elementos caso sejam dados bru- tos, obtendo o Rol. Em seguida determinamos o número n de elementos do Rol. 1.1. Se n é impar - O Rol admite apenas um termo central que ocupa a posição " + ' Y 0 valor do elemento que ocupa esta posição é a mediana. ( 7 1 Exemplo: Determinar a mediana do conjunto: Solução: Ordenando estes elementos obtemos o rol. X: 2, 8, 12, 12, 20, 20,23. O número de elementos é n = 7 (ímpar), a posição do termo central é [F] 0 = 40. A mediana é o quarto elemento do Rol: md = 12. O valor 12 deixa a sua esquerda e à sua direita o mesmo número de elementos, sendo, portanto, o elemento central da série. Quando lidamos com sériss com urn grailde número de elementos, a quantidade de elementos à esquerda é â direita é aproximadamente 50% do total de elementos, o que conduz a veguinie interpreta~ão genérica para a mediana: "50% dos valores da série são valores menores ou iguais a 12 e 50% dçzs valores da série são valor?s maiores ou iguais a 12". 1.2. Se n é par - Neste caso, o rol admite dois termos centrais que ocupam as posições ("/2)O e ("/2 + l)O. A mediana é convencionada como sendo a média dos valores que ocupam estas posições centrais. Medidas de Tendência Central 67. Exemplo: Determinar a mediana da série: X:7, 21, 13, 15, 10, 8, 9, 13. Solução: Ordenando estes elementos, obtemos o rol: X 7, 8, 9, 10, 13, -3, 15,21: O número de elementos é n = 8 (par). As posições dos termos centrais são: (8/2)" 44" e (8/2 + 1)" s5" O elemento que ocupa a quarta posição na série é 10 e o elemento z.ie ocupa a quinta posição é 13. Portanto, Interpretação: 50% dos valores do rol são valores menores ou iguais a -: ,5 e 50% dos valores do rol são valores maiores ou iguais a 11,5. P Caso - VARIÁVEL DISCRETA Se os dados estão apresentados na forma de uma variável discreta, 5'ss já estão naturalmente ordenados. Assim, basta verificar se o número de elementos da série é ímpar ou i z r e aplicar o mesmo raciocínio do caso anterior. Para facilitar a localização dos termos centrais, construímos a frequên- s acumulada da série. Exemplo 1: Determinar a mediana da série: Solução: O número de elementos da série é n = C fi = 23 (ímpar). Portanto, a série admite apenas um termo central que ocupa a posição 3 4 1 o -)- = 129. 2 Construindo a frequência acumulada podemos localizar com facilidade : décimo segundo elemento da série. 68 Estatística 1 Note que o elemento que ocupa a primeira posição na série é 2. Em seguida aparecem quatro elementos iguais a 5. Estes elementos ocupam na série as posições de segundo a quinto. Depois aparecem mais dez elementos iguais a 8 que ocupam na série as posições de sexto a décimo quinto. Conseqüentemente, o elemento que ocupa a décima segunda posição vale 8, e podemos afirmar que md= 8. Interpretação: 50% dos valores da série são menores'ou iguais a 8 e 50% dos valores da série são maiores ou iguais a 8. Exemplo 2: Calcular a mediana da série: Solução: O número de elementos da série é 32 (par) e a série admite dois termos centrais que ocupam as posições: (32/2)" leO e (32/2 + l)o = 17°.. Para localizar estes elementos, construímos a frequência acumulada da série. Medidas de TendênciaCentral 69 As três primeiras posições da série são ocupadas por elementos iguais 2 3. Da quarta a oitava posição os elementos são iguais a 1. Da nona a :+cima sexta posição os elementos são iguais a 2. Da décima sétima a - lésima sexta posição os elementos valem 3. Portanto, o elemento que ocupa a décima sexta posição é 2 e o ele- -rnto que ocupa a décima sétima posição é 3 e, consequentemente, a me- : m a é: Interpreta@o: 50% dos valores da série são valoreqmenores ou iguais i e 50% dos valores da série são valores maiores ou i&ais a 2,5. F Caso - VARIÁVEL CONT~NUA Se a dados são apresentados na forma de uma variável contínua, o ~ciocínio anterior não pode ser utilizado, uma vez que mesmo identificada a zzsição da mediana na série, o valor do elemento da série que ocupa esta i x i ção não é identificável. Utilizaremos um exemplo, para generalizar a fórmula de cálculo da -ediana. Considere a distribuição de frequência: O número de elementos da série é n = Ç fí = 19. A mediana, por definição, separa o número de elementos da série em dois grupos, contendo cada um deles 50% dos elementos. Portanto, a posição da mediana na série é "/2. No exemplo (I%)" 9,5"., O valor decimal 9,5 indica que a mediana é um elemento posicionado rntre o nono e o décimo elemento da série. Classe 1 2 3 4 5 Int. cl. 3 1 6 6 1 9 9 1 12 12 1 15 15 1 18 f j 2 5 8 3 1 70 Estatística 1 Construiremos a frequência acumulada para identificar em qual classe estão situados o nono e o décimo elemento da série. Note que o nono e o décimo elementos estão posicionados na terceira classe, o que indica que a mediana é um valor compreendido entre 9 e 12. A classe que contém a mediana será identificada como classe mediana. Este intervalo de três unidades contém oito elementos. Supondo que eles estão uniformemente distribuídos neste intervalo, então poderemos dividir este intervalo de modo proporcional a posição da mediana na série. 15- 7 9,5-7 - Ou seja: - - - 3 . Simplificando: X Classe 1 2 3 4 5 Portanto: m d = 9 + x fi 2 5 8 3 1 Int. cl. 3 1 6 6 1 9 9 1 12 12 1 15 15 1 18 Observando na fórmula em destaque acima que: fA 2 7 15 18 19 - 9 é o limite inferior da classe mediana. - 9,5 é a metade dos elementos da série, isto é, "/2. - 7 é a frequência acumulada da classe anterior a classe mediana. - 8 é a frequência simples da classe mediana. Medidas de Tendência Central 71 - 3 é a amplitude do intervalo de classe, poderemos generalizar a fórmula de cálculo da mediana para variável contínua: Im, - limite inferior da classe mediana. n - número de elementos da série. Fant- Frequência acumulada da classe anterior a classe mediana. fmd - frequência simples da classe mediana. h - amplitude do intervalo de classe. COMENTÁRIO: Devido as condições impostas na obtenção da fórmu- a da mediana, fica evidente que o valor obtido pela fórmula é um valor zproximado do verdadeiro valor da mediana da série. De modo geral, todas as medidas calculadas para uma variável contí- lua serão valores aproximados para estas medidas, uma vez que ao agrupar- 70s os dados segundo uma variável contínua, há perda de informações quan- :3 a identidade dos dados. 3.9 Exercícios Propostos . Calcule a mediana da sequência: a) X:2,5,8, 10, 12, 15,8,5, 12 b) Y:3,4;5,2;4,7;6;8,4;9,3;2,1;4,8 2. Interprete os valores obtidos no exercício anterior. 3. Calcule a mediana da distribuição. vitor Seta vitor Seta vitor Seta 72 Estatística 1 4. Calcule a mediana da distribuição do número de acidentes por dia, observados em determinado cruzamento, durante 40 dias. por dia de dias 4 1 5. Interprete o valor da mediana obtida no problema anterior: 6. Calcule a mediana para a série representativa da idade de 50 alunos de uma classe do primeiro ano de uma Faculdade. 7. Inferprete o valor obtido para a mediana no problema anterior. 8. Uma máquina produz peças que são embaladas em caixas contendo 48 unidades. Uma pesquisa realizada com 59 caixas, revelou a existência de peças defeituosas seguindo a tabela: Determine o valor mediano da série. NQ de peças defeituosas por caixa o 1 2 3 4 5 9. Interprete o valor obtido no problema anterior. Número de caixas 20 15 12 6 4 2 10. Determine o valor mediano da distribuição a seguir que representa os salários de 25 funcionários selecionados em uma empresa. vitor Seta vitor Seta vitor Seta vitor Seta vitor Seta vitor Seta vitor Seta I Medidas de Tendência Central 73 Classe Salários $ NP de funcionários 1 .ooo,oo 1- 1.200,oo 1.200,OO 1- 1.400,OO 0 1.400,OO 1- 1.600,OO 10 4 1.600,OO 1- 1.800,OO 5 5 1.800,OO 1- 2.000,OO 2 ' '. Interprete o valor mediano obtido no problema anterior. -2. Uma loja de departamentos, selecionou um grupo de 54 notas fiscais, durante um dia, e obteve o seguinte quadro: Determine o valor mediano da série. - 3. Interprete o valor obtido. No de notas 1 O 28 12 2 1 1 Classe 1 2 3 4 5 6 -4 O departamento de recursos humanos de uma empresa, tendo em vista o aumen- to de produtividade de seus vendedores, resolveu, premiar com um aumento de 5% no salário, a metade de seus vendedores mais eficientes. Para isto, fez um levantamento de vendas semanais, por vendedor, obtendo a tabela: Consumo por nota $ O I- 50 50 1- 1 O0 100 1- 150 150 1- 200 200 1- 250 250 1- 300 Classe Vendas $ NP de vendedores 10.000 10.000 1- 20.000 3 20.000 1- 30.000 27 4 30.000 1- 40.000 31 5 40.000 1- 50.000 1 O A partir de qual volume de vendas o vendedor será premiado? - - 2. O consumo de energia elétrica verificado em 250 residências de famílias da classe média, com dois filhos, revelou a distribuição: Calcule a mediana da distribuição. ' 3. Interprete o valor obtido. Classe 1 2 3 4 5 6 7 Consumo kwh O I- 50 50 1- 1 O0 100 1- 150 150 1- 200 200 1- 250 250 1- 300 300 1- 350 NQ de familias 2 15 32 47 50 80 24 vitor Seta 74 Estatística 1 RESPOSTAS 1. a)m,=8 b)m,=5 2. a) 50% dos valores da série são menores ou iguais a 8 e 50% são valores maiores ou iguais a 8. b) 50% dos valores da série são menores ou iguais a 5 e 50% dos valores da série são maiores ou iguais a 5. 3. m, = 5. 4. md= O 5. Em 50% dos dias observados não ocorreu acidente e em 50% dos dias observados ocorre O ou mais acidentes por dia. 6. md=19. 7. 50% dos alunos desta sala tem 19 anos ou menos e 50% têm 79 anos ou mais. 9. 50% das caixas contêm uma ou nenhuma peça defeituosa e 50% contêm uma ou mais peças defeitu- osas. 10. md=$ 1.490. 11. 50% dos funcionários desta empresa recebem $1.490 ou menos e 50% recebem $1.490 ou mais. 12. m, = $80,36. 13. 50% das notas apresentavam consumo menor ou igual a $ 80, 36 e 50% apresentavam consumo maior ou igual a $80,36. 14. md=$30.161,29 15. md = 229 Kwh. 16. 50% das residências da classe m6dia com dois filhos consomem 229 kwh ou menos e 50% consomem 229 kwh ou mais. 3.10 Moda É o valor de maior frequência em um conjunto de dados. Nota~ão: A moda será denotada por m,. 3.1 1 Cálculo da Moda 1" Caso - DADOS BRUTOS OU ROL Basta identificar o elemento de maior frequência. Exemplos: 1. X:2,8,3,5,4,5,3,5,5,1 O elemento de maior frequência é 5. Portanto, m, 5. É uma sequência unimodal. vitor Seta vitor Seta vitor Seta vitor Seta vitor Seta vitor Seta vitor Seta vitor Seta vitor Seta Medidas de Tendência Central 75 Esta sequência apresenta o elemento 6 e o elemento 10 como ele- - o~ tos de maior frequência. Portanto, mo = 6 e mo = 10. É uma sequência : -odal. Poderemos encontrar sequências trimodais, tetramodais e assim 'su- --e -,=sivamente. Estas sequências serão chamadas de forma genérica por se- :: 3ncias polimodais. Observe que todos os elementos da série apresentam a mesma fre- 113ncia. Nesta situação, não há um elemento que se destaque pela maior --lquência,
Compartilhar