Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 ��������� �� ����� � �� ���� ��������� �� � ������� � ��� ������ ���� ����� �� � ��� ������ �� �������� �� ���� ��� ������ ��������� INTRODUÇÃO O cidadão comum pensa que a estatística se resume apenas a apresentar tabelas de números em colunas esportivas e ou econômicas de jornais e revistas, ilustradas com gráficos, pilhas de moedas, etc. ou quando muito associam a estatística à previsão de resultados eleitorais. Mas estatístico de hoje não se limita a compilar tabelas de dados e os ilustrar graficamente. Pois á partir de 1925, com os trabalhos de Fisher, a estatística iniciou-se como método científico, então, o trabalho do estatístico passou a ser o de ajudara planejar experimentos, interpretar e analisar os dados experimentais e apresentar os resultados de maneira a facilitar a tomada de decisões razoáveis. Deste modo, podemos então definir estatística como sendo a ciência que se preocupa com a coleta, organização, apresentação, análise e interpretação de dados. Didaticamente podemos dividir a estatística em duas partes: a estatística descritiva e a inferência estatística. A estatística descritiva se refere à maneira de apresentar um conjunto de dados em tabelas e gráficos, e ao modo de resumir as informações contidas nestes dados a algumas medidas. Já a inferência estatística baseia-se na teoria das probabilidades para estabelecer conclusões sobre todo um grupo (chamado população), quando se observou apenas uma parte (amostra) desta população. É necessário ter em mente que a estatística é uma ferramenta para o pesquisador, nas respostas dos “por quês" de seus problemas. E que para ela ser bem usada é necessário conhecer os seus fundamentos e princípios, e acima de tudo que o pesquisador desenvolva um espírito crítico e jamais deixe de pensar. Pois "em ciência é fácil mentir usando a estatística, o difícil é falar a verdade sem usar a estatística". 1. CONCEITOS BÁSICOS 1.1 O QUE É A ESTATÍSTICA? Podemos dizer, de uma forma bem simplificada, que: ESTATÍSTICA é um conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos. 1 Agradecimento especial à profa. Sandra Regina Peres da Silva por ter cedido o original para adaptação 2 Tentando ser um pouco mais rigoroso, podemos dizer que: ESTATÍSTICA é a ciência que estuda as técnicas necessárias para coletar, organizar, apresentar, analisar e interpretar os dados, a fim de extrair informações a respeito de uma população. POPULAÇÃO é o conjunto de todos os elementos (pessoas ou objetos) que interessam ao estudo de um fenômeno coletivo segundo alguma característica. AMOSTRA é qualquer subconjunto não vazio de uma população. PARÂMETRO é uma característica numérica estabelecida para toda uma população. ESTIMADOR é uma característica numérica estabelecida para uma amostra. Exemplo: Fenômeno coletivo: eleição para governador do Estado de Goiás. População: conjunto de todos os eleitores do estado. Parâmetro: proporção de votos de um certo candidato X. Amostra: grupo de 1.000 eleitores selecionados em todo o estado. Estimador: proporção de votos do candidato X, obtida na amostra. Dentre os modelos estatísticos podemos destacar os seguintes: CENSO é um levantamento estatístico (pesquisa) que abrange todos os elementos de uma população. AMOSTRAGEM é o processo de obter as amostras, com a finalidade de fazer generalizações sobre a população sem precisar examinar cada um de seus elementos. Principais propriedades do Censo: • Confiabilidade 100% • Custo elevado • Lento • Nem sempre é viável Principais propriedades da Amostragem: • Confiabilidade menor que 100% • Mais barata que o Censo • Mais rápida que o Censo • É sempre viável 3 1.2 PARTES DA ESTATÍSTICA Estatística Descritiva – é a parte da Estatística que trabalha com a organização e a apresentação dos dados. Estatística Indutiva ou Inferência Estatística – é a parte da Estatística que trabalha com análise e interpretação dos dados, com o objetivo de obter e generalizar conclusões para a população a partir de uma amostra. Inicialmente vamos nos dedicar ao estudo da Estatística Descritiva. Posteriormente, abordaremos alguns aspectos da Inferência Estatística. 1.3 ATRIBUIÇÕES DA ESTATÍSTICA DESCRITIVA • Obtenção ou coleta de dados – normalmente feita através de um questionário ou de observação direta • Organização dos dados – consiste na ordenação e crítica dos dados • Apresentação dos dados – através de tabelas e gráficos • Obtenção de algumas informações como médias, proporções, dispersões, índices que facilitam a descrição dos fenômenos observados. Passamos a descrever os conceitos envolvidos em um estudo da Estatística Descritiva. DADO ESTATÍSTICO é toda informação devidamente coletada e registrada. Todo dado se refere a uma variável. POPULAÇÃO AMOSTRA informações (conclusões / tomada de decisões) Análise e interpretação dos dados (usando técnicas estatísticas) Coleta 4 VARIÁVEL é uma característica dos elementos de uma população ou de uma amostra, que pode assumir diferentes valores, sejam numéricos ou não, e que interessa ao estudo. 1.3.1 CLASSIFICAÇÃO DAS VARIÁVEIS Variável Qualitativa: tipo de variável que não pode ser medida numericamente. Exemplos: cor dos cabelos, marca de refrigerantes, cor dos olhos, etc. As variáveis qualitativas se classificam em dois tipos: - Variável Qualitativa Ordinal: quando seus elementos têm relação de ordem. Exemplos: colocação – primeiro lugar, segundo lugar, etc. conceito – ótimo, bom, regular, péssimo. - Variável Qualitativa Nominal: quando seus elementos são identificados por um nome. Exemplos: cor dos olhos, marcas de carro, etc. Variável Quantitativa: tipo de variável que pode ser medida numericamente. Exemplos: peso, altura, número de faltas, número de gols, etc. Já as variáveis quantitativas têm as seguintes classificações: - Variável Quantitativa Discreta: tipo de variável que só pode assumir valores pertencentes a um conjunto enumerável. Normalmente seus valores estão associados a característica de contagem. Exemplos: número de carros vendidos, número de filhos, etc. - Variável Quantitativa Contínua: tipo de variável que pode assumir qualquer valor num intervalo de valores. Normalmente seus valores estão associados a característica de medidas. Exemplos: altura das pessoas, peso dos recém-nascidos, etc. Variável Qualitativa Quantitativa Ordinal Nominal Discreta Contínua 5 Obs.: a variável idade, apesar de ser representada, geralmente, por números inteiros, é uma variável contínua, pois está relacionada com o tempo, que é uma variável contínua. 1.3.2 ORGANIZAÇÃO DE DADOS EM TABELAS Objetivo: apresentar resumidamente, de maneira clara e precisa, um conjunto de dados estatísticos. São elementos das tabelas: Título – texto conciso, indicador do conteúdo de uma tabela. Localizado no topo da tabela, responde às perguntas: O quê? Quando? Onde? Corpo – conjunto de linhas e colunas que contém informações sobre a variável em estudo. Cada cruzamento de uma linha com uma coluna constitui uma casa ou célula. Cabeçalho – parte superior da tabela que especifica o conteúdo das colunas. Coluna Indicadora – parte da tabela que especifica o tipo de informação que cada linha contém. Fonte – identificador do responsável (pessoa física ou jurídica) pelo fornecimento dos dados. Não se indicaa fonte no caso em que a tabela é apresentada pelo próprio pesquisador, ou pelo próprio grupo de pesquisadores, ou pela própria instituição que obteve os dados. É inscrita na primeira linha do rodapé (parte inferior da tabela) e deve ser precedida da palavra Fonte:. Notas – são informações de natureza geral que servem para esclarecer o conteúdo das tabelas ou para explicar o método utilizado no levantamento dos dados. As notas são colocadas logo após a fonte. Chamadas – são informações de natureza específica que servem para explicar ou conceituar determinados dados. As chamadas são inscritas no rodapé após a Fonte e as Notas. As chamadas devem obedecer às seguintes regras: a) A chamada deve ser indicada por algarismo arábico, ou por asterisco, entre parênteses. A chamada deve ser escrita à esquerda da casa, quando feita no corpo da tabela, e à direita da coluna indicadora, quando feita nessa coluna. b) Se houver mais de uma chamada na mesma tabela, elas devem ser numeradas sucessivamente, de cima para baixo e da esquerda para a direita. 6 c) As chamadas são colocadas no rodapé da tabela, em ordem numérica e separadas por pontos. d) Quando a tabela ocupa várias páginas, as chamadas devem ser apresentadas na página em que aparecem. Exemplo de tabela: PRODUÇÃO BRASILEIRA DE CAFÉ Título 1991-1995 Coluna ANOS PRODUÇÃO (1.000 t) Cabeçalho Indicadora 1991 2.535 1992 2.666 Casa ou célula 1993 2.122 1994 3.750 1995 2.007 Rodapé FONTE: IBGE Corpo 1.3.3 NORMAS PARA APRESENTAÇÃO DE TABELAS a) as tabelas devem ser delimitadas, no alto e em baixo, por traços horizontais; b) as tabelas não devem ser delimitadas, à direita e à esquerda, por traços verticais; c) o cabeçalho deve ser delimitado por traços horizontais; d) podem ser feitos traços verticais no interior da tabela, separando as colunas; e) as tabelas devem ter significado próprio, isto é, devem ser entendidas mesmo quando não se lê o texto em que estão apresentadas; f) as tabelas devem ser numeradas com algarismos arábicos; g) a tabela deve ser colocada no texto em posição tal que não exija, para a leitura, rotação da página em sentido horário; h) quando dois ou mais tipos de informação tiverem sido agrupados em um só conjunto, esse conjunto entra na tabela sob a denominação “outros”; i) as tabelas podem apresentar dados obtidos através de perguntas ou de entrevistas. Nesses casos, se parte das pessoas não respondeu a determinada pergunta, essa informação deve ser apresentada na tabela sob a especificação “sem declaração”; j) nenhuma célula da tabela deve ficar em branco. Toda célula deve apresentar um número ou um sinal, conforme a convenção: ... dado numérico não disponível 7 - dado numérico igual a zero não resultante de arredondamento. 0 quando o valor é muito pequeno para ser expresso pela unidade utilizada x dado omitido, a fim de evitar a individualização da informação k) as tabelas muito longas precisam ser apresentadas em duas ou mais páginas. Nesses casos, o cabeçalho deve ser repetido em todas as páginas, mas o título é escrito apenas na primeira. Nas demais páginas escreve-se, em lugar do título, “continua” e na última escreve-se “conclusão”. Só deve ser feito o traço inferior, que delimita a tabela, na última página; l) as tabelas com muitas linhas e poucas colunas ficam melhor apresentadas quando as colunas são organizadas em duas ou mais partes, escritas lado a lado. Essas partes são separadas por dois traços verticais. Nesses casos, o cabeçalho deve indicar o conteúdo das colunas em todas as partes; m) as tabelas com muitas colunas precisam ocupar duas páginas que se confrontam. Para facilitar a leitura, todas as linhas devem receber um número de ordem. O número de ordem deve ser escrito na primeira coluna da página à esquerda e na última coluna da página à direita; n) o total é geralmente apresentado na última linha, entre dois traços horizontais, embora também possa ser apresentado na primeira linha. 1.4 SÉRIES ESTATÍSTICAS Uma série estatística é toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função do tempo, do local ou do fenômeno. Tipos Básicos de Séries: • Temporal, Cronológica ou Histórica • Geográfica, Territorial ou de Localização • Categórica ou Específica Série Temporal: usada para apresentar dados observados em determinado local, discriminados ao longo do tempo. 8 Exemplo: Produção Brasileira de Motos 1996-1998 Ano Produção (unidades) 1996 288.073 1997 426.547 1998 476.655 Fonte: Revista ISTO É – no1546 Apresentação do tempo: • Toda série temporal consecutiva deve ser apresentada, em uma tabela, por seus períodos inicial e final ligados por um hífen (-). Exemplos: 1991 – 1995 apresenta dados numéricos para os anos de 1991, 1992, 1993, 1994, 1995; Out 1991 – Mar 1992 apresenta dados numéricos para os meses de outubro, novembro e dezembro de 1991 e janeiro, fevereiro e março de 1992. • Toda série temporal não consecutiva deve ser apresentada, em uma tabela, por seus períodos inicial e final ligados por barra (/). Ex: 1991/1995 apresenta dados para os anos entre 1991 e 1995, deixando de apresentar dados numéricos para algum (ns) dos anos desta série. Série Geográfica: usada para apresentar dados de diferentes regiões geográficas, em determinado tempo. Exemplo: Vacinação contra a Poliomielite 1993 Regiões Quantidade Norte 211.209 Nordeste 631.040 Sudeste 1.119.708 Sul 418.785 Centro-Oeste 185.823 Fonte: Ministério da Saúde 9 Série Categórica: usada para apresentar dados que se distribuem em diferentes categorias, em determinado tempo e local. Exemplo: Avicultura Brasileira 1992 Espécies Número (1.000 cabeças) Galinhas 204.160 Galos, frangos, frangas e pintos 435.465 Codornas 2.488 Fonte: IBGE Séries Mistas ou Conjugadas (tabela de dupla entrada): quando são feitas combinações de duas ou mais séries. Exemplo: Exportação Brasileira 1985/1995 Importadores 1985 1990 1995 América Latina 13,0 13,4 25,6 EUA e Canadá 28,2 26,3 22,2 Europa 33,9 35,2 20,7 Ásia e Oceania 10,9 17,7 15,4 África e Oriente Médio 14,0 8,8 5,5 Fontes: MIC e SECEX Nota: Valores em percentagem 1.5 REPRESENTAÇÃO GRÁFICA DAS SÉRIES ESTATÍSTICAS Os gráficos produzem uma visão mais rápida e viva do fenômeno em estudo, ajudando a visualizar as tendências e a interpretar os valores representativos deste fenômeno. Requisitos Fundamentais na Representação Gráfica: • O gráfico deve ser simples, claro e deve expressar a verdade sobre o fenômeno em estudo; • Todo gráfico deve ter título e escala, para que possa ser interpretado sem que haja necessidade de esclarecimentos adicionais no texto; • O título do gráfico pode ser escrito acima ou abaixo do gráfico. O IBGE escreve o título acima do gráfico; 10 • As variáveis devem ser claramente identificadas; • A escala deve iniciar-se na origem do sistema de eixos cartesianos. Quando os valores iniciais dos dados são muito altos, deve ser feita uma interrupção no eixo, com indicação clara da posição do zero; • O sistema de eixos cartesianos e as linhas auxiliares devem ter traçado mais leve do que a parte do gráfico que se pretende evidenciar; • Para facilitar a leitura, podem ser feitas linhas auxiliares. Nesses casos, o gráfico é feito dentro de um retângulo. Principais Tipos de Gráficos: •••• Diagramas •••• Cartogramas•••• Pictogramas Cartogramas: São representações através de mapas (cartas geográficas). Este gráfico é empregado quando o objetivo é o de relacionar os dados estatísticos diretamente com áreas geográficas ou políticas. Pictogramas: É a representação gráfica através de figuras. Por se tratar de uma apresentação atraente, é um gráfico que desperta muito a atenção do leitor. Diagramas: São gráficos geométricos construídos, em geral, no sistema cartesiano. Principais Diagramas: Gráfico em Linha, Gráfico em Colunas, Gráfico em Barras, Gráfico em Colunas ou em Barras Múltiplas e Gráfico em Setores. Gráfico em Linha: Usado para apresentar as séries temporais. Representado num sistema de coordenadas cartesianas, cada par de valores da série corresponde a um ponto. Estes pontos são unidos por segmentos de reta. Exemplo: Tabela 1 PRODUÇÃO BRASILEIRA DE CAFÉ 1991-1995 ANOS PRODUÇÃO (1.000 t) 1991 2.535 1992 2.666 1993 2.122 1994 3.750 1995 2.007 FONTE: IBGE 11 PRODUÇÃO BRASILEIRA DE CAFÉ 1991-1995 0 500 1.000 1.500 2.000 2.500 3.000 3.500 4.000 1991 1992 1993 1994 1995 ANOS P R O D U Ç Ã O ( 1. 00 0t ) Regras para a elaboração de um gráfico em linhas: • Fixe a largura (l) do gráfico; • Determine a altura máxima e a altura mínima de acordo com as normas a seguir: hmín = 60% da largura e hmáx = 80% da largura • Determine os limites da escala, dividindo o maior valor a representar pela altura máxima e pela altura mínima; • Determine a escala, escolhendo um valor, de preferência inteiro, entre os valores encontrados para limites; • Trace um sistema de coordenadas cartesianas; • Determine, graficamente, todos os pontos da série; • Ligue esses pontos, dois a dois, por segmentos de reta; • Identifique, claramente, as variáveis nos dois eixos; • Acrescente o Título, a Fonte e a Legenda (quando necessária). Gráfico em Colunas: Usado para representar as séries cronológicas, geográficas e categóricas. Representado por meio de retângulos de mesma base, dispostos verticalmente (em colunas). Exemplo: 12 Tabela 1 PRODUÇÃO BRASILEIRA DE CAFÉ 1991-1995 ANOS PRODUÇÃO (1.000 t) 1991 2.535 1992 2.666 1993 2.122 1994 3.750 1995 2.007 FONTE: IBGE PRODUÇÃO BRASILEIRA DE CAFÉ 1991-1995 0 500 1.000 1.500 2.000 2.500 3.000 3.500 4.000 1991 1992 1993 1994 1995 ANOS P R O D U Ç Ã O ( 1. 00 0t ) Gráfico em Barras: Usado para representar as séries geográficas e categóricas. Representado por meio de retângulos dispostos horizontalmente (em barras). Exemplo: 13 Tabela 2 EXPORTAÇÕES BRASILEIRAS MARÇO – 1995 ESTADOS VALOR (US$ milhões) São Paulo 1.344 Minas Gerais 542 Rio Grande do Sul 332 Espírito Santo 285 Paraná 250 Santa Catarina 202 FONTE: SECEX E X P O R T A Ç Õ E S B R A S I L E I R A S M A R Ç O - 1 9 9 5 0 5 0 0 1 . 0 0 0 1 . 5 0 0 S ã o P a u l o M i n a s G e r a i s R i o G r a n d e d o S u l E s p í r i t o S a n t o P a r a n á S a n t a C a t a r i n a V a l o r ( U S $ m i l h õ e s ) OBSERVAÇÕES: 1) O procedimento para a construção de um gráfico em colunas (ou barras) é análogo ao do gráfico em linhas, observando que no gráfico em barras deve-se fazer a inversão nos eixos cartesianos (o eixo x corresponde a altura e o eixo y corresponde a largura). 2) Sempre que os dizeres a serem inscritos forem extensos, deve-se dar preferência ao gráfico em barras (séries geográficas e específicas). Gráfico em Colunas ou em Barras Múltiplas: Usado para representar as séries conjugadas. Exemplo: 14 Tabela 3 BALANÇA COMERCIAL DO BRASIL 1989 – 1993 ESPECIFICAÇÕES VALOR (US$ 1.000.000) 1989 1990 1991 1992 1993 Exportação (FOB) 34.383 31.414 31.620 35.793 38.783 Importação 18.263 20.661 21.041 20.554 25.711 FONTE: Ministério da Fazenda BALANÇA COMERCIAL DO BRASIL 1989-1993 0 5.000 10.000 15.000 20.000 25.000 30.000 35.000 40.000 45.000 1989 1990 1991 1992 1993 V al o r (u s$ 1 .0 00 .0 00 ) Exportação (FOB) Importação Gráfico em Setores: Construído com base em um círculo, este gráfico é usado para comparar proporções. Exemplo: 15 Tabela 4 REBANHO SUINO DO SUDESTE DO BRASIL 1992 ESTADOS QUANTIDADE (mil cabeças) Minas Gerais 3.363,7 Espírito Santo 430,4 Rio de Janeiro 308,5 São Paulo 2.035,9 Total 6.138,5 FONTE: IBGE REBANHO SUÍNO DO SUDESTE DO BRASIL 1992 55% 33% 5% 7% Minas Gerais Espírito Santo Rio de Janeiro São Paulo Regras para a elaboração de um gráfico em setores: • Trace uma circunferência. A área do círculo representa o total, isto é, 100%, devendo ser dividida em tantos setores quantas sejam as partes. • Lembre-se de que uma circunferência tem 360°. Então, se ao total correspondem 360°, a cada parte corresponderá um setor cujo ângulo x é dado por: TOTAL PARTE x 360× = • Marque os valores dos ângulos calculados na circunferência e trace os raios, separando os setores. • Para facilitar a distinção, faça um tracejado diferente em cada setor. • Coloque título e legenda no gráfico. OBS.: Para clareza dos dados, deve-se usar no máximo sete setores. 16 1.6 DISTRIBUIÇÃO DE FREQUÊNCIAS Freqüentemente, ao coletar dados, o pesquisador se depara com uma grande massa de valores numéricos, que se repetem algumas vezes, dificultando sua análise e interpretação. Surge então a necessidade de organizar esses dados em uma tabela onde os valores observados se apresentam associados individualmente ou em classes com os números de suas repetições, isto é, com suas respectivas freqüências. Esta tabela recebe o nome de Distribuição de Freqüências. De acordo com a disposição dos dados têm-se dois tipos de distribuição: 1.6.1 Distribuição de Freqüências Simples (dados não agrupados ou não tabulados em classes de valores) É uma tabela onde os valores da variável analisada aparecem individualmente correlacionados com os números de suas repetições (freqüências). Esse tipo de distribuição é normalmente usado para representar variáveis discretas. Exemplo: Tabela 1 Construtora Aimorés – Número de Acidentes Registrados Janeiro de 2000 Nº de Acidentes Nº de Dias 0 18 1 5 2 2 3 2 4 3 5 1 Total 31 FONTE: Dados Hipotéticos 1.6.2 Distribuição de Freqüências por Classes (dados agrupados ou tabulados em classes de valores) Quando a variável analisada apresenta um grande número de valores torna-se mais vantajoso o agrupamento destes em classes de freqüência, evitando assim grande extensão da tabela e facilitando a visualização do fenômeno como um todo. 17 A distribuição de freqüências por classes é uma tabela onde os valores observados são agrupados em classes, isto é, em intervalos de variações da variável em questão. Esse tipo de distribuição é normalmente usado para representar variáveis contínuas. É utilizada também para representar variáveis discretas em um grande número de valores observados. Exemplo: Tabela 2 Salários dos funcionários da Loja XY Salários (R$) Nº de funcionários 1000 1200 2 1200 1400 6 1400 1600 10 1600 1800 5 1800 2000 2 Total 25 FONTE: Dados Hipotéticos A seguir são apresentados alguns conceitos fundamentais para a compreensão dessas séries. Dados Brutos É aapresentação dos dados observados na seqüência em que foram coletados, isto é, sem nenhuma ordenação numérica. Exemplo: O número de peças defeituosas obtidas da produção de uma máquina durante vinte dias foi: 2 – 4 – 2 – 1 – 2 – 3 – 1 – 0 – 5 – 1 – 0 – 1 – 1 – 2 – 0 – 1 – 3 – 0 – 1 – 2 Rol É a organização dos dados brutos em ordem crescente ou decrescente. Exemplo: O rol do exemplo anterior é: 0 – 0 – 0 – 0 – 1 – 1 – 1 – 1 – 1 – 1 – 1 – 2 – 2 – 2 – 2 – 2 – 3 – 3 – 4 – 5 18 Amplitude Total (AT) É a diferença entre o maior valor e o menor valor da seqüência dos dados observados. AT = valor máximo – valor mínimo Exemplo: A amplitude total do rol apresentado é: AT = 5 – 0 = 5 Freqüência Absoluta Simples (ou simplesmente freqüência) Denotada por Fi, a freqüência indica o número de ocorrências de cada valor ou o número de valores pertencentes a uma classe. Na Tabela 1: F6 = F(5) = 1 Na Tabela 2: F2 = 6 1.6.3 Regras para a elaboração de uma Distribuição de Freqüências Simples a) Escreve-se, ordenadamente, os dados observados na coluna indicadora. b) Obtém-se as freqüências absolutas simples dos dados (Fi). Essas freqüências constituem o corpo da tabela. Exemplo: Sejam os dados abaixo representativos de uma pesquisa sobre o número de irmãos de 20 alunos da Turma PEST. Dados Brutos: 1 – 3 – 0 – 5 – 2 – 1 – 1 – 0 – 0 – 1 – 4 – 3 – 1 – 0 – 1 – 2 – 2 – 1 – 3 – 1 Rol: 0 – 0 – 0 – 0 – 1 – 1 – 1 – 1 – 1 – 1 – 1 – 1 – 2 – 2 – 2 – 3 – 3 – 3 – 4 – 5 A distribuição de freqüências do rol apresentado é: 19 Tabela 3 Número de Irmãos de 20 alunos da Turma PEST i Número de Irmãos (xi) Repetições (Fi) 1 0 4 2 1 8 3 2 3 4 3 3 5 4 1 6 5 1 Total � Fi = 20 1ª Coluna (i) – número de ordem dos valores distintos da variável número de irmãos. 2ª Coluna (xi) – valores distintos da variável número de irmãos. 3ª Coluna (Fi) – número de repetições dos valores distintos da variável número de irmãos. Nota: k i i 1 F n = =� , onde n é igual ao número de dados observados (n = 20) Observa-se que neste tipo de tabela não há perda de informação, podendo os dados originais serem reconstituídos a partir da distribuição elaborada. 1.6.4 Tipos de Freqüências Para a interpretação dos resultados de uma pesquisa, conforme os tipos de informações requeridas utilizam-se diversos tipos de freqüências de dados. A seguir serão apresentados os tipos de freqüências, derivados da distribuição de freqüências absolutas, bastante úteis na interpretação de dados. Freqüência Total É a soma de todas as freqüências absolutas simples em uma tabela. k i i 1 F n = =� 20 A freqüência total de uma distribuição de freqüências é igual ao número total de observações (n). Exemplo: Na Tabela 3, temos: 6 i 1 2 3 4 5 6 i 1 F F F F F F F 4 8 3 3 1 1 20 = = + + + + + = + + + + + =� Freqüência Relativa Simples, ou simplesmente, Freqüência Relativa Simbolizada por fi, a freqüência relativa simples fornece a proporção de cada valor ou de casos ocorridos em cada classe, em relação ao número total de observações. Portanto, é um número relativo. Para calcular a freqüência relativa, basta dividir a freqüência absoluta da ordem em questão pelo número de observações. n F f ii = As comparações expressas através de porcentagem são mais usuais. Para obter a porcentagem de cada valor ou de casos ocorridos em cada classe, multiplica-se o quociente obtido por 100, ou seja: i i F f 100 n = × Nota: k i i 1 f 1 = =� ou 100% Exemplo: Na Tabela 3, temos: 1 1 F 4 f 0,20 100 20 20 20 = = = × = % 2 2 F 8 f 0,40 100 20 20 = = = × = 40% 3 3 F 3 f 0,15 100 15 20 20 = = = × = % 21 4 4 F 3 f 0,15 100 15 20 20 = = = × = % 5 5 F 1 f 0,05 100 5 20 20 = = = × = % 6 6 F 1 f 0,05 100 5 20 20 = = = × = % Freqüência Absoluta Acumulada Denotada por Faci, a freqüência absoluta acumulada fornece a informação de quantos elementos se situam até determinado valor. A freqüência acumulada do i- ésimo valor ou i-ésima classe (freqüência acumulada de ordem i) é obtida somando-se a freqüência desse valor ou classe com as freqüências anteriores, ou seja, é a soma de todas as freqüências de ordens menores ou igual a da ordem em questão. Exemplo: Fac3 = 3 i 1= � Fi = F1 + F2 + F3 Fac4 = 4 i 1= � Fi = F1 + F2 + F3 + F4 Exemplo: Na tabela 3, temos: Fac1 = F1 = 4 Fac4 = F1 + F2 + F3 + F4 = 15 + 3 = 18 Fac2 = F1 + F2 = 4 + 8 = 12 Fac5 = F1 + F2 + F3 + F4 + F5 = 18 + 1 = 19 Fac3 = F1 + F2 + F3 = 12 + 3 = 15 Fac6 = F1 + F2 + F3 + F4 + F5 + F6 = 19 + 1 = 20 Freqüência Acumulada Relativa Denotada por faci, fornece a proporção de elementos situados até determinado valor. Consiste na soma da freqüência relativa de cada valor ou classe com as freqüências relativas dos valores ou classes anteriores, ou seja, é a soma das freqüências simples relativas de ordens menores ou iguais a da ordem em questão. . 22 Exemplo: fac3 = 3 i 1= � fi = f1 + f2 + f3 Exemplo: Na tabela 3, temos: fac1 = f1 = 0,20 = 20% fac2 = f1 + f2 = 0,20 + 0,40 = 0,60 = 60% fac3 = f1 + f2 + f3 = 0,60 + 0,15 = 0,75 = 75% fac4 = f1 + f2 + f3 + f4 = 0,75 + 0,15 = 0,90 = 90% fac5 = f1 + f2 + f3 + f4 + f5 = 0,90 + 0,05 = 0,95 = 95% fac6 = f1 + f2 + f3 + f4 + f5 + f6 = 0,95 + 0,05 = 1 = 100% A freqüência relativa acumulada de ordem i pode ser também calculada através do quociente: = � � ��� ��� � Exemplo: 3 15 fac 0,75 75 20 = = = % Com relação à Tabela 3, utilizando todos os tipos de freqüências definidas anteriormente, podemos construir a seguinte distribuição de freqüências: Tabela 4 Número de Irmãos de 20 alunos da Turma PEST i xi Fi fi fi (%) Faci faci faci(%) 1 0 4 0,20 20 4 0,20 20 2 1 8 0,40 40 12 0,40 40 3 2 3 0,15 15 15 0,75 75 4 3 3 0,15 15 15 0,90 90 5 4 1 0,05 5 5 0,95 95 6 5 1 0,05 5 5 1,00 100 Total 20 1,00 100 − − − FONTE: Dados Fictícios 23 Interpretação: • f3 = 0,15; 15% dos alunos responderam que têm 2 irmãos. • F2 = 8; 8 alunos responderam que têm 1 irmão; • fac3 = 0,75; 75% dos alunos responderam que têm entre 0 e 2 irmãos. 1.6.5 Representação Gráfica de uma Distribuição de Freqüências Simples A distribuição de Freqüências Simples é representada graficamente por um Gráfico em Hastes, um diagrama onde as freqüências são representadas por segmentos de retas perpendiculares ao eixo das abcissas. Cada segmento é determinado pelos pontos (xi,Fi) e (xi,0). Exemplo: Representação gráfica da Tabela 3. EXERCÍCIOS 1. Considere a seguinte distribuição de freqüências correspondente aos diferentes preços de um determinado produto pesquisados em 20 lojas. Preços do Produto A i Preço (R$) Número de Lojas 1 50 2 2 51 5 3 52 6 4 53 6 5 54 1 Total 20 FONTE: Dados Fictícios 0 1 2 3 4 5 xi (numero de irmãos) Fi 1 3 4 8 24 a) Quantas lojas apresentam preços de R$ 52,00? b) Determine as freqüências relativas simples e as freqüências absolutas acumuladas. c) Quantas lojas apresentaram um preço de até R$ 52,00 (inclusive)? d) Qual é a percentagem de lojas com preços de até R$ 53,00 (inclusive)? 2. A distribuição de freqüências a seguir apresenta o número de acidentes por dia, durante40 dias, em determinado cruzamento. Número de Acidentes no Cruzamento X i Nº de Acidentes por dia (xi) Número de Dias (Fi) 1 0 30 2 1 5 3 2 3 4 3 1 5 4 1 Total 40 FONTE: Dados Fictícios a) Determine as freqüências absolutas acumuladas, as freqüências simples relativas e as freqüências acumuladas relativas. b) Após ter determinado as freqüências acima, interprete todos os resultados da 3ª linha da distribuição de freqüências. 3. Em uma amostra de 30 milheiros de telhas recebidas pela Construtora ABC Ltda, constatou-se os seguintes números de unidades defeituosas por milheiro: 5 – 20 – 10 – 5 – 40 – 30 – 20 – 5 – 10 – 15 – 10 – 30 – 40 – 10 – 50 – 10 – 30 – 15 − 20 – 40 – 10 – 20 – 20 – 50 – 10 – 40 – 30 – 20 – 0 – 30 a) Agrupar estes dados em uma distribuição de freqüências simples. b) Representá-la através de um gráfico conveniente. c) Calcular todos os tipos de freqüências conhecidos. d) Qual a percentagem de milheiros com mais de 30 telhas defeituosas? e) Quantos milheiros tiveram menos de 10 telhas defeituosas? f) Qual a proporção de milheiros com menos de 20 telhas defeituosas? 25 4. Dada a distribuição de freqüências: Indústria de Equipamentos Eletrônicos – IEE Número de Falhas em Componentes durante o período de garantia Janeiro de 2000 i Nº de Falhas (xi) Número de Equipamentos (Fi) 1 0 148 2 1 52 3 2 34 4 3 26 5 4 13 6 5 7 Total 280 FONTE: Dados Fictícios a) Determinar as freqüências relativas percentuais, as freqüências acumuladas e as freqüências relativas acumuladas percentuais. b) Através das freqüências calculadas, responder qual a porcentagem de: b.1) equipamentos que não apresentaram falha em seus componentes; b.2) equipamentos que apresentaram pelo menos uma falha em seus componentes; b.3) equipamentos trocados, sabendo-se que a indústria se compromete a trocar o equipamento que apresente 4 ou mais falhas em seus componentes. 5. Considere os seguintes números. 1 3 5 7 9 2 4 6 8 10 15 20 25 0 1 2 3 4 5 6 7 8 9 9 8 7 8 6 5 4 3 2 1 0 10 15 20 25 12 8 11 6 4 2 1 3 5 7 9 11 a) Construa a distribuição de freqüências simples. b) Representá-la através de um gráfico conveniente. c) Calcular todos os tipos de freqüências conhecidos. 26 1.7 Intervalo de Classe ou Classe Classes são intervalos de variações da variável, ou seja, é cada um dos grupos de valores em que se subdivide a amplitude total do conjunto de valores observados da variável. Uma determinada classe pode ser identificada por seus extremos ou pela ordem em que ela se encontra na tabela (valor do índice i) O número de classes de uma distribuição de freqüências será denotado por k. A notação indica intervalo fechado à esquerda. Assim, na Tabela 2, um funcionário que apresentou salário de R$ 1400,00 pertence à classe 1400 1600, ou terceira classe (i = 3). Existem diversas maneiras de expressar as classes: a) a b compreende todos os valores entre a e b, incluindo a e b b) a b compreende todos os valores entre a e b, excluindo a c) a b compreende todos os valores entre a e b, excluindo b d) a b compreende todos os valores entre a e b, excluindo a e b Em nosso curso usaremos a forma expressa em “c)”. 1.7.1 Limites de Classe São os valores extremos de cada classe. O menor valor denomina-se limite inferior da classe i (li) e o maior, limite superior da classe i (Li). Assim, na quarta classe da Tabela 2 tem-se l4 = 1600 e L4 = 1800. 1.7.2 Amplitude do Intervalo de Classe (h) A amplitude do intervalo de classe é o comprimento da classe, sendo definida como a diferença entre o limite superior e o limite inferior da classe. hi = Li − li Exemplo: Na Tabela 2, temos: h1 = 1200 – 1000 = 200 h2 = 1400 – 1200 = 200 27 Em geral h1 = h2 = h3 = ... = h k = h, e determina-se a amplitude do intervalo fazendo: T A h k = Exemplo: Dados: AT = 64 e k = 7. Temos: h = 64 7 = 9,14 ≈ 10 Nota: Sugere-se sempre aproximar o valor encontrado para o inteiro superior. 1.7.3 Número de Classes (k) Não existe uma regra fixa que forneça o número de classes. No entanto, como o objetivo da distribuição de freqüências é facilitar a compreensão dos dados, é importante que a distribuição contenha um número adequado de classes. Se este número for escasso, os dados originais ficarão tão comprimidos que pouca informação poderá ser extraída da tabela. Se por outro lado forem utilizadas várias classes, haverá algumas com freqüências nulas ou muito pequenas e o resultado será uma distribuição irregular e prejudicial à interpretação do fenômeno como um todo. Na prática esse número não deve ser superior a 20 nem inferior a 5. Se a quantidade de dados for pequena não se justifica a construção de uma tabela, e se for grande, mais de 20 classes dificulta a análise. Em função do total de observações existem vários métodos que orientam a escolha de um número de classes conveniente. Seguem-se os dois mais utilizados: a) Regra da Raiz Quadrada k = 5 para n ≤ 25 k = n para n > 25, onde n é o número de observações. Exemplo: Para n = 30, o número de classes será 48,530 = ≈ 5. b) Regra de Sturges k = 1 + 3,3 log n, onde: n = número de observações. Exemplo: Para n = 30, tem-se: k = 1 + 3,3 log 30 ≈ 6. 28 Para n = 30 os resultados obtidos pelos dois critérios são bastante próximos. O mesmo não acontece para valores grandes de n onde a regra de Sturges tem o inconveniente de prever um número relativamente pequeno de classes e o procedimento da raiz quadrada, um número relativamente grande. Neste caso deve prevalecer o bom senso do analista. 1.7.4 Ponto Médio da Classe (xi) Considerando que os valores de uma classe estão distribuídos uniformemente, o ponto médio ou valor médio de uma classe é o valor que melhor a representa para efeito de cálculo de certas medidas. O ponto médio de uma classe i é definido por: i ii l L x 2 + = Uma outra maneira de obter o ponto médio é adicionar a metade da amplitude ao limite inferior da classe. Na Tabela 2, o ponto médio da classe 1200 1400 é: 3 1200 1400 x 1300 2 + = = , ou 3 200 x 1200 1300 2 = + = . 1.7.5 Regras para a elaboração de uma Distribuição de Freqüências por Classes a) Determinar o rol (opcional). b) Determinar a amplitude total (AT) dos dados: AT = valor máximo – valor mínimo c) Determinar o número conveniente de classes (k), de acordo com um dos critérios citados anteriormente. d) Determinar a amplitude de cada classe (h) dividindo a amplitude total pelo número de classes. AT h k = Muitas vezes ao efetuar esta divisão, pode-se chegar a um resultado não muito conveniente sob o aspecto de montagens das classes. Neste caso sugere-se que o 29 valor encontrado seja aproximado para o maior inteiro, caso contrário algum dado excederia o limite superior da última classe prevista. e) Determinar os limites das classes, escolhendo-se, preferencialmente, números inteiros. O limite inferior da primeira classe e o limite superior da última, não precisam, necessariamente, pertencer ao conjunto. f) Construir a tabela de freqüências, contando o número de ocorrência de cada classe. Exemplo: Os dados a seguir representam as notas de 50 alunos. 33 35 35 39 41 41 42 45 47 48 50 52 53 54 55 55 57 5960 60 61 64 65 65 65 66 66 66 67 68 69 71 73 73 74 74 76 77 77 78 80 81 84 85 85 88 89 91 94 97 Vamos agrupar estes elementos em uma distribuição de freqüências por classes a) Amplitude Total: AT = 97 – 33 = 64 b) Número de Classes: k = 50 ≈ 7 ou k = 1 + 3,3 log 50 = 1 + 3,3 x 1,7 ≈ 7 c) Amplitude das Classes (h): T A 64 h 9,14 10 k 7 = = = ≅ (aproximar para o maior inteiro) d) Limites das Classes 30 40 40 50 50 60 60 70 70 80 80 90 90 100 e) Distribuição de Freqüências por Classes Ponto inicial = 30 (o ponto inicial deve ser sempre menor ou igual ao menor valor observado) Ponto final = 100 (o ponto final deve ser sempre maior que o maior valor observado) 30 Notas de 50 alunos Classes Notas Fi fi fi(%) Faci faci faci(%) xi 1 30 |--- 40 4 0,08 8 4 0,08 8 35 2 40 |--- 50 6 0,12 12 10 0,20 20 45 3 50 |--- 60 8 0,16 16 18 0,36 36 55 4 60 |--- 70 13 0,26 26 31 0,62 62 65 5 70 |--- 80 9 0,18 18 40 0,80 80 75 6 80 |--- 90 7 0,14 14 47 0,94 94 85 7 90 |--- 100 3 0,06 6 50 1,00 100 95 Total 50 1,00 100 − − − − FONTE: Dados Hipotéticos Interpretação: F3 = 8 → 8 alunos obtiveram nota igual ou superior a 50 e inferior a 60. f4 = 26% → 26% dos alunos obtiveram notas entre 60 (inclusive) e 70 (exclusive). Fac6 = 47 → 47 alunos obtiveram notas inferiores a 90. fac5 = 80% → 80% dos alunos obtiveram notas inferiores a 80. 1.8 Distribuição de Freqüências com Intervalos de Classes Desiguais Existem casos em que é mais adequado agrupar os dados em classes com larguras desiguais, como, por exemplo, as idades dos atletas de acordo com a categoria a que pertencem. Exemplo: Tabela 5 Categoria de Atletas por Idade Classes Idades Fi 1 2 |--- 13 12 2 13 |--- 15 5 3 15 |--- 18 8 4 18 |--- 30 30 5 30 |--- 40 12 6 40 |--- 60 10 7 60 |--- 90 2 Total 79 31 1.9 Gráficos de uma Distribuição de Freqüências por Classes 1. Histograma É um tipo de gráfico apropriado para representar dados agrupados em classes. Consiste de colunas justapostas cujas bases representam as classes e as alturas correspondem às freqüências das classes. 2. Polígono de Freqüências Trata-se da representação de uma distribuição de freqüências por classes, através de um polígono. O eixo das abcissas constitui a base do polígono. Os vértices são os pontos (xi,Fi) onde xi é o ponto médio e Fi é a freqüência da classe. O fechamento da poligonal com a base é feito unindo o primeiro vértice ao ponto médio de uma classe anterior à primeira, e o último vértice ao ponto médio de uma classe posterior à última. Esse gráfico é adequado também para a representação de freqüências relativas e percentuais. 3. Polígono de Freqüências Acumuladas ou Ogiva de Galton Utilizado para representar as freqüências acumuladas. Os vértices são os pontos (Li, Faci). Pode ser usado também para representar as freqüências acumuladas relativas percentuais. O fechamento é feito unindo o primeiro vértice ao limite inferior da primeira classe. Esse gráfico será útil para a determinação das medidas separatrizes que serão tratadas posteriormente. Exemplo: Dada a distribuição de freqüências: Notas dos alunos da turma PEST Notas Fi Fac Fi xi 30 |--- 40 4 4 0,08 35 40 |--- 50 6 10 0,12 45 50 |--- 60 8 18 0,16 55 60 |--- 70 13 31 0,26 65 70 |--- 80 9 40 0,18 75 80 |--- 90 7 47 0,14 85 90 |--- 100 3 50 0,06 95 Total 50 − 1,00 − 32 Os gráficos representativos dessa distribuição são: HISTOGRAMA E POLÍGONO DE FREQUÊNCIAS POLÍGONO DE FREQUÊNCIAS ACUMULADAS EXERCÍCIOS 1. Os dados a seguir referem-se às notas de 50 alunos: 60 85 33 52 65 77 84 65 74 57 71 35 81 50 35 64 74 47 54 68 80 61 41 91 55 73 59 53 77 45 71 55 78 48 69 85 67 39 60 76 94 98 66 66 73 42 65 94 88 89 3 4 6 7 8 9 13 Fi 30 40 50 60 70 80 90 100 classe Polígono de freqüência 10 4 18 47 31 40 50 Fac 30 40 50 60 70 80 90 100 classe 33 Pede-se: a) A amplitude total da amostra. b) O número de classes. c) A amplitude das classes. d) As classes (valor inicial = 30). e) As freqüências absolutas das classes. f) As freqüências relativas. g) Os pontos médios das classes. h) As freqüências acumuladas das classes. i) O histograma. j) O polígono de freqüências. k) O polígono de freqüências acumuladas. 2. A tabela abaixo apresenta os salários de 90 operários da Empresa Aço S/A Salários dos Funcionários da Empresa Aço Classes Salários Mínimos Fi 1 1 |--- 3 40 2 3 |--- 5 30 3 5 |--- 7 10 4 7 |--- 9 5 5 9 |--- 11 5 Total 90 a) Determine as freqüências simples relativas, as freqüências absolutas acumuladas e as freqüências relativas acumuladas. b) Quantos funcionários ganham menos de 3 salários mínimos? c) Quantos ganham mais de salários mínimos? d) Qual a percentagem de operários com salário entre 5 e 7 salários mínimos? e) Qual a percentagem de operários com salário inferior a 7 salários mínimos? f) Construa o histograma e o polígono de freqüência. 3. Complete a tabela abaixo: i Classes xi Fi Faci fi 1 0 |--- 2 1 4 0,04 2 2 |--- 4 8 3 4 |--- 6 5 30 0,18 4 |--- 7 27 0,27 5 8 |--- 10 15 72 6 10 |--- 12 83 7 |--- 13 10 93 0,10 8 14 |--- 16 0,07 − Total − 34 4. A tabela abaixo apresenta uma distribuição de freqüência das áreas de 400 lotes: i Áreas (m2) Nº de Lotes 1 300 |--- 400 14 2 400 |--- 500 46 3 500 |--- 600 58 4 600 |--- 700 76 5 700 |--- 800 68 6 800 |--- 900 62 7 900 |--- 1000 48 8 1000 |--- 1100 22 9 1100 |--- 1200 6 Com referência a essa tabela determine: a) A amplitude total. b) O limite superior da 5ª classe. c) A freqüência acumulada da 4ª classe. d) O número de lotes cuja área não atinge 700 m2. e) O número de lotes cuja área é superior ou igual a 800 m2. f) A classe do 72º lote. 5. Responda as seguintes questões: a) O que é freqüência simples absoluta de uma classe? b) O que é freqüência simples relativa de uma classe? c) O que é freqüência acumulada absoluta de uma classe? d) O que é freqüência acumulada relativa de uma classe? e) O que é limite inferior de uma classe? f) O que é ponto médio de uma classe? 6. Os pesos de 40 alunos estão relacionados a seguir: 69 57 72 54 93 68 72 58 64 62 65 76 60 49 74 59 66 83 70 45 60 81 71 67 63 64 53 73 81 50 67 68 53 53 65 58 80 60 63 53 a) Agrupar estes dados em classes de valores (Dado log 40 = 1,6). b) Determine as freqüências relativas, as freqüências acumuladas e as freqüências relativas acumuladas. c) Determine os pontos médios das classes. d) Interprete todos os resultados da 3ª linha da tabela. e) Construa o histograma, o polígono de freqüências e o polígono de freqüências acumuladas da distribuição. 35 7. Os dados abaixo referem-se ao consumo mensal de energia elétrica em kwh da conta nº 001.161157-1 das Centrais Elétricas de Goiás, no períodode 1997 a 1999. 142 – 178 – 164 – 190 – 146 – 131 – 119 – 131 – 187 – 158 – 168 – 111 – 96 – 118 – 182 – 116 – 188 – 207 – 229 – 180 – 181 – 175 – 205 – 179 – 184 – 227 – 210 – 210 – 213 – 190 – 240 – 215 – 226 – 188 – 190 – 205 – a) Sintetizar esses dados através de uma distribuição de freqüências por classes. b) Calcular todos os tipos de freqüências que você conhece. c) Com base nas freqüências calculadas, apresentar os seguintes percentuais: c.1) de meses com consumo inferior a 150 kwh. c.2) de meses com consumo superior a 200 kwh. d) Representar a distribuição elaborada através de um histograma e de um polígono de freqüências. e) Representar a distribuição de freqüências acumuladas através de uma Ogiva. 8. Dada a amostra: 28 33 27 30 31 30 33 30 33 29 27 33 31 27 31 28 27 29 31 24 31 33 30 32 30 33 27 33 31 33 23 29 30 24 28 34 39 30 18 17 18 15 16 17 17 18 19 19 20 29 a) Agrupar os elementos em classes (inicie pelo 15 e use h = 5). b) Calcule as freqüências absolutas, as freqüências acumuladas e os pontos médios das classes. c) Interprete todos os resultados da 4ª linha da tabela. d) Construa o histograma, o polígono de freqüências e o polígono de freqüências acumuladas da distribuição. 9. Abaixo temos a distribuição dos aluguéis de 65 casas. Aluguel (centenas de $) 1,5 |-- 3,5 3,5 |-- 5,5 5,5 |-- 7,5 7,5 |-- 9,5 9,5 |-- 11,5 Nº de casas 12 18 20 10 5 Com referência a essa tabela determine: a) A amplitude total. b) O limite superior da 5ª classe. c) A freqüência acumulada da 4ª classe. d) O número de aluguéis cujo valor atinge, no máximo, R$ 550,00. 36 e) O número de aluguéis cujo valor é superior ou igual a R$ 750,00. f) A classe do 50º aluguel. 10. A distribuição de freqüência abaixo representa o consumo por nota de 54 notas fiscais emitidas durante um dia em uma loja de departamentos. Consumo por nota (R$) nº de notas 0 |------ 50 10 50 |------ 100 28 100 |------ 150 12 150 |------ 200 2 200 |------ 250 1 250 |------ 300 1 a) Interprete todos os resultados da 4ª linha da tabela. b) Construa o histograma e o polígono de freqüências. 37 2. MEDIDAS DE POSIÇÃO As medidas de posição são valores que representam o conjunto de dados observados ou então promovem uma partição sobre este conjunto. Entre as medidas de posição destacam-se as medidas de tendência central e as separatrizes. 2.1 MEDIDAS DE TENDÊNCIA CENTRAL A maneira mais simples de resumirmos as informações contidas em um conjunto de dados observados é estabelecer um ponto central em torno do qual os dados se distribuem. Tais medidas orientam quanto à posição do conjunto no eixo dos números reais e possibilitam comparações de séries de dados entre si pelo confronto destes números. São chamadas Medidas de Tendência Central, pois representam os fenômenos pelos seus valores médios em torno dos quais tendem a se concentrar os dados. 2.1.1 MÉDIA ARITMÉTICA ( x ) a) Média aritmética para dados não agrupados Sejam x1, x2, ..., xn, n valores da variável X. A média aritmética simples, denotada por x , é definida por: n i i 1 x x n == � , onde n é o número de valores observados da variável X. Exemplo: Determinar a média aritmética simples dos valores: 7,0; 3,0; 5,5; 6,5; 8,0. 5 i i 1 x 7,0 3,0 5,5 6,5 8,0 x 6,0 5 5 = + + + + = = = � 38 b) Média aritmética para dados agrupados Neste caso, usamos a média aritmética dos valores x1, x2, ..., xk, ponderada pelas suas respectivas freqüências absolutas F1, F2, F3, ... , Fk. Desta forma, temos: k i i i 1 x F x n == � , onde n = F1 + F2 + ... + Fk = k i i 1 F = � Observação: Quando se tratar de uma distribuição de freqüência por classe, xi corresponde ao ponto médio da classe, ou seja, i ii l L x 2 + = . Exemplos: 1. Determinar a média aritmética da distribuição a seguir. NÚMERO DE IRMÃOS DE 20 ALUNOS DA TURMA IDX i xi Fi 1 0 4 2 1 8 3 2 3 4 3 3 5 4 1 6 5 1 TOTAL 20 Fonte: Dados Hipotéticos Solução: Para determinar a média acrescentaremos a coluna com o cálculo de xiFi NÚMERO DE IRMÃOS DE 20 ALUNOS DA TURMA IDX i xi Fi XIFI 1 0 4 0 2 1 8 8 3 2 3 6 4 3 3 9 5 4 1 4 6 5 1 5 39 TOTAL 20 32 Fonte: Dados Hipotéticos k 6 i i i i i 1 i 1 x F x F 32 x 1,6 n 20 20 = == = = = � � 2. Dada a distribuição: Renda Familiar de 40 Famílias i Salários (R$ 1.000) Fi 1 2 |--- 4 5 2 4 |--- 6 10 3 6 |--- 8 14 4 8 |--- 10 8 5 10 |--- 12 3 TOTAL 40 Fonte: Dados Hipotéticos Determinar a renda média familiar destas 40 famílias. Solução: Acrescentamos as colunas com os cálculos de xi e xiFi , Renda Familiar de 40 Famílias i Salários (R$ 1.000) Fi xi xiFi 1 2 |--- 4 5 3 15 2 4 |--- 6 10 5 50 3 6 |--- 8 14 7 98 4 8 |--- 10 8 9 72 5 10 |--- 12 3 11 33 TOTAL 40 − 268 Fonte: Dados Hipotéticos e utilizamos a fórmula: k 5 i i i i i 1 i 1 x F x F 268 x 6,7 n 40 40 = == = = = � � 40 Assim, cada família possui, em média, uma renda de R$6.700,00. Observação: Do ponto de vista teórico, vários tipos de média podem ser calculados para uma massa de dados. O uso da média aritmética apresenta vantagens para cálculos posteriores, devendo, entretanto, além de outros casos, ser empregada em séries que estejam em progressão aritmética ou se os valores extremos não influírem sensivelmente sobre ela. Outra orientação para seu emprego é na comparação com as outras medidas de tendência central. Focalizaremos ainda neste estudo as médias geométricas e as médias harmônicas. 2.1.2 MÉDIA GEOMÉTRICA (Mg) a) Média geométrica para dados não agrupados Sejam x1, x2, ..., xn, n valores da variável X. A média geométrica, denotada por Mg, é definida por: n 1 2 3 nMg x x x ... x= ⋅ ⋅ ⋅ ⋅ Exemplo: Calcular a média geométrica dos valores: 3, 6, 12, 24 e 48. 5 5Mg 3 6 12 24 48 248.832 12= × × × × = = b) Média geométrica para dados agrupados Sejam x1, x2, ..., xk, valores da variável X associados às freqüências absolutas F1, F2, F3, ... , Fk, respectivamente. A média geométrica, denotada por Mg, é definida por: 31 2 kFF F Fn 1 2 3 kMg x x x ... x= ⋅ ⋅ ⋅ ⋅ Exemplo: Calcular a média geométrica da distribuição: xi 1 2 3 5 Fi 8 6 5 3 41 8 6 5 322Mg 1 2 3 5 1,9311= × × × = Observação: Quando o número de observações for muito grande é aconselhável o emprego de logaritmo (decimal ou neperiano). Assim, 31 2 kFF F Fn 1 2 3 kMg x x x ... x= × × × × � Mg = ( )31 2 k 1 FF F F n 1 2 3 kx x x ... x× × × × log Mg = log ( )31 2 k 1 FF F F n 1 2 3 kx x x ... x× × × × = 1 1 2 2 k kF . log x F . log x ... F . log x n + + + Aplicando este resultado no exemplo acima, temos: log Mg = 8 . log 1 6 . log 2 5 . log 3 3 . log 5 22 + + + = 8 . 0 6 . 0,3010 5 . 0,4771 3 . 0,6990 22 + + + = 0,2858 Logo, Mg = antilog 0,2858 = 10 0,2858 = 1,9311 A média geométrica como medida de tendência central é de pouco uso, e seu emprego é restrito, como no caso dos dados de uma série formarem ou se aproximarem deuma progressão geométrica, e em números índices. Exemplos de dados com este comportamento são os preços num período de inflação e a variação do montante em juros compostos, apresentando-se em progressão geométrica de razão (1 + r), sendo r a taxa unitária. Como a média geométrica depende do produto, se um dos fatores for igual a zero ela também o será. Por outro lado, se tiver fatores negativos ela poderá ser negativa ou imaginária (número complexo), dependendo para isso, do índice n ser ímpar ou par. 2.1.3 MÉDIA HARMÔNICA (Mh) a) Média harmônica para dados não agrupados Sejam x1, x2, ..., xn, n valores da variável X. A média harmônica, denotada por Mh, é definida por: 42 1 2 3 n n Mh 1 1 1 1 ... x x x x = + + + + Exemplo: Calcular a média harmônica de 2, 5 e 8. 3 Mh 3,64 1 1 1 2 5 8 = = + + b) Média harmônica para dados agrupados Sejam x1, x2, ..., xk, valores da variável X associados às freqüências absolutas F1, F2, F3, ... , Fk, respectivamente. A média harmônica de X, denotada por Mh, é definida por: k 1 2 3 k i 1 2 3 k i 1 i n n Mh F F F F F... x x x x x = = = + + + + � A média harmônica é particularmente recomendada para séries de valores que são inversamente proporcionais, como para o cálculo de velocidade média, tempo médio de escoamento de estoque, etc. A média harmônica poderá ser empregada, por exemplo, no caso dos preços unitários de certas mercadorias que são inversamente proporcionais às quantidades de lotes, se o preço total de cada lote tiver o mesmo custo. O preço médio unitário deverá ser igual à média harmônica dos demais preços. EXERCÍCIOS: 1. Determine a média aritmética das seguintes séries: a) 3, 4, 1, 3, 6, 5 e 6; b) 60, 80, 90, 100 e 120; c) 2,5; 3,6; 4,1; 4,3 e 6,2. 2. A média mínima para aprovação em uma matéria é 5. Se um estudante obteve as notas 7,5; 8,0; 3,5; 6,0; 2,5; 2,0; 5,5 e 4,0 nos trabalhos mensais desta matéria, pergunta-se: ele foi ou não aprovado? 3. Calcule para cada uma das distribuições a sua respectiva média: 43 a) xi 3 4 7 8 12 Fi 2 5 8 4 3 b) Aluguel (R$1.000) 1,5 |--- 3,5 3,5 |--- 5,5 5,5 |--- 7,5 7,5 |--- 9,5 9,5 |--- 11,5 Nº DE IMÓVEIS 12 18 20 10 5 4. Com importâncias iguais foram compradas quantidades diferentes de certa mercadoria cujos preços unitário foram R$ 20,00, R$ 40,00, R$ 20,50, R$ 21,00 e R$ 21,60. Calcular o preço médio unitário de custo destas mercadorias. (Sugestão: utilize a média harmônica) . 5. Calcule a média geométrica para as séries: a) 1, 2, 4, 7, 16; b) 81, 26, 10, 3, 1. 6. Utilizando a série de dados 2, 8, 7 e 15, comprove as seguintes propriedades da média aritmética: a) A soma dos desvios em torno da média é zero, isto é, i(x x) 0− =� b) Somando (ou subtraindo) uma mesma quantidade arbitrária a (de) todos os valores da série, a média ficará aumentada (ou diminuída) desta mesma quantidade. c) Multiplicando ou dividindo cada termo de uma série por uma constante, a média ficará multiplicada ou dividida pela constante. d) A soma dos quadrados dos desvios medidos em relação à média é um mínimo, ou seja, é sempre menor que a soma dos quadrados dos desvios medidos em relação a qualquer outro valor, isto é, i(x x)−� é mínimo. 7. Calcule as médias aritmética, geométrica e harmônica para a série a seguir e observe pelos cálculos qual a relação entre estas médias. xi Fi 2 1 3 4 4 3 5 2 TOTAL 44 2.1.4 MEDIANA (Md) A mediana, denotada por Md, é o valor que divide o rol em duas partes contendo, cada uma, a mesma quantidade de elementos. Assim, a mediana é o valor que ocupa a posição central de uma série de dados. 50% 50% Md a) Mediana para dados não agrupados i) Se n é ímpar – o rol admite apenas um termo central que ocupa a posição n 1 2 + . O valor do elemento que ocupa esta posição é a mediana. Exemplo: Determinar a mediana da série: 20; 12; 23; 20; 8; 12; 2. Rol: 2; 8; 12; 12; 20; 20; 23. n = 7 (n é ímpar) O rol admite somente um termo central que ocupa a posição 7 1 2 + , ou seja, a 4ª posição. Portanto Md = x4 = 12. Interpretação: 50% dos valores da série são menores ou iguais a 12 e 50% dos valores são maiores ou iguais a 12. ii) Se n é par – neste caso o rol admite dois termos centrais que ocupam as posições n 2 e n 1 2 + . Neste caso a mediana é definida como a média aritmética destes dois termos centrais. Exemplo: Determinar a mediana da série: 7; 21; 13; 15; 10; 8; 9; 13. Rol: 7; 8; 9; 10; 13; 13; 15; 21. n = 8 (n é par) A série admite dois termos centrais que ocupam as posições 8 2 e 8 1 2 + , ou seja, a 4ª posição e a 5ª posição. Portanto, 45 4 5x x 10 13Md 11,5 2 2 + + = = = . Interpretação: 50% dos valores do rol são menores ou iguais a 11,5 e 50% dos valores são maiores ou iguais a 11,5. b) Mediana para dados agrupados sem intervalos de classes O procedimento para o cálculo da mediana para dados agrupados sem intervalos de classes é o mesmo utilizado para dados não agrupados, ou seja: • Se n for ímpar, a mediana será o termo central, isto é, o termo de ordem n 1 2 + . • Se n for par, a mediana será a média aritmética entre os elementos centrais, isto é, os elementos de ordem n 2 e n 1 2 + . Exemplo 1: Determinar a mediana da distribuição abaixo. i xi Fi Faci 1 2 1 1 2 5 4 5 3 8 10 15 4 10 6 21 5 12 2 23 TOTAL 23 − n = 23 (n é ímpar) A distribuição admite apenas um termo central que ocupa a posição 23 1 2 + , ou seja, a 12ª posição. Através das freqüências acumuladas podemos observar que: o 1º elemento é o 2; o 2º, o 3º, o 4º e o 5º elementos são iguais a 5; o 6º, o 7º, ... , o 15º elementos são iguais a 8; e assim sucessivamente. Portanto o 12º elemento é o 8. Logo, Md = x12 = 8. 46 Exemplo 2: Determinar a mediana da distribuição i xi Fi Faci 1 0 3 3 2 1 5 8 3 2 8 16 4 3 10 26 5 5 6 32 TOTAL 32 − n = 32 (n é par). A série admite dois termos centrais que ocupam as posições 32 2 e 32 1 2 + , ou seja, o 16º e o 17º elementos. Observando as freqüências acumuladas, temos: O 1º, o 2º e o 3º elementos são iguais a 0; O 4º, o 5º, o 6º, o 7º e o 8º são iguais a 1; O 9º, o 10º, ... , o 16º são iguais a 2; O 17º, o 18º, ... , o 26º são iguais a 3; O 27º, o 28º, ..., o 32º são iguais a 5. Portanto o 16º termo é igual a 2 e o 17º termo é igual a 3. Logo, 16 17 x x 2 3 Md 2,5 2 2 + + = = = c) Mediana para dados agrupados com intervalos de classes • Calcula-se n 2 , independente de n ser par ou ímpar; • Localiza-se, através das freqüências acumuladas, a classe mediana, ou seja, a classe que contém o termo de ordem n 2 ; • Aplica-se a fórmula: ant Md Md n Fac 2Md l h F − = + × , onde: lMd = limite inferior da classe mediana; Facant = freqüência acumulada da classe anterior à classe mediana; h = amplitude da classe mediana; FMd = freqüência absoluta da classe mediana. 47 Exemplo 1 Determinar a mediana da distribuição. i Altura(cm) Fi Faci 1 150 |--- 154 4 4 2 154 |--- 158 9 13 3 158 |--- 162 11 24 → classe mediana 4 162 |--- 166 8 32 5 166 |--- 170 5 37 6 170 |--- 174 3 40 TOTAL 40 − • Calcula-se n 2 → 40 20 2 = • Localiza-se a classe mediana(a classe que contém o termo de ordem n 2 ) Classe mediana = 3ª classe • Aplica-se a fórmula: ant Md Md n Fac 2Md l h F − = + × lMd = 158 Facant= 13 20 13 Md 158 4 160,55 11 − = + × = h = 4 FMd = 11 Interpretação: 50% das pessoas têm altura inferior a 160,55 cm. Exemplo 2 Consideremos a distribuição de freqüência por classes das notas dos 50 alunos da turma PEST e vamos calcular a sua mediana. Notas de 50 alunos da turma PEST Classes Notas Fi Faci 1 30 |--- 40 4 4 2 40 |--- 50 6 10 3 50 |--- 60 8 18 4 60 |--- 70 13 31 →→→→ classe mediana 5 70 |--- 80 9 40 6 80 |--- 90 7 47 7 90 |--- 100 3 50 Total 50 ---- Fonte: Dados Hipotéticos 48 • Calcula-se n 2 → 50 25 2 = • Localiza-se a classe mediana (a classe que contém o termo de ordem 2 n ) Classe mediana = 4ª classe • Aplica-se a fórmula: ant Md Md n Fac 2Md l h F − = + × lMd = 60 Facant= 18 25 18 Md 60 10 65,38 13 − = + × = h = 10 FMd = 13 Interpretação: 50% das notas foram inferiores a 65,38. EXERCÍCIOS: 1. Determinar a média e a mediana das séries: a) 2; 5; 8; 10; 12; 8; 5; 12 b) 3,4; 5,2; 4,7; 6; 8,4; 9,3; 2,1; 4,8 2. Determinar a média e a mediana das distribuições: a) xi 2 3 4 5 7 Fi 3 5 8 4 2 b) xi 73 75 77 79 81 Fi 2 10 12 5 2 c) Classes 1 |-- - 3 3 |-- - 5 5 |-- - 7 7 |-- - 9 9 |-- - 11 11 |-- - 13 Fi 3 5 8 6 4 3 d) Classes 22 |-- - 25 25 |-- - 28 28 |-- - 31 31 |-- - 34 Fi 3 5 8 6 49 2.1.5 MODA (Mo) A moda é o valor mais freqüente do conjunto de dados observados. a) Moda para dados não agrupados Para determinar a moda, basta identificar o(s) elemento(s) que mais se repete(m). Exemplo: Determinar a moda dos conjuntos de dados abaixo: a) 2; 8; 3; 5; 4; 5; 3; 5; 1 O elemento que mais se repete é o 5. Portanto: Mo = 5 (seqüência unimodal). b) 6; 10; 5; 6; 10; 2 Neste conjunto de dados o elemento 6 e o elemento 10 se repetem mais vezes que os demais. Portanto: Mo1 = 6 e Mo2 = 10 (seqüência bimodal). c) 2; 2; 8; 8; 5; 5; 6; 6 Não há nenhum elemento que se destaque por possuir maior freqüência. Portanto, a série não possui moda e é dita amodal. Observação: A moda só é considerada medida de tendência central no caso unimodal. Nos demais casos é uma medida estatística de análise. b) Moda para dados agrupados sem intervalos de classes Neste caso, basta identificar o(s) elemento(s) de maior freqüência. Exemplo: Determinar a moda das distribuições: a) i xi Fi 1 0 2 2 2 5 3 3 8 4 4 3 5 5 1 Total Mo = 3 (Distribuição Unimodal) 50 b) i xi Fi 1 1 2 2 2 5 3 3 4 4 4 5 5 5 1 Total Mo1 = 2 e Mo2 = 4 (Distribuição Bimodal) c) i xi Fi 1 4 5 2 5 5 3 8 5 4 10 5 Total Não há moda (Distribuição Amodal) c) Moda para dados agrupados com intervalos de classes Neste caso, há diversos processos para o cálculo da moda. i) Fórmula de Czuber • Identifica-se a classe modal (a que possui maior freqüência); • Aplica-se a fórmula: 1 Mo 1 2 Mo l h ∆ = + ⋅ ∆ + ∆ , onde: lMo = limite inferior da classe modal. ∆1 = diferença entre a freqüência absoluta da classe modal e a freqüência absoluta da classe anterior à classe modal. ∆2 = diferença entre a freqüência absoluta da classe modal e a freqüência absoluta da classe posterior à classe modal. h = amplitude da classe modal. 51 Exemplo 1 Determinar a moda da distribuição: i classes Fi 1 0 |--- 1 3 2 1 |--- 2 10 3 2 |--- 3 17 → Classe Modal 4 3 |--- 4 8 5 4 |--- 5 5 TOTAL 43 • Identifica-se a classe modal: 3ª classe (maior freqüência = 17) • Aplica-se a fórmula: 1 Mo 1 2 Mo l h ∆ = + ⋅ ∆ + ∆ , onde: lMo = 2; ∆1 = 17 – 10 = 7; ∆2 = 17 – 8 = 9; h = 3 – 2 = 1 Logo: 7 Mo 2 1 2,44 7 9 = + ⋅ = + Exemplo 2 Considere a distribuição abaixo. Salários dos Empregados da Empresa PEST Classes Salários (classes) Fi (nº funcionários) 1 800 |- 1800 70 2 1800 |- 2500 140 3 2500 |- 3000 140 4 3000 |- 5000 60 Total 410 Fonte: Dados Hipotéticos Como as amplitudes das classes não são iguais, vamos utilizar as densidades das classes i i F h para identificar a classe modal (aquela com a maior densidade) 52 Salários dos Empregados da Empresa PEST Classes Salários (classes) xi (pto médio) Fi (nº funcionários) Fi/hi (densidade) 1 800 |- 1800 1300 70 0,07 2 1800 |- 2500 2150 140 0,20 3 2500 |- 3000 2750 140 0.28 4 3000 |- 5000 4000 60 0,03 Total 410 Fonte: Dados Hipotéticos • Identifica-se a classe modal: 3ª classe (maior densidade = 0,28) • Aplica-se a fórmula: 1 Mo 1 2 Mo l h ∆ = + ⋅ ∆ + ∆ , onde: lMo = 2500; ∆1 = 0,28 – 0,20 = 0,08; ∆2 = 0,28 – 0,03 = 0,25; h = 500 Logo: 0,08 Mo 2500 500 2500 0,24 500 2621,21 0,08 0,25 = + ⋅ = + ⋅ = + Assim, R$ 2621,21 é o salário mais freqüente entre os 410 funcionários dessa empresa. ii) Fórmula de Pearson Mo 3Md 2x≅ − Na fórmula de Pearson a moda é aproximadamente igual a diferença entre o triplo da mediana e o dobro da média. Esta fórmula dá uma boa aproximação quando a distribuição apresenta razoável simetria em relação à média. Observação: Para calcular a moda de uma variável, precisamos apenas da distribuição de freqüência. Para a mediana necessitamos minimamente ordenar os valores atribuídos à variável. A média só pode ser calculada para variáveis quantitativas. Assim, para as variáveis nominais somente podemos trabalhar com a mediana, além da moda. 53 EXERCÍCIOS: 1. Para cada distribuição, determine a média, a mediana e a moda: a) xi 72 75 78 80 Fi 8 18 28 38 b) Classes 7 |--- 10 10 |--- 13 13 |--- 16 16 |--- 19 19 |--- 22 Fi 6 10 15 10 5 3. MEDIDAS SEPARATRIZES As medidas separatrizes são valores que dividem o conjunto de dados observados em um determinado número de partes, contendo cada uma a mesma quantidade de elementos. São elas: • Mediana É considerada também uma medida separatriz. • Quartis São valores que dividem o rol em quatro partes iguais, cada uma com 25% dos elementos. Ao todo tem-se 3 quartis: Q1 (1º quartil), Q2 (2º quartil) e Q3 (3º quartil). 25% 25% 25% 25% Q1 Q2=Md Q3 Observe que: o Abaixo do 1º quartil tem-se 25% dos elementos; o Abaixo do 2º quartil tem-se 50% dos elementos; o Abaixo do 3º quartil tem-se 75% dos elementos; • Decis São valores que dividem o rol em dez partes iguais, cada uma com 10% dos elementos. Ao todo tem-se 9 decis: D1 (1º decil), D2 (2º decil), ... , D9 (9º decil). 54 10% 10% 10% 10% 10% 10% 10% 10% 10% 10% D1 D2 D3 D4 D5 D6 D7 D8 D9 Observe que: • Abaixo do 1º decil tem-se 10% dos elementos; • Abaixo do 2º decil tem-se 20% dos elementos; • Abaixo do 3º decil tem-se 30% dos elementos; e assim sucessivamente. • Centis ou Percentis Dividem o rol em cem partes iguais, cada uma com 1% dos elementos. Ao todo tem-se 99 centis: P1 (1º centil), P2 (2º centil), ... , P99 (99º centil). 1% 1% 1% 1% ...1% ... 1% ... 1% P1 P2 P3 P4 P50 P51 P80 P81 P99 Observe que: • Abaixo do 1º centil tem-se 1% dos elementos; • Abaixo do 2º centil tem-se 2% dos elementos; • Abaixo do 3º centil tem-se 3% dos elementos; • Abaixo do 4º centil tem-se 4% dos elementos; e assim sucessivamente. Cálculo das medidas separatrizes: a) Separatrizes para dados não agrupados Devemos ordenar os elementos, identificar a medida que queremos obter (quartil, decil ou centil), localizar a posição da medida desejada e identificar o elemento que ocupa esta posição, de acordo com o esquema a seguir: Quartil i: i n pos ,i 1,2,3 4 ⋅ = = Decil i: i n pos ,i 1,2,...,9 10 ⋅ = = Centil i: i n pos ,i 1,2,...,99 100 ⋅ = = 55 Observe que: • Se pos for um número inteiro, então a medida procurada corresponde ao elemento do rol que ocupa esta posição. • Se pos não for um número inteiro, então a medida procurada é um elemento intermediário entre os elementos que ocupam as posições aproximadas por falta e por excesso do valor pos. Neste caso, a separatriz corresponde à média aritmética dos valores que ocupam estas posições. Exemplos: 1. Calcule o primeiro quartil da seqüência: 2, 5, 8, 5, 5, 10, 1, 12, 12, 11, 13, 15. Rol: 1, 2, 5, 5, 5, 8, 10, 11, 12, 12, 13, 15. i n 1 12 pos 3 4 4 ⋅ ⋅ = = = Logo, Q1= x3 = 5. 2. Calcule o P60 da seqüência: 2; 8; 7,5; 6; 10; 12; 2; 9. Rol: 2; 2; 6; 7,5; 8; 9; 10; 12. i n 60 8 pos 4,8 100 100 ⋅ ⋅ = = = Como este valor não é inteiro, o P60 é um valor situado entre o 4º e o 5º elemento da seqüência. Logo, 4 560 x x 7,5 8 P 7,75 2 2 + + = = = b) Separatrizes para dados agrupados sem intervalos de classes Neste caso, como os dados já estão ordenados, utilizamos a freqüência acumulada da série para localizar o elemento que ocupa a posição da separatriz desejada, conforme citado no item anterior. Exemplo: Calcular o quarto decil da distribuição: 56 i xi Fi Faci 1 2 3 3 2 4 5 8 3 5 8 16 4 7 6 22 5 10 2 24 Total 24 −−−− i n 4 24 pos 9,6 10 10 ⋅ ⋅ = = = Como este valor não é inteiro, o D4 é um valor situado entre o 9º e o 10º elemento da distribuição. Logo, 9 104 x x 5 5 D 5 2 2 + + = = = c) Separatrizes para dados agrupados com intervalos de classes Neste caso, aplica-se a fórmula: antpos FacSep l h F − = + × , onde: Sep = medida separatriz a ser determinada (Mediana, Quartil, Decil ou Centil); l = limite inferior da classe separatriz (a classe que contém a separatriz a ser determinada); Facant = freqüência acumulada da classe anterior à classe separatriz; F = freqüência absoluta simples da classe separatriz; h = amplitude da classe separatriz; pos = é a posição da separatriz, sendo dada por: Mediana: n pos 2 = Quartil i: i n pos ,i 1,2,3 4 ⋅ = = Decil i: i n pos ,i 1,2,...,9 10 ⋅ = = Centil i: i n pos ,i 1,2,...,99 100 ⋅ = = 57 Exemplo: Calcular o 1º quartil, o 4º decil e o 70º centil da distribuição. i Altura (cm) Fi Faci 1 150 |--- 154 4 4 2 154 |--- 158 9 13 → classe que contém o 1º quartil 3 158 |--- 162 11 24 → classe que contém o 4º decil 4 162 |--- 166 8 32 → classe que contém o 70º centil 5 166 |--- 170 5 37 6 170 |--- 174 3 40 TOTAL 40 − Cálculo do 1º quartil: • Calcula-se pos = n 4 → 40 10 4 = • Localiza-se a classe que contém o 10º termo (2ª classe) • Aplica-se a fórmula: 1 1 ant 1 Q Q pos Fac Q l h F − = + × 1Q l = 154 Facant= 4 1 10 4 Q 154 4 156,67 9 − = + × = h = 4 1Q F = 9 Interpretação: 25% das pessoas têm altura inferior a 156,67 cm. Cálculo do 4º decil: • Calcula-se pos = 4 n 10 ⋅ → 4 40 16 10 ⋅ = • Localiza-se a classe que contém o 16º termo (3ª classe) • Aplica-se a fórmula: 4 4 ant 4 D D pos Fac D l h F − = + × 4D l = 158 Facant= 13 4 16 13 D 158 4 159,09 11 − = + × = h = 4 e 4D F = 11 58 Interpretação: 40% das pessoas têm altura inferior a 159,09 cm. Cálculo do 70º centil: • Calcula-se pos = 70 n 100 ⋅ → 70 40 28 100 ⋅ = • Localiza-se a classe que contém o 28º termo (4ª classe) • Aplica-se a fórmula: 70 70 ant 70 C C pos Fac C l h F − = + × 70C l = 162 Facant= 24 70 28 24 C 162 4 164 8 − = + × = h = 4 70C F = 8 Interpretação: 70% das pessoas têm altura inferior a 164 cm. EXERCÍCIOS: 1. Para a distribuição: Classes 4 |--- 6 6 |--- 8 8 |--- 10 10 |--- 12 Fi 4 11 15 5 Calcule Q1, D6 e P65. Interprete os resultados obtidos. 2. Para a distribuição abaixo calcule Q3, D2 e P45. Interprete os resultados obtidos. Classes 20 |--- 30 30 |--- 40 40 |--- 50 50 |--- 60 60 |--- 70 Fi 3 8 18 22 24 3. O departamento de recursos humanos de uma empresa, tendo em vista o aumento de produtividade de seus vendedores, resolveu , premiar com um aumento de 5% no salário, a metade e seus vendedores mais eficientes. Para isto, fez um levantamento de vendas semanais, por vendedor, obtendo a tabela: 59 Vendas (R$) Nº DE VENDEDORES 0 |---- 10.000 1 10.000 |---- 20.000 12 20.000 |---- 30.000 27 30.000 |---- 40.000 31 40.000 |---- 50.000 10 Total A partir de qual volume de vendas o vendedor será premiado? 4. Se, no problema anterior, o gerente resolver premiar somente os 25% dos vendedores mais eficientes, a partir de qual volume de vendas o vendedor será premiado? 5. A distribuição de freqüência abaixo representa o consumo por nota de 54 notas fiscais emitidas durante um dia em uma loja de departamentos. Consumo por nota fiscal (R$) Nº DE NOTAS 0 |---- 50 10 50 |---- 100 28 100 |---- 150 12 150 |---- 200 2 200 |---- 250 1 250 |---- 300 1 Total O gerente desta loja de departamentos decidiu premiar a nível promocional com um brinde, 10% dos fregueses que mais consumirem, nos próximos 30 dias. A partir de qual valor de consumo da nota fiscal os clientes seriam premiados? 60 4. MEDIDAS DE DISPERSÃO, MEDIDAS DE ASSIMETRIA E MEDIDAS DE CURTOSE 4.1 MEDIDAS DE DISPERSÃO As medidas de dispersão são medidas estatísticas utilizadas para avaliar o grau de variabilidade, ou dispersão, dos valores em torno da média. Servem para medir a representatividade da média. Essa avaliação é necessária, pois quando se trata de interpretar dados estatísticos, mesmo aqueles já convenientemente simplificados, como a média aritmética, deve-se ter uma idéia retrospectiva de como se apresentavam esses mesmos dados nas tabelas. Assim, não é o bastante dar uma medida de posição para caracterizar perfeitamente um conjunto de valores, devemos, também, medir a variabilidade do conjunto de valores em relação à essa medida de posição. Se observarmos as seqüências X: 10, 1, 18, 20, 35, 3, 7, 15, 11, 10 Y: 12, 13, 13, 14, 12, 14, 12, 14, 13, 13 Z: 13, 13, 13, 13, 13, 13, 13, 13, 13, 13 concluiremos que todas possuem a mesma média 13. No entanto, são seqüências completamente distintas do ponto de vista da variabilidade de dados. Na seqüência Z não há variabilidade de dados. A média 13 representa bem qualquer valor da série. Na seqüência Y, a média 13 representa bem a série,
Compartilhar