Baixe o app para aproveitar ainda mais
Prévia do material em texto
Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 1 UNIVERSIDADE ESTADUAL DE FEIRA DE SANTANA DEPARTAMENTO DE CIÊNCIAS EXATAS DISCIPLINA: CURSO: DATA: / / PROFESSOR: Jackson Oliveira ALUNO: APOSTILA DE ESTATÍSTICA CONTEÚDO PROGRAMÁTICO I UNIDADE AULAS CONTEÚDO DATA PREVISTA PÁGINA AULAS 01-02: INTRODUÇÃO E CONCEITOS DE ESTATÍSTICAS. 15 DE SETEMBRO 02 AULAS 03-04: FASES DO TRABALHO, TABELAS E GRÁFICOS. 16 DE SETEMBRO 08 AULAS 05-06: DISTRIBUIÇÃO DE FREQUÊNCIAS E HISTOGRAMA. 22 DE SETEMBRO 14 AULAS 07-08: SOMATÓRIO E PRODUTÓRIO. 23 DE SETEMBRO 21 AULAS 09-10: MÉDIA ARITMÉTICA 30 DE SETEMBRO 24 AULAS 11-12: MÉDIAS GEOMÉTRICA E HARMÔNICA 06 DE OUTUBRO 29 AULAS 13-14: MODA E MEDIANA 07 DE OUTUBRO 33 AULAS 15-16: SEPARATRIZES E BOX PLOT 20 DE OUTUBRO 45 AULAS 17-18: MEDIDAS DE DISPERSÃO: DESVIO MÉDIO, VARIÂNCIA, DESVIO PADRÃO E COEFICIENTE DE VARIAÇÃO. 21 DE OUTUBRO 50 AULAS 18-19: MEDIDAS DE DISPERSÃO PARA DADOS AGRUPADOS 27 DE OUTUBRO 58 AULAS 20-21: MEDIDAS DE ASSIMETRIA 10 DE NOVEMBRO 70 AULAS 17-18: AVALIAÇÃO 11 DE NOVEMBRO Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 2 [AULAS 1-2] : INTRODUÇÃO E CONCEITOS DE ESTATÍSTICAS 1. INTRODUÇÃO Antes de começarmos a estudar Estatística, é importante que saibamos o que estamos estudando. A estatística, antes de qualquer coisa, é um ramo da matemática aplicada. Seu objetivo é fornecer métodos para coleta, organização, resumo, apresentação e análise dos dados, visando obtenção de conclusões válidas e, finalmente, tomada de decisões. Assim, a estatística serve de instrumento de apoio a vários outros campos do conhecimento; na verdade, a todos os ramos do conhecimento em que dados experimentais são manipulados. Podemos, apenas para citar alguns, falar da importância da estatística na Física, Química, Medicina, Engenharia, Ciências Socias, e, é claro, na Administração de Empresas. 2. O PASSADO: A HISTÓRIA DA ESTATÍSTICA Muitos anos antes de Cristo as necessidades que exigiam o conhecimento numérico começaram a surgir, pois contar e recensear sempre foi uma preocupação em todas as culturas. O primeiro dado estatístico disponível foi o de registros egípcios de presos de guerra na data de 5000 a.C., em 3000 a.C. existem também registros egípcios da falta de mão-de-obra relacionada a construção de pirâmides. No ano de 2238 a.C. o Imperador da China Yao, ordenou que fosse feito o primeiro recenseamento com fins agrícolas e comerciais. Em 600 a.C. no Egito todos os indivíduos tinham que declarar todos os anos ao governo de sua província a sua profissão e suas fontes de rendimento, caso não a fizessem seria declarada a pena de morte. Já na Era de Cristo o governador romano da Síria, Quirino, que incluía a Judéia e a Galiléia, por ordem do Senado, teve que fazer um recenseamento no qual as pessoas tinham que ser entrevistadas no local de sua origem. Acredite. Não fosse a Estatística Jesus Cristo não teria nascido numa manjedoura em Belém e a história do cristianismo – e de quase toda a cultura ocidental – poderia ter sido diferente. Explica-se. Como está escrito na Bíblia, Lucas cap. 2:1-2 - O imperador Augusto mandou uma ordem para todos os povos do Império. Todas as pessoas deviam se registrar para que fosse feita uma contagem da população. Foi então que São José e a Virgem Maria saíram de Nazareth, na Galiléia, para Belém, na Judéia, para responder ao censo ordenado pelo imperador César Augusto. Foi enquanto estavam na cidade que Jesus nasceu. Alguns acontecimentos podem ser destacados como fatos importantes na formação da estatística: No mundo: - Em 620 surgiu em Constantinopla o Primeiro Bureau de Estatística. - No ano de 1654, Blaise Pascal e Pierre de Fermat estabelecem os princípios do cálculo de probabilidades. - Somente em 1708, houve a criação do Primeiro Curso de Estatística, criado na Universidade de IENA, na Alemanha. - A palavra estatística surge em 1752 pelo alemão Gottfried Achenwall que deriva da palavra latina STATU, que significa estado, pelo aproveitamento que os políticos e o estado tiravam dela. Enquanto isso no Brasil: - No ano de 1872, houve o primeiro senso geral da população brasileira feito por José Maria da Silva Paranhos, conhecido como Visconde do Rio Branco (1819-1880) - Em 1936 temos a Criação do Instituto Brasileiro de Geografia e Estatística (IBGE). Em 1953 duas escolas iniciaram o Ensino de Estatística no Brasil: uma no Rio de Janeiro, a Escola Nacional de Ciências Estatística (ENCE) e a outra conhecida como Escola de Estatística da Bahia. - Só em 1972 que surge o Primeiro Computador Brasileiro, que ajudou a dar um grande salto na estatística. Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 3 - A inclusão da Estatística no Ensino Fundamental e Médio apareceu a partir da determinação dos Parâmetros Curriculares Nacionais (PCN’s) em 1997. 3. O QUE É ESTATÍSTICA? Estatística é a ciência que investiga os processos de obtenção, organização e análise de dados sobre uma população, e os métodos de tirar conclusões ou fazer predições com base nesses dados. Este conceito tem um significado mais amplo do que aquele que usualmente se dá à palavra "estatística", isto é, o resultado de contagens sobre a ocorrência de determinados eventos e a sua representação através de gráficos e tabelas, como, por exemplo, as estatísticas de ocorrência de chuvas numa certa época do ano; as estatísticas sobre os ganhadores de prêmios de loteria; as estatísticas de renda média por região etc. Em geral, este conceito mais popular de estatística corresponde somente à organização e descrição dos dados relativos a um determinado experimento ou situação e não trata da análise e interpretação desses dados. Ele está associado à parte da Estatística que denominamos de Estatística Descritiva. A Estatística Descritiva, portanto, é a parte da Estatística que se preocupa com a organização e descrição de dados experimentais. Além da Estatística Descritiva há a Estatística Indutiva ou Estatística Inferência que consiste, fundamentalmente, das técnicas de análise e interpretação dos dados. A partir de um conjunto restrito de dados, chamado de amostra, organizado e descrito pela Estatística Descritiva, a Estatística Indutiva procura fazer inferências ou, em outras palavras, tirar conclusões sobre a natureza desses dados e estender essas conclusões a conjuntos maiores de dados, chamados de populações. É evidente que, para que a Estatística Indutiva possa deduzir conclusões válidas, é necessário que se tomem alguns cuidados para a escolha da amostra a ser utilizada. Esses cuidados, mais propriamente chamados de critérios, são estabelecidos por uma técnica chamada de amostragem. Contudo, para permitir que a Estatística Indutiva proporcione conclusões válidas não basta utilizar as técnicas de organização e descrição dos dados da Estatística Descritiva e as técnicas corretas de amostragem. Fica ainda faltando uma última ferramenta que é o cálculo de probabilidades. O cálculo de probabilidades é um conjunto de técnicas matemáticas que visa determinar as chances de ocorrência de eventos regidos pelas leis do acaso. Grandes áreas da Estatística Para fins de apresentação, é usual se dividir a estatística em três grandes áreas, embora não se trate de ramos isolados: • Estatística Descritiva e Amostragem – Conjunto de técnicas que objetivam coletar, organizar, apresentar, analisar e sintetizar os dados numéricos de uma população, ou amostra; • Estatística Inferencial – Processo de se obter informações sobre uma população a partir de resultadosobservados na amostra; • Probabilidade - Modelos matemáticos que explicam os fenômenos estudados pela Estatística em condições normais de experimentação. Em estatística, utilizamos extensamente os termos: população, amostra, censo, parâmetros, estatística, dados discretos, dados contínuos, dados quantitativos e dados qualitativos; que estaremos definindo abaixo para maior compreensão. 4. CONCEITOS BÁSICOS DE ESTATÍSTICA População e Amostra Ao coletarmos dados sobre um grupo de objetos ou indivíduos, como por exemplo a cor dos olhos ou o peso de estudantes de ensino médio ou até o número de peças defeituosas produzidas em um dia, nem sempre poderemos observar todo o grupo, principalmente nos casos em que tal grupo for muito grande ou até mesmo inacessível. Desse modo, em vez de examinarmos todo o grupo ou conjunto, chamado de população, levantaremos os dados apenas de uma parte desta população, chamada amostra. Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 4 De maneira mais formal, população (ou universo) é um conjunto de elementos com pelo menos uma característica comum. Os estudantes universitários, por exemplo, constituem uma população, pois no mínimo apresentam uma característica em comum: são aqueles que estudam em universidades. Essa característica em comum delimita de maneira inequívoca os elementos que pertencem à população, e os que não pertencem. No entanto, como já citei, muitas vezes não é conveniente, e muitas vezes é impossível levantar os dados referentes a todos os elementos da população. Devemos, portanto, limitar nossas observações à uma amostra. Formalizando a ideia, amostra é um subconjunto finito de uma população. • População: é uma coleção completa de todos os elementos a serem estudados. • Amostra: é um subconjunto de elementos extraídos de uma população. • Censo: é uma coleção de dados relativos a todos os elementos de uma população. • Parâmetros: é uma medida numérica que descreve uma característica de uma população. • Estimativa: é um valor aproximado do parâmetro e é calculado com o uso da amostra. Tipos de Variáveis Dentro de um estudo estatístico, precisamos definir quais características dos elementos (população ou amostra) nos interessa estudar. Por convenção, definimos variável como o conjunto de resultados possíveis para um fenômeno. Dependendo do objetivo de nosso estudo, a característica (variável) em foco poderá ser: a. Qualitativa – quando for expressa por tipos ou atributos: sexo (masculino ou feminino), cor dos olhos (azuis, castanhos, etc.), qualidade de uma peça produzida (perfeita ou defeituosa). b. Quantitativa – quando for expressa em números. É importante notar que as variáveis quantitativas podem ser subdivididas em discretas e contínuas. Variável contínua é aquela que pode assumir qualquer valor entre dois limites. Por outro lado, uma variável discreta só pode assumir valores pertencentes a um conjunto enumerável. Ao observarmos os exemplos, podemos perceber que, de maneira geral, os valores das variáveis discretas são obtidos por contagens, enquanto que os valores das variáveis contínuas são obtidos por medições. NÍVEL DE MENSURAÇÃO QUALITATIVAS: suas realizações são atributos dos elementos pesquisados. QUANTITATIVAS (intervalares): suas realizações são números resultantes de contagem ou mensuração Nominais: apenas identificar as categorias Ordinais: é possível ordenar as categorias Discretas: podem assumir apenas alguns valores Contínuas: podem assumir infinitos valores Sexo, Naturalidade Classe social Número de filhos Temperatura, velocidade Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 5 Arredondamento de dados a) Quando o primeiro algarismo a ser abandonado é 0,1,2,3 ou 4, fica inalterado o último algarismo a permanecer. Exemplo: 76,23 passa a 76,2. b) Quando o primeiro algarismo a ser abandonado é 6, 7, 8 ou 9, aumenta-se de uma unidade o algarismo a permanecer. Exemplo: 23,68 passa a 23,7. c) Quando o primeiro algarismo a ser abandonado é 5, há duas soluções: - Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma unidade ao algarismo. Exemplo: 5,353 passa a 5,36. - Se o 5 for o último algarismo ou se ao 5 só se seguirem zeros, o último algarismo a ser conservado só será aumentado de uma unidade se for ímpar. Exemplos: 34,75 passa a 34,8; 43,85 passa a 43,8 OBS.: Não devemos nunca fazer arredondamentos sucessivos. Exercícios propostos: QUESTÃO 01 -Considere as afirmações a seguir: I – Estatística Descritiva se preocupa com a organização e descrição dos dados experimentais. II – Estatística Indutiva cuida da análise e interpretação dos dados experimentais. III – Podemos considerar a Estatística como uma ciência que se preocupa com a organização, descrição, análise e interpretação dos dados experimentais. Assinale a alternativa correta: a) as afirmações I e II são falsas b) apenas a afirmação I é verdadeira c) todas as firmações estão corretas d) apenas as afirmações II e III estão corretas e) apenas as afirmações I e III são corretas QUESTÃO 02 -Qual das alternativas representa um dado quantitativo? a) o volume, em mililitros de sucos fabricados pela empresa A. b) qualidade das peças fabricadas pela máquina B. c) grupo sanguíneo disponíveis no banco de sangue do hospital “Doação”. d) sexo (feminino ou masculino) dos nascituros da maternidade A. e) cor dos cabelos das modelos da agência Belle. QUESTÃO 03 - Assinale a alternativa correta: a) População ou Universo é: i) Conjunto de pessoas. ii) Conjunto de indivíduos apresentando uma característica especial. iii) Conjunto todos os indivíduos apresentando uma característica comum objeto de estudo. b) A parte da estatística que se preocupa somente com a descrição de determinadas características de um grupo, sem tirar conclusões sobre um grupo maior denomina-se: i) Estatística Inferencial ii) Estatística Descritiva; iii) Estatística Grupal. Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 6 QUESTÃO 04 - Quando se quer estimar parâmetros populacionais sem examinar toda a população, utiliza-se uma amostra. Dentre os motivos para se utilizar esse procedimento em vez de um censo, NÃO se inclui a) maior custo para realizar um censo. b) a população por ser infinita ou muito grande. c) o processo de pesquisa e o destrutivo. d) maior precisão na amostra do que no censo. e) maior demora para a realização de um censo. QUESTÃO 05 - De acordo com os conceitos de estatística, assinale a alternativa CORRETA. a) Estatística inferencial compreende um conjunto de técnicas destinadas à síntese dos dados numéricos. b) A estatística descritiva compreende as técnicas por meio das quais são tomadas decisões sobre uma população com base na observação de uma amostra. c) Uma população só pode ser caracterizada, se forem observados todos os seus componentes. d) Parâmetros são medidas características de grupos, determinadas por meio de uma amostra aleatória. e) O processo utilizado para se medir as características de todos os membros de uma dada população recebe o nome de censo. QUESTÃO 06 – Assinale a alternativa que responde CORRETAMENTE à pergunta abaixo. Quais das variáveis abaixo podem ser classificadas como quantitativas contínuas? 1. Grau de satisfação 2. Peso 3. Número de carros 4. Grau de escolaridade a) 2. b) 1 e 2. c) 2 e 3. d) 3 e 4. e) 1 e 4. QUESTÃO 07 – Em uma análise estatística, o parâmetro é: a) O obtido na amostra. b) Uma informação da amostra c) Uma informação da população d) Um método de seleçãode variáveis e) Uma informação do método de amostragem QUESTÃO 08 – Julgue os itens abaixo em (V) verdadeiro ou (F) falso e assinale a alternativa correta. I. A Estatística Descritiva pode ser definida como um conjunto de técnicas destinadas a descrever e resumir dados, a fim de que possamos tirar conclusões a respeito de características de interesse. II. Amostra é o conjunto de elementos retirados da população, suficientemente representativos dessa população. Através da análise dessa amostra estaremos aptos para analisar os resultados da mesma forma que se estudássemos toda a população. III. Inferência Estatística é o estudo de técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir de subconjuntos de valores, usualmente de dimensões muito menores. A sequência CORRETA é: a) V, F, V. b) F, F, V. c) F, V, V. d) V, V, F. e) V, V, V. QUESTÃO 09 – Observe a tabela com classificações de variáveis e exemplos. Variável Exemplo I. Qualitativa nominal A. Medida de peso II. Qualitativa ordinal B. Tipo sanguíneo III. Quantitativa discreta C. Nível escolaridade IV. Quantitativa contínua D. Número de filhos por casal Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 7 A relação correta entre esses dois conjuntos é a) I C II B III D IV A b) I B II C III A IV D c) I C II D III A IV B d) I B II C III D IV A QUESTÃO 10 – A área da Estatística caracterizada pelo processo de obter conclusões sobre parâmetros da população, com base em estatísticas amostrais, é denominada: a) populacional. b) descritiva. c) diferencial. d) amostragem. e) inferencial. QUESTÃO 11 – Para participar de um Programa de Qualidade de Vida, promovido por determinada empresa, o funcionário deve responder a um questionário, que fica como seu cadastro. O quadro a seguir apresenta, na coluna A, quatro das questões a serem respondidas pelos funcionários e, na coluna B, quatro tipos de variáveis estatísticas. COLUNA A COLUNA B 1.Qual o seu peso? ( ) qualitativa nominal 2.Quantas pessoas moram em sua casa (incluindo você)? ( ) qualitativa ordinal 3.Qual a sua escolaridade? ( ) quantitativa discreta 4.Você caminha? ( ) quantitativa contínua Associando as questões contidas na coluna A, com seus respectivos tipos de variáveis estatísticas contidos na coluna B, a ordem correta resultante dessa associação é: a) (4), (3), (2), (1). b) (4), (2), (3), (1). c) (3), (4), (2), (1). d) (4), (3), (1), (2). e) (3), (2), (4), (1). Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 8 [AULAS 3 - 4 ] : FASES DO TRABALHO, TABELAS E GRÁFICOS. DO TRABALHO ESTATÍSTICO Fases de um Trabalho Estatístico a) Definição do problema Formulação correta do problema. Saber exatamente o que se pretende estudar. b) Planejamento Como levantar informações? Que dados deverão ser obtidos? Qual levantamento a ser utilizado? Censitário? Por amostragem? E o cronograma de atividades? Os custos envolvidos? Etc. 2 tipos de levantamento • Censitário: abrange toda a população (Censo ou Recenseamento). • Amostragem: estuda-se uma parte da população (amostra). c) Coleta dos dados Fase operacional. É o registro sistemático de dados, com um objetivo determinado. Obtenção, reunião e registro dos dados. • Fontes Primárias: dados coletados diretamente pelo pesquisador. • Fontes Secundárias: através de relatórios, arquivos, livros, etc. d) Apuração dos dados Tratamento prévio dos dados coletados, resumindo-os através de sua contagem e agrupamento. É a condensação e tabulação de dados. e) Apresentação dos dados Há duas formas de apresentação, que não se excluem mutuamente: A apresentação tabular: apresentação numérica dos dados em linhas e colunas distribuídas de modo ordenado segundo regras práticas fixadas pelo Conselho Nacional de Estatística. A apresentação gráfica: os dados numéricos constituem uma apresentação geométrica permitindo uma visão rápida e clara do fenômeno. f) Análise e interpretação A última fase do trabalho estatístico é a mais importante e delicada. Está ligada essencialmente ao cálculo de medidas e coeficientes, cuja finalidade principal é descrever o fenômeno (estatística descritiva). Na estatística indutiva a interpretação dos dados se fundamenta na teoria da probabilidade. SÉRIE ESTATÍSTICA É qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. Séries Homógradas: são aquelas em que a variável descrita apresenta variação discreta ou descontínua. Podem ser do tipo temporal, geográfica ou específica. Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 9 a) Série Temporal: Identifica-se pelo caráter variável do fator cronológico. O local e a espécie (fenômemo) são elementos fixos. Esta série também é chamada de histórica ou evolutiva. ABC VEÍCULOS LTDA. Vendas no 1º bimestre de 2017 PERÍODO UNIDADES VENDIDAS * JAN/96 2 0 FEV/96 1 0 TOTAL 3 0 * Em mil unidades b) Série Geográfica: Apresenta como elemento variável o fator geográfico. A época e o fato (espécie) são elementos fixos. Também é chamada de espacial, territorial ou de localização. ABC VEÍCULOS LTDA. Vendas no 1º bimestre de 2017 FILIAIS UNIDADES VENDIDAS * São Paulo 1 3 Rio de Janeiro 1 7 TOTAL 3 0 * Em mil unidades c) Série Específica: O caráter variável é apenas o fato ou espécie. Também é chamada de série categórica. ABC VEÍCULOS LTDA. Vendas no 1º bimestre de 2017 MARCA UNIDADES VENDIDAS * FIAT 1 8 GM 1 2 TOTAL 3 0 * Em mil unidades SÉRIES CONJUGADAS: Também chamadas de tabelas de dupla entrada. São apropriadas à apresentação de duas ou mais séries de maneira conjugada, havendo duas ordens de classificação: uma horizontal e outra vertical. O exemplo abaixo é de uma série geográfica- temporal. ABC VEÍCLULOS LTDA. Vendas no 1º bimestre de 2017 FILIAIS Janeiro/96 Fevereiro/96 São Paulo 1 0 3 Rio de Janeiro 1 2 5 TOTAL 2 2 8 Em mil unidades Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 10 APRESENTAÇÃO GRÁFICA E TABULAR O que tabulação de dados? É a padronização e codificação das respostas de uma pesquisa. É a maneira ordenada de dispor os resultados numéricos para que a leitura e a análise sejam facilitadas. Tabelas É um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática. • De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar: um traço horizontal ( - ) quando o valor é zero; três pontos ( ... ) quando não temos os dados; zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada; um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de determinado valor. Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto.. Muitas vezes, para organizarmos melhor os dados, fazemos o uso de tabelas. De maneira simplificada, uma tabela é um quadro resumindo o nosso conjunto de observações. Toda tabela deve conter, resumidamente: Título, Cabeçalho, Células e Fonte Gráficos A apresentação gráfica é um complemento importante da apresentação tabular. A principal vantagem de um gráfico sobre a tabela é o fato de que ele permite conseguir uma visualização imediata da distribuição dos valores observados. TABELA . Tipos de Frutas Quantidades Maçãs 10 Bananas 18 Pêras 15 Goiabas 6 Laranjas 20 Professor Jackson – Universidade Estadual de Feira de Santana– Estatística Parte I - 11 a) Gráfico de Linhas Representa observações feitas ao longo do tempo, em intervalos iguais ou não. b) Gráfico de Barras e Gráfico de Colunas São indicados para representar séries categóricas (ou específicas) e séries geográficas. Os gráficos de barras são fáceis de construir e de ler, por isso são os mais populares. . c) Gráfico de Barras Múltiplas ou Agrupadas Utilizado quando é necessário uma comparação das distribuições de dois ou mais grupos de dados d) Gráfico de Barras Empilhadas ou Sobrepostas Utilizado para ilustrar uma representação proporcional dentro de um conjunto de dados. Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 12 e) Gráfico de Setores ou Pizza Utilizado para representar uma série categórica (ou específica). Neste tipo de gráfico todo o conjunto de dados é representado por um círculo, e cada categoria é representada por parte desse círculo (isto é, um setor). Cada setor é obtido por meio de regra de três simples, com o total da série valendo 360º Os gráficos circulares são uma boa forma de mostrar como um todo está repartido. f) Gráfico Pictóricos ou Pictogramas São construídos a partir de figuras ou conjuntos de figuras representativas da intensidade ou das modalidades do fenômeno. g) Gráfico Polar É o gráfico ideal para representar séries temporais cíclicas, isto é, séries temporais que apresentam em seu desenvolvimento determinada periodicidade. Exemplos: → a variação da precipitação pluviométrica ao longo do ano ou da temperatura ao longo do dia; o consumo de energia elétrica durante o mês ou o ano; o número de passageiros de uma linha de ônibus ao longo da semana. O gráfico faz uso do sistema de coordenadas polares. 0 50 100 150 200 Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro Movimento de Compras da Empresa Beta Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 13 EXERCÍCIOS PROPOSTOS QUESTÃO 01 - Os pictogramas são gráficos que se representam através de: (a) barras. (b) união de pontos. (c) linhas. (d) figuras. (e) polígonos. QUESTÃO 02 - Assinale a alternativa correta: a) As fases principais do método estatístico são: i) Coleta dos dados, amostragem, apresentação tabular e apresentação gráfica e definição dos problemas. ii) Amostragem, apresentação tabular, apuração dos dados, interpretação dos dados e planejamento. iii) Definição do problema, planejamento, coleta dos dados, apuração, apresentação dos dados, análise e interpretação dos dados. b) A séria Estatística é chamada cronológica quando: i) O elemento variável é o tempo. ii) O elemento variável é o local. iii) Não tem elemento variável. QUESTÃO 03 - Com relação às normas de apresentação tabular, é correto afirmar que: (A) Uma tabela pode ser apresentada sem título, uma vez que este é um item opcional. (B) A moldura de uma tabela deve ter traços verticais que a delimitem à esquerda e à direita. (C) A fim de diminuir o espaço ocupado pelas colunas de uma tabela, é recomendado que a indicação das palavras do cabeçalho seja feita por meio de abreviações. (D) Toda tabela deve ter cabeçalho para indicar, em complemento ao título, o conteúdo das colunas. (E) O item da tabela inscrito no topo e que indica a natureza e a abrangência geográfica e temporal dos dados numéricos é chamado cabeçalho. QUESTÃO 04 - Em uma pesquisa eleitoral para verificar a posição de três candidatos a prefeito de uma cidade, 2700 pessoas foram consultadas. Se o resultado da pesquisa deve ser mostrado em três setores circulares de um mesmo disco e certo candidato recebeu 300 intenções de voto, então o ângulo central correspondente a este candidato deve ser: a) 45º b) 90° c) 20° d) 40° e) 60° QUESTÃO 05 - Dentre os resíduos industriais, destaca-se a emissão de gás carbônico, que causa o efeito estufa. O gráfico mostra como se distribuía a produção desse poluente em 1990. Se a produção dos países desenvolvidos era de 3,2 bilhões de toneladas, a produção dos países em desenvolvimento, em bilhões de toneladas, deve ser estimadas em cerca de: a) 2,7 b) 2,1 c) 1,8 d) 1,5 e) 1,2 Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 14 [AULAS 5-6] : DISTRIBUIÇÃO DE FREQÜÊNCIAS Distribuição de frequências Uma distribuição de frequência é uma tabela na qual os possíveis valores de uma variável se encontram agrupados em classes, registrando-se o número de valores observados em cada classe. Os dados organizados em uma distribuição de frequência são chamados de dados agrupados. Ao estudar grandes conjuntos de dados, é conveniente resumi-los numa tabela, através do agrupamento dos dados em classes, com suas respectivas frequências. Quando os dados são discretos com valores repetidos, a simples identificação dos mesmos com as respectivas frequências, pode ser um procedimento adequado. Quando os dados são contínuos, pode acontecer que poucos, ou até nenhum deles, apresente frequência. Nestes casos, o procedimento começa pela definição de classes. Cada classe é determinada por um intervalo (diferença entre os limites superior e inferior). Neste caso, a distribuição de frequência é um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições de seus valores). CONCEITOS ESSENCIAIS a) Tabela primitiva ou dados brutos: É uma tabela ou relação de elementos que não foram numericamente organizados. É difícil formarmos uma ideia exata do comportamento do grupo como um todo, a partir de dados não ordenados. b) ROL:É a tabela obtida após a ordenação dos dados (crescente ou decrescente). c) Distribuição de frequência sem intervalos de classe: É a simples condensação dos dados conforme as repetições de seus valores. Para um ROL de tamanho razoável esta distribuição de frequência é inconveniente, já que exige muito espaço. d) Distribuição de frequência com intervalos de classe: Quando o tamanho da amostra é elevado é mais racional efetuar o agrupamento dos valores em vários intervalos de classe. Elementos de uma distribuição de frequência (com intervalos de classe): a) amplitude total da distribuição: é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. AT = L(max) - l(min). b) amplitude total da amostra (rol): é a diferença entre o valor máximo e o valor mínimo da amostra (ROL). Onde H = Ls - Li. Obs: AT sempre será maior que H. c) classe: são os intervalos de variação da variável e é simbolizada por i e o número total de classes simbolizada por k. d) limites de classes: Li: Limite inferior de classe; LS: Limite superior de classe Classe ou Intervalo de classe Li (incluir) |––– LS (excluir) e) Intervalo de Classe: É estabelecido com a finalidade de determinar quais elementos serão considerados como pertencentes à classe. Os quatro intervalos possíveis são representados por “inclusive – exclusive” “inclusive – inclusive” Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 15 f) amplitude do intervalo de classe: é obtida através da diferença entre o limite superior e inferior da classe e é simbolizada por hi = Li - li. Obs: Na distribuição de frequência c/ classe o hi será igual em todas as classes. Para cada classe, em uma distribuição de frequência, os limites de classe inferior e superior indicam os valores compreendidos pela classe. Há diversos métodospara determinar o número de classes (k). Cálculo de número total de classes Para montar uma distribuição de frequência é necessário que primeiramente se determine o número de classes (k) em que os dados serão agrupados. Não existe regra fixa para se determinar o número de classes (k). Contudo, neste material são apresentadas algumas: Regra 1: Fórmula de Sturges, que nos dá o número de classe em função em função do número de valores da variável: nK log*3.31 , onde n é o número de itens que compõe a amostra; Regra 2: se 25n , então 5K ; se 25 ≤ n < 100 então nK , se n ≥ 100 então K = 5*log n, ou seja, nknse nknse knse log5,100 ,10025 5,25 n= número total de observações. Regra 3: Bom senso!! Amplitude do intervalo de classe (h): k H h , onde: h = Amplitude de classe; H = amplitude total; e k = número total de classes. Ponto Médio de classe (PM): é o ponto que divide o intervalo de classe em duas partes iguais. 2 infsup LL PM , onde supL = Limite superior da classe; infL = Limite inferior da classe; E os demais limites são obtidos somando-se c ao limite anterior TIPOS DE FREQÜÊNCIAS a) Frequência simples ou absoluta ( if ): é o valor que realmente representam o número de observações em uma determinada classe ou em um determinado atributo de uma variável qualitativa. A soma das frequências simples é igual ao número total dos dados da distribuição. nff i k i i 1 (número total de observações) b) frequência relativa e percentual de classe Frequência relativa ( )rf : é o valor da razão (proporção) entre a frequência absoluta em uma determinada classe e a frequência total da distribuição. A soma das frequências relativas é igual a 1 (100%). A frequência relativa da i-ésima classe é dada pela divisão da frequência desta classe pela soma das frequências. Isto é n f fr ii (Razão entre a frequência simples e o total de observações) 1ifr (Soma das frequências relativas) Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 16 frequência percentual (i-ésima classe ou valor): A frequência relativa percentual da i-ésima classe é dada pela multiplicação da frequência relativa desta classe por 100 (cem). Então 100% ii frf ou 100% n f f ii 100% if (Soma das frequências percentuais) c) frequência simples acumulada A frequência acumulada da i-ésima classe pode ser: Crescente (do tipo “abaixo de” f-): É a soma da frequência da i-ésima classe com as frequências das classes anteriores. Então: i j ii ffac 1 Decrescente (do tipo “acima de” f+): É a soma da frequência da i-ésima classe com as frequências das classes posteriores. Então: n ij ji ffad d) frequência relativa e percentual acumulada ii ffrfrFr 21 , frequência relativa acumulada da i-ésima classe ou valor; %%%%% 321 ii ffffF , frequência percentual acumulada da i-ésima classe ou valor REGRAS BÁSICAS 1. Efetua-se um ROL ESTATÍSTICO (ordenação crescente ou decrescente de grandeza) nos Dados Brutos (aqueles ainda não organizados numericamente). 2. Determina-se a AMPLITUDE TOTAL dos dados H = Ls – Li, onde Ls: maior valor observado e Li: menor valor observado 3. Escolhe-se convenientemente o número de classes K (nº inteiro), 5 ≤ K ≤ 10 onde podemos tomar nK ou a fórmula de Sturges nK log3,31 , n ≥ 25 (total de observações). Se possível determina-se, ou seja, constrói-se classes de mesma amplitude, tomando k H h . 4. Efetua-se o AGRUPAMENTO EM CLASSES e, a seguir, toma-se as FREQÜÊNCIAS SIMPLES DE CLASSES, elaborando-se, portanto, a tabela de distribuição de frequências. O primeiro elemento das classes seguintes sempre serão formadas pelo último elemento da classe anterior. Pontos importantes na construção de tabelas de frequências Intervalos de classes inadequados podem conduzir os usuários a erros: a) os intervalos de classe devem ser representativos, isto é, a média dos valores dentro do intervalo devem ser aproximadamente igual ao ponto médio da classe; b) os intervalos de classe devem ser do mesmo tamanho, a menos que determinada amplitude de valores precise de atenção particular; c) o número de intervalos de classe deve ser um meio-termo entre a quantidade exigida de detalhes e a facilidade com que o usuário pode assimilar os dados; d) a tabela de frequência deve atender o objetivo de identificar as características de uma variável. Em algumas situações, nossos interesses não são as frequências, ou seja, quantas observações caem em cada intervalo, mas a frequência acumulada, isto é, quantas observações caem acima (ou abaixo) de determinado valor. Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 17 A partir dos dados originais ou dos dados distribuídos em classes, podem-se representá-los graficamente. REPRESENTAÇÃO GRÁFICA O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápidos que as séries (tabelas). Para tornarmos possível uma representação gráfica, estabelecemos uma correspondência entre os termos da série e determinada figura geométrica, de tal modo que cada elemento da série seja representado por uma figura proporcional. - REQUISITOS A representação gráfica de um fenômeno deve obedecer aos seguintes requisitos primordiais: a) Simplicidade - indispensável devido à necessidade de levar a uma rápida apreensão do sentido geral do fenômeno apresentado a fim de não nos perdermos na observação de minúcias de importância secundaria. b) Clareza - o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo. c) Veracidade - indispensável qualquer comentário, posto que, se não representa uma realidade, o gráfico perde sua finalidade. Os principais tipos de gráficos estatísticos para as distribuições de frequências são os DIAGRAMAS, os quais são gráficos geométricos de, no máximo duas dimensões. Para sua construção, em geral, fazemos uso do sistema cartesiano. Dentre os principais tipos de diagramas destacamos, segundo a variável em estudo: Variável Qualitativa gráficos em barras ou colunas, gráficos em setores Variável Quantitativa Distribuição por Intervalos histograma, polígono de frequências. Histograma É uma representação gráfica dos resultados das distribuições de frequências construídas de retângulos justapostos, cujas alturas são os segmentos de retas dados pelas frequências de cada classe e cujas larguras são proporcionadas pelo h. Dito de outra forma, o histograma é, simplesmente, o equivalente gráfico de uma tabela de frequências onde o eixo X estão os extremos inferiores de cada intervalo de classe e no eixo Y, estão as frequências correspondentes a cada classe. O histograma não é claro nos extremos dos intervalos de classe. Gráfico 1 - Alturas dos estudantes. Altura 188,3181,9175,4169,0162,6156,1149,7 Fr eq üê nc ia 14 12 10 8 6 4 2 0 Polígono de Frequência Polígono é um gráfico de linha de uma distribuição de frequência. O polígono é uma versão “suavizada” do histograma, porque é constituído unindo os pontos médios do topo de cada bloco do histograma. Para realmente obtermos um polígono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição. Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I -18 Gráfico 2 - Alturas dos estudantes Altura 188,3181,9175,4169,0162,6156,1149,7 F re qü ên ci a 14 12 10 8 6 4 2 0 Polígono de freqüência .Polígono de frequência acumulada (ogiva): Uma outra maneira de representar graficamente, os dados analisados, é através do polígono de frequência acumulada (ogiva), que é traçado utilizando-se as frequências acumuladas a partir dos limites superiores de cada classe. A ogiva permite perceber qual a proporção de observações é maior/menor do que um dado valor. EXEMPLOS Exemplo 01: A amostra abaixo apresenta as vendas diárias de um determinado aparelho elétrico, durante um mês, por uma firma comercial: 14 -12 -11 -13 -14 -13 -12 -14 -13 -14 -11 -12 -12 -14 -10 -13 -15 -11 -15 -13 -16 -17 -14 -14 Forme uma distribuição de frequências sem intervalos. Exemplo 02: Os dados seguintes referem-se ao tempo de espera (em minutos) de 30 clientes em uma fila de banco, em um dia de grande movimento: 23 – 19 – 7 – 21 – 16 – 13 – 11 – 16 – 33 – 22 – 17 – 15 – 12 – 18 – 25 – 20 – 14 – 16 – 12 – 10 – 8 – 20 – 16 – 14 – 19 – 23 – 36 – 30 – 30 – 28 – 35 Construa uma tabela de frequência, agrupando as informações em classes. Exemplo 03: Completar os dados que faltam: Valores fi Fi Fr 1 2 3 4 5 6 7 8 4 4 7 5 7 16 28 38 45 0,08 0,16 0,14 0,14 Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 19 EXERCÍCIOS PROPOSTOS QUESTÃO 01 -O conhecimento dos vários tipos de freqüência nos ajuda a responder muitas questões com relativa facilidade. Assim, conforme a tabela abaixo que representa a altura de 40 alunos do curso de contabilidade, responda as seguintes questões: Estaturas (cm) (fi) 150 |- 154 4 154 |- 158 9 158 |- 162 11 162 |- 166 8 166 |- 170 5 170 |- 174 3 Fonte: desconhecida a)Quantos alunos têm estatura entre 154 cm inclusive e 158 cm exclusive? b)Qual a % de alunos cujas estaturas são inferiores a 154 cm? c)Quantos alunos têm estatura abaixo de 162 cm? d)Quantos alunos têm estatura não inferior a 158 cm? QUESTÃO 02 - Um estudo sobre o consumo diário de leite, de 200 famílias de certa região verificou-se que 20% das famílias consomem até 1 litro, 50% consomem entre 1 e 2 litros, 20% consomem entre 2 e 3 litros e o restante consome entre 3 e 4 litros. Para a variável estudada : a) Sintetize as informações na forma de uma tabela de freqüência; b) Elabore o histograma; QUESTÃO 03 - A amplitude total de um conjunto de números é 500. Se a distribuição de freqüências apresenta 20 classes, qual deverá ser o limite inferior e o ponto médio da quinta classe, se o limite superior da primeira classe é igual a 35? QUESTÃO 04 - Assinale a alternativa correta: a) A amplitude total é: i) A diferença entre dois valores quaisquer de um conjunto de valores. ii) A diferença entre o maior e o menor valor observado da variável dividido por 2. iii) A diferença entre o maior e menor valor observado da variável. b) Para obter o ponto médio de uma classe: i) Soma-se ao seu limite superior metade de sua amplitude. ii) Soma-se ao seu limite inferior metade de sua amplitude. iii) Soma-se ao seu limite inferior metade de sua amplitude e divide-se o resultado por 2. c) Frequência simples absoluta de um valor da variável é: i) O número de repetições desse valor. ii) A porcentagem de repetições desse valor. iii) O número de observações acumuladas até esse valor. d) Frequência total é: i) O número de repetições de um valor da variável. ii) A soma das freqüências simples absoluta. iii) A somadas freqüências relativas menos as freqüências absolutas. QUESTÃO 05 - Coloque F (falso) ou V (verdadeiro) nas afirmações abaixo, com relação aos elementos de uma distribuição de frequências, assinalando, a seguir, a opção correta. Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 20 ( ) Rol são aqueles dados que ainda não forma numericamente organizados ( ) Classes de frequência são intervalos de variação da variável. ( ) Denomina-se limites de classes os extremos de cada classe. ( ) A frequência relativa de uma classe é a frequência dessa classe dividida pelo total de todas elas e é, geralmente, expressa em porcentagem. (A) (V) (V) (V) (V) (B) (F) (V) (V) (V) (C) (V) (F) (F) (V) (D) (F) (F) (V) (V) (E) (F) (F) (F) (F) QUESTÃO 06 - Ao se unirem os pontos médios de cada uma das colunas de um histograma, é correto afirmar que se obterá o(a) (A) amplitude das classes. (B) polígono de frequências. (C) máximo da distribuição. (D) moda da distribuição. QUESTÃO 07 – Informe se é verdadeiro (V) ou falso (F) o que se afirma abaixo e depois assinale a alternativa que apresenta a sequência correta das letras, de cima para baixo. ( ) Um histograma pode ser construído utilizando-se, indistintamente, as frequências absolutas ou relativas de um intervalo de classe. ( ) O polígono de frequência é construído, ligando-se os pontos médios dos topos dos retângulos de um histograma. ( ) O gráfico de setores é apropriado para a apresentação de séries temporais. ( ) A Estatística Descritiva compreende as técnicas por meio das quais são tomadas decisões sobre uma população, com base na observação de uma amostra. a) F – F – V – V b) F – V – F – V c) V – V – F – F d) V – F – V – F Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 21 AULAS 07-08: SOMATÓRIO E PRODUTÓRIO. SOMATÓRIO E PRODUTÓRIO A letra grega Σ (sigma maiúsculo) é utilizada como símbolo matemático de somatório dos possíveis valores de uma variável. Portanto, a soma de uma série representada pela variável X: x1, x2, x3, ..., xn, é: ∑𝑥𝑖 = 𝑥1 + 𝑥2 +⋯+𝑥𝑛 𝑛 𝑖=1 que se lê somatório de x índice i, em que i varia de 1 até n. Se o índice do primeiro termo da série for zero, o símbolo é dado por: ∑𝑥𝑖 = 𝑥0 + 𝑥1 +⋯+𝑥𝑛 𝑛 𝑖=0 As operações com somatórios dependem das seguintes propriedades: P1] Se k é uma constante arbitrária, então ∑𝑘 = 𝑛 𝑘 𝑛 𝑖=1 Eis que pode ser demonstrado que: ∑𝑘 = 𝑘 + 𝑘 +⋯+ 𝑘 = 𝑛𝑘 𝑛 𝑖=1 Exemplo: Calcular o somatório da série 5, 5, 5 e 5. ∑5 = 5 + 5 + 5 + 5 = 4𝑥5 = 20 4 𝑖=1 P2] Se k é uma constante e X uma variável, então ∑𝑘𝑥𝑖 𝑛 𝑖=1 = 𝑘∑𝑥𝑖 𝑛 𝑖=1 É verdade que kx1 + kx2 +. . . +kxn = k(x1 + x2 +. . . +xn) = 𝑘∑𝑥𝑖 𝑛 𝑖=1 Exemplo: Para X : 2, 4, 6, resolver: ∑8𝑥𝑖 3 𝑖=1 ∑8𝑥𝑖 𝑛 𝑖=1 = 8∑𝑥𝑖 𝑛 𝑖=1 = 8(x1 + x2 + x3) = 8(2 + 4 + 6) = 8 x 12 = 96 P3] Se X e Y são duas variáveis, a soma ou subtração pode ser distribuída: ∑(𝑥𝑖 ± 𝑦𝑖) 𝑛 𝑖=1 =∑𝑥𝑖 𝑛 𝑖=1 ±∑𝑦𝑖 𝑛 𝑖=1 Veja a demonstração a seguir: Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 22 ∑(𝑥𝑖 ± 𝑦𝑖) 𝑛 𝑖=1 = (𝑥1 + 𝑦1) ± (𝑥2 + 𝑦2)±. . . ±(𝑥𝑛 + 𝑦𝑛) = (𝑥1 + 𝑥2 +⋯+𝑥𝑛) ± (𝑦1 + 𝑦2 +⋯+𝑦𝑛) Exemplo: Para X: 2, 4, 6 e X: 1, 3, 5, resolver: ∑(𝑥𝑖 + 𝑦𝑖) 3 𝑖=1 ∑(𝑥𝑖 + 𝑦𝑖) 3 𝑖=1 =∑𝑥𝑖 3 𝑖=1 +∑𝑦𝑖 = (2 + 4 + 6) + (1 + 3 + 5) = 21 3 𝑖=1 P4] A soma do produto é diferente do produto da soma de duas variáveis. ∑(𝑥𝑖𝑦𝑖) 𝑛 𝑖=1 ≠∑𝑥𝑖 𝑛 𝑖=1 ∑𝑦𝑖 𝑛 𝑖=1 Pois (x1y1+ x2y2+...+ xnyn)(x1+x2+...+xn)(y1+y2+...+yn) Exemplo: Sejam X: 2,4,6 e Y:1,3,5. Consequentemente: ∑(𝑥𝑖𝑦𝑖) 3 𝑖=1 = (x1y1 + x2y2 + x3y3) = 2x1 + 4x3 + 6x5 = 2 + 12 + 30 = 44 ∑𝑥𝑖 3 𝑖=1 ∑𝑦𝑖 3 𝑖=1 = (𝑥1 + 𝑥2 + 𝑥3)(𝑦1 + 𝑦2 + 𝑦3) = (2 + 4 + 6)(1 + 3 + 5) = 12𝑥9 = 108 Efetivamente, 44 108. P5] A soma do quociente de duas variáveis é diferente do quociente deduas somas. ∑ 𝑥𝑖 𝑦𝑖 𝑛 𝑖=1 ≠ ∑ 𝑥𝑖 𝑛 𝑖=1 ∑ 𝑦𝑖 𝑛 𝑖=1 , 𝑝𝑜𝑖𝑠 𝑥1 𝑦1 + 𝑥2 𝑦2 +. . . + 𝑥𝑛 𝑦𝑛 ≠ x1 + x2 +. . . +xn 𝑦1 + 𝑦2 +⋯+𝑦𝑛 Exemplo: Sejam X: 2,4,6 e Y:1,3,5. Consequentemente: 𝑥1 𝑦1 + 𝑥2 𝑦2 + 𝑥3 𝑦3 ≠ x1 + x2 + x3 𝑦1 + 𝑦2+𝑦3 → 2 1 + 4 3 + 6 5 ≠ 2 + 4 + 6 1 + 3 + 5 → 4,53 ≠ 1,33 P6] O quadrado de uma soma é diferente da soma dos quadrados: (∑𝑥𝑖 𝑛 𝑖=1 ) 2 ≠∑𝑥𝑖 2 𝑛 𝑖=1 , 𝑝𝑜𝑖𝑠(𝑥1 + 𝑥1 +⋯+𝑥𝑛) 2 ≠ 𝑥1 2 + 𝑥2 2+. . . +𝑥𝑛 2 Exemplo: Sejam X: 2,4,6 . Consequentemente: (2+4+6)2 22+42+62 → 122 4+16+36 → 144 56 P7] Somatório múltiplo – É o mesmo que calcular o produto de duas ou mais somas. ∑∑(𝑥𝑖 𝑚 𝑗=1 𝑦𝑖) 𝑛 𝑖=1 =∑𝑥𝑖 𝑛 𝑖=1 ∑𝑦𝑖 𝑚 𝑗=1 = (𝑥1 + 𝑥2 +⋯+𝑥𝑛) (𝑦1 + 𝑦2 +⋯+𝑦𝑚) Exemplo: Sejam X: 2,4,6 e Y:1,3,5. Consequentemente: ∑∑(𝑥𝑖 3 𝑗=1 𝑦𝑖) 3 𝑖=1 =∑𝑥𝑖 3 𝑖=1 ∑𝑦𝑖 3 𝑗=1 = (𝑥1 + 𝑥2+𝑥3) (𝑦1 + 𝑦2+𝑦3) = (2+4+6)(1+3+5)=12 x 9 = 108. Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 23 De modo similar ao caso da soma, a letra grega (pi) é utilizada como símbolo de produto. Assim, a multiplicação dos possíveis valores de uma série denotada pela variável X: x1, x2, x3, ..., xn, é feita de modo abaixo: ∏𝑥𝑖 𝑛 𝑖=1 , 𝑞𝑢𝑒 𝑠𝑒 𝑙ê 𝑝𝑟𝑜𝑑𝑢𝑡ó𝑟𝑖𝑜 𝑑𝑒 𝑥 í𝑛𝑑𝑖𝑐𝑒 𝑖, 𝑒𝑚 𝑞𝑢𝑒 𝑖 𝑣𝑎𝑟𝑖𝑎 𝑑𝑒 1 𝑎𝑡é 𝑛. 𝑆𝑒𝑛𝑑𝑜 ∏𝑥𝑖 = 𝑥1×𝑥2×…×𝑥𝑛, 𝑝𝑎𝑟𝑎 𝑥𝑖 ≠ 0 𝑛 𝑖=1 Exemplo: Para X: 2,3,4, determine: ∏𝑥𝑖 4 𝑖=1 ∏𝑥𝑖 = 𝑥1×𝑥2×𝑥3×𝑥4 = 4 𝑖=1 2𝑥3𝑥4𝑥5 = 120 Exercícios propostos: 1. Coloque as seguintes expressões sob a forma de Somatório: a) 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8; b) 12 + 22 + 32 + 42 + 52; c) 5𝑥1 2 + 5𝑥2 2 + 5𝑥3 2 + 5𝑥4 2 d) (x1+x2+...+xk) + (1 + 2 + ... + k) e) 2x1y1+ 2x2y2+...+2xmyn f)x1y1+x2y2+...+xmyn 2. Resolva os seguintes somatórios para X: 2, 4, 5 e Y: 1, 3, 6. 𝑎) ∑(𝑥𝑖 2 − 1)2 3 𝑖=1 𝑏) ∑(𝑥𝑖 2 + 𝑦𝑖) 3 𝑖=1 𝑐) ∑ 𝑥𝑖 2 2𝑦𝑖 3 𝑖=1 3. Para X = 2, 3, 4, 5 e Y:1, 3, 2, 7. Resolva: ∑𝑥𝑖 3 ÷ 2 4 𝑖=1 ∑(𝑦𝑖 + 2 3 ) 4 𝑗=1 4. Com os valores do quadro abaixo, calcule os somatórios dados a seguir: X 0 1 2 3 4 5 Y 3 5 7 8 10 13 𝑎)∑𝑥𝑖 6 𝑖=1 ∑𝑦𝑖 6 𝑗=1 𝑏) ∑𝑥𝑖 6 𝑖=1 𝑦𝑖 𝑐) ∑𝑥𝑖 2 6 𝑖=1 𝑦𝑖 𝑑) (∑𝑥𝑖 6 𝑖=1 ) 2 𝑒) ∑𝑦𝑖 2 6 𝑖=1 𝑓) ∑(𝑥𝑖 − 2,5) 2𝑦𝑖 6 𝑖=1 𝑔)∑(𝑥𝑖 − 2,5) ℎ) 6 𝑖=1 ∑(𝑥𝑖 − 2,5) 2 𝑖) 6 𝑖=1 ∑𝑥𝑖 2 6 𝑖=1 Respostas: 2 ) a) 810 b) 55 c) 27/4 4) a) 690 b) 148 c) 590 d) 225 e) 416 f) 137,25 g) 0 h) 17,5 i) 55 Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 24 AULAS 09-10: MEDIDAS DE POSIÇÃO: MÉDIA ARITMÉTICA MEDIDAS DE POSIÇÃO Introdução São medidas que possibilitam representar resumidamente um conjunto de dados relativos à observação de um determinado fenômeno, pois orientam quanto à posição da distribuição no eixo dos X, permitindo a comparação das séries de dados entre si pelo confronto desses números. As medidas de posições mais importantes são as medidas de tendência central ou promédias (verifica-se uma tendência dos dados observados a se agruparem em torno dos valores centrais). As medidas de tendência central mais utilizadas são: média aritmética, moda e mediana. Outros promédios menos usados são as médias: geométrica, harmônica, quadrática, cúbica e biquadrática. As outras medidas de posição são as separatrizes, que englobam: a própria mediana, os decis, os quartis e os percentis. MEDIDAS DE TENDÊNCIA CENTRAL As medidas de tendência central (ou de posição) servem para ressaltar as características de cada distribuição, isoladamente ou em confronto com outras. MÉDIAS A Média, também chamada de Esperança, Esperança Matemática, Valor Esperado ou, ainda, Expectância de uma Variável Aleatória, pode ser: MÉDIA { 𝐴𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 { 𝑠𝑖𝑚𝑝𝑙𝑒𝑠 𝑝𝑜𝑛𝑑𝑒𝑟𝑎𝑑𝑎 𝐺𝑒𝑜𝑚é𝑡𝑟𝑖𝑐𝑎 𝐻𝑎𝑟𝑚ó𝑛𝑖𝑐𝑎 𝑄𝑢𝑎𝑑𝑟á𝑡𝑖𝑐𝑎 Média Aritmética A média aritmética, ou daqui para diante simplesmente média, é a medida de tendência central mais utilizada, porque, além de ser fácil de calcular, tem uma interpretação familiar e propriedades estatísticas que a tornam muito útil nas comparações entre populações e outras situações que envolvem inferências. Uma vantagem da média é que ela leva em conta todos os valores no seu cálculo, uma desvantagem é que ela é afetada por valores extremos. Essa medida representa uma espécie de centro de gravidade dos valores. Se os dados são de uma amostra, a média é denotada por x , se os dados são de uma população, a média é denotada pela letra grega μ . A média aritmética é igual ao quociente entre a soma dos valores do conjunto e o número total dos valores. �̅� = ∑ 𝒙𝒊 𝒏 onde xi são os valores da variável e n o número total dos valores. Dados não-agrupados: Quando desejamos conhecer a média dos dados não-agrupados em tabelas de frequências, determinamos a média aritmética simples. Propriedades da média: 1ª A média de uma constante é a própria constante. Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 25 �̅� = ∑𝑲 𝒏 = 𝑲 2ª propriedade: A soma algébrica dos desvios em relação à média é nula. (𝑥1 − �̅�) + (𝑥2 − �̅�) + ⋯+ (𝑥𝑛 − �̅�) = 0 3ª propriedade: Somando-se (ou subtraindo-se) uma constante (k) a todos os valores de uma variável, a média do conjunto fica aumentada ( ou diminuída) dessa constante. �̅� = ∑ 𝒙𝒊 𝒏 → ∑(𝒙𝒊 ± 𝒌) 𝒏 = �̅� ± 𝒌 4ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada ( ou dividida) por essa constante. �̅� = ∑𝒙𝒊 𝒏 → ∑(𝒙𝒊. 𝒌) 𝒏 = �̅�. 𝒌 5ª propriedade: A média da soma ou diferença de 2 Variáveis Aleatórias é a soma ou diferença das médias. 𝑿 ± 𝒀̅̅ ̅̅ ̅̅ ̅̅ = ∑(𝒙𝒊 ± 𝒚𝒊) 𝒏 = ∑𝒙𝒊 𝒏 ± ∑𝒚𝒊 𝒏 = �̅� ± �̅� 6ª propriedade: A média do produto de 2 Variáveis Aleatórias independentes é o produto das médias. 𝑿×𝒀̅̅ ̅̅ ̅̅ = ∑(𝒙𝒊×𝒚𝒊) 𝒏 = ∑𝒙𝒊 𝒏 ×× ∑𝒚𝒊 𝒏 = �̅�×�̅� Média Aritmética Ponderada: Quando as observações tiverem pesos diferentes, esses pesos terão influência sobre a média. Assemelha-se ao cálculo da média aritmética simples para dados agrupados, bastando que troquemos as freqüências pelos pesos. Então: �̅�𝑝 = ∑𝑥𝑖𝑃𝑖 ∑𝑃𝑖 Onde: ∑𝑥𝑖𝑃𝑖 é a soma dos produtos de cada valor observado pelo seu respectivo peso ∑𝑃𝑖 é a soma dos pesos Dados agrupados: Sem intervalos de classe Como as frequências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula: �̅� = ∑ 𝒙𝒊𝒇𝒊 𝒏 Com intervalos de classe Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula: �̅� = ∑ 𝒙𝒊𝒇𝒊 𝒏 onde Xi é o ponto médio da classe. Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 26 EXEMPLOS: Exemplo 01 - Uma escola tem 18 professores. Um deles se aposenta e é substituído por um professor de 22 anos. Com isso a média das idades dos professores diminui de 2 anos. Qual é a idade do professor que se aposentou? Exemplo 02 - Numa escola é adotado o seguinte critério: a nota da primeira prova é multiplicada por 1, a nota da segunda prova é multiplicada por 2 e a da última prova é multiplicada por 3. Os resultados,após somados, são divididos por 6. Se a média obtida por esse critério for maior ou igual a 6,5 o aluno é dispensado das atividades de recuperação. Suponha que um aluno tenha tirado 6,3 na primeira prova e 4,5 na segunda. Quanto precisará tirar na terceira para ser dispensado da recuperação? Exemplo 03 -A média aritmética de 5 números é 13,4. Quanto preciso adicionar a cada um deles para que a nova média seja igual a 14,2. Exemplo 04 - A idade média do corpo docente de um colégio é de 38 anos. Com a aposentadoria do professor Baltazar, o mais velho deles, a nova média das idades dos 11 professores restantes passou a ser de 35 anos. Com que idade se aposentou o professor Baltazar? EXERCÍCIOS PROPOSTOS QUESTÃO 01- Ao tomar uma amostra de 40 pessoas e observar o número de cáries que apresentam, foram registrados os seguintes dados: Número de cáries 1 2 3 4 5 6 7 8 Número de pessoas 2 6 10 5 10 3 2 2 Marque a opção que mostra a média aritmética (a) 4,2. (b) 4,3. (c) 4,4. (d) 4,05. (e) 4,6. QUESTÃO 02 - Uma distribuição de frequência com dados agrupado sem classe forneceu os pontos médios de classes m e as respectivas frequências absolutas f abaixo: m f 49 7 52 15 55 12 58 5 61 1 Calcule a média aritmética simples dos dados. a) 52. b) 52,25. c) 53,35. d) 54,15. e) 55. QUESTÃO 03 -A tabela abaixo representa a quantidade de alunos e suas respectivas notas em uma prova de estatística em uma classe de 30 alunos: Nota Nº de Alunos 4 6 5 4 6 3 7 7 8 2 9 3 10 5 Qual foi a média da classe nessa prova? a) 5,8 b) 6,8 c) 7,8 d) 6,0 e) 5,0 QUESTÃO 04 -De acordo com a tabela abaixo, pode-se afirmar que: Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 27 A média aritmética dos pesos é, aproximadamente: A) 5,30 kg; B) 5,27 kg; C) 5,24 kg; D) 5,21 kg; E) 5,19 kg QUESTÃO 05 - Para que a média aritmética das notas de uma turma de 20 alunos aumentasse em 0,1, alterou-se uma dessas notas para 7,5. Antes da alteração, tal nota era: a) 5,5 b) 6,0 c) 7,4 d) 7,6 e) 8,5 QUESTÃO 06 - Um funcionário foi avaliado durante o 1º semestre de um ano obtendo para cada mês as seguintes notas, referente ao quesito produtividade: 7,5; 8,0; 7,0; 6,7; 9,5; 9,0. Considerando para os meses pares peso 2 e para os ímpares peso 1 a nota média foi de: a) 7,75 b) 7,83 c) 7,85 d) 7,93 e) 7,95 QUESTÃO 07 - Considere a tabela abaixo, correspondente à quantidade de processos, de um determinado tipo, analisados por dia no setor jurídico de uma repartição pública durante um período de 250 dias úteis. Quantidade de processos (n) analisados no dia 0 1 2 3 4 5 Número de dias em que foram analisados n processos 10 40 100 70 25 5 O valor da média aritmética (quantidade de processos por dia) é igual a: a) 2,56. b) 2,40. c) 2,34. d) 2,30. e) 2,26. QUESTÃO 08 – Para os valores de uma determinada característica, foram observados os seguintes valores: {2, 3, 2, 1, 3}. Qual o valor da média ponderada, sabendo que os pesos são respectivamente {1, 3, 2, 1, 3}? a) 2,5 b) 2,4 c) 2,3 d) 2,2 e) 2,1 QUESTÃO 09 - Um analista calculou a média amostral de vinte e cinco observações e obteve 12,80. Mais tarde, percebeu que havia se enganado em relação a uma das observações, cujo valor correto era 18,6 em vez de 22,6, o valor usado pelo pesquisador para calcular a média. O valor correto da média amostral é: (A) 10,06 (B) 10,28 (C) 11,36 (D) 12,64 QUESTÃO 10 - A medida de posição mais usada é a média de uma série. Uma das principais desvantagens é: (A) não usa todos os dados disponíveis. (B) difícil de incluir em equações matemáticas. (C) é afetada pelos valores extremos. (D) pode estar afastada do centro das observações. QUESTÃO 11 - Um estudo realizado para controle do consumo de Energia elétrica identificou o número de lâmpadas acesas em 16 apartamentos no horário de pico, distribuídos na tabela a seguir: Lâmpadas acesas fi 0 6 1 4 2 5 3 1 Total 16 Qual é a média de lâmpadas acesas? (A) 16 (B) 6,07 (C) 3,5 (D) 0,06 (E) 1,06 Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 28 QUESTÃO 12 - Como podemos classificar a Variável Aleatória da questão anterior? (A) Quantitativa contínua. (B) Qualitativa nominal. (C) Quantitativa discreta. (D) Qualitativa ordinal. (E) Quantitativa ordinal. QUESTÃO 13 – Considere a distribuição de frequências abaixo, referente aos salários dos empregados de uma empresa em setembro de 2008. Salários (R$) Frequências Simples Absolutas 500,00|-------1.000,00 100 1.000,00|-------1.500,00 300 1.500,00|-------2.000,00 500 2.000,00|-------2.500,00 400 2.500,00|-------3.000,00 300 O valor da média aritmética dos salários dos empregados desta empresa, calculado considerando que todos os valores incluídos num certo intervalo de classe são coincidentes com o ponto médio deste intervalo, pertence ao intervalo de classe que contém (A) 6,25% dos empregados. (B) 12,50% dos empregados. (C) 18,75% dos empregados. (D) 25,00% dos empregados. (E) 31,25% dos empregados. QUESTÃO 14 – Um aluno obteve as notas 3,0; 3,5; 4,5 e 6,0 nas quatro avaliações realizadas durante o semestre. O aluno que não consegue a média 6,0 nas quatro avaliações deve realizar o exame final. Na composição da média final, a média das quatro avaliações tem peso 4,0, e a nota do exame final tem peso 6,0. O aluno será considerado aprovado se atingir média final maior ou igual a 5,0. Qual a nota mínima que o aluno em questão deverá obter no exame final para obter aprovação? (A) 4,25. (B) 5,5. (C) 5,75. (D) 6,1. (E) 7,2. QUESTÃO 15 – Considere hipoteticamente que cinco pessoas obesas seguem uma dieta de emagrecimento. A tabela a seguir apresenta o número de quilogramas (kg) perdidos por cada uma delas durante o período de tratamento. N o do indivíduo 1 2 3 4 5 Duração X (meses) 4 3 1 5 2 Número Y de kg perdidos 9 6 4 11 5 O valor da média aritmética da variável Y é igual a (A) 5. (B) 6. (C) 7. (D) 15. (E) 35. QUESTÃO 16 - Um aluno quer calcular a média ponderada de suas 5 qualificações. A segunda qualificação vale o dobro da primeira, a terceira é três vezes a primeira, a quarta vale 4 vezes a primeira e a quinta 5 vezes a primeira. Se suas qualificações são 8,5; 7,3; 8,3; 6,4 e 9,2,podemos afirmar que a média ponderada do aluno é (a) 7,94. (b) 6,5. (c) 7,3. (d) 7,97. (e) 6,8. QUESTÃO 17 – A média aritmética dos salários dos 100 empregados em uma empresa é de R$ 1.500,00. Na hipótese de serem demitidos 20 empregados, que ganham cada um o salário de R$ 2.500,00, e ser concedido, posteriormente, um aumento de 10% em todos os salários dos remanescentes, a nova média aritmética dos salários será de a) R$ 1 375,00 b) R$ 1 350,00 c) R$ 1 345,00 d) R$ 1 320,00 e) R$ 1 300,00 Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 29 AULAS 11-12: MÉDIAS GEOMÉTRICA E HARMÔNICA Média Geométrica A Média Geométrica de um conjunto de n valores observados X1, X2, X3, ... Xn é a raiz de ordem n do produto desses valores, ou seja, é a raiz n-ésima do produto de todos eles. Média Geométrica Simples: �̅�𝒈 = √𝑿𝟏. 𝑿𝟐. … . 𝑿𝒏 𝒏 ou �̅�𝒈 = (𝑿𝟏. 𝑿𝟐. … . 𝑿𝒏) 𝟏 𝒏 onde: n é o número de observações Xi é o valor observado de ordem i A Média Geométrica é bem menos usada que a Média Aritmética, pois para um número grande de observações apresenta a desvantagem de ter um processo de cálculo muito longo e trabalhoso. MédiaGeométrica Ponderada : �̅�𝒈𝒑 = √𝑿𝟏 𝒇𝟏 . 𝑿𝟐 𝒇𝟐 . … . 𝑿𝒊 𝒇𝒊∑𝒇𝒊 ou �̅�𝒈 = (𝑿𝟏 𝒇𝟏 . 𝑿𝟐 𝒇𝟐 . … . 𝑿𝒊 𝒇𝒊 ) 𝟏 ∑𝒇𝒊 .Propriedades da Média Geométrica 1ª propriedade: O produto dos quocientes de cada valor de um conjunto de números pela média geométrica do conjunto é = 1. .2ª propriedade: Séries que apresentam o mesmo número de elementos com o mesmo produto têm a mesma média geométrica. .3ª propriedade: A média geométrica é menor ou igual a média aritmética. A desigualdade �̅�𝑔 ≤ �̅�..sempre se verifica, quando os valores da série forem positivos e nem todos iguais. Se entre eles houver um ou mais zeros, a média geométrica será nula. A igualdade �̅�𝑔 = �̅�..só ocorrerá quando todos os valores da série forem iguais. .4ª propriedade: Quanto maior a diferença entre os valores originais maior será diferença entre as médias aritmética e geométrica. Veja na tabela abaixo: conjunto média aritmética média geométrica X = {2, 2} 2 2 Y = {14, 16} 15 14,97 W = {8, 12} 10 9,8 Z = {2, 50} 26 10 .Aplicações da Média Geométrica a) Média de Relações Empresa Capital líquido Dívida Capital líquido/Dívida A 2.500 1.000 2,5 B 1.000 2.000 0,5 R: 1,1180 Obs: Se, para uma determinada empresa, se deseja estabelecer uma relação do tipo capital/dívida que seja independente da dívida ou do capital das diferentes empresas envolvidas, é recomendável o uso da média geométrica. Se o que se deseja saber é a relação capital/dívida de um certo número de empresas, após a consolidação, a cifra correta será obtida através da média aritmética. b) Média em distribuições assimétricas c) Média de taxas de variação Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 30 Exemplo: Suponhamos que um indivíduo tenha aplicado um capital de R$ 500,00 em 1995. Após um ano de aplicação, essa importância chegou a R$ 650,00. Reaplicando essa última quantia, ao final de mais um ano seu montante situava-se em R$ 910,00. Qual a taxa média de aumento de capital ? Período Taxa 1995 a 1996 650/500 = 1,3 1996 a 1997 910/650 = 1,4 Resposta: 1,3491 Exercício: Uma categoria de operários terá um aumento salarial de 20% após um mês, 12% após dois meses e 7% após três meses. Qual o percentual médio mensal de aumento desta categoria? MÉDIA HARMÔNICA A Média Harmônica de um conjunto de n valores observados X1, X2, X3, ... Xn será o resultado da divisão da quantidade n de elementos do conjunto pelo somatório dos inversos dos valores observados, ou seja, é o inverso da média aritmética dos inversos. Observação: A média harmônica é útil quando temos séries de valores inversamente proporcionais, como é o caso do cálculo da velocidade média, do tempo médio de escoamento de estoques, do custo médio de bens adquiridos por uma quantia fixa, etc. Média Harmônica Simples:.(para dados não agrupados) �̅�ℎ = 1 1 𝑋1 + 1 𝑋2 +⋯+ 1 𝑋𝑛 𝑛 ou �̅�ℎ = 𝑛 1 𝑋1 + 1 𝑋2 +⋯+ 1 𝑋𝑛 = 𝑛 ∑ 1 𝑋𝑖 onde : ∑ 1 𝑋𝑖 é o soma dos inversos dos valores observados n = número de observações Pelo mesmo motivo da Média Geométrica, a Média Harmônica também é pouco usada. Média Harmônica Ponderada : (para dados agrupados em tabelas de freqüências) �̅�ℎ𝑝 = ∑𝑓𝑖 ∑ 𝑓𝑖 𝑋𝑖 Exemplo - Calcular a média harmônica dos valores da tabela abaixo: classes ....fi.... ....xi.... ........fi/xi........ 1 |--------- 3 2 2 2/2 = 1,00 3 |--------- 5 4 4 4/4 = 1,00 5 |--------- 7 8 6 8/6 = 1,33 7 |--------- 9 4 8 4/8 = 0,50 9 |--------- 11 2 10 2/10 = 0,20 total 20 4,03 Resp: 20 / 4,03 = 4,96 Propriedades da média harmônica A média harmônica é menor que a média geométrica para valores da variável diferentes de zero. �̅�ℎ ≤ �̅�𝑔 e por extensão de raciocínio podemos escrever :..�̅�ℎ ≤ �̅�𝑔 ≤ �̅� Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 31 OBS: A média harmônica não aceita valores iguais a zero como dados de uma série. A igualdade �̅�ℎ = �̅�𝑔 = �̅� só ocorrerá quando todos os valores da série forem iguais. OBS: Quando os valores da variável não forem muito diferentes, verifica-se aproximadamente a seguinte relação: �̅�𝑔 = �̅�ℎ + �̅� 2 Exercício: Um veículo realizou o trajeto de ida e volta entre as cidades A e B. Na ida ele desenvolveu uma velocidade média de 80 km/h, na volta a velocidade média desenvolvida foi de 120 km/h. Qual a velocidade média para realizar todo o percurso de ida e volta? OBS: • Sempre que os valores de X forem positivos e pelo menos um dado diferente é válida a seguinte relação: �̅� ≥ �̅�𝑔 ≥ �̅�ℎ • A igualdade entre as médias acima se verifica quando os valores da variável forem iguais (constantes) EXEMPLOS QUESTÃO 01 - A Casa & Vídeo possui um estoque de 100 televisores na filial Méier e de 200 televisores na filial Copacabana. O primeiro esgota-se em 2 meses e o segundo em 5 meses. Determinar o tempo médio de escoamento de ambos os estoques. QUESTÃO 02 - Em uma pesquisa sobre a duração de um certo sabonete junto a 55 famílias com o mesmo número de pessoas e a mesma classe social, obtivemos os resultados a seguir. Calcular a duração média do sabonete. EXERCÍCIOS PROPOSTOS QUESTÃO 01 - A respeito dos diversos tipos de média, assinale a alternativa correta. a) A média harmônica dos elementos do conjunto {1, 2, 3, 4} é superior à média aritmética desses números. b) A média harmônica os elementos do conjunto {1, 2} é igual a 2/3. c) Dados o conjunto de valores positivos {x1, x2, x3, ..., xn}, denominando A média aritmética, G média geométrica e H a média harmônica, sempre temos que: H A G. d) Em um determinado bimestre, as inflações mensais, foram 28% e 62%. A inflação média do período foi 1,44. QUESTÃO 02 - Um carro viaja 120 km de A até B, a uma velocidade de 30 km/h, mas faz a volta a uma velocidade de 40 km/h. Qual a velocidade média, ida e volta, do percurso? QUESTÃO 03 - Considerando que a estatística reúne importantes ferramentas para a análise e a interpretação de dados, julgue o item a seguir. As séries X = {2, 6, 30} e Y = {5, 6, 12} Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 32 possuem a mesma média geométrica e a mesma mediana; porém, a diferença entre as médias geométrica e aritmética será maior na série X. ( ) CERTO ( ) ERRADO QUESTÃO 04 – Digamos que uma categoria de operários tenha um aumento salarial de 20% após um mês, 12% após dois meses e 7%após três meses. Qual o percentual médio mensal de aumento desta categoria? a) 11,57% b) 12,0% c) 12,87% d) 13,0% e) 13,37% QUESTÃO 05 - Para um conjunto determinado de números positivos, tem-se : MA como a Média Aritmética, MG como a Média Geométrica e MH como a Média Harmônica. Sobre isso, é CORRETO afirmar que a) MH menor ou igual a MG menor ou igual a MA. b) MG maior que MA maior que MH. c) MA menor ou igual a MG menor ou igual a MH. d) MA menor ou igual a MH menor ou igual a MG. e) MH maior que MG maior que MA. QUESTÃO 06 – Um comerciante vendeu oito pares de sapatos por R$ 100,00 cada. Na semana seguinte, reduziu o preço para R$ 90,00 cada, tendo vendido dez pares. Finalmente, concedeu novo desconto, para vender os últimos doze pares, por R$ 80,00 cada. Qual foi, aproximadamente, o preço médio de cada par de sapatos? a) R$ 88,70. b) R$ 91,30. c) R$ 92,25. d) R$ 97,60. QUESTÃO 07 – Uma pessoa comprou em três trimestres consecutivos combustível aos seguintes preços: $ 5,00, $ 6,00 e $ 8,00 o litro respectivamente. Determinar o custo médio (CM) em todo o período considerado. Considerando o mesmo consumo monetário. (ex: $240/trimestre) temos: a) $ 6,33 b) $ 6,10 c) $ 6,00d) $ 5,83 e) nda Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 33 AULAS 13-14: MODA E MEDIANA MODA - (Mo) É o valor que mais aparece ou o de maior frequência simples (absoluta ou relativa) numa distribuição de frequência. A Moda pode não existir; existindo, pode não ser única. Uma distribuição pode ser: Amodal (não há Moda - todas os valores observados aparecem o mesmo número de vezes), Unimodal (uma só Moda), Bimodal (quando tem duas Modas) ou Multimodal (tem várias Modas). Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa fábrica. A Moda quando os dados não estão agrupados A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor que mais se repete. Exemplo: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10. Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros. Exemplo: { 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal. Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A série é bimodal. A Moda quando os dados estão agrupados a) Sem intervalos de classe Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior freqüência. b) Com intervalos de classe Se os dados de uma variável quantitativa estão dispostos em uma tabela agrupada em classes, e não há acesso aos dados originais, é possível encontrar a moda por vários procedimentos. Vamos apresentar três. i) moda bruta A classe que apresenta a maior frequência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. ii) Moda pelo Método de Czuber: O cálculo da moda de Czuber leva em conta não somente a influência das classes adjacentes à modal, mas também a própria frequência modal. A fórmula para cálculo da moda de Czuber é: h pa a lMo inf onde: linf = limite inferior da classe modal. a = diferença entre a fi da classe modal e a fi da classe anterior. Entenderemos como classe anterior aquela que precede à classe modal. p = diferença entre a fi da classe modal e a fi da classe posterior (aquela que vem logo após a classe modal). h = amplitude da classe modal. Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 34 iii) Moda pelo Método de King: O cálculo da moda leva em conta a influência das classes adjacentes à classe modal, "deslocando" a moda em direção a aquelas. A fórmula para cálculo da moda de King é: h fantfpost fpost lMo inf onde: linf = limite inferior da classe modal. fpost = fi da classe posterior à classe modal; fant = fi da classe anterior à classe modal; h = amplitude da classe modal Observe que os três valores de moda são diferentes! Qual deles escolher? A moda absoluta baseia se no ponto médio, que pode ou não ser um bom representante da classe. A moda de King não leva em conta a frequência da própria classe modal, o que ocorre na de Czuber. Mas estes três procedimentos são aproximações, a moda real seria obtida a partir dos dados brutos. # Dica de Memorização: Para facilitar a memorização destas duas fórmulas – Czuber e King – poderemos seguir a seguinte sugestão: 1º) Memorizemos o corpo de ambas as fórmulas, que é exatamente o mesmo: hlMo inf 2º) Agora, nossa preocupação será apenas com o “miolo” da fórmula, ou seja, aquilo que estará dentro dos parênteses! Aí, lembraremos: “a fórmula de Czuber é a fórmula dos deltas” e com a no numerador! Percebamos que quem está no numerador também inicia a soma do denominador! Daí: h pa a lMo inf Ora, se Czuber é a fórmula dos deltas, então King é a fórmula das freqüências, começando com fpost no numerador! Logo, fpost também iniciará a soma no denominador! E teremos: h fantfpost fpost lMo inf Cuidado com o numerador dos parênteses destas duas fórmulas: em Czuber surge o “delta anterior” , enquanto que em King teremos a “freqüência posterior”. É preciso toda a atenção! Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 35 Observação: A moda é utilizada quando desejamos obter uma medida rápida e aproximada de posição ou quando a medida de posição deva ser o valor mais típico da distribuição. Já a média aritmética é a medida de posição que possui a maior estabilidade. MEDIANA A mediana de um conjunto de valores, dispostos segundo uma ordem ( crescente ou decrescente), é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. Em outras palavras, é um valor tal que tenha igual quantidade de valores menores e maiores do que ele. Ao contrário da média, a mediana não leva em conta todos os valores no seu cálculo, e não é afetada por valores extremos. Símbolo da mediana: Md . A mediana em dados não-agrupados Dada uma série de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 } De acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 } O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9. . Método prático para o cálculo da Mediana Se a série dada tiver número ímpar de termos: O valor mediano será o termo de ordem dado pela fórmula : .( n + 1 ) / 2 Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 } 1º - ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 } n = 9 logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º elemento da série ordenada será a mediana A mediana será o 5º elemento = 2 . Se a série dada tiver número par de termos: O valor mediano será o termo de ordem dado fela fórmula :.... .[( n/2 ) +( n/2+ 1 )] / 2 Obs: n/2 e (n/2 + 1) serão termos de ordem e devem ser substituídos pelo valor correspondente. Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 } 1º - ordenar a série { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 } n = 10 logo a fórmula ficará: [( 10/2 ) + (10/2 + 1)] / 2 [( 5 + 6)] / 2 será na realidade (5º termo+ 6º termo) / 2 Professor Jackson – Universidade Estadual de Feira de Santana – Estatística Parte I - 36 5º termo = 2 6º termo = 3 A mediana será = (2+3) / 2 ou seja, Md = 2,5 . A mediana no exemplo será a média aritmética do 5º e 6º termos da série. Notas: • Quando o número de elementos da série estatística for ímpar, haverá coincidência da mediana com um dos elementos da série. • Quando o número de elementos da série estatística for par, nunca haverá coincidência da mediana com um dos elementos da série. A mediana será sempre a média aritmética dos 2 elementos centrais da série. • Em uma série a mediana, a média e a moda não têm, necessariamente, o mesmo valor. • A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa é uma da diferenças marcantes entre mediana e média (que se deixa influenciar, e muito, pelos valores extremos). Vejamos: Em { 5, 7, 10, 13, 15 } a média = 10 e a mediana = 10 Em { 5, 7, 10, 13, 65 } a média = 20 e a mediana = 10 isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos valores extremos, ao passo
Compartilhar