Baixe o app para aproveitar ainda mais
Prévia do material em texto
MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CAMPUS PATO BRANCO MATERIAL DE APOIO ESTATÍSTICA DESCRITIVA GRÁFICOS MEDIDAS DE TENDÊNCIA CENTRAL MEDIDAS DE DISPERSÃO NOTAS DE AULA – 1ª PARTE/2020 PROF. LUIZ CARLOS SCHEITT 2 SUMÁRIO 1. INTRODUÇÃO À ESTATÍSTICA................................................................................. 03 1.1 ESTATÍSTICA DESCRITIVA ..................................................................................... 03 1.2 REPRESENTAÇÃO GRÁFICA .................................................................................. 03 2. SÉRIE ESTATÍSTICA................................................................................................ 04 2.1 SÉRIE TEMPORAL OU CRONOLÓGICA ................................................................. 04 2.2 SÉRIE GEOGRÁFICA ............................................................................................... 05 2.3 SÉRIE ESPECÍFICA .................................................................................................. 06 2.4 SÉRIE MISTA ............................................................................................................ 08 3 DADOS ESTATÍSTICOS DE UMA PESQUISA ........................................................ 08 3.1 POPULAÇÃO E AMOSTRA ...................................................................................... 08 3.2 INDIVÍDUO OU OBJETO ......................................................................................... 09 3.3 VARIÁVEL ................................................................................................................ 09 4 CONSTRUÇÃO DE TABELAS DE FREQUÊNCIA ................................................... 10 4.1 CASO QUALITATIVO ............................................................................................... 10 4.2 CASO QUANTITATIVO ............................................................................................ 11 4.2.1 CASO QUANTITATIVO DISCRETO ........................................................................ 11 4.2.2 CASO QUANTITATIVO CONTÍNUO ........................................................................ 14 5 MEDIDAS DE TENDÊNCIA CENTRAL ................................................................... 32 5.1 MÉDIA ...................................................................................................................... 32 5.1.1 MÉDIA ARITMÉTICA SIMPLES ............................................................................... 32 5.1.1.1 MÉDIA ARITMÉTICA PARA DUAS VARIÁVEIS ....................................................... 33 5.1.2 MÉDIA ARITMÉTICA PONDERADA ........................................................................ 36 5.2 MEDIANA ................................................................................................................. 37 5.3 RELAÇÃO ENTRE MEDIA E MEDIANA .................................................................. 38 5.4 MODA ...................................................................................................................... 39 6 MEDIDAS DE DISPERSÃO .................................................................................... 39 6.1 VARIÂNCIA ............................................................................................................... 39 6.2 DESVIO PADRÃO ..................................................................................................... 42 7 MÉDIA, MODA, MEDIANA E DESVIO PADRÃO COM BASE NAS TABELAS DE FREQUÊNCIA ........................................................................................................... 45 8 MÉDIA, MODA, MEDIANA E DESVIO PADRÃO COM BASE EM DADOS AGRUPADOS ......................................................................................................... 50 9 RESPOSTAS DOS EXERCÍCIOS PROPOSTOS .................................................... 63 10 BIBLIOGRAFIA UTILIZADA ...................................................................................... 69 3 1. INTRODUÇÃO À ESTATÍSTICA A estatística é um ramo da Matemática que visa, entre outros, coletar, organizar e apresentar dados relacionados a algum fato ou acontecimento. Para isso, é necessário informações sobre esses acontecimentos. Essas informações chegam das mais diversas fontes e diferentes formas de apresentação, como rádio, televisão, revistas, jornais, internet, etc... O uso da pesquisa é muito comum nas várias atividades humanas. Desde a antiguidade, há registros de contagem da população do Egito por volta de 2900 a.C. Pouco tempo depois, os governantes já contabilizavam residências, bens, etc. Nesse caso, a finalidade era a cobrança de impostos. Atualmente, o estudo da estatística permeia os mais diversos campos do conhecimento, com por exemplo, a Medicina, a Agronomia a Computação. Etc... Esses estudos são aplicados não somente com o objetivo de constatar fatos, mas também, de percepção de tendências. Com a evolução tecnológica, os meios de comunicação nos trazem cada vez mais informações apresentadas com tratamento estatístico, ou seja, com a utilização de gráficos, tabelas e medidas estatísticas. Diante disso, é importante que tenhamos a capacidade de interpretar, compreender, estabelecer relações e realizar suposições a partir dos dados informados. Podemos definir isso como pesquisa estatística. 1.1 Estatística Descritiva Considerando os conceitos e informações já ditas, uma pesquisa estatística envolve um grande número de dados numéricos. Nosso objetivo é analisar estes dados e organizá-los de tal maneira que tenha uma fácil visualização. Uma das formas de apresentação ou organização destes dados são as tabelas de frequência ou distribuições de frequência. Tais tabelas de frequência são organizadas de acordo com o tipo de variável que está sendo analisada. Outra forma de apresentação é através de gráficos, que, além de simplificar a exposição dos dados obtidos na pesquisa, possibilitam uma análise mais detalhada sobre a evolução das variáveis ou de como elas se relacionam. Há diversos tipos de gráficos, e a escolha mais adequada depende de uma série de fatores, desde o objetivo do pesquisador e as características das informações a serem apresentadas. 1.2 REPRESENTAÇÃO GRÁFICA Existem diversos modelos de gráficos: colunas, setores, linhas, etc. A opção por um modelo em específico é orientada pela identificação da série estatística que desejamos representar. Para que possamos representar graficamente os dados, estes devem ser inicialmente organizados em uma tabela. A forma de referenciar os dados nas tabelas determina as séries estatísticas. 4 2. SÉRIES ESTATÍSTICAS 2.1 Série Temporal ou Cronológica Os dados são registrados segundo a época (data) de ocorrência. O tempo é variável, o fato e o local são fixos. População Brasileira - Censo Demográfico - 1892 -2010 Ano População do Brasil 1872 9.930.478 1890 14.333.915 1900 17.438.434 1920 30.635.605 1940 41.236.315 1950 51.944.397 1960 70.992.343 1970 94.508.583 1980 121.150.573 1991 146.917.459 2000 169.590.693 2010 190.755.799 Fonte: IBGE Para esta série, sugere-se a representação em linhas pelo fato de que cada observação gera um ponto (referente a população daquela data), e a ligação dos pontos gera a linha. 0 20.000.000 40.000.000 60.000.000 80.000.000 100.000.000 120.000.000 140.000.000 160.000.000 180.000.000 200.000.000 1872 1890 1900 1920 1940 1950 1960 1970 1980 1991 2000 2010 P o p u la çã o Fonte: IBGE População Brasileira - Censo Demográfico - 1892 -2010 5 2.2 Série Geográfica Nesta série os dados são registrados segundo o local de ocorrência. O local varia, o tempo e o fato são fixos. Brasil - População por Região - Censo 2010 Região Nº de Habitantes Norte15.864.454 Nordeste 53.081.950 Sudeste 80.364.410 Sul 27.386.891 Centro-Oeste 14.058.094 Total 190.755.799 Fonte: IBGE Para a série Geográfica, uma das formas indicadas de representação é o gráfico de colunas. A separação das colunas faz a distinção dos dados. 0 10.000.000 20.000.000 30.000.000 40.000.000 50.000.000 60.000.000 70.000.000 80.000.000 90.000.000 Norte Nordeste Sudeste Sul Centro-Oeste Fonte: IBGE Brasil - População por Região - Censo 2010 6 Representação através do gráfico de setores. 2.3 Série Específica Os dados são agrupados segundo a modalidade de ocorrência. Fato variável, tempo e local fixos. Gastos com Pessoal das Empresas Brasileiras de Construção - 2011 Rubrica Gastos com Pessoal (R$) Salários, retiradas e outras remunerações 49.860.866,57 Contribuições para previdência social 11.088.490,40 FGTS 4.140.163,05 Contribuições para previdência privada 309.583,73 Indenizações trabalhistas 2.651.810,58 Benefícios concedidos aos empregados 6.663.744,48 Total 74.714.658,81 Fonte: IBGE Norte 8% Nordeste 28% Sudeste 42% Sul 14% Centro-Oeste 8% Brasil - Distribuição da População por Região - Censo 2010 Fonte: IBGE 7 Nas séries específicas são indicados os gráficos de colunas e os gráficos de setores. R$- R$5.000.000,00 R$10.000.000,00 R$15.000.000,00 R$20.000.000,00 R$25.000.000,00 R$30.000.000,00 R$35.000.000,00 R$40.000.000,00 R$45.000.000,00 R$50.000.000,00 Salários, retiradas e outras remunerações Contribuições para previdência social FGTS Contribuições para previdência privada Indenizações trabalhistas Benefícios concedidos aos empregados Gastos com Pessoal das Empresas Brasileiras de Construção (R$ 1.000,00)- 2011 Fonte: IBGE Salários, retiradas e outras remunerações 66,74% Contribuições para previdência social 14,84% FGTS 5,54% Contribuições para previdência privada 0,41% Indenizações trabalhistas 3,55% Benefícios concedidos aos empregados 8,92% Distribuição dos Gastos com Pessoal nas Empresas Brasileiras de Construção - 2011 Fonte: IBGE 8 2.4 Série Mista É a combinação entre duas ou três das séries. Profissionais Ativos nos Conselhos Regionais de Contabilidade - Brasil Região Sul - Segundo o Gênero e Formação - 2014 Estado Masculino Feminino Contador Técnico Contador Técnico PR 12.911 6.982 8.402 2.728 RS 11.885 8.638 10.655 6.372 SC 8.130 3.840 6.512 1.305 Total 32.926 19.460 25.569 10.405 Fonte: Conselho Federal de Contabilidade É indicado o gráfico de colunas justapostas. 3. DADOS ESTATÍSTICOS DE UMA PESQUISA 3.1 População e amostra A população é todo o universo estatístico que queremos consultar. Por exemplo, se quisermos saber qual a matéria favorita entre os alunos de uma classe, podemos consultar todos os alunos da classe. 0 2.000 4.000 6.000 8.000 10.000 12.000 14.000 Contador Técnico Contador Técnico Masculino Feminino Profissionais Ativos nos Conselhos Regionais de Contabilidade - Brasil Região Sul - Segundo o Gênero e Formação - 2014 PR RS SC Fonte: CFC 9 Entretanto, isso não é possível quando queremos pesquisar a intenção de voto dos eleitores do estado do Paraná, pois não podemos consultar todos os eleitores que constituem a população. Nesse caso recorremos a um grupo de eleitores, que consultados, permitem que se chegue ao resultado mais próximo possível da realidade. A isso, chamamos de amostra. É importante a quantidade de elementos que foram consultados, pois a escolha da amostra é fundamental para o resultado. 3.2 Indivíduo ou objeto Cada elemento que compõe a amostra é um indivíduo ou objeto. No exemplo da intenção de voto, os indivíduos da pesquisa são pessoas. Quando tratamos de marcas de pneus de carro, quanto a durabilidade, por exemplo, cada marca é um objeto. 3.3 Variável Quando o IBGE (Instituto de Brasileiro de Pesquisa e Estatística) realiza o censo, busca obter informações sobre o perfil da população brasileira (sexo, grau de instrução, renda, tipo de moradia, etc. Em estatística, estes itens são denominados variáveis. Quando uma variável está relacionada a um valor numérico, por exemplo, a idade de uma pessoa, ou o número de carros em um estacionamento, é denominada variável quantitativa. Por sua vez, quando está relacionada a uma qualidade ou atributo, por exemplo, o sexo de um indivíduo ou a raça de uma espécie de animal, é denominada variável qualitativa. A Variável Quantitativa pode ser classificada em Discreta e Contínua. Quantitativa Discreta: Variável que assume, como possíveis valores números, em geral inteiros, formando uma conjunto finito ou enumerável. Exemplo: Número de acidentes ocorridos durante uma semana. Quantitativa Continua: Variável que assume como possíveis valores, números em intervalos, em geral, resultantes de mensurações. Exemplo: Altura, peso, notas... A Variável Qualitativa pode ser classificada em Ordinal e Nominal Qualitativa Nominal: Variável que assume como possíveis valores, atributos ou qualidades e estes não apresentam uma ordem natural de ocorrência. Exemplo: Meio de informação utilizado pelos alunos, o esporte predileto de uma pessoa. Qualitativa Ordinal: Quando se refere a uma categoria que, mesmo não sendo numérica, pode ser ordenada. Exemplo: Nível de desenvolvimento de um país, pois, um país pode ter alto, médio ou baixo nível de desenvolvimento. 10 Esquema da definição de variáveis: 4. CONSTRUÇÃO DE TABELAS DE FREQUÊNCIA DAS SÉRIES ESTATÍSTICAS E APRESENTAÇÃO DE DADOS Quando lidamos com poucos valores numéricos, o trabalho estatístico fica reduzido. Entretanto, normalmente teremos que trabalhar com grande quantidade de dados. Um dos objetivos da Estatística Descritiva é obter uma redução na quantidade de dados com os quais devemos trabalhar. Podemos conseguir isso modificando a forma de apresentação desses dados. 4.1 Caso Qualitativo Exemplo 1: Considere uma amostra de 50 pessoas classificadas de acordo com seu estado civil. Temos a seguinte situação: Solteiros: 23 pessoas; Casados: 17 pessoas; Divorciados: 10 pessoas; Construir uma tabela de freqüência e um gráfico para representar esta situação. Variáveis Quantitativas Contínua Discreta Qualitativas Nominal Ordinal 11 SOLUÇÃO: Tabela Modalidade Frequência Frequência Relativa Porcentagem Solteiros 23 23/50 46% Casados 17 17/50 34% Divorciados 10 10/50 20% Total 50 1 100% Gráfico 4.2 Caso Quantitativo 4.2.1 Caso Quantitativo Discreto Exemplo: Foi registrado o número de acidentes em um cruzamento da cidade de Pato Branco, durante 100 dias consecutivos. O número de acidentes por dias foi: 0 5 10 15 20 25 Solteiros Casados Divorciados 12 6 4 4 2 6 1 7 1 2 2 5 2 8 8 4 2 3 4 4 7 6 4 2 3 7 7 5 7 3 7 5 6 8 7 8 5 5 5 4 3 5 4 1 8 7 4 7 7 1 6 8 2 8 6 8 3 5 4 5 2 4 7 8 5 5 1 1 1 3 5 6 4 7 7 5 4 5 8 6 1 1 3 6 5 5 1 1 7 8 5 1 2 7 2 4 8 3 3 4 6 Podemos definir como freqüência absoluta simples de um elemento o número de vezes que este elemento aparece no conjunto de dados. Assim, podemos reduzir significativamente o número de elementos com os quais devemos trabalhar. Essa organização é feita manipulando o conjunto de dados na forma de uma série estatística chamada variável discreta. Distribuição de freqüência – variável discreta É uma representação tabular de um conjunto de valores em que colocamos na primeira coluna em ordem crescente os valores distintos da série e na segunda coluna colocamos os valores das freqüências simples correspondentes. Construir uma tabela de distribuição de frequência com os dados acima. Os valores distintos da série são: 1, 2, 3, 4, 5, 6, 7, 8 (nº de acidentes) As freqüências simples correspondentessão: 12, 10, 9, 16, 16, 10, 15, 12 (nº de dias). 13 Acidentes (Xi) fi (nº de dias) Fi ri Ri 1 12 12 12% 12% 2 10 22 10% 22% 3 9 31 9% 31% 4 16 47 16% 47% 5 16 63 16% 63% 6 10 73 10% 73% 7 15 88 15% 88% 8 12 100 12% 100% Total 100 Legenda: Xi – Variável Analisada; fi- Frequência absoluta da ocorrência de xi; Fi - Frequência absoluta acumulada; ri – Frequência Relativa da ocorrência de xi; Ri – Frequência Relativa acumulada; OBS: A colocação de um índice i para x e para f tem a finalidade de referência. Deste modo, x1 representa o primeiro valor distinto da série, x2 representa o segundo valor distinto da série, f1 representa a freqüência simples do primeiro valor distinto da série, f2 representa a freqüência simples do segundo valor distinto da série e assim sucessivamente. Devemos optar por uma variável discreta na representação de um série de valores quando o número de elementos distintos da série for pequeno 14 No exemplo dado, caso o número de acidentes por dia tivesse uma variação maior, por exemplo, poderíamos utilizar variável contínua, a qual veremos a seguir. 4.2.2 Caso Quantitativo Contínuo Exemplo: Consideremos as seguintes alturas, expressas em centímetros de 30 atletas de um clube 177 177 175 169 183 170 172 182 166 174 186 175 170 175 181 171 170 166 181 166 179 178 173 169 169 173 172 176 176 180 Construir uma tabela de distribuição de frequência com os dados apresentados acima. Observando esses valores notamos grande número de elementos distintos, o que significa que neste caso a variável discreta não é aconselhável na redução de dados. Nesse caso é melhor agrupar os dados por faixas de valores. Essa representação da série de valores é denominada variável contínua. A construção da variável contínua requer o conhecimento de alguns conceitos que vamos estabelecer: 0 5 10 15 20 dados fictícios Acidentes cidade de Pato Branco - Pr 15 Amplitude total de uma sequência é a diferença entre o maior e o menor elemento de uma sequência. Representando a amplitude total por At, o maior elemento da sequência X por Xmáx e o menor elemento por Xmín, a amplitude total é dada por: At = Xmáx - Xmín No exemplo da sequência que temos: A = 186-166 = 20 O número 20 (amplitude total) representa o comprimento total da sequência, ou seja, a diferença máxima entre as alturas. Intervalo de classe é qualquer subdivisão da amplitude total de uma série estatística. Número de classes: o número de classes a ser utilizado depende muito das questões que se pretende responder com a variável contínua. Através da experiência, o pesquisador poderá visualizar facilmente, pois, não há um critério padrão obrigatório. Para nossos exemplos, utilizaremos o critério da raiz quadrada para a determinação do número de classes. Se a sequência estatística contém n elementos e se indicarmos por K o número de classes a ser utilizado, então teremos: nK = Para a construção do número de classes, devemos determinar o número de elementos da sequência. Verificamos que a sequência possui n = 30 elementos. Então: 477,530 ==K Como o número de classes deve ser necessariamente um número inteiro, podemos escolher um número inteiro mais próximo do resultado, podendo variar uma unidade para cima ou para baixo As opções para K então são: 4, 5 ou 6. Vamos optar pelo número 5 (cinco classes). Obs: Nada impede que usássemos outro número de classes. Por exemplo, 3 classes ou 7 classes. A amplitude do intervalo de classe que designamos por h é determinada da seguinte forma k A h t= Onde: 16 =tA amplitude total K = nº de classes Então: 4 5 20 ==h De outro modo, também podemos dizer que a amplitude do intervalo de classe é a diferença entre o limite superior e o limite inferior da classe. Portanto, podemos denominar a amplitude do intervalo de classe da seguinte forma: h = L - l Onde: h = amplitude do intervalo de classe L = limite superior da classe l = limite inferior da classe Assim... h = 170 – 166 = 4 h = 174 – 170 = 4 h = 178 – 174 = 4 h = 182 – 178 = 4 h = 186 – 182 = 4 Tabela: Intervalo de Classes fi ri 166 170 9 30,0% 170 174 6 20,0% 174 178 8 26,7% 178 182 5 16,7% 182 186 2 6,7% Total 30 100% 17 OBS: O símbolo significa que o intervalo é aberto à esquerda e fechado à direita, ou seja: o limite inferior não entra na contagem (exceto o primeiro, que nesse caso é o número 166), e o limite superior entra. Também é possível representar de modo contrário; nesse caso o símbolo ficaria invertido e o último limite superior entraria no intervalo (nesse caso o número 186). 0 1 2 3 4 5 6 7 8 9 10 166 a 170 170 a 174 174 a 178 178 a 182 182 a 186 Q u an ti d ad e d e al u n o s Distribuição dos alunos de acordo com a altura (em cm) 18 EXERCÍCIOS – VARIÁVEIS E ANÁLISE DE GRÁFICOS E1) De acordo com as informações abaixo, as perguntas definem um tipo de variável (qualitativa ou quantitativa). Leia as perguntas e classifique-as. Num cursinho pré-vestibular, os estudantes inscritos responderam a um questionário no qual constavam, entre outras, as seguintes perguntas: a) Qual é a área da carreira universitária pretendida? ( ) QUALITATIVA ( ) QUANTITATIVA b) Você cursou o ensino médio em escola pública ou particular? ( ) QUALITATIVA ( ) QUANTITATIVA c) Qual é a renda familiar mensal? ( ) QUALITATIVA ( ) QUANTITATIVA d) Qual é o grau de escolaridade do chefe da família? ( ) QUALITATIVA ( ) QUANTITATIVA e) Qual é a sua disciplina favorita? ( ) QUALITATIVA ( ) QUANTITATIVA f) Quantas vezes você já fez cursinho? ( ) QUALITATIVA ( ) QUANTITATIVA g) Você é usuário da internet? ( ) QUALITATIVA ( ) QUANTITATIVA h) Quanto tempo de estudo diário pretende dedicar ao cursinho? ( ) QUALITATIVA ( ) QUANTITATIVA E2) (FGV) No gráfico abaixo está representado, no eixo das abscissas, o número de fitas de vídeos alugadas por semana numa locadora; e no eixo das ordenadas a frequência correspondente, isto é, a quantidade de pessoas que alugaram o correspondente número de fitas. 19 a) Qual a porcentagem de pessoas que alugaram 4 ou mais fitas? b) Se cada fita é alugada por R$ 4,00, qual a receita semanal da videolocadora? c) Qual a porcentagem de pessoas que alugaram 3 ou menos fitas? d) Construa a tabela de frequência do gráfico. E3) Analisando o gráfico de barras abaixo, classifique em V ou F cada sentença seguinte, justificando; 0 5 10 15 20 25 30 1 2 3 4 5 6 Fr eq u ên ci a Número de fitas 20 a) Se o conjunto de dados fosse representado em um gráfico de setores, o ângulo correspondente à região Sul seria menor que 90º; b) O número de emissoras da região Sudeste supera a soma do número de emissoras das regiões Nordeste, Centro-Oeste e Norte juntas; c) Supondo que Goiás concentre 60% das emissoras de sua região, o percentual de emissoras do país representado por esse Estado é menor que 5%; d) Construa a tabela com os dados representados no gráfico E4) O histograma abaixo representa o tempo de espera (em minutos) na fila de um banco, em um certa manhã, no centro de Belo Horizonte. 1064 762 666 225 165 0 200 400 600 800 1000 1200 Sudeste Sul Nordeste Centro - Oeste Norte Fonte: Almanaque Abril 2001 Rádio - Emissoras no ano 2000 21 OBS: Intervalo fechado à direita. a) Que porcentagem do total de pessoas esperou até 20 minutos na fila? b) Que porcentagem do total de pessoas esperou mais do que 16 minutos na fila?c) construa a tabela de frequência contendo: fi- Frequência absoluta da ocorrência de xi; ri – Frequência Relativa da ocorrência de xi; E5) A tabela abaixo refere-se a uma pesquisa realizada com 180 alunos de uma escola, a respeito da carreira universitária pretendida: 16 12 6 4 2 0 2 4 6 8 10 12 14 16 18 8 a 12 12 a 16 16 a 20 20 a 24 24 a 28 frequência absoluta tempo em minutos 22 ÁREA FREQUÊNCIA ABSOLUTA FREQUÊNCIA RELATIVA PORCENTAGEM Exatas 45 a b Biológicas c 0,35 d Humanas e f g a) Quais os valores de: a, b, c, d, e, f, g? b) Construa um gráfico de barras representando a pesquisa. 23 E6) Os gastos totais (em R$) em petiscos e bebidas consumidos por vinte famílias em um domingo de sol, no clube da sua cidade, estão abaixo relacionados: 9,00 – 12,40 – 11,00 – 12,00 – 14,80 – 9,60 – 7,60 – 13,40 – 10,20 – 17,00 13,50 – 13,00 – 15,50 – 10,00 – 14,20 – 7,00 – 8,20 – 10,30 – 16,00 – 15,00 a) Agrupe os dados em classes de amplitude igual a 2 e construa uma tabela de frequência contendo a frequência absoluta e a frequência relativa. Obs: intervalo fechado à direita. b) Qual é a porcentagem das famílias que consumiram até R$ 11,00 (inclusive)? c) Qual é a porcentagem das famílias que consumiram mais do que R$ 9,00 e menos ou igual a R$ 15,00? 24 E7) No gráfico abaixo, mostra-se como variou o valor do dólar, em relação ao real, entre o final de 2001 e o início de 2005. Por exemplo, em janeiro de 2002, um dólar valia cerca de R$ 2,40. Durante esse período, a época em que o real esteve mais desvalorizado em relação ao dólar foi no a) 2º semestre de 2001 b) 2º semestre de 2002 c) 1º semestre de 2003 d) 2º semestre de 2004 e) 1º semestre de 2005 E8) Podemos estimar o consumo de energia elétrica de uma casa, considerando as principais fontes desse consumo. Pense na situação em que apenas os aparelhos que constam da tabela abaixo, fossem utilizados diariamente da mesma forma. Tabela: A tabela fornece a potência e o tempo efetivo de uso diário de cada aparelho doméstico. 25 Supondo que o mês tenha 30 dias e que o custo de 1 KWh é de R$ 0,40, o consumo de energia elétrica mensal dessa casa, é de aproximadamente. a) R$ 135 b) R$ 165 c) R$ 190 d) R$ 210 e) R$ 230 E9) As 23 ex-alunas de uma turma que completou o Ensino Médio há 10 anos se encontraram em uma reunião comemorativa. Várias delas haviam se casado e tido filhos. A distribuição das mulheres, de acordo com a quantidade de filhos, é mostrada no gráfico abaixo. Qual a quantidade total de filhos dessas mulheres? a) 16 b) 18 c) 22 d) 25 e) 33 26 E10) Em uma área observa-se o seguinte regime pluviométrico: Os anfíbios são seres que podem ocupar tanto ambientes aquáticos quanto terrestres. Entretanto, há espécies de anfíbios que passam todo o tempo na terra ou então na água. Apesar disso, a maioria das espécies terrestres depende de água para se reproduzir e o faz quando essa existe em abundância. Os meses do ano em que, nessa área, esses anfíbios terrestres poderiam se reproduzir mais eficientemente são de: a) setembro a dezembro b) novembro a fevereiro c) janeiro a abril d) março a julho e) maio a agosto 27 E11) A escolaridade dos jogadores de futebol nos grandes centros é maior do que se imagina, como mostra a pesquisa abaixo, realizada com os jogadores profissionais dos quatro principais clubes de futebol do Rio de Janeiro. De acordo com esses dados, o percentual dos jogadores dos quatro clubes que concluíram o Ensino Médio é de aproximadamente: a) 14% b) 48% c) 54% d) 60% e) 68% E12) Os gráficos 1 e 2 a seguir mostram, em milhões de reais, o total do valor das vendas que uma empresa realizou em cada mês, nos anos de 2004 e 2005. 28 Como mostra o gráfico 1, durante o ano de 2004, houve em cada mês, crescimento das vendas em relação ao mês anterior. A diretoria dessa empresa, porém, considerou muito lento o ritmo de crescimento naquele ano. Por isso, estabeleceu como meta mensal para o ano de 2005 o crescimento das vendas em ritmo mais acelerado que o de 2004. Pela análise do gráfico 2, conclui-se que os meses que houve mais crescimento em 2005 foi: a) janeiro, fevereiro e outubro. b) fevereiro, marco e junho. c) marco, maio e agosto. d) abril, agosto e novembro. e) julho, setembro e dezembro. E13) Nos últimos anos, ocorreu redução gradativa da taxa de crescimento populacional em quase todos os continentes. A seguir, são apresentados dados relativos aos países mais populosos em 2000 e também as projeções para 2050. Com base nas informações acima, é correto afirmar que, no período de 2000 a 2050, a) a taxa de crescimento populacional da China será negativa. b) a população do Brasil duplicará. c) a taxa de crescimento da população da Indonésia será menor que a dos EUA. d) a população do Paquistão crescerá mais de 100%. e) a China será o país com a maior taxa de crescimento populacional do mundo. E14) Uma enquete, realizada em março de 2010, perguntava aos internautas se eles acreditavam que as atividades humanas provocam o aquecimento global. Eram três alternativas possíveis e 300 internautas responderam à enquete, como mostra o gráfico. 29 Analisando os dados do gráfico, quantos internautas responderam “NÃO” à enquete? a) menos de 23 b) mais de 23 e menos de 25 c) mais de 50 e menos de 80 d) mais de 100 e menos de 190 e) mais de 200 E15) Em uma eleição concorreram os candidatos A, B e C e, apurada a primeira urna, os votos foram os seguintes: A = 50 votos; B = 80 votos; C = 60 votos e Branco e nulos = 10 votos.Com base nesses dados construa: a) A tabela de freqüência dessa variável, contendo: fi- Frequência absoluta da ocorrência de xi; ri – Frequência Relativa da ocorrência de xi; b) O gráfico de barras, relacionando os valores da variável com as respectivas freqüências absolutas; c) O gráfico de setores (ou gráfico de pizza), relacionando os valores da variável com suas freqüências relativas (porcentagens); 30 E16) Uma pesquisa sobre a idade, em anos de uma classe de calouros de uma faculdade, revelou os seguintes valores: 18,17,18,27,21,19,20,18,17,25, 20,24,19,26,19,21,18,19,25,18 23,19,27,20,17,21,19,18,26,19 24,21,18,19,19,20,19,18,22,20 18,19,23,18,20,20,18,19,22,18 a) Construir a tabela da distribuição de frequência para os dados acima contendo: Xi – Variável Analisada; fi- Frequência absoluta da ocorrência de xi; Fi - Frequência absoluta acumulada; ri – Frequência Relativa da ocorrência de xi; Ri – Frequência Relativa acumulada; 31 OBS: Faça o intervalo fechado à direita. resultado ajuste Mínimo (x) Máximo (X) amplitude total (At) (X - x) Nº de classes (k) (raiz quadrada de n) amplitude do intervalo (h) h = At/k Idade em anos dos calouros de uma classe Alunos Idade(fi) Frequencia acumulada Frequencia relativa frequência Relativa acumulada entre 17 e 19 entre 19 e 21 entre 21 e 23 entre 23 e 25 entre 25 e 27 Total b) Construir o gráfico (histograma), relacionando os valores da variável com as respectivas freqüências absolutas. 32 5. MEDIDAS DE TENDÊNCIA CENTRAL Medidas de tendência central são valores representativos de um conjunto de números (variáveis). São utilizadas para sintetizar em um único número o conjunto de dados observados As três medidas mais utilizadas são: MÉDIA, MEDIANA E MODA. 5.1 Média ( x͞ ) Podemos classificar a média em: Simples e Ponderada. 5.1.1 Média Aritmética Simples Trata-se deum valor de equilíbrio para todo o conjunto. n xxxx x n ...321 +++= − ou Cada valor corresponde a um xi e ∑ representa a soma dos xi. Exemplo: Valores de contribuição para a Previdência Privada dos funcionários da Assessoria Contábil AC. 100,00 200,00 140,00 150,00 100,00 270,00 6 270150200100140100 +++++= − x 160= − x O valor R$ 160,00 é o ponto de equilíbrio, ou seja, se todos os valores fossem iguais, todos valeriam R$ 160,00. Obviamente os valores não são iguais a R$ 160,00 e isso chama a atenção para o fato de que a média pode não representar adequadamente um conjunto de valores que apresente uma variabilidade muito grande. A calculadora HP-12C dispõe de operadores para cálculos estatísticos. n x x n i i∑ == 1 33 Na HP-12C • Zere os registros anteriores: <f>clear<∑> • Cadastre seus dados: digite o valor e em seguida <∑+> • Você obterá a média digitando <g> <x> Exemplo: Calcular o custo médio das refeições semanais: Segunda-feira = R$ 15,00; Terça-feira = R$ 16,40; Quarta-feira = R$ 15,30; Quinta-feira = R$ 12,00; Sexta-feira = R$ 16,50; Sábado = R$ 20,00 e Domingo = R$ 28,50. HP-12C <f>clear<∑> 15 <∑+> 16,40 <∑+> 15,30 <∑+> 12 <∑+> 16,50 <∑+> 20 <∑+> 28,50 <∑+> <g><x>[junto a tecla 0] Solução =17,67 Na Planilha Excel: • O comando é: < =média(célula inicial : célula final)> Na célula A3 foi registrada a palavra média apenas como um título (rótulo) para o valor calculado em B3 5.1.1.1 Média Aritmética para duas Variáveis ),( yx Exemplo1: A tabela abaixo mostra o número de horas trabalhadas e o número de peças usinadas que 5 trabalhadores produzem em uma fábrica. Calcular a média diária de horas trabalhadas e a média do número de peças produzidas. 34 Trabalhador Horas por dia No de peças A 8 10 B 4 3 C 6 5 D 6 8 E 8 4 Média diária de nº de peças n xxxx x n ...321 +++= − 6 5 30 5 485310 ==++++= − x Média diária de horas trabalhadas n xxxx x n ...321 +++= − 4,6 5 32 5 86648 ==++++= − x 35 HP-12C <f>clear<∑> ou [f] [CLEAR] [REG] 8 enter 10 <∑+> 4 enter 3 <∑+> 6 enter 5 <∑+> 6 enter 8 <∑+> 8 enter 4 <∑+> <g><x>[junto a tecla 0] Solução = 6 (média diária de peças produzidas por trabalhador) x><y Solução = 6,4 (média diária de horas trabalhadas por trabalhador) Obs: Pode-se inverter a ordem de entrada dos dados. Exemplo2: A tabela abaixo mostra o volume de vendas mensais e o número de horas semanais de cinco vendedores. Qual a média de horas semanais de um vendedor e quanto ele vende, em média, por mês? Vendedor Horas por semana Volume de vendas mensais (R$) A 40 3.000 B 35 2.800 C 45 3.500 D 30 2.000 E 42 3.200 Média do volume de vendas mensais 2900 5 14500 5 32002000350028003000 ==++++= − x Média mensal de horas trabalhadas 4,38 5 192 5 4230453540 ==++++= − x 36 HP-12C <f>clear<∑> ou [f] [CLEAR] [REG] 40 enter 3000 <∑+> 35 enter 2800 <∑+> 45 enter 3500 <∑+> 30 enter 2000 <∑+> 42 enter 3200 <∑+> <g><x>[junto a tecla 0] Solução = 2.900 (média mensal de vendas) x><y Solução = 38,4 (média semanal de trabalho em horas) 5.1.2 Média Aritmética Ponderada Para uma sequência numérica X: onde cada valor possui um peso Respectivamente, a média aritmética ponderada, será calculada por: Exemplo 2 : Suponha as médias bimestrais de um aluno: 5, 6, 8 e 5. Calcular a média ponderada dos valores com seus pesos 2, 2, 2 e 4 respectivamente. Obs: npp ,...,1 nxxx ,...,, 21 ∑ ∑= i ii p px pX 8,5 10 58 4222 4.52.82.62.5 1 1 == +++ +++== ∑ ∑ = = k i i k i ii f fx X 37 HP-12C <f>clear<∑> 5 enter 2 <∑+> 6 enter 2 <∑+> 8 enter 2 <∑+> 5 enter 4 <∑+> <g><w x>[junto a tecla 6] Solução = 5,8 5.2 Mediana (Me) A Mediana corresponde ao termo central de uma lista ordenada. Primeiramente você distribui os dados em ordem (crescente ou decrescente) A Mediana corresponde ao valor central (se o conjunto de dados for ímpar) Exemplo1: Idade dos funcionários de uma empresa (em anos) 19 23 23 25 26 30 31 36 36 40 55 50% dos funcionários tem 30 anos ou menos e 50% tem 30 anos ou mais. OBS: Se n é ímpar, a posição da mediana será dada pela expressão Nesse caso temos: Ou seja, o número 30. OBS: Se n é par, o conjunto analisado admite dois termos centrais que ocupam as posições pelas seguintes expressões. + 2 1n conjunto do elemento 6) 2 12 ( 2 111 o== + 38 Ou corresponde a média dos dois valores centrais (se o conjunto de dados for par). Dessa forma, a Me tem 50% dos dados abaixo e 50% acima. 19 23 23 25 26 30 31 36 36 40 55 56 58 60 33,5 50% dos funcionários tem menos de 33,5 anos e 50% tem mais de 33,5 anos. Nesse exemplo temos: Na Planilha Excel: • O comando é < =mediana(célula inicial : célula final) 5.3 Relação entre Média e Mediana A média é sensível a (ou influenciada por) cada valor do conjunto, inclusive os extremos. A mediana por sua vez é relativamente insensível aos valores extremos. Exemplo: considere o seguinte conjunto de dados: 14 15 16 17 18 19 24 38 Mediana = 17,5 Média = 20,1 A média foi influenciada pelo valor 38, o que não aconteceu com a mediana. Portanto, quando o conjunto tem pontos fora do padrão (outliers) a mediana é a medida mais adequada para representar o conjunto. (Embora a média seja de 20,1, 50% dos dados são inferiores a 17,5). + 1 2 2 n e n conjunto do elementos 8 e 71 2 14 2 14 oo= + e 39 5.4. Moda (Mo) Trata-se do valor com maior frequência, ou seja, é o valor que mais se repete. Exemplo: Nº de horas extras por funcionário: 2 2 4 5 5 5 5 7 9 9 18 25 Mo = 5, pois é o número com maior freqüência. Ocorreu 4 vezes. 6. MEDIDAS DE DISPERSÃO As Medidas de Dispersão indicam se os dados estão próximos da média ou se estão mais distantes. Nº de filhos por funcionário: (pequena dispersão, pois estão próximos da média 1,5) 0 0 1 1 1 1 2 2 2 2 2 4 Nº de horas extras por funcionário: (grande dispersão, pois estão mais distantes da média 8) 2 2 4 5 5 5 5 7 9 9 18 25 A dispersão é representada através da VARIÂNCIA e do DESVIO PADRÃO 6.1 Variância A variância corresponde "A média do quadrado da distância de cada ponto até a média". Primeiro calculamos a diferença entre cada valor e a média do conjunto. Em seguida elevamos ao quadrado essas diferenças. A seguir dividimos a soma dos quadrados por n (para dados populacionais) ou por n -1 para dados amostrais. 40 1 )( 1 2 2 − − = ∑ = n xx s n i i é a variância amostral n xx n i i∑ = − = 1 2 2 )( σ é a variância populacional Veja o seguinte esquema: Média = 5,13 8 25191612111087 x - =+++++++= A média das diferenças é zero, pois sendo a média o ponto de equilíbrio dos dados, a soma das diferenças é zero. Média das diferenças = (-6,5)+(-5,5)+(-3,5)+(-2,5)+(-1,5)+2,5+5,5+11,5 = 0 41 Elevando cada uma das diferenças ao quadrado, eliminamos o sinal negativo e a soma não será nula. Além disso, como estamos analisando as variações em torno da média, ao elevarmos ao quadrado, estamos dando ênfase as variações, pois, pequenos valores ao quadrado continuam pequenos e grandes valores ficam ainda maiores. (-6,5)² + (-5,5)² + (-3,5)² + (-2,5)² + (-1,5)² + 2,5² + 5,5² + 11,5² = soma dos quadrados 42,25 + 30,25 + 12,25 + 6,25 + 2,25 + 6,25 + 30,25 + 132,25 = 262 (a unidade está ao quadrado) Calculando a média destes quadrados teremos: No caso populacional No caso amostral quadrado) (ao unidades 75,32 8 2622 ==σ quadrado) (ao unidades 43,37 )18( 262 S2 = − = Exemplo:Nº de Atendimentos na 1ª semana de março de 2017 no Posto de Saúde do bairro XXX Dia da semana Nº de Atend. (xi) xi - x ( xi - x )² s² = 77,2/(5-1) Segunda 25 25 - 18,4 = 6,6 43,56 Terça 18 18 - 18,4 = -0,4 0,16 Quarta 15 15 - 18,4 = -3,4 11,56 s² = 19,3 Quinta 20 20 - 18,4 = 1,6 2,56 Sexta 14 14 - 18,4 = -4,4 19,36 Amostral porque os dados são parte do período trabalhado média = 18,4 77,2 O número médio de atendimentos foi 18,4 e a variância foi 19,3. Observe que a variância traz a unidade, nº de atendimentos ao quadrado, dificultando a interpretação. Extraindo a raiz quadrada da variância obtemos o DESVIO PADRÃO. No exemplo anterior, √�� = √19,3 = 4,39� = 4,39 4,39 é a média das variações (no nº diário de atendimentos) em torno da média diária de 18,4 atendimentos. 42 6.2 Desvio Padrão O desvio padrão representa a média das variações em torno da média do conjunto. Sua unidade é a mesma dos dados. - Se os pontos estiverem mais concentrados em torno da média, menor será a dispersão (a amostra será mais homogênea). - Se os pontos estiverem mais afastados do valor médio, maior será a dispersão (a amostra será mais heterogênea). 1 )( 1 2 − − = ∑ = n xx s n i i Desvio Padrão calculado a partir de uma amostra. n xx n i i∑ = − = 1 2)( σ Desvio Padrão calculado com dados populacionais. Exemplos: a) Em um treinamento de salto em altura, os atletas realizaram 4 saltos cada um. Veja as marcas obtidas pelos três melhores atletas: Atleta A: 148 cm; 170 cm; 155 cm e 131 cm. Atleta B: 145 cm; 151 cm; 150 cm e 152 cm. Atleta C: 146 cm; 151 cm, 143 cm e 160 cm. a) Qual deles teve a melhor média? b) Qual deles foi o mais regular? Analise os dados através da média e do desvio padrão. 43 b) Nº de funcionários nos supermercados de uma cidade do interior. (dados fictícios) SuperM1 SuperM2 SuperM3 SuperM4 SuperM5 5 2 3 8 1 Nº de funcionários (xi) (xi – média) (diferença)² 5 2 3 8 1 Média = Se estes supermercados representam uma amostra calculamos s (desvio padrão amostral), caso contrário calculamos (desvio padrão populacional) Em sua calculadora HP-12C <f>clear<∑> 5 <∑+> 2 <∑+> 3 <∑+> 8 <∑+> 1 <∑+> <g><x>[junto a tecla 0] 3,8 <g><s>[desvio padrão amostral] 2,77 <g><x><∑+>[registra a média como mais uma dado] <g><s>[desvio padrão populacional] 2,4819 44 Na planilha EXERCÍCIOS: E17) Identifique a MÉDIA, a MEDIANA, a MODA, a VARIÂNCIA e o DESVIO PADRÃO para cada conjunto de dados: a) Peso (em Kg) de uma amostra das ovelhas da fazenda AHLEVO. 25 25 26 26,6 30 30 30 33 33,5 35 35 36,5 38 40 41 43 50 52 53 55 b) Despesa mensal (em R$) com estacionamento de todos os funcionários do hospital HH. 78 78 78 78 78 104 104 104 125 125 125 125 125 125 150 150 155 155 165 165 170 175 180 180 c) Despesas com combustível (R$) de alguns vendedores da Distribuidora DD no mês de fev/17. 875,50 908,12 950 980 1020,50 1125,12 1210 45 1215 1260 1265 1270 1280 1305 1315 1316 1319 1324 1346 1356 1400 2040 E18) Uma loja vende cinco produtos básicos A,B,C,D,E. O lucro por unidade comercializada destes produtos vale respectivamente R$ 200,00; R$ 300,00; R$ 500,00; R$ 800,00; R$ 900,00. A loja vendeu em determinado mês 20; 30; 18; 15 e 8 unidades respectivamente. a) Determine o lucro médio por unidade comercializada por essa loja? b) Determine a mediana e a moda. 7. MÉDIA, MODA, MEDIANA, VARIÂNCIA e DESVIO PADRÃO COM BASE NAS TABELAS DE FREQUÊNCIA. Utilizando os valores (números ou intervalos) e as frequências absolutas das tabelas de frequência das variáveis quantitativas, podemos calcular a média, a moda e a mediana de seus valores. Exemplos: 1) Uma empresa distribuidora de frutas entregou, em determinado dia, 500 kg de maçã fuji em diversos pontos de vendas no varejo. O preço (em R$) e a quantidade por kg vendido nos diversos locais estão explicitados na tabela abaixo: Determine a MÉDIA, a MODA, a MEDIANA, a VARIÂNCIA e o DESVIO PADRÃO dos preços praticados pela empresa. OBS: Considere uma população (e não amostra) para o cálculo da variância e do desvio padrão. 46 Locais de venda Preço em R$ (Maçã fuji) Frequência Absoluta (em kg) Local 1 R$ 3,00 90 Local 2 R$ 3,50 120 Local 3 R$ 4,80 50 Local 4 R$ 5,00 140 Local 5 R$ 6,00 100 total 500 a) Média 46,4 500 2230 500 100*6140*550*8,4120*5,390*3 Média ==++++= OBS: Essa média significa que, se, os 500 kg de maçã fossem vendidos pelo mesmo preço, esse preço seria R$ 4,46. Soluções na HP-12C: HP-12C <f> clear <∑> 3 ENTER 90 <∑+> 3,50 ENTER 120 <∑+> 4,80 ENTER 50 <∑+> 5 ENTER 140 <∑+> 6 ENTER 100 <∑+> <g> <x w> [junto a tecla 6] Solução = 4,46 47 b) Moda A maior frequência é 140, que corresponde ao valor de R$ 5,00. Logo, a moda é R$ 5,00. c) Mediana O total da frequência é 500 (número par), portanto os valores centrais são: 00 251 e 2501 2 500 e 2 500 =+= . Então em ordem crescente do preço praticado temos: 90 kg + 120 kg + 40 kg. Assim estamos na frequência da linha 3 onde o preço praticado é R$ 4,80. Isso quer dizer que o 250º e 251º foi vendido por R$ 4,80 cada um. Portanto a mediana é R$ 4,80: Ou seja; 80,4 2 80,480,4 Mediana =+= d) Variância 17,1 500 586 500 )46,46(*100)46,45(*140)46,480,4(*50)46,45,3(*120)46,43(*90 22222 == −+−+−+−+−= V V e) Desvio Padrão 08,117,1 ==DP Portando, o desvio padrão nos preços praticados é de R$ 1,08. OBS: O desvio padrão, na HP-12C, com duas variáveis, faz separadamente os desvios do primeiro conjunto de dados e do segundo conjunto de dados. Portanto, o artifício utilizado é um pouco diferente. Vejamos: Soluções na HP-12C: 48 HP-12C <f> clear <∑> 3 ENTER ENTER 90 X <∑+> 3,50 ENTER ENTER 120 X <∑+> 4,80 ENTER ENTER 50 X <∑+> 5 ENTER ENTER 140 X <∑+> 6 ENTER ENTER 100 X <∑+> 500 STO 1 RCL 6 STO 3 < g > < X > 4,46 (média) <∑+> (insere como um elemento da amostra) < g > < S > 1,08 (desvio padrão populacional) Observação: Tendo o desvio padrão conhecido, fica fácil encontrar a variância, pois, o desvio padrão é a raiz quadrada da variância. Portanto, nesse caso é só fazer a operação inversa para encontrar a variância, ou seja, elevar o desvio padrão ao quadrado. 1,08 ENTER 2 Yx = 1,17 (variância). EXERCÍCIOS: E19) Na tabela abaixo são representados 20 escritórios de contabilidade com seus respectivos números de funcionários. N° de Funcionários N° de Escritórios (frequência absoluta) 12 1 15 4 18 7 24 5 42 3 Calcular as medidas de tendência central: A Média, a moda, a mediana, a variância e o desvio padrão do nº de funcionários das empresas analisadas. Obs: Considere uma amostra para calcular a variância e o desvio padrão E20) A tabela abaixo mostra a idade dos 50 alunos de uma classe de primeiro ano de determinada Faculdade, em anos. 49 Idade (Anos) (xi) Nº de Alunos(fi) 17 3 18 18 19 17 20 8 21 4 Determine a MÉDIA, a MODA, a MEDIANA, a VARIÂNCIA e o DESVIO PADRÃO das idades dos alunos dessa classe. Obs: Nesse caso é uma população e não amostra, pois são todos os alunos da classe. 8. MÉDIA, MODA, MEDIANA E VARIÂNCIA, DESVIO PADRÃO COM BASE EM DADOS AGRUPADOS. 50 Quando as informações referentes a uma variável estão agrupadas em classes de valores (intervalos), não é possível saber como os valores estão distribuídos em cada faixa. Devido a isso, como recurso para associar medidas a esses dados, costuma-se fazer a suposição de que, em cada intervalo, os valores estão distribuídos homogeneamente, isto é, admite-se uma distribuição simétrica ao redor do ponto médio do intervalo.Exemplo: O consumo de energia elétrica verificado de uma amostra de 30 residências de famílias da classe média, com dois filhos, revelou a distribuição abaixo. Determine a MÉDIA, a MODA, a MEDIANA, a VARIÂNCIA e o DESVIO PADRÃO do consumo em Kw/h praticados pelas famílias. a) Média 62 30 1860 30 5*1009*806*604*406*20 Média ==++++= OBS: Essa média significa que, se, todas as famílias consumissem a mesma quantidade de kw/h, o consumo seria 62 kw/h. Soluções na HP-12C: HP-12C <f> clear <∑> 20 ENTER 6 <∑+> 40 ENTER 4 <∑+> 60 ENTER 6 <∑+> 80 ENTER 9 <∑+> 100 ENTER 5 <∑+> <g> <x w> [junto a tecla 6] Solução = 62 b) Moda Classe Consumo Kwh Ponto Médio (Pm) Famílias (fi) Pm * fi Desvio Quadrático 1 10|---30 20 6 120 (62 – 20)2 = 1.764 2 30|---50 40 4 160 (62 – 40)2 = 484 3 50|---70 60 6 360 (62 – 60)2 = 4 4 70|---90 80 9 720 (62 – 80)2 = 324 5 90|---110 100 5 500 (62 – 100)2 = 1.444 TOTAL 30 1.860 4.020 51 A classe modal é dada pela classe que reúne a maior frequência. Nesse exemplo, a classe de maior frequência é a de 70 a 90, pois ela concentra 9 famílias. Portanto, dizemos que a classe modal é o intervalo 70|---90. c) Mediana O total da frequência é 30 (número par), portanto os valores centrais são: 00 16 e 151 2 30 e 2 30 =+= . Em situações que apresentam seus valores distribuídos em intervalos, admite- se que 50% dos dados encontram-se abaixo da mediana e 50% acima da mediana. Então em ordem crescente do consumo por família temos: 6 famílias (20%) + 4 famílias (13,3%) + 6 famílias (20%). Assim estamos no 3º intervalo onde o consumo é de 50 a 70 kwh (20% + 13,3% + 20% = 53,3%). Portanto, dizemos que a mediana pertence ao intervalo 50|---70. d) Variância 07,782 29 22680 130 )10062(*5)8062(*9)6062(*6)4062(*4)2062(*6 22222 == − −+−+−+−+−= V V e) Desvio Padrão 97,2707,782 ==DP Portando, o desvio padrão no consumo de energia elétrica das famílias pesquisadas é 27,97 kw/h. Soluções na HP-12C: 52 HP-12C <f> clear <∑> 20 ENTER ENTER 90 X <∑+> 40 ENTER ENTER 120 X <∑+> 60 ENTER ENTER 50 X <∑+> 80 ENTER ENTER 140 X <∑+> 100 ENTER ENTER 100 X <∑+> 30 STO 1 RCL 6 STO 3 < g > < S > 27,97 (desvio padrão amostral) Observação: Tendo o desvio padrão conhecido, fica fácil encontrar a variância, pois, o desvio padrão é a raiz quadrada da variância. Portanto, nesse caso é só fazer a operação inversa para encontrar a variância, ou seja, elevar o desvio padrão ao quadrado. 27,97 ENTER 2 Yx = 782,32 (variância). OBS: A diferença entre 782,32 e 782,02 é devido ao arredondamento do número 27,97 (27,965496...). EXERCÍCIOS: E21) A tabela abaixo mostra os resultados de uma pesquisa sobre a faixa salarial de todos os funcionários de uma empresa. Determine a MÉDIA, a MODA, a MEDIANA, a VARIÂNCIA e o DESVIO PADRÃO dos salários pagos pela empresa. 53 E22) Considere a tabela abaixo que contém as medidas em altura numa turma de calouros. Altura em cm da turma de calouros 158 159 161 163 164 166 166 167 168 169 169 170 170 172 173 175 175 176 176 177 178 180 181 182 183 185 185 186 187 188 Obs: Intervalo fechado à direita. a) Construa uma tabela de frequência com os intervalos de classe contendo frequência absoluta, frequência absoluta acumulada, frequência relativa e frequência relativa acumulada. resultado ajuste Mínimo (x) Máximo (X) amplitude total (At) (X - x) Nº de classes (k) (raiz quadrada de n) amplitude do intervalo (h) h = At/k TABELA DE FREQUÊNCIA Altura em cm N° de alunos (fi) Frequência Acumulada (FI) Frequência relativa (ri) Frequência relativa Acumulada (RI) Total b) Faça um esboço do histograma; 54 c) Determine a média, mediana, moda, variância e desvio padrão, considerando os intervalos agrupados (histograma). E23) Dado o rol de medidas das alturas (dadas em cm) de uma amostra de 100 indivíduos de uma faculdade: 55 Obs: considere 8 classes, e o intervalo fechado à esquerda. Faça uma tabela de frequência contendo as frequências absolutas e os pontos médios das classes, e através dela: a) Construa o histograma b) Encontre a média c) Encontre a moda d) Encontre a mediana e) Encontre a variância f) Encontre o desvio padrão OBS: Esses cálculos sempre considerando a tabela de frequência. EXERCÍCIOS DE REVISÃO – TESTES 151 152 154 155 158 159 159 160 161 161 161 162 163 163 163 164 165 165 165 166 166 166 166 167 167 167 167 167 168 168 168 168 168 168 168 168 168 168 169 169 169 169 169 169 169 170 170 170 170 170 170 170 171 171 171 171 172 172 172 173 173 173 174 174 174 175 175 175 175 176 176 176 176 177 177 177 177 178 178 178 179 179 180 180 180 180 181 181 181 182 182 182 183 184 185 186 187 188 190 190 56 E24) A participação dos estudantes na Olimpíada Brasileira de Matemática das Escolas Públicas (OBMEP) aumenta a cada ano. O quadro indica o percentual de medalhistas de ouro, por região, nas edições da OBMEP de 2005 a 2009: Região 2005 2006 2007 2008 2009 Norte 2% 2% 1% 2% 1% Nordeste 18% 19% 21% 15% 19% Centro-Oeste 5% 6% 7% 8% 9% Sudeste 55% 61% 58% 66% 60% Sul 21% 12% 13% 9% 11% Disponível em: http://www.obmep.org.br. Acesso em: abr. 2010 (adaptado). Em relação às edições de 2005 a 2009 da OBMEP, qual o percentual médio de medalhistas de ouro da região Nordeste? a) 14,6% b) 18,2% c) 18,4% d) 19,0% e) 21,0% E25) Uma equipe de especialistas do centro meteorológico de uma cidade mediu a temperatura do ambiente, sempre no mesmo horário, durante 15 dias intercalados, a partir do primeiro dia de um mês. Esse tipo de procedimento é frequente, uma vez que os dados coletados servem de referência para estudos e verificação de tendências climáticas ao longo dos meses e anos. As medições ocorridas nesse período estão indicadas no quadro: Dia do Mês Temperatura ºC 57 1 15,5 3 14 5 13,5 7 18 9 19,5 11 20 13 13,5 15 13,5 17 18 19 20 21 18,5 23 13,5 25 21,5 27 20 29 16 Em relação à temperatura, os valores da média, mediana e moda são, respectivamente, iguais a a) 17°C, 17°C e 13,5°C. b) 17°C, 18°C e 13,5°C. c) 17°C, 13,5°C e 18°C. d) 17°C, 18°C e 21,5°C. e) 17°C, 13,5°C e 21,5°C. E26) Um concurso avaliou n candidatos atribuindo-lhes notas de 0 a 100 pontos. Sabe-se que exatamente 20 deles obtiveram nota máxima e, nesse caso, a média aritmética foi de 80 pontos. Agora, se consideradas apenas as 58 notas inferiores a 100 pontos, a média passa a ser de 70 pontos. Nessas condições, pode-se afirmar que n é igual a a) 70 b) 60 c) 80 d) 40 e) 50 E27) Uma empresa seleciona 16 funcionários fumantes e promove um ciclo de palestras com os mesmos para esclarecimentos sobre os efeitos prejudiciais do cigarro à saúde. Após essas palestras, são coletados dados sobre a quantidade de cigarros que cada um desses fumantes está consumindo diariamente. Tais dados são expressos da seguinte maneira: 10, 1, 10, 11, 13, 10, 34, 13, 13, 12, 12, 11, 13, 11, 12, 12 Os dados 1 e 34 são chamados discrepantes, pois são dados muito menores ou muito maiores que a maioria dos dados obtidos. Segundo esta coleta de dados, pode-se afirmar que: a) os cálculos da média, da mediana e da moda não sofrem influência dos dados discrepantes. b) o cálculo da mediana sofre influência dos dados discrepantes que surgiram. c) o cálculo da moda sofre influência dos dados discrepantes que surgiram. d) o cálculo da média sofre influência dos dados discrepantes que surgiram. E28) Sejam os números 7, 8, 3, 5, 9 e 5 seis números de uma lista de nove númerosinteiros. O maior valor possível para a mediana dos nove números da lista é a) 5 b) 6 c) 7 d) 8 e) 9 E29) Sabe-se que a média aritmética de 5 números inteiros distintos, estritamente positivos, é 16. O maior valor que um desses inteiros pode assumir é 59 a) 70. b) 20. c) 50. d) 16. e) 100. E30) A tabela abaixo mostra os resultados de uma pesquisa sobre a faixa salarial dos funcionários de uma empresa que usam bicicleta para ir ao trabalho. O salário médio desses trabalhadores é a) R$ 400,00. b) R$ 425,00. c) R$ 480,00. d) R$ 521,00. e) R$ 565,00. E31) Ao considerar um conjunto de dados, com uma média como medida central, temos a variância e o desvio padrão referentes a esta média. Em relação a estes parâmetros, a) a variância é uma medida cujo significado é a metade do desvio padrão. b) a variância é calculada com base no dobro do desvio padrão. c) o desvio padrão é a raiz quadrada da variância. 60 d) a média dividida pelo desvio padrão forma a variância. e) a variância elevada ao quadrado indica qual é o desvio padrão. E32) Um aluno obteve as notas 4,5; 8,0 e 7,0 nas três avaliações realizadas durante o semestre. O aluno que não consegue a média 7,0 nas três avaliações mensais deve realizar a prova final. Na composição da média final, a média das três avaliações têm peso 4, e a nota da prova final tem peso 6. O aluno será considerado aprovado com a média final superior ou igual a 5. Para obter aprovação, o aluno citado deverá conseguir no exame final, nota mínima igual a: a) 5,0 b) 3,5 c) 4,0 d) 7,0 e) 6,0 E33) Considerando que a tabela abaixo mostra o tempo, em minutos, gasto para a realização de auditorias em seis balanços contábeis, assinale a opção correta a respeito de medidas de tendência central e variabilidade. Auditoria 1 2 3 4 5 6 tempo 60 90 30 40 50 90 a) A amplitude total, que representa a diferença entre as observações nas extremidades do conjunto de dados, foi igual a 30 minutos b) A mediana foi 60 minutos c) A variância amostral desse conjunto de dados foi inferior a 600 minutos2 d) A média foi 55 minutos. e) O desvio padrão amostral foi inferior a 30 minutos E34) Em 2009 uma universidade pagou cada um de seus 45 instrutores um salário mensal de R$ 1.500,00; a cada um de seus 67 assistentes R$ 2.000,00; a cada um dos 58 adjuntos R$ 2.600,00 e a cada um de seus 32 titulares R$ 3.100,00. O salário mediano de todos os docentes dessa universidade é: a) R$ 2.300,00 b) R$ 2.600,00 61 c) R$ 2.000,00 d) R$ 2.400,00 e) R$ 2.200,00 E35) Durante 4 anos consecutivos, o cliente de uma gráfica mandou imprimir cartões de visita para sua empresa. No primeiro ano a gráfica cobrou R$ 10,00 o cento; no segundo ano, R$ 12,00 o cento; no terceiro ano, R$ 15,00; e no quarto ano, R$ 20,00. Sabe-se que, durante o período considerado, o cliente gastou exatamente R$ 3.000,00 em cada ano. Nessas condições, o custo médio do cento de cartões para o período de 4 anos foi de, aproximadamente: a) R$ 11,11 b) R$ 13,33 c) R$ 14,25 d) R$ 15,33 e) R$ 17,66 E36) A tabela abaixo apresenta a distribuição de frequências absolutas de salários, em número de salários mínimos dos 100 funcionários de uma empresa. Classe de salários (em S. M.) Frequências absolutas 1 a 3 30 62 3 a 5 40 5 a 7 30 O valor do desvio padrão desses funcionários, considerado como desvio padrão populacional, e obtido por meio dessa tabela, calculado como se todos os valores de cada classe de salários coincidissem com o ponto médio da referida classe, em número de S. M., é: a) 2,1 b) 2,2 c) 2 d) 8,1 e) 4,2 9. RESPOSTAS DOS EXERCÍCIOS PROPOSTOS: E1) a) qualitativa b) qualitativa c) quantitativa d) qualitativa e) qualitativa f) quantitativa g) qualitativa h) quantitativa 63 E2) a) 31,25% b) R$ 940,00 c) 68,75% d) Xi (variável analisada - nº de fitas) fi (frequência absoluta) Fi (frequência aboluta acumulada) ri (frequência relativa) Ri (frequência relativa acumulada) 1 10 10 12,50% 12,50% 2 25 35 31,25% 43,75% 3 20 55 25,00% 68,75% 4 15 70 18,75% 87,50% 5 5 75 6,25% 93,75% 6 5 80 6,25% 100,00% Total 80 100,00% Fonte: Dados fictícios E3) a) Falso; seria de aproximadamente 95o. b) Verdadeiro; pois essa soma é 1056. c) Verdadeiro; é 4,68% d) Região Nº de emissoras Sudeste 1064 Sul 762 Nordeste 664 Centro Oeste 227 Norte 165 Total 2882 Rádio - Emissoras no ano 2000 Fonte: Almanaque Abril 2001 E4) a) 85% b) 30% E5) a = 0,25; b = 25%; c = 63; d = 35%; e = 72; f = 0,4; g = 40% E6) 64 a) Intervalo de Classes fi ri 7 9 4 20,0% 9 11 5 25,0% 11 13 3 15% 13 15 5 25% 15 17 3 15% Total 20 100% b) 45% c) 65% E7) B E8) E E9) D E10) B E11) 60% E12) D E13) D 65 E14) C E15) Variável Frequência Absoluta Frequência Relativa Canditado A 50 25% Canditado B 80 40% Canditado C 60 30% Brancos e Nulos 10 5% Total 200 100% E16) 0 10 20 30 40 50 60 70 80 90 Canditado A Canditado B Canditado C Brancos e Nulos N ú m er o d e vo ta n te s Resultado da Eleição 25% 40% 30% 5% Resultado da Eleição Canditado A Canditado B Canditado C Brancos e Nulos 66 resultado ajuste Mínimo (x) 17 17 Máximo (X) 27 27 amplitude total (At) (X - x) 10 10 Nº de classes (k) (raiz quadrada de n) 7,07 5 amplitude do intervalo (h) h = At/k 1,41 2 Idade em anos dos calouros de uma classe Alunos Idade(fi) Frequencia acumulada Frequencia relativa frequência Relativa acumulada entre 17 e 19 27 27 54,0% 54,0% entre 19 e 21 11 38 22,0% 76,0% entre 21 e 23 4 42 8,0% 84,0% entre 23 e 25 4 46 8,0% 92,0% entre 25 e 27 4 50 8,0% 100,0% Total 50 203 100% E17) a) Média = 36,88 Moda = 30 Mediana = 35 Variância = 91,34 D. Padrão = 9,56 0 5 10 15 20 25 30 entre 17 e 19 entre 19 e 21 entre 21 e 23 entre 23 e 25 entre 25 e 27 N ú m e ro d e a lu n o s Dados Fictícios Distribuição dos alunos de acordo com a sua idade 67 b) Média = 129,04 Moda = 125 Mediana = 125 Variância = 1.200,04 D. Padrão = 34,64 c) Média = 1.241,91 Moda = Não existe Mediana = 1.270,00 Variância = 59.013,51 D. Padrão = 242,93 E18) Média = 452,74 Moda = 300,00 Mediana = 300,00 E19) Média = 22,2 Moda = 18 Mediana = 18 Variância = 85,64 Desvio Padrão = 9,25 E20) Média = 18,84 anos Moda = 18 anos Mediana = 19 anos Variância = 1,054 Desvio Padrão = 1,027 anos E21) Média = R$ 565,00 Moda = 1º intervalo: R$ 350,00 a R$ 450,00 Mediana = 2º intervalo: R$ 450,00 a R$ 550,00 Variância = 23.608,33 Desvio Padrão = R$ 153,65 E22) a) resultado ajuste Mínimo (x) 158 158 Máximo (X) 188 188 amplitude total (At) (X - x) 30 30 68 Nº de classes (k) (raiz quadrada de n) 5,4 5 amplitude do intervalo (h) h = At/k 5,56 6 TABELA DE FREQUÊNCIA Altura em cm N° de alunos (fi) Frequência Acumulada (FI) Frequência relativa (ri) Frequência relativa Acumulada (RI) 158 a 164 5 5 16,7% 16,7% 164 a 170 8 13 26,7% 43,3% 170 a 176 6 19 20,0% 63,3% 176 a 182 5 24 16,7% 80,0% 182 a 188 6 30 20,0% 100,0% Total 30 91 1 b) E23) ? E24) C E25) B E26) B E27) D 0 1 2 3 4 5 6 7 8 9 158 a 164 164 a 170 170 a 176 176 a 182 182 a 188 N ú m e ro d e a lu n o s Altura em cm da turma de calouros 69 E28) D E29) A E30) E E31) C E32) C E33)E E34) C E35) B E36) E 10. BIBLIOGRAFIA UTILIZADA 1) ANDERSON, David R & SWEENEY, Dennis J. & WILLIAN, Thomas A. Estatística Aplicada à Administração e Economia. 2ª Edição. São Paulo. Cengage Learning, 2012. 2) DA SILVA, Ermes Medeiros.;Da SILVA, Elio Medeiros; GONÇALVES, Valter.; MUROLO, Afrânio Carlos. Estatística: para os cursos de economia, administração e ciências contábeis. Volume 1. 4ª ed. São Paulo: Atlas, 2010. 3) CRESPO, Antônio Arnot. Estatística Fácil. 19ª Edição Atualizada. São Paulo: Saraiva, 2009. 4) IEZZI, Gelson & HAZZAN, Samuel & DEGENSZAJN, David. Fundamentos de Matemática Elementar. Volume 11. São Paulo: Atual Editora,2004.
Compartilhar