Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Descritiva Básica Prof. Luiz Gustavo Alves Silva 2014 Sumário 01. Conceitos Iniciais ......................................................................................................................... 01 1.1. Definição de Estatística ........................................................................................................................ 01 1.2. Variável ................................................................................................................................................. 01 1.3. População e Amostra ........................................................................................................................... 01 1.4. Frequência Absoluta e Frequência Relativa ......................................................................................... 02 1.5. Representações Gráficas ...................................................................................................................... 02 1.5.1. Gráficos de Barras e de Colunas ................................................................................................... 02 1.5.2. Gráficos de Setores e de Rosca .................................................................................................... 03 1.5.3. Gráficos de Linhas ........................................................................................................................ 04 1.6. Distribuição de Frequências ................................................................................................................. 05 02. Medidas de Posição ..................................................................................................................... 13 2.1. Média Aritmética ................................................................................................................................. 13 2.1.1. Média Aritmética para Dados Agrupados - sem intervalos de classe ......................................... 15 2.1.2. Média Aritmética para Dados Agrupados - com intervalos de classe ......................................... 16 2.2. Mediana ............................................................................................................................................... 20 2.3. Moda.................................................................................................................................................... 20 2.4. Comparando a Média, a Mediana e a Moda ....................................................................................... 24 03. Medidas de Dispersão ................................................................................................................. 25 3.1. Amplitude Total ................................................................................................................................... 25 3.2. Desvio Médio ....................................................................................................................................... 25 3.3. Variância .............................................................................................................................................. 26 3.4. Desvio Padrão ...................................................................................................................................... 26 Respostas ........................................................................................................................................... 30 Bibliografia ......................................................................................................................................... 31 Nota do autor Esta apostila tem por interesse fornecer uma introdução ao estudo da Estatística Descritiva, apresentando noções gerais sobre gráficos e tabelas, medidas de posição e de dispersão. Este material serve para estudantes de nível básico e universitário, para o professor que busca por material de apoio ou para qualquer um que se interesse pelo tema. Procurei adicionar bastante exercícios extraídos de vestibulares e ENEM, assim como busquei expor situações práticas nos exemplos. Desde já agradeço a atenção de todos e desejo-lhes bons estudos! Dúvidas, críticas e sugestões são sempre bem vindas. Este material (juntamente com vários outros) está disponível gratuitamente no sítio: http://manualdasexatas.blogspot.com.br/ Prof. Gustavo Silva http://manualdasexatas.blogspot.com.br/ LUIZ GUSTAVO ALVES SILVA Estatística Descritiva Básica/ SILVA, Luiz Gustavo Alves – Pouso Alegre: Blog Manual das Exatas, 1ª Edição, 2014. 31 f. Apostila (Matemática) http://manualdasexatas.blogspot.com.br/, 2015. 1. Estatística Descritiva 2. Matemática 3. Médias 4. Tabelas e Gráficos http://manualdasexatas.blogspot.com.br/ 1 01 Conceitos Iniciais 1.1. Definição de Estatística Podemos definir a Estatística como a ciência que lida com métodos de coleta, organização, descrição e análises de dados, assim como auxilia na tomada de decisões a partir da interpretação dos mesmos. Ao que se refere à coleta, organização e descrição dos dados, cabe à Estatística Descritiva, enquanto a análise, interpretação e previsões de resultados ficam a cargo da Estatística Indutiva ou Inferencial. Nesta apostila básica será trabalhada apenas a estatística descritiva. 1.2. Variável Chamamos de variável o conjunto de aspectos que podem ser atribuídos aos objetos da pesquisa, ou seja, representa os possíveis resultados de um fenômeno. Veja alguns exemplos: para o fenômeno voto eleitoral podemos ter os resultados: voto nulo, voto em branco, voto ao candidato A ou ao candidato B, etc; para o fenômeno número de alunos de uma instituição existe um número de resultados possíveis que podem ser expressos pelos números naturais: , , , , , ... , ; para o fenômeno tempo de duração um determinado evento temos que os resultados podem assumir um número infinito de valores numéricos dentro de certo intervalo. Uma variável é dita qualitativa se seus valores são expressos por entradas não numéricas, ou seja, por atributos ou qualidades: verdadeiro ou falso, masculino ou feminino, voto nulo, voto em branco, etc. E a variável é dita quantitativa se seus valores são expressos por medidas numéricas: número de pessoas, salários de funcionários, quantidade de votos, etc. Uma variável quantitativa que pode assumir somente valores dentro de um conjunto enumerável é chamada de variável discreta; e uma variável que pode assumir, teoricamente, qualquer valor dentro de um intervalo é denominada variável contínua. 1.3. População e Amostra Em estatística chamamos de população o conjunto de todos os elementos que possuem, pelo menos, uma característica em comum e que é de interesse seu estudo. Uma amostra é um subconjunto finito da população e que sua análise nos permite aferir sobre a totalidade, desde que a amostra represente significativamente a população. Por exemplo, se uma pesquisa deseja avaliar o desempenho acadêmico dos alunos de determinado curso de uma universidade, o conjunto de todos os alunos matriculados no curso constitui a população; todavia é muito mais prático (e menos propenso a erros de cálculos) que seja feita uma amostragem dessa população, selecionando, a partir de algum critério específico, certo conjunto menor de alunos. 2 1.4. Frequência Absoluta e Frequência Relativa O número total de vezes em que ocorre certo resultado para determinada variável é chamado de frequência absoluta que indicaremos por , o índice atribui-se ao fato de que cada resultado aparece determinado número de vezes. No entanto, podemos atribuir um valor comparativo a certo resultado de uma variável ao considerarmos a razão entre sua frequência absoluta pelo número total “ ” de valores ocorridos ao considerar todas as variáveis. Esse valorcomparativo é chamado de frequência relativa ( ): Por exemplo, uma pesquisa está avaliando a faixa etária dos habitantes de um certo bairro caracterizando-os em criança/recém-nascido, adolescente, adulto ou idoso. Com o levantamento obtido, pôde-se construir a seguinte tabela de frequências: Faixa etária Frequência absoluta Frequência relativa Porcentagem criança/recém-nascido adolescente adulto idoso Total 1.5. Representações Gráficas As representações gráficas constituem uma importante ferramenta para descrição e apresentação de dados coletados, facilitando na interpretação dos mesmos. Essa importância atribuída aos gráficos se dá, principalmente, pelo apelo visual dos mesmos que facilita na absorção e interpretação das informações. Há uma gama bem diversificada de tipos de gráficos, a seguir discutiremos brevemente os tipos mais utilizados. Não será dada ênfase em como construir tais gráficos, pois atualmente o que se usa são softwares com assistentes gráficos. 1.5.1. Gráficos de Barras e de Colunas Esses gráficos são representados por retângulos organizados na horizontal (barras) ou na vertical (colunas), cujo tamanho dos retângulos são proporcionais aos respectivos dados. São usados principalmente para expressar séries de dados estatísticos em função do tempo, local, espécie, etc. Por exemplo, a seguir temos o gráfico1 (de colunas) que associa número de inscritos no Exame Nacional do Ensino Médio (ENEM) de distribuídos por região em (escala de milhões): 1 Dados disponíveis em <<http://portal.inep.gov.br/enem>> acesso em 02.nov.2014. 3 Fonte: Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP) Outro exemplo é o gráfico2 (de barras) abaixo que expressa a relação entre o eleitorado por categoria de voto e as abstenções referentes ao segundo turno da eleição presidencial de : Fonte: Tribunal Superior Eleitoral (TSE) 1.5.2. Gráficos de Setores e Gráficos de Rosca Os gráficos de setores (conhecidos também como gráficos de pizza) são gráficos na forma de um disco dividido em setores (fatias). Cada setor representa certa parte de um todo e, o tamanho dessa fatia é proporcional a frequência de cada categoria. Já os gráficos de rosca são análogos aos de setores, porém o aspecto se aproxima de um anel. 2 Dados disponíveis em <<http://divulga.tse.jus.br/oficial/index.html>> acesso em 03.nov.2014. 0,77 2,88 0,95 3,08 1,04 0 0,5 1 1,5 2 2,5 3 3,5 Centro-Oeste Nordeste Norte Sudeste Sul Número de inscritos por região no ENEM - 2014 (milhões) 30,14 5,22 1,92 105,54 0 20 40 60 80 100 120 Abstenções Votos nulos Votos em branco Votos válidos Eleitorado por categoria de voto - 2º turno eleição presidencial 2014 (milhões) 4 Esses gráficos são utilizados para expressar a relação entre as partes de um todo e, geralmente indicam na forma de porcentagem. Por exemplo, o gráfico3 (de setores) abaixo nos mostra a distribuição da população brasileira entre os setores urbanos e rurais: Fonte: Instituto Brasileiro de Geografia e Estatística (IBGE) O índice de Desenvolvimento da Educação Básica (IDEB) é um indicador da qualidade da educação básica criado pelo Inep, e que atribui uma nota de a . Abaixo temos o gráfico4 de rosca que indica distribuição dos escores do IDEB nos anos iniciais do ensino fundamental municipal e estadual avaliado em mais de mil municípios por todo o Brasil. Fonte: Instituto de Pesquisa Econômica Aplicada (IPEA) 1.5.3. Gráficos de Linhas Os gráficos de linhas são traçados usando o sistema de coordenadas cartesianas, em que os pontos que representam a evolução das frequências dos valores de uma variável são ligados por segmentos. São utilizados para indicar a tendência de aumento ou diminuição dos valores de uma dada informação ao longo do tempo. 3 Dados disponíveis em <<http://www.ibge.gov.br/paisesat/main_frameset.php>> acesso em 04.nov.2014. 4 Dados disponíveis em <<http://www.ipea.gov.br/portal/index.php?option=com_content&view=article&id=20731>> acesso em 05.nov.2014 85,43% 14,57% Distribuição da população brasileira por zonas - 2014 Residentes em área urbana Residentes em área rural 23,40% 29,10% 33,90% 13,60% Distribuição dos resultados do IDEB nos anos iniciais do ensino fundamental, desagregados segundo intervalos de escores - 2010 Baixo (< 4,0) Médio-Inferior (≥ 4,0 < 5,0) Médio-Superior (≥ 5,0 < 6,0) Alto (≥ 6,0) 5 Por exemplo, o gráfico5 de linhas abaixo representa a evolução da taxa de desmatamento florestal da Amazônia Legal entre os anos de e : Fonte: Instituto Nacional de Pesquisas Espaciais 1.6. Distribuição de Frequências Imaginemos uma empresa fictícia que tenha uma distribuição salarial que pode ser separada em intervalos de classes como mostra a seguinte tabela: Distribuição salarial da empresa X Salários (reais) Frequência Total O número de valores da variável pertencentes a uma classe é a frequência absoluta ( ) da mesma e uma tabela como a indicada acima é denominada distribuição de frequência com intervalos de classe. Os histogramas são gráficos semelhantes aos de barras/colunas, mas que são usados para representar dados agrupados em intervalos de classe, onde a base dos retângulos possui largura proporcional ao tamanho do intervalo e a altura corresponde a frequência da classe. 5 Dados disponíveis em <<http://www.inpe.br/noticias/noticia.php?Cod_Noticia=3301>> acesso em 04.nov.2014. 27772 19014 14286 11651 12911 7464 7000 6418 4571 0 5000 10000 15000 20000 25000 30000 2004 2005 2006 2007 2008 2009 2010 2011 2012 km 2 /p o r an o Ano Taxa de desmatamento anual da Amazônia Legal (km2) 6 Abaixo temos o histograma construído usando dados da tabela anterior: O gráfico de linhas que se obtém ligando os pontos médios das bases superiores de um histograma é chamado de polígono de frequências, desse último exemplo, temos: 88 114 150 97 79 66 0 20 40 60 80 100 120 140 160 800 ˫ 1000 1000 ˫ 1200 1200 ˫ 1400 1400 ˫ 1600 1600 ˫ 1800 1800 ˫ 2000 N ú m e ro d e f u n ci o n ár io s Faixa salarial Distribuição salarial da empresa X 0 20 40 60 80 100 120 140 160 800 ˫ 1000 1000 ˫ 1200 1200 ˫ 1400 1400 ˫ 1600 1600 ˫ 1800 1800 ˫ 2000 N ú m e ro d e f u n ci o n ár io s Faixa salarial Distribuição salarial da empresa X 7 Observe agora a seguinte distribuição de frequências de alunos de uma sala de aula, segundo a nota obtida em uma avaliação de matemática de valor pontos: Nota Nº de alunos ( ) Chamamos de frequência acumulada ( ) de uma dada classe a soma de todas as frequências inferiores ao limite superior do intervalo da classe em questão. Do exemplo acima, a frequência acumulada da terceira classe é esse resultado significa que existem alunos com nota inferior a pontos. Podemos representar graficamente a frequência acumulada de cada classe inserindo no histograma segmentos verticais como segue: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 0 ˫ 20 20 ˫ 40 40 ˫ 60 60 ˫ 80 80 ˫ 100 N ú m e ro d e a lu n o s Notas 8 Exercícios resolvidos 1. (EPCAr-MG) O gráfico, a seguir, representa o resultado de uma pesquisasobre a preferência por conteúdo, na área de Matemática, dos alunos do curso preparatório de cadetes do ar. Sabendo-se que no gráfico o resultado por conteúdo é proporcional à área do setor que a representa, pode-se afirmar que o ângulo central do setor do conteúdo MATRIZ é de a) b) c) d) Solução: Observe que o círculo completo representa o que corresponde a . Assim, basta que apliquemos uma regra de três simples diretamente proporcional: Ângulo Porcentagem Para transformar a fração de grau em minutos, basta multiplicá-lo por , pois , logo: Resposta: alternativa c. 2. (ENEM-2005) Um estudo caracterizou ambientes aquáticos, nomeados de a , em uma região, medindo parâmetros físico-químicos de cada um deles, incluindo o nos ambientes. O Gráfico I representa os valores de dos ambientes. Utilizando o gráfico II, que representa a distribuição estatística de espécies em diferentes faixas de , pode-se esperar um maior número de espécies no ambiente: a) b) c) d) e) Combinatória; 47% Função; 11% Geometria espacial; 22% Matriz; 14% Progressões; 6% 9 Solução: Este é um típico problema de análise gráfica. Ora, basta que observemos no gráfico II, em qual intervalo de ph ocorre a maior frequência no número de espécies e, comparar no gráfico I qual dos cinco ambientes apresenta tal ph. Analisando o gráfico II, observamos que a classe de ph que contém o maior número de espécies é o intervalo de [ ] e, pelo gráfico I, percebe-se facilmente que o ambiente D é o único que possui ph em tal intervalo. Resposta: alternativa d. 3. (ENEM-2002) No gráfico estão representados os gols marcados e os gols sofridos por uma equipe de futebol nas dez primeiras partidas de um determinado campeonato. Considerando que, neste campeonato, as equipes ganham pontos para cada vitória, ponto por empate e ponto em caso de derrota, a equipe em questão, ao final da décima partida, terá acumulado um número de pontos igual a a) b) c) d) e) Solução: É fácil perceber que o time obtém uma vitória se a diferença entre gols marcados e gols sofridos for positiva, um empate se a diferença for nula e, uma derrota se a diferença for negativa. Assim, por exemplo, no dia temos: , portanto representa uma vitória e consequentemente o ganho de três pontos. Calculando-se essa mesma diferença para os demais dias, contabilizam-se vitórias, empates e derrotas. Logo ao final da décima partida temos um total de pontos igual a: Resposta: alternativa c. 4. Uma pesquisa com 175 alunos de uma escola sobre qual era seu animal de estimação de preferência resultou a seguinte tabela: Animal Frequência Absoluta Frequência Relativa Porcentagem Cachorro Gato Outros Total Sendo assim, determine os valores de , e . 0 1 2 3 4 5 6 28/1 4/2 11/2 18/2 25/2 4/3 11/3 18/3 25/3 1/4 N ú m e ro d e g o ls Data da partida Gols sofridos Gols marcados 10 Solução: Podemos determinar observando que o mesmo adicionado a e a deve resultar , logo: Já , pela definição de frequência relativa, pode ser dado pela razão entre e : E por fim, temos (já que é a porcentagem que falta para inteirar ) Exercícios propostos 1. (UFLA-MG) Uma prefeitura fez uma pesquisa na comunidade sobre qual deveria ser a ordem de prioridade do governo com relação a educação, saúde e segurança. As opções, para a ordem de prioridades, eram: a Educação – Saúde – Segurança d Educação – Segurança – Saúde b Segurança – Saúde – Educação e Saúde – Educação - Segurança c Saúde – Segurança – Educação f Segurança – Educação - Saúde O resultado da pesquisa foi descrito pelo gráfico, em que, para cada opção, uma barra indica a porcentagem de pessoas que optaram por ela. Determine a alternativa incorreta. a) A maioria das pessoas entrevistadas priorizou Educação em detrimento da Segurança. b) A maioria das pessoas entrevistadas priorizou Educação e Segurança em detrimento da Saúde. c) das pessoas entrevistadas priorizaram Educação e Saúde em detrimento da Segurança. d) das pessoas entrevistadas consideraram que a Segurança deveria ser a maior prioridade do governo municipal. 2. Uma pesquisa com todos os funcionários de uma empresa sobre o meio de transporte que as mesmas usam para ir ao trabalho resultou a seguinte tabela: Transporte Frequência Absoluta Frequência Relativa Porcentagem Carro Motocicleta Coletivo Total Dessa forma, complete a tabela com os valores que faltam. 22 8 18 15 20 17 0 5 10 15 20 25 a b c d e f Fr eq u ên ci a (% ) 11 3. (ENEM-2012) A figura a seguir apresenta dois gráficos com informações sobre as reclamações diárias recebidas e resolvidas pelo Setor de Atendimento ao Cliente (SAC) de uma empresa, em uma dada semana. O gráfico de linha tracejada informa o número de reclamações recebidas no dia, o de linha contínua é o número de reclamações resolvidas no dia. As reclamações podem ser resolvidas no mesmo dia ou demorarem mais de um dia para serem resolvidas. O gerente de atendimento deseja identificar os dias da semana em que o nível de eficiência pode ser considerado muito bom, ou seja, os dias em que o número de reclamações resolvidas excede o número de reclamações recebidas. O gerente de atendimento pôde concluir, baseado no conceito de eficiência utilizado na empresa e nas informações do gráfico, que o nível de eficiência foi muito bom na a) segunda e na terça-feira. b) terça e na quarta-feira. c) terça e na quinta-feira. d) quinta-feira, no sábado e no domingo. e) segunda, na quinta e na sexta-feira. 4. (UFPE-PE) Os gráficos a seguir ilustram a distribuição percentual do consumo de energia elétrica no Brasil dos diversos setores e do setor industrial. Assinale a alternativa incorreta sobre o consumo de energia elétrica no Brasil: a) O setor de metais consome mais que o comercial. b) O setor público consome mais que o de alimentos. c) O setor residencial consome mais que, juntos, o químico e o de metais. d) O setor de papel consome do total de energia. e) O setor químico e o de alimentos consomem juntos menos que o residencial. 0 10 20 30 Qui Sex Sáb Dom Seg Ter Qua 12 5. (ENEM-2014) Uma empresa de alimentos oferece três valores diferentes de remuneração a seus funcionários, de acordo com o grau de instrução necessário para cada cargo. No ano de , a empresa teve uma receita de milhões de reais por mês e um gasto mensal com a folha de salarial de , distribuídos de acordo com o Gráfico . No ano seguinte, a empresa ampliará o número de funcionários, mantendo o mesmo valor salarial para cada categoria. Os demais custos da empresa permanecerão constantes de para . O número de funcionários em e , por grau de instrução, está no Gráfico . Gráfico II Qual deve ser o aumento na receita da empresa para que o lucro mensal em seja o mesmo de ? a) b) c) d) e) 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 Ensino fundamental Ensino médio Ensino superior Número de funcionários por grau de instrução 2013 2014 13 02 Medidas de Posição Introdução Os dados observados em uma população tendem, em geral, a se agruparem entorno de valores centrais e quantificamos este fenômeno a partir das chamadas medidas de posição. As medidas de posição mais usuais são as medidas de tendência central que serão apresentadas no decorrer deste capítulo. 2.1. MédiaAritmética A média aritmética para dados brutos (não agrupados) de uma amostra é dada pela razão entre a soma dos valores assumidos pela variável pelo número de valores. Indicamos a média aritmética por ̅: Exercícios resolvidos 1. (ENEM-2013) As notas de um professor que participou de um processo seletivo, em que a banca avaliadora era composta por cinco membros, são apresentadas no gráfico. Sabe-se que cada membro da banca atribuiu duas notas ao professor, uma relativa aos conhecimentos específicos da área de atuação e outra, aos conhecimentos pedagógicos, e que a média final do professor foi dada pela média aritmética de todas as notas atribuídas pela banca avaliadora. Utilizando um novo critério, essa banca avaliadora resolveu descartar a maior e a menor nota atribuída ao professor. A nova média, em relação à média anterior, é a) ponto maior b) ponto maior c) ponto menor d) ponto maior e) pontos menor 18 17 14 19 16 16 13 1 14 12 0 2 4 6 8 10 12 14 16 18 20 Avaliador A Avaliador B Avaliador C Avaliador D Availador E Notas (em pontos) Conhecimentos específicos Conhecimentos pedagógicos ̅ ∑ 14 Solução: A média de todas as notas atribuídas pela banca é dada por: ̅ E se descartarmos a maior e a menor nota, respectivamente e , temos: ̅ Assim, a diferença entre nova média e a média anterior é . Resposta: alternativa b. 2. (UFMG-MG) Define-se a média aritmética de números dados como o resultado da divisão por da soma dos números dados. Sabe-se que é a média aritmética de ; ; e . O número é igual a: a) b) c) d) Solução: Basta determinarmos o valor de para que a equação abaixo seja verdadeira: Resposta: alternativa d. 3. (UFAL-AL) Considere números cuja média aritmética é . Retirando-se um desses números, a média aritmética dos restantes é . O número retirado é: a) b) c) d) e) Solução: Chamando de a soma resultante dos números iniciais, temos que: Assim, se é o número retirado, temos que: Substituindo em , vem: Resposta: alternativa d. Observação: Pode-se provar que a média aritmética obedece às seguintes propriedades: Se a cada valor de uma variável for adicionada uma constante , a média aritmética ficará adicionada de unidades. Se cada valor de uma variável for multiplicado uma constante , a média aritmética ficará multiplicada por . ̅ ̅ 15 2.1.1. Média Aritmética para Dados Agrupados - sem intervalo de classe Nesse caso tem-se a ocorrência de certa frequência absoluta para os valores de uma variável quantitativa e, a média aritmética é dada pela razão entre a soma dos valores multiplicados por sua frequência pela soma das frequências. Por exemplo, a tabela abaixo nos mostra a distribuição de alunos de uma turma de administração de empresas, tomando como variável o número de disciplinas que os mesmos pretendem cursar no próximo semestre (será mais prático abrirmos uma coluna para ): Número de disciplinas ( ) Número de alunos ( ) 14 Assim, o número médio de disciplinas a serem cursadas por aluno é dado por: ̅ ∑ ∑ ̅ ̅ É claro que o número de disciplinas que um aluno cursa deve ser inteiro, então o número sugere que a maior parte da amostra pretende cursar disciplinas, porém com uma tendência a optarem por disciplinas. Observação: Se numa amostra possui dados que devem ter maior efeito sobre a média, ou seja, resultados que possuem pesos, então podemos calcular a média aritmética ponderada ao considerar os pesos como a frequência absoluta de cada valor da variável, pois a frequência é um modo de quantificar a intensidade de cada um desses valores. Exemplo: Em certa universidade, a nota de classificação para ingresso nos cursos é dada pela média aritmética ponderada das notas obtidas no ENEM para cada candidato. O curso que André pretende ingressar adota os seguintes pesos: Linguagens Ciências humanas Ciências da natureza Matemática Redação Peso André obteve em linguagens, em ciências humanas, em ciências da natureza, em matemática e na redação. Sendo assim, a nota final de André é dada pela por: ̅ ̅ ̅ ∑ ∑ 16 2.1.2. Média Aritmética para Dados Agrupados - com intervalos de classe Nesse caso, consideramos que todos os valores contidos em um determinado intervalo de classe coincidem com o ponto médio da classe e calculamos: Considere, por exemplo, a seguinte distribuição de frequências que expressa os valores de motocicletas disponíveis à venda em uma determinada concessionária: Valor ( ) Frequência ( ) Ponto médio da classe ( ) Logo, a média de preço das motocicletas dessa concessionária é dada por: ̅ ∑ ∑ ̅ ̅ Ressaltando que o ponto médio de uma classe é dado pela metade soma dos valores que limitam a mesma. Exercícios resolvidos 1. (UFF-RJ) Cada um dos alunos da turma obteve, na avaliação de um trabalho, nota ou nota . A média aritmética dessas notas foi . Determine quantos alunos obtiveram nota e quantos obtiveram nota . Solução: O problema solicita os valores das frequências absolutas do número de alunos segundo sua nota. Vamos chamar de e o número de alunos que obtiveram, respectivamente, nota e , perceba que: Usando a fórmula da média para dados agrupados, temos: ̅ ∑ ∑ Assim, temos o seguinte sistema: { cuja solução é e . Resposta: alunos obtiveram a nota e alunos a nota . 2. (PUC-RJ) Um aluno fez provas com pesos , e . Se ele tirou e mas duas primeiras, quanto precisa tirar na terceira prova para ficar com média maior ou igual a ? a) Pelo menos b) Pelo menos c) Pelo menos d) Pelo menos e) Pelo menos ̅ ∑ ∑ 17 Solução: Chamando de a nota da terceira prova, temos ̅ ̅ Impondo a condição ̅ , vem: Resposta: alternativa e. 3. (FGV-SP) A tabela a seguir representa a distribuição de frequências dos salários de um grupo de empregados de uma empresa, num certo mês. Número de classe Salário do mês em reais Número de empregados O salário médio desses empregados, nesse mês, foi de: a) b) c) d) e) Solução: Como vimos em exemplo anterior, torna-se mais prático os cálculos se expandirmos a tabela abrindo uma coluna para o ponto médio da classe e uma coluna para o produto , acompanhe: Número de classe Salário do mês em reais Número de empregados ( ) Ponto médio da classe ( ) Desse modo, o salário médio dos empregados é dado por: ̅ ∑ ∑ ̅ ̅ Resposta: alternativa e. Exercícios propostos 1. (UFMG-MG) No início de uma partida de futebol, a altura média dos jogadores de um dos timesera . Ainda no primeiro tempo, um desses jogadores, com de altura, foi substituído. Em seu lugar, entrou outro que media de altura. No segundo tempo, outro jogador do mesmo time, com de altura, foi expulso. Ao terminar a partida, a altura média dos jogadores desse time era: a) b) c) d) 18 2. (UERJ-RJ) Observe um demonstrativo do consumo de energia elétrica durante alguns meses: Considere que o consumo médio, de agosto/ a dezembro/ , foi igual ao que ocorreu de janeiro/2012 a abril/2012. Assim, o consumo no mês de abril de , em , foi igual a: a) b) c) d) e) 3. (UERJ-RJ) Seis caixas-d’água cilíndricas iguais estão assentadas no mesmo piso plano e ligadas por registros ( ) situados nas suas bases, como sugere a figura a segui: Após a abertura de todos os registros, as caixas ficaram com os níveis de água no mesmo plano. A altura desses níveis, em , equivale a: a) b) c) d) 4. (ENEM-2014) Ao final de uma competição de ciências em uma escola, restaram apenas três candidatos. De acordo com as regras, o vencedor será o candidato que obtiver a maior média ponderada entre as notas das provas finais nas disciplinas química e física, considerando, respectivamente, os pesos e para elas. As notas são sempre números inteiros. Por questões médicas, o candidato II ainda não fez a prova final de química. No dia em que sua avaliação for aplicada, as notas dos outros dois candidatos, em ambas as disciplinas, já terão sido divulgadas. O quadro apresenta as notas obtidas pelos finalistas nas provas finais. Candidato Química Física I II III A menor nota que o candidato II deverá obter na prova final de química para vencer a competição é: a) b) c) d) e) 235 150 182 215 248 268 158 257 0 30 60 90 120 150 180 210 240 270 ago.2011 set.2011 out.2011 nov.2011 dez.2011 jan.2012 fev.2012 mar.2012 kWh 19 5. (Fuvest-SP) A distribuição das idades dos alunos de uma classe é dada pelo gráfico seguinte: Qual das alternativas representa melhor a média de idade dos alunos? a) anos e meses. b) anos e mês. c) anos e meses. d) anos e meses. e) anos e meses. 6. (FGV-SP) O gráfico de barras indica como informação principal o número de pessoas atendidas em um pronto-socorro, por faixa etária, em um determinado dia. Outra informação apresentada no gráfico, por meio das linhas verticais, é a frequência acumulada. Em virtude de um rasgo na folha em que o gráfico estava desenhado, as informações referentes à última barra, e apenas elas, foram perdidas, como se vê na figura. A média de idade do total de pessoas de a anos que frequentou o pronto-socorro nesse dia foi anos. Nessas condições, na folha intacta do gráfico original, o comprimento da linha vertical posicionada na última barra, que indica a frequência acumulada até anos de idade, em centímetros, era igual a a) b) c) d) e) 20 2.2. Mediana A mediana ( ) é outra medida de tendência central e é definida como o valor que divide uma série de valores quantitativos em duas partes, de modo que a mediana se encontra no centro da série, estando essa série disposta segundo uma ordem. Considerando uma série de dados brutos de uma variável quantitativa e, estando ela ordenada (em crescente ou decrescente), a mediana é o valor central da série se a mesma contiver um número ímpar de elementos e, será a média dos dois valores centrais caso contenha um número par de elementos. Considere, por exemplo, a seguinte série de valores: , , , , , , , pela definição de mediana, devemos primeiramente ordenar os valores dados: , , , , , , Agora devemos observar o valor que se encontra ao centro da série, ou seja, aquele em que há o mesmo número de elementos a sua direita e a sua esquerda, logo: Porém, se acrescentarmos o número a essa série, ela terá um número par de elementos: , , , , , , , Pela definição, a mediana será dada por: 2.3. Moda A moda ( ) também é outra medida de tendência central e é definida como o valor que possui maior frequência numa série de dados, ou seja, é o valor que mais se repete. Assim, por exemplo, idade modal entre pessoas de um mesmo grupo é a idade possuída pelo maior número de indivíduos desse grupo. Exercícios resolvidos 1. (ENEM-2013) Foi realizado um levantamento nos hotéis de uma cidade, no qual foram anotados os valores, em reais, das diárias para um quarto padrão de casal e a quantidade de hotéis para cada valor da diária. Os valores das diárias foram: ; ; e . No gráfico, as áreas representam as quantidades de hotéis pesquisados, em porcentagem, para cada valor da diária. O valor mediano da diária, em reais, para o quarto padrão de casal nessa cidade, é a) b) c) d) e) 21 Solução: Primeiramente vamos determinar qual a frequência absoluta de cada valor da variável diária: Assim, se dispormos ordenadamente os valores das diárias, temos: ⏟ , ⏟ , ⏟ , ⏟ Note que os dois grupos de valores, da esquerda e da direita, possuem elementos cada e, como temos um número par de termos, a mediana será dada pela média dos dois valores centrais: ⏟ Resposta: alternativa c. 2. (UFU-MG) As medidas colhidas por um cientista num determinado experimento, todas na mesma unidade, foram as seguintes: , , , , , , , , , . Ao trabalhar na análise estatística dos dados, o cientista esqueceu-se, por descuido, de considerar uma dessas medidas. Dessa forma, comparando os resultados obtidos pelo cientista em sua análise estatística com os resultados corretos para esta amostra, podemos afirmar que: a) a moda e a média foram afetadas. b) a moda não foi afetada, mas a média foi. c) a moda foi afetada, mas a média não foi. d) a moda e a média não foram afetadas. Solução: Se a média aritmética leva em conta todos os dados da amostra, então ao omitir algum dado, a média é sempre afetada. A moda desta amostra é o valor “ ”, pois esse possui maior frequência e, note que ao omitir qualquer outro dado, a moda não é afetada, já que seria mantida a superioridade de “ ”. E mesmo que se omita um desses “ ” , tal dado ainda aparecerá com maior frequência (neste caso específico). Resposta: alternativa b. 3. Em um conjunto de observações numéricas, podemos afirmar que: a) a média aritmética é maior que a mediana. b) a mediana é maior que a moda. c) dos valores estão acima da média aritmética. d) dos valores estão abaixo da mediana. e) dos valores estão entre a moda e a mediana. Solução: Ao ordenar esses números, a mediana será dada pela média entre o e o termo, assim desses valores ficam abaixo da mediana (considerando que os dados numéricos sejam distintos). Resposta: alternativa d. 22 Exercícios propostos 7. (ENEM-2014) Os candidatos , , , e estão disputando uma única vaga de emprego em uma empresa e fizeram provas de português, matemática, direito e informática. A tabela apresenta as notas obtidas pelos cinco candidatos. Candidatos Português Matemática Direito Informática Segundo o editalde seleção, o candidato aprovado será aquele para o qual a mediana das notas obtidas por ele nas quatro disciplinas for a maior. O candidato aprovado será: a) b) c) d) e) 8. (UFU-MG) O Departamento de Comércio Exterior do Banco Central possui funcionários com a distribuição salarial em reais mostrada na tabela ao lado. Quantos funcionários que recebem devem ser demitidos para que a mediana desta distribuição de salários seja de ? a) b) c) d) e) 9. (FGV-SP) Quatro amigos calcularam a média e a mediana de suas alturas, tendo encontrado como resultado e , respectivamente. A média entre as alturas do mais alto e do mais baixo, em metros, é igual a: a) b) c) d) e) 10. (ENEM-2012) O gráfico apresenta o comportamento de emprego formal surgido, segundo o CAGED, no período de janeiro de a outubro de . Com base no gráfico, o valor da parte inteira da mediana dos empregos formais surgidos no período é: a) b) c) d) e) Nº de funcionários Salário (em R$) 23 11. (UFPel-RS) Na busca de solução para o problema da gravidez na adolescência, uma equipe de orientadores educacionais de uma instituição de ensino pesquisou um grupo de adolescentes de uma comunidade próxima a essa escola e obteve os seguintes dados Idade (em anos) Frequência absoluta de adolescentes grávidas Com base nos textos e em seus conhecimentos, é correto afirmar, em relação às idades das adolescentes grávidas, que: a) a média é de anos. b) a mediana é de anos. c) a mediana é de anos. d) a moda é de anos. e) a média é de anos. 12. (ENEM-2011) Uma equipe de especialistas do centro meteorológico de uma cidade mediu a temperatura do ambiente, durante dias intercalados, a partir do primeiro dia de um mês. Esse tipo de procedimento é frequente, uma vez que os dados coletados servem de referência para estudos e verificação de tendências climáticas ao longo dos meses e anos. As medições ocorridas nesse período estão indicadas no quadro: Dia do mês Temperatura (em °C) Em relação à temperatura, os valores da média, mediana e moda são, respectivamente, iguais a a) , e . b) , e . c) , e . d) , e . e) , e . 24 2.4. Comparando a Média, a Mediana e a Moda A média é sem dúvida a medida de tendência central mais utilizada, todavia, considere a seguinte série de valores que representa as idades de indivíduos de um grupo: , , , , , , , , , , , , , , , , , a média dessas idades é de aproximadamente anos e de modo geral esse não é um valor que representa satisfatoriamente a série se comparado a mediana ou aos valores de maior frequência, e (bimodal). Nesse exemplo, a média foi influenciada pela presença dos valores discrepantes e que são entradas que estão muito afastadas das demais e, em casos como esse, podemos usar a mediana ou moda, conforme a conveniência. Podemos visualizar graficamente a relação entre a média, a mediana e a moda. Considere as seguintes distribuições de frequências genéricas: Distribuição simétrica Distribuição assimétrica negativa Distribuição assimétrica positiva Distribuição uniforme 25 03 Medidas de Dispersão Introdução Dizemos que uma série de valores quantitativos é homogênea se seus elementos são números com pouca dispersão em relação a sua média, ou seja, são todos relativamente próximos entre si. E dizemos que a série é heterogênea se a mesma for constituída de valores com certa variabilidade entre si e que tendem a se afastarem da média. As medidas de dispersão ou variabilidade são indicadores que quantificam grau de variabilidade em relação à média. Por exemplo, observe os seguintes conjuntos de dados: conjunto : , , , , conjunto : , , , , conjunto : , , , , conjunto : , , , , A média aritmética de todos eles é ̅ , mas perceba que o conjunto é uma série uniforme - predominantemente homogênea - e, por outro lado, o conjunto apresenta-se bastante disperso em relação à média. 3.1. Amplitude Total Define-se amplitude total ( ) a medida de dispersão dada pela diferença entre o maior e o menor valor observado. Assim, por exemplo, a amplitude total para os valores do conjunto e do conjunto ilustrados acima são, respectivamente: e OBS.: Se os dados forem agrupados com determinada frequência, sem intervalos de classe, a amplitude é calculada da mesma forma que para dados brutos. E se houver intervalos de classe, a amplitude total é dada pela diferença entre o limite superior da classe mais alta e o limite inferior da classe mais baixa. 3.2. Desvio Médio Denomina-se desvio ( ) de uma entrada de um conjunto de valores a diferença entre essa entrada e a média aritmética desses valores: Parece razoável tentar medir a variabilidade de uma amostra a partir da média dos desvios, todavia uma propriedade relevante do desvio é que a soma algébrica de todos os desvios de uma amostra é sempre igual a zero e, portanto sua média também é nula. ̅ 26 No entanto, podemos considerar a média aritmética dos valores absolutos de cada desvio e assim define-se a medida de dispersão chamada de desvio médio ( ): 3.3. Variância A variância ( ) é a medida de dispersão dada pela média aritmética dos quadrados dos desvios: Se os dados observados forem, por exemplo, medidas do comprimento de avenidas de uma cidade, a média será dada em metros, porém a variância será expressa em metros quadrados, o que ocasiona uma incompatibilidade de unidades. Para unificá-las, definiremos o desvio padrão. 3.4. Desvio Padrão O desvio padrão ( ) é a medida de dispersão definida como a raiz quadrada da variância: Observe que ao tomar os quadrados dos desvios, o desvio padrão apresenta uma espécie de média ponderara desses desvios, pois os dados mais dispersos entram com peso maior do que os menos dispersos. O símbolo “ ” usado para indicar o desvio padrão é a letra grega minúscula chamada sigma. Observação: A variância e o desvio padrão apresentados acima se referem a medidas de dispersão populacionais e quando se trata de dados amostrais, normalmente usamos como divisor “ ” ao invés de “ ” e, trocamos o símbolo “ ” por “ ”: Variância amostral Desvio padrão amostral √ ∑ ̅ ∑ ̅ √ ∑ ̅ ∑ ̅ ̅ ̅ ̅ ∑| ̅| | ̅| | ̅| | ̅| 27 Exercícios resolvidos 1. (ENEM-2010) Em uma corrida de regularidade, a equipe campeã é aquela em que o tempo dos participantes mais se aproxima do tempo fornecido pelos organizadores em cada etapa. Um campeonato foi organizado em etapas, e o tempo médio de prova indicado pelos organizadores foi de minutos por prova. No quadro, estão representados os dados estatísticos das cinco equipes mais bem classificadas. Dados estatísticos das equipes mais bem classificadas (em minutos) Equipes Média Moda Desvio padrão Equipe I Equipe II Equipe III Equipe IV Equipe V Utilizando os dados estatísticos do quadro, a campeã foi a equipe: a) I b) II c) III d) IV e) V Solução: O enunciado diz que a equipe campeã é aquela em que o tempo dos participantes mais se aproxima de minutos. Bem, se olharmos pela média apenas,nada podemos concluir, pois a média de ambas as equipes é de . A moda, por sua vez, seria determinante caso houvesse uma única equipe de moda igual a , no entanto há duas equipes com moda . Ora, dessas equipes de moda será a campeã aquela que apresentar menor desvio, ou seja, aquela em que os valores menos se afastam da média. Resposta: alternativa c. 2. (FGV-SP) Um conjunto de dados tem variância igual a zero. Podemos concluir que: a) A média também vale zero. b) A mediana também vale zero. c) A moda também vale zero. d) O desvio padrão também vale zero. e) Todos os valores desse conjunto são iguais a zero. Solução: Ter a variância igual a zero significa que não há afastamento dos valores em relação à média e, como o desvio padrão é igual a raiz quadrada da variância, logo o desvio padrão também é igual a zero. Resposta: alternativa d. 3. Os valores a seguir representam respectivamente as despesas de uma empresa nos quatro primeiros meses de : , , e . Determine a amplitude total, o desvio médio, a variância e o desvio padrão para essa série de dados. 28 Solução: Primeiro podemos calcular a amplitude total: Em seguida, calculemos a média: ̅ A tabela a seguir poderá nos auxiliar nos cálculos: | ̅| ̅ Logo, temos: Considerando o conjunto de dados como sendo populacional, vem: e √ Exercícios propostos 1. (UFPR-PR) Considere as seguintes medidas descritivas das notas finais dos alunos de três turmas: Turma Número de alunos Média Desvio padrão Com base nesses dados, considere as seguintes afirmativas: I. Apesar de as médias serem iguais nas três turmas, as notas dos alunos da turma foram as que se apresentaram mais heterogêneas. II. As três turmas tiveram a mesma média, mas com variação diferente. III. As notas da turma se apresentaram mais dispersas em torno da média. a) Somente a afirmativa III é verdadeira. b) Somente a afirmativa II é verdadeira. c) Somente as afirmativas II e III são verdadeiras. d) Somente as afirmativas I e II são verdadeiras. e) Somente as afirmativas I e III são verdadeiras. 29 2. (PROFMAT) Numa empresa, os salários não são todos iguais e um novo funcionário foi contratado com um salário igual à média dos salários pagos pela empresa antes de sua contratação. Comparando a média dos salários e o desvio padrão calculados antes da contratação do novo funcionário com a média dos salários e o desvio padrão calculados levando em conta o novo funcionário, podemos afirmar que: a) a nova média é menor que a antiga e o desvio padrão permanece igual. b) a nova média e o novo desvio padrão são ambos iguais aos antigos. c) a nova média e o novo desvio padrão são ambos maiores que os antigos. d) a nova média é igual a antiga e o novo desvio padrão é menor que o antigo. e) a nova média e o novo desvio padrão são ambos menores que os antigos. 3. (PROFMAT) Em uma turma de quatro alunos, o professor aplicou duas provas e , obtendo as seguintes notas: e Analisando os resultados, é possível afirmar que: a) e possuem a mesma média aritmética e o mesmo desvio padrão. b) e possuem médias aritméticas diferentes e desvios padrões diferentes. c) e possuem a mesma média aritmética e desvios padrões diferentes. d) possui maior desvio padrão que . e) possui maior média aritmética que . 4. (ENEM-2010) Marco e Paulo foram classificados em um concurso. Para a classificação no concurso o candidato deveria obter média aritmética na pontuação igual ou superior a 14. Em caso de empate na média, o desempate seria em favor da pontuação mais regular. No quadro a seguir são apresentados os pontos obtidos nas provas de Matemática, Português e Conhecimentos Gerais, a média, a mediana e o desvio padrão dos dois candidatos. Dados dos candidatos no concurso Matemática Português Conhecimentos Gerais Média Mediana Desvio Padrão Marco Paulo O candidato com pontuação mais regular, portanto mais bem classificado no concurso, é a) Marco, pois a média e a mediana são iguais. b) Marco, pois obteve menor desvio padrão. c) Paulo, pois obteve a maior pontuação da tabela, em Português. d) Paulo, pois obteve maior mediana. e) Paulo, pois obteve maior desvio padrão. 30 Respostas dos exercícios propostos 01 Conceitos Iniciais 1. b 2. Segue a tabela completa: Transporte Frequência Absoluta Frequência Relativa Porcentagem Carro Moto Coletivo Total 3. b 4. d 5. b 02 Medidas de Posição 1. c 2. a 3. c 4. a 5. c 6. e 7. d 8. d 9. e 10. b 11. e 12. b 03 Medidas de Dispersão 1. d 2. d 3. c 4. b 31 Bibliografia CRESPO, A. A. Estatística Fácil. 18 ed. São Paulo: Saraiva, 2002. DORNELLES JR, L. A. Estatística I. 6 ed. Palhoça: Unisul Virtual, 2007. FREUND, J. E. Estatística Aplicada: economia, administração e contabilidade. 11 ed. Trad.: Claus Ivo Doering. Porto Alegre: Bookman, 2006. LARSON, R. Estatitica Aplicada. 4 ed. Tra.: Luciene Ferreira Paulete Viana. São Paulo: Pearson Prentice Hall, 2010. MORETTIN, L. G. Estatística Básica: Probabilidade. 7 ed. vol. 1. São Paulo: Makron Books, 1999. Sumário Cap. 01 Cap. 02 Cap. 03 Respostas Bibliografia
Compartilhar