Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Aula 03 – Distribuição de frequências Hoje vivemos numa época em que devemos lidar com uma grande quantidade de informações. Essas informações podem vir ou na forma bruta como, por exemplo, a lista completa de todos os municípios do Brasil com sua população ), ou na forma resumida através de tabelas, gráficos ou medidas estatísticas. Para que possamos interpretar ou mesmo produzir informações é importante que tenhamos Noções de Estatística A Estatística se divide em duas áreas: Estatística Descritiva e Estatística Inferencial. Neste curso iremos trabalhar apenas com a Estatística Descritiva e um pouco da Teoria da Probabilidade que dá suporte à Estatística Inferencial. A Estatística Descritiva tem por objetivo propiciar técnicas para representar dados e de um modo geral, responder as seguintes perguntas: 1) Como organizar dados em tabelas e gráficos? Que tipos de representação são mais recomendados para os diversos tipos de dados? 2) Como resumir, de forma sensata, a informação contida em um conjunto de dados através de estatística apropriada? 3) O que se pode concluir a respeito de um ou mais conjuntos de dados a partir de gráficos e estatísticas relativas a esses dados? ( prof. Paulo Cezar- Estatística-IMPA) O primeiro aspecto a ser trabalhado se refere à tabela de distribuição de frequências. Então, vamos lá: O que é uma tabela? TABELA É UM QUADRO QUE RESUME UM CONJUNTO DE OBSERVAÇÕES. Uma tabela compõe-se de: corpo: conjunto de linhas e colunas que contém informações sobre a variável em estudo; cabeçalho: parte superior da tabela que especifica o conteúdo das colunas; coluna indicadora: parte da tabela que especifica o conteúdo das linhas; linhas: retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas; casa ou célula: espaço destinado a um só número; título: conjunto de informações, as mais completas possíveis, respondendo às perguntas: O quê?, Quando?, Onde?, localizado no topo da tabela. Exemplo: 2 Há ainda a considerar os elementos complementares da tabela, que são a fonte, as notas e as chamadas, colocados, de preferência, no seu rodapé. O que é uma tabela de Distribuição de Frequências: Ao estudar uma variável, o nosso maior interesse é conhecer a distribuição dessa variável através dos possíveis valores da mesma. Registramos essa distribuição numa tabela que chamamos de tabela de distribuição de frequências. Para compor uma tabela de distribuição de frequências, temos que definir alguns termos estatísticos: Dados brutos: São dados inicialmente coletados que ainda não foram organizados. Exemplo: Notas dos alunos de uma classe em Matemática: 9, 6, 2 ,9, 4, 7 ,7, 1, 8, 3, 9, 6, 2, 4, 9, 5, 6, 9, 4, 2, 0, 6, 9, 5, 8, 5, 4, 6, 3, 7, 6, 4, 6, 4, 9, 7, 7, 2, 1, 0, 2, 6, 3, 1, 9, 1, 4, 4, 6, 9 Rol: É um arranjo de dados brutos em ordem crescente ou decrescente. Ordem crescente: 0,0,1,1,1,1,2,2,2,2,2,3,3,3,3,4,4,4,4,4,4,4,4,5,5,5,6,6,6,6,6,6,6,6,6,7,7,7,7,7,8,8,9,9,9,9,9,9,9,9 Distribuição de frequência: É uma disposição de dados, de acordo com o tamanho ou a magnitude dos mesmos. Tabela de frequências ou distribuição de frequências é a tabela que mostra a relação entre a variável e a quantidade de vezes que cada valor se repete (frequência). A distribuição de frequência pode ser apresentada por valor (único) ou por classes (grupos), descriminando a frequência dos mesmos. Exemplos: a) Por valor – Notas dos alunos de uma classe em Matemática: 3 Notas Frequências 0 1 2 3 4 5 6 7 8 9 Total b) Por classe – Mesmo exemplo Notas Frequências 0 ⊢ 2 2 ⊢ 4 4 ⊢ 6 6 ⊢ 8 8 ⊢ 10 Total Existem várias formas de representar uma frequência: Frequência total (n): É a soma de todas as frequências absolutas. Frequência simples ou absoluta (fi): é o número de repetições da observação ou seja quantas vezes a variável assume determinado valor. 4 Frequência relativa (fr): É a razão entre a frequência absoluta e a frequência total. Frequência percentual : f(%) frequência na forma de porcentagem. Pode ser obtida multiplicando a frequência relativa por 100 Frequência acumulada (fAC): É a soma das frequências absolutas anteriores a uma determinada classe. Exemplo 01: vamos completar a tabela de distribuição de frequências do exemplo dado anteriormente: x: variável (notas); ��: valores da variável (0,1,2,3,4,5,6,7,8,9) a) Por valor Notas (��) �� �� �% �� �% 0 1 2 3 4 5 6 7 8 9 total Pela tabela acima, responda: a) Qual foi a variável estudada? b) Como você classifica a variável? c) Qual é o tamanho da amostra? fac = f1 + f2 + ... + fj �� = �� � n = �� + �� + ��+.....+�� = ∑ �� f(%) = �� . 100 5 d) Qual foi a porcentagem dos alunos aprovados, sabendo que a nota mínima de aprovação é 5. e) Quantos alunos tiveram nota menor ou igual a 5? f) Qual é o significado da frequência acumulada? b) Por classe classe �� �� �% �� �% 0 l→ 2 2 l→ 4 4 l→ 6 6 l→ 8 8 l→ 10 total Exemplo 02: Pesquisa com dados fictícios: (adaptado: Estatística Básica – Wilton O. Bussab e Pedro A.Morettin) Informações sobre estado civil, número de irmãos, salário (expresso com fração do salário mínimo),idade ( em anos e meses) e procedência de 16 funcionários da Companhia A Funcionário Estado Civil Nº de irmãos Salário Idade Região de Procedência Grau de instrução 1 solteiro 0 1,30 26 interior fundamental 2 casado 1 2,25 32 capital fundamental 3 casado 2 3,05 36 capital fundamental 4 solteiro 0 4,26 20 outro fundamental 5 solteiro 1 6,15 40 outro médio 6 casado 0 6,26 28 outro médio 7 solteiro 2 7,30 41 interior médio 8 solteiro 1 8,32 43 capital médio 9 casado 2 9,25 34 outro médio 10 solteiro 3 10,2 23 interior médio 11 casado 2 11,4 33 capital superior 12 solteiro 3 12,2 27 capital superior 13 solteiro 2 131 37 interior médio 14 casado 4 13,5 44 capital superior 15 casado 2 14,8 30 capital superior 16 solteiro 1 16,1 38 interior superior Responda: a) Quais são as variáveis envolvidas? Classifique em quantitativas e qualitativas. As quantitativas em discretas e contínuas. b) Vamos analisar a variável ‘região de procedência’: variável qualitativa 6 Capital: C; Interior: I ; Outros: O Dados brutos: Rol: Tabela completa de distribuição de frequências: procedência �� �� f% total Como representar esses dados usando gráficos: Gráfico de Colunas Gráfico de Barras Horizontais Gráfico de Setores( Pizza) Gráfico de Pontos Todos os tipos de gráficos podem representar a variável “procedência” mas geralmente para representar variáveis qualitativas usamos o gráfico de setores Os gráficos acima foram construídos com o auxílio do software Excel 0 2 4 6 8 I C O Procedência Gráfico de Colunas 0 2 4 6 8 I C O Procedência Gráfico de Barras Horizontais 31% 44% 25% Procedência I C O 7 Considerando o gráfico de setores, podemos esboçar cada setor utilizando uma simples regra de três de proporcionalidade: 360° → 100% ���° = ���% ��% ou x . 100= 360.31 ou x= ���.�� ��� ≈ 111,6° Determine quantos graus deve ter o setor correspondente a 25% e 44% c) Variável “ número de irmãos”: variável quantitativa discreta. Dados brutos: 0,1,2,0,1,0,2,1,2,3,2,3,2,4,2,1 Rol: quando os valores são numéricos, organizamos os valores em ordem (crescente ou decrescente): 0,0,0,1,1,1,1,2,2,2,2,2,2,3,3,4 Tabela de distribuição de frequências: Número de irmãos �� ��$% �� f% f%(ac) 0 1 23 4 Total Frequência acumulada: é o número que indica a frequência dos valores menores ou igual à frequência do valor da variável. ��$%: frequência absoluta acumulada f%(ac): frequência percentual acumulada Responda: a) Quantos funcionários tem o número de irmãos menor ou igual a 3? b) Qual é a porcentagem dos funcionários que tem pelo menos 2 irmãos? c) Faça um gráfico representando essa distribuição 8 d) Variável “ idade”: variável quantitativa contínua Dados brutos: Rol: Tabela de distribuição de frequências: agrupamento em classes A organização de uma tabela por agrupamento em classes é utilizada muitas vezes para representar a frequência de variáveis contínuas. A escolha dos intervalos (amplitude da classe) é arbitrária, dependendo da familiaridade do pesquisador com os dados, no entanto podemos calcula-la utilizando as seguintes fórmulas: Número de classes: nc √( , onde n é o número total de elementos da amostra No exemplo n = 16 e portanto o número de classes nc= √16=4. Amplitude total da distribuição H= maior valor – menor valor da distribuição No exemplo H= 44-20=24 Amplitude da classe: h = H/ nc ,é, aproximadamente, o quociente entre a amplitude total da distribuição (H) e o número de classes (nc) No exemplo h= 24/4=6 Ponto médio da classe (PM): é a média entre os limites inferior e superior da classe. Este valor representará o valor da variável na classe: PM = xi Xi = PM = ( L inf + L sup) / 2 Tabela de distribuição de frequências classes �� = PM �� ��$% �� f% f%(ac) 20l→ 26 23 2 26l→ 32 4 32l→ 38 5 38l→ 44 5 Total Gráfico: Histograma: São gráficos de barras verticais justapostas em número igual ao de classes da distribuição. Cada classe é representada por uma barra de altura correspondente á sua frequência. 9 Construir o histograma Exercícios 1) Complete a tabela de distribuição de frequências abaixo: Uma pesquisa socioeconômica sobre itens de conforto, perguntou-se a cada um dos 800 entrevistados: quantos aparelhos de TV em cores há em sua casa? Os resultados aparecem na tabela: Número de aparelhos Frequência absoluta Frequência relativa Frequência percentual 0 20 - - 1 - - - 2 - 0,6 - 3 - - 7,5 4 30 - - 2) O IBGE publica o seguinte gráfico: Aqui temos um Gráfico de Linhas Bastante utilizados na identificação de tendências de aumento ou diminuição dos valores numéricos de uma dada informação. Utilizamos frequentemente esse tipo de representação em 10 análise de lucros de empresas, incidência de moléstias, índices de crescimento populacional, índices de custo de vida, etc. Qual foi a porcentagem do aumento da população no ano de 2010 em relação ao ano 2000 3) O professor Paulo de Educação Física fez uma pesquisa sobre as alturas dos alunos de sua turma de 20 alunos. A partir de uma lista de chamada em ordem alfabética, obteve- se o conjunto de alturas, em cm:168, 168, 163, 164, 160, 160, 164, 166, 169, 169, 166, 168, 162, 165, 165, 164, 168, 166, 161, 168 Pede-se: a) Qual é a variável em questão e classifique-a b) Escreva o rol dos dados acima c) A distribuição de frequências completa d) Um histograma 4) Considere o problema inicial dos 16 funcionários da Companhia A. a) Classifique a variável “estado civil” da questão. b) Faça uma tabela de distribuição de frequências completa. c) Faça um gráfico para a distribuição de frequência dessa variável. 5) Vinte e cinco jovens de até 15 anos foram selecionados para participar de um programa desenvolvido pela secretaria de esportes de uma cidade cujo objetivo consiste na formação de futuros jogadores de vôlei. As alturas dos jogadores (em metro) são dadas a seguir: 1,82 1,77 1,79 1,74 1,73 1,81 1,82 1,69 1,71 1,78 1,78 1,88 1,72 1,65 1,75 1,74 1,73 1,70 1,84 1,74 1,76 1,79 1,83 1,76 1,70 a) Distribuir os dados em classes e fazer a tabela de frequências. b) Faça o histograma da distribuição c) Em visita ao centro de treinamento, um técnico sugeriu que pelo menos 48% do jovens deveriam ter estatura superior ou igual a 1,80m. Esse grupo obedece a essa sugestão? Justifique. 6) Uma psicóloga realizou com os alunos da 1a série do ensino médio de um colégio um estudo sobre orientação profissional. Após algumas dinâmicas e entrevistas, condensou as informações sobre a intenção de carreira dos alunos no gráfico abaixo. 11 Quando os mesmos alunos estavam na 3a série, a psicóloga repetiu o estudo com eles e notou que, em relação a sondagem anterior, 16 7 dos interessados em Humanas migraram para Exatas e 40 9 para Biológicas. Admitindo que não haja outras migrações, faça a tabela de frequências que represente a nova situação, sabendo que o número de participantes da dinâmica foi 200 alunos. 7) O histograma seguinte mostra as temperaturas máximas diárias registradas em 80 dias durante um verão na cidade do Rio de Janeiro. a. Represente o histograma acima em uma tabela de frequência. b. Em quantos dias a temperatura máxima manteve-se abaixo dos 38o C? c. Em quantos dias a temperatura máxima variou de 36o C a 42o C? H B E H - Humanas B - Biológicas E - Exatas 10 20 30 40 fi % área porcentagem temperatura (o C) 30 32 34 36 38 40 42 5% 12,5% 22,5% 37,5% 17,5% 5% 12
Compartilhar