Baixe o app para aproveitar ainda mais
Prévia do material em texto
Distribuição de frequência Sumário ▪Construção de tabelas de frequência com e sem intervalos; ▪Interpretação das tabelas; ▪Representação gráfica: histograma, polígono de frequências simples e polígono de frequência acumulada. Distribuição de frequência Consiste na construção de uma tabela a partir dos dados brutos, onde se considera a frequência com que cada observação ocorre. A interpretação dos resultados obtidos em tabelas de frequências pode ser auxiliada pela análise gráfica. distribuição deAlém de resumir a informação, frequência tem por finalidade: ▪ Representar a forma como se distribuem os valores das variáveis (localização da maioria dos valores, simetria, número de picos e formato das caudas). probabilidade poderia ser adequado para ▪ Indicar qual modelo de distribuição de esses dados, pois fornece uma ideia empírica da distribuição da população. ▪ O formato é muito sensível ao número de observações disponíveis. As características dessas tabelas variam de acordo com o tipo de variável em estudo: ▪Variáveis qualitativas ou quantitativa discreta - Se a variável é do tipo categórica ou numérica discreta (com poucos valores), devemos obter as frequências para cada nível da variável. ▪Variáveis quantitativas contínuas - Se a variável é do tipo numérica contínua, devemos agrupar os dados: 1º) construir intervalos de mesma amplitude; 2º) obter as frequências para cada intervalo. Conceitos 1.Dados Brutos: são os valores numéricos obtidos após a coleta dos dados. 2.Rol: é o arranjo dos dados brutos em ordem de frequência crescente ou decrescente. 3. Classes de frequência: é o intervalo de variação de uma variável. As classes são representadas por i. 4.Número de classes (i): não há uma fórmula exata para o cálculo do número de classes, mas a mais usual é a Regra de Sturges. 5. Limites de classe: são os valores extremos de cada classe. Limite superior (lsi) e limite inferior (lii). Ex.: 1 |- 3 2 i lsi + liiPm = Tipos de frequências 1.Frequência simples absoluta (fi): é o número de vezes que o elemento aparece na amostra ou o número de elementos pertencentes a uma mesma classe. 2. Frequência relativa (fri): é a relação entre a frequência absoluta e o número total de observações (n). 3. Frequência percentual (fp): 4. Frequências acumuladas: É o total acumulado (soma) de todas as classes anteriores até a classe atual. Pode ser: frequência acumulada absoluta (Fi), frequência acumulada relativa (Fri) ou frequência acumulada percentual (Fp). n fifri = f p = f ri . 1 0 0 Distribuição de Frequência sem intervalos de classes Frequência simples absoluta Na primeira coluna colocamos, em ordem crescente, apenas os valores distintos que ocorreram e na segunda coluna colocamos o número de vezes que este valor se repete no conjunto de dados. Aluno Num. Filhos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 1 0 2 1 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 27 0 Exemplo: 1. Dados brutos tabelados Construção da tabela de frequências 2. Ordená-los de forma crescente (rol) e verificar quais os valores distintos que ocorreram. 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 2 Valores distintos: 0 1 2 i xi fi 1 0 22 2 1 4 3 2 1 Total 27 Distribuição de frequência absoluta para a variável número de filhos i - classes Xi – Num. de filhos (nesse caso, não há intervalos) fi - frequência A soma da frequência simples absoluta deverá ser sempre igual ao número de observações (n). fi Sabemos que 22 alunos, dentre os 27, não possuem filhos. Em termos relativos, devemos fazer a frequência dividido pelo total de observações. friFrequência relativa i xi fi fri 1 0 22 22/27=0,8148 2 1 4 4/27=0,1481 3 2 1 1/27=0,0370 Total 27 1 Frequência percentual i xi fi 1 2 0 1 fri fp 22 0,8148 81,48% 4 0,1481 14,81% fri.100 fp 3 2 1 0,0370 3,70% 27 100% Total 27 1 100% Ou regra de três Alunos % 22 x Fi Vamos agora supor que desejamos saber a quantidade de alunos que possuem 1 ou menos filhos e 2 ou menos filhos. absolutaExiste uma frequência chamada frequência acumulada (abaixo de), denotada por Fi. Frequência acumulada absoluta Ou 22+4+1=27 i xi fi Fi 1 0 22 22 2 1 4 22+4 = 26 3 2 1 26+1 = 27 Total 27 - Os valores nos locais destacados são SEMPRE iguais!!! i X i fi fp Fi Fp 1 0 11 27,5% 11 27,5% 2 1 8 20,0% 19 47,5% 3 2 12 30,0% 31 77,5% 4 3 5 12,5% 36 90,0% 5 4 4 10,0% 40 100% Total 40 100 % -- -- Exemplo Tabela 1. Distribuição de frequência do número de filhos por funcionário de uma empresa Frequências acumuladas i X i fi fp Fi Fp 1 0 11 27,5% 11 27,5% 2 1 8 20,0% 19 47,5% 3 2 12 30,0% 31 77,5% 4 3 5 12,5% 36 90,0% 5 4 4 10,0% 40 100,0% Total 40 100,0% -- -- Interpretação Tabela 1. Distribuição de frequência do número de filhos por funcionário de uma empresa Vamos interpretar os valores da terceira classe!!! Podemos afirmar que, dentre os 40 funcionários, 12 possuem exatamente 2 filhos; 30% possuem exatamente 2 filhos; 31 funcionários possuem nenhum, 1 ou 2 filhos (2 filhos ou menos); 77,5 % possuem nenhum, 1 ou 2 filhos. 1. Um dado foi lançado 12 vezes e foram registrados os seguintes resultados: 5 4 6 1 2 5 3 1 3 3 4 4 Construa a tabela de frequências sem intervalos de classes para estes dados. Responda: a) Qual a frequência das faces abaixo de 4? b) Qual a porcentagem que corresponde as faces maiores ou iguais a 3? Exercícios i xi fi fri Fi Fri 1 1 2 0,17 2 0,17 2 2 1 0,08 3 0,25 3 3 3 0,25 6 0,50 4 4 3 0,25 9 0,75 5 5 2 0,17 11 0,92 6 6 1 0,08 12 1,00 TOTAL 12 1 Devido à grande variabilidade de resultados, não temos mais os resultados da variável ordenados de forma crescente. Temos intervalos de resultados da variável ordenados de forma crescente. É comumente utilizada para variáveis contínuas. Distribuição de frequência com intervalos de classe Exemplo: Idade de alunos– ordem crescente Aluno Idade Aluno Idade 1 17 15 22 2 18 16 23 3 18 17 23 4 18 18 24 5 18 19 24 6 18 20 27 7 18 21 27 8 19 22 29 9 20 23 30 10 21 24 32 11 21 25 35 12 21 26 41 13 22 27 49 14 22 Quantos resultados diferentes? 15 resultados diferentes! Precisamos aprender a tornar os 27 dados da variável IDADE inteligíveis!! Em um total de 27 dados, obtivemos 15 resultados diferentes, que são: 17; 18; 19; 20; 21; 22; 23; 24; 27; 29; 30; 32; 35; 41 e 49. Embora esta redução de 27 para 15 seja significativa, o número de classes (15) ainda é grande. É quase um consenso entre os autores que, quando o número de resultados distintos é superior a 8, deve-se agrupar os dados por intervalos de classes. É preciso saber qual é a maior e a menor idade dos alunos. AT = valor máximo – valor mínimo AT = 49 – 17 = 32 anos. Distribuição de Frequência com Intervalos de Classe Passo 1 – ordenar os valores e verificar os diferentes resultados Passo 2 – calcular a amplitude total (AT) Passo 3 – calcular o número de intervalos de classe (i) Vamos determinar quantos intervalos de classe serão utilizados. Para conhecer o número de classes (i), utilizamos a Regra de Sturges : i = 1 + 3,3 . log n onde: i = número de classes; n = número de observações; log = logaritmo. i = é sempre arredondado para o INTEIRO mais próximo. i = 1 + 3,3 . log 27 I = 5,72 => i = 6 Usaremos 6 intervalos Procura-se geralmente de 5 a 15 classes. Usar menos de 5 classes há muita perda de informação; mais de que 15, a tabela passa a ficar muito extensa e dificulta a interpretação. i Todos os intervalos devem ter o mesmo h, ou seja, o mesmo tamanho, de modo que a amplitude total (AT = 32 para a idade) deve ser distribuída igualmente nos por todos os seis intervalos (i = 6 para a idade). h = AT = Max −Min deve-se usar o valor já arredondado de i 6 i h = 32 = 5,33 h=6 Arredondar o valor paramais, sempre! Poderia ser h=5? Passo 4 – calcular a amplitude do intervalo de classe (h) Lembre-se que cada intervalo é composto de dois limites: o inferior (à esquerda), e o superior (à direita). Em cada classe ls = li + h. Assim, cada classe tem seu próprio limite inferior e superior. Logo, Lembre-se: a notação |- inclui o valor à esquerda e exclui o valor à direita. Cada valor da variável só pertence a um único intervalo. Passo 5 – organizar os intervalos das classe i Idades (anos) fi 1 17 |- 22 2 22 |- 27 3 27 |- 32 4 32 |- 37 5 37 |- 42 6 42 |- 47 Total 27 Se i=6 e h= 5 Valor máximo da idade (49 anos) não está incluso no último intervalo. E agora? PODE? ls = li+h 17+5 =22 22+5=27 27+5=32 ... i Idades (anos) fi 1 17 |- 23 2 23 |- 29 3 29 |- 35 4 35 |- 41 5 41 |- 47 6 47 |- 53 Total 27 Se i=6 e h= 6 Valor máximo da idade (49 anos) está incluso no último intervalo, então OK! 17+6 =23 23+6=29 ... i Idades (anos) fi 1 17 |- 23 15 2 23 |- 29 3 29 |- 35 4 35 |- 41 5 41 |- 47 6 47 |- 53 Total 27 Intervalos de classe e distribuição de frequências da Idade dos alunos Contar o número de alunos com idade maior ou IGUAL a 17 e MENOR do que 23 Vai até 22,9999... Passo 6 – contar a frequência em cada classe i Idades (anos) fi 1 17 |- 23 15 2 23 |- 29 6 3 29 |- 35 3 4 35 |- 41 1 5 41 |- 47 1 6 47 |- 53 1 Total 27 Intervalos de classe e distribuição de frequências da Idade dos alunos Passo 7 – calcular as demais frequências i Idades (anos) fi fp Fi Fp 1 17 |- 23 15 2 23 |- 29 6 3 29 |- 35 3 4 35 |- 41 1 5 41 |- 47 1 6 47 |- 53 1 Total 27 O Pm divide o intervalo em duas partes exatamente iguais, ou seja, 2 i i i ls + li Pm = Assim, para i = 3, temos 2 3 Pm = 35+ 29 = 32 O ponto médio é o valor que representa a classe e jamais é arredondado Passo 8 – calcular o ponto médio (Pm) i Idades (anos) fi Pm 1 17 |- 23 15 2 23 |- 29 6 3 29 |- 35 3 4 35 |- 41 1 5 41 |- 47 1 6 47 |- 53 1 Total 27 Histogramas, polígono de frequência e polígono de frequência acumulada Representação gráfica • Para representar graficamente dados agrupados em uma distribuição de frequências, podemos utilizar um histograma, um polígono de frequências ou um polígono de frequências acumuladas. • Um histograma pode representar a distribuição de frequência simples absoluta ou a relativa para intervalos de classe. Colocamos no eixo x os limites de cada intervalo de classe e em y a frequência das classes (também podemos usar a fp). Para construção da primeira classe, devemos deixar antes no eixo dos x um espaço ( no mínimo) igual ou superior a amplitude de classe. Figura 1 – Histograma da Idade dos alunos. O polígono de frequência é obtido unindo-se os pontos médios da parte superior de cada retângulo do histograma com segmentos de reta. Figura 2. Polígono de frequência absoluta para idade dos alunos. O que podemos concluir observando o histograma? 1. Um grupo de estudantes do ensino médio foi submetido a um teste de matemática resultando em: a) Construa a tabela com os outros tipos de frequências e o ponto médio. b) Construa o histograma. c) Se a nota mínima para aprovação é 6, qual será a porcentagem de aprovação? d) Alunos com nota inferior a 4 estão em exame. Quantos alunos estão nesta condição? Nota Frequência 0 |– 2 14 2 |– 4 28 4 |– 6 27 6 |– 8 11 8 |–10 4 Exercícios 2. Suponha que os dados abaixo referem-se a temperatura (ºC) ao amanhecer nos últimos 20 dias na cidade de Cachoeira do Sul. 10,1 7,3 8,5 5,0 4,2 3,1 2,2 9,0 9,4 6,1 3,3 10,7 1,5 8,2 10,0 4,7 3,5 6,5 8,9 6,1 a)Construa uma tabela de frequências agrupando os dados em intervalos de amplitude 2 (h=2), iniciando em 1. b) Construa o histograma. c) Qual intervalo de temperatura foi mais frequente? Distribuição de Frequência: Histogramas com classes de amplitudes desiguais Em um histograma, as classes devem SEMPRE ter a mesma largura? Não necessariamente! Existem casos em que é mais adequado agrupar os dados em classes com larguras/amplitudes desiguais. Exemplo: classificação de pessoas por faixas etárias (infantil, juvenil, adulto, sênior, etc). Essas faixas não têm a mesma amplitude. Distribuição de Frequência: Histogramas com classes de amplitudes desiguais A representação gráfica dos dados requer a transformação dos valores de frequência absoluta em densidade de frequência. Isso é fundamental, pois devemos manter a área dos retângulos proporcionais à frequência da classe. Densidade de frequência = frequência da classe amplitude da classe (h) Valores relativosValores absolutos (x100) tenho a % Dados de 250 empresas classificadas segundo o número de empregados (Bussab e Morettin, 2013). A altura das barras (eixo vertical) representam a densidade de frequência. Figura 7. Exemplo de histograma com classes desiguais (valores relativos). Interpretando histogramas quanto ao seu formato Um histograma nos permite visualizar a forma da distribuição desses dados, a localização do valor central e a dispersão dos dados em torno do valor central. •O valor médio está localizado no centro do histograma; •A frequência é mais alta no meio e diminui gradualmente em direção aos extremos; •Ocorre quando não existem restrições aos valores que a variável de controle pode assumir. Simétrico ou em forma de sino •O valor médio está localizado fora do centro do histograma; •A frequência diminui gradativamente em um dos lados e de modo um tanto abrupto do outro lado. Assimétrico Assimetria negativa Assimetria positiva •O valor médio está localizado fora do centro do histograma; •A frequência diminui abruptamente de um dos lados e suavemente em direção ao outro. Despinhadeiro ou precipício Ilhas isoladas ou pico isolado •Parte do gráfico é relativamente simétrica com o acréscimo de algumas classes mais afastadas de menores frequências; •Ocorre quando dados de outra distribuição, diferente da distribuição da maior parte das medidas, são incluídos. Bimodal ou com dois picos •A frequência é mais baixa no centro do histograma e existe um “pico” em cada lado; •Ocorre quando dados de duas distribuições, com médias muito diferentes, são misturados. Achatado ou Platô •Todas as classes possuem mais ou menos a mesma frequência, exceto aquelas das extremidades; •Ocorre quando dados de duas distribuições, com médias não muito diferentes, são misturados. as alturas dosDigamos que temos histogramas para estudantes de duas turmas diferentes. Poderíamos sobrepor os desenhos para fazer uma análise comparativa das turmas? Que cuidados devemos tomar? Para fazermos análises comparativas de conjuntos de dados diferentes, os intervalos de classes devem ser os mesmos! Algumas considerações... Em seguida, vamos começar a estudar as características de uma distribuição de frequências: a) Posição central, que informa onde se localiza o centro da distribuição; b) A dispersão, que se refere à variabilidade dos dados; c) A assimetria, que representa a concentração dos valores em um dos extremos da distribuição de achatamento dad) A curtose, que é o grau distribuição. Barbetta, Reis, Bornia (2010) Exercício Avaliado Montar a tabela com os dados com intervalos de classe e as frequências (absoluta, relativa e percentual). Faça o gráfico para esses dados (histograma) e uma reflexão/conclusão. Entregar manuscrito, com identificação do aluno, na próxima aula (18/09). Notas de 40 alunos 5,5 10,0 9,9 7,8 8,0 8,9 2,0 3,0 8,9 3,8 4,5 7,3 3,8 8,8 7,5 3,4 1,0 4,0 7,5 5,8 8,0 6,9 5,0 3,0 6,5 9,9 1,1 7,4 5,5 7,5 6,4 10,0 6,0 9,9 10,0 8,9 8,0 10,0 8,6 9,5 Notas TOTAL 𝑓𝑖 𝑓𝑟𝑖 𝑓𝑝𝑖 Referências • Morettin, P.A.; Bussab, W.O. Estatística Básica. 8 ed. São Paulo: Saraiva, 2013. • Barbetta, P.A.; Reis, M.M.; Bornia, A.C. Estatística Para Cursosde Engenharia e Informática. 3 ed. São Paulo: Atlas,2010.• Crespo, A. A. Estatística fácil. 17 ed. São Paulo: Saraiva,2009. • Portnoi, M. Distribuição de frequência. 2005. Disponível em: https://www.eecis.udel.edu/~portnoi/classroom/prob_estatistica/2005_ 2/lecture_slides/Aula04-Est.Descritiva-DistribuicaoFrequencia.pdf. http://www.eecis.udel.edu/%7Eportnoi/classroom/prob_estatistica/2005_ http://www.eecis.udel.edu/%7Eportnoi/classroom/prob_estatistica/2005_
Compartilhar