Baixe o app para aproveitar ainda mais
Prévia do material em texto
SERVIÇO PÚBLICO FEDERAL MINISTÉRIO DA EDUCAÇÃO DISTRIBUIÇÃO DE FREQUÊNCIA Uma das formas de exposição de dados é a apresentação tabular. A vantagem da tabela estatística é a de condensar, de forma consistente, as informações necessárias ao estudo desejado. Isto porque, freqüentemente, o estudo de um determinado fenômeno requer a coleta de uma grande massa de dados numéricos, difícil de ser tratada se esses dados não forem organizados e condensados numa tabela. No caso específico das seriações, acontece normalmente que, ao coletar os dados referentes ao fenômeno objeto de estudo, o analista se defronta com valores que se repetem algumas vezes, sugerindo sua apresentação através de tabelas onde somente apareçam valores distintos uns dos outros. Essa providência favorece evidentemente uma análise e interpretação mais rápida da natureza e comportamento do fenômeno observado. A distribuição de freqüência é exatamente um tipo de tabela que condensa uma coleção de dados conforme as freqüências ou repetições de seus valores. 1. Dados Brutos Feita a coleta, os dados originais ainda não se encontram prontos para análise, por não estarem numericamente organizados. Por essa razão costuma-se chamá-los de dados brutos. 2. Rol O rol é uma lista em que os valores estão dispostos em uma determinada ordem, crescente ou decrescente. Apesar de o rol propiciar ao analista mais informações e com menos esforço de concentração do que os dados brutos, ainda assim persiste o problema de a análise ter que se basear em todas as observações individuais. O problema se agravará quando o número de dados for grande. 3. Frequência(fi) Denominamos freqüência o número de vezes que um determinado valor da variável aparece repetido no conjunto de dados. 4. Distribuição de freqüência da variável qualitativa: Ex 1: Vamos fazer a distribuição de freqüência da variável grau de instrução, de 40 funcionários da rede estadual de ensino, em 2004: Dados Brutos Fundamental Fundamental Fundamental Médio Fundamental Fundamental Fundamental Fundamental Médio Médio Médio Fundamental Médio Fundamental Médio Médio Médio Fundamental Superior Médio Médio Fundamental Médio Médio Médio Superior Superior Médio Superior Fundamental Fundamental Médio Médio Médio Superior Fundamental Médio Superior Fundamental Fundamental Rol Fundamental Fundamental Fundamental Fundamental Fundamental Fundamental Fundamental Fundamental Fundamental Fundamental Fundamental Fundamental Fundamental Fundamental Fundamental Fundamental Médio Médio Médio Médio Médio Médio Médio Médio Médio Médio Médio Médio Médio Médio Médio Médio Médio Médio Superior Superior Superior Superior Superior Superior 2 GRAU DE INSTRUÇÃO DE 40 FUNCIONÁRIOS DA REDE ESTADUAL DE ENSINO MACAPÁ/AP-2004 Grau de Instrução fi (Freqüência absoluta) fr(%) (Freqüência relativa) Fundamental Médio Superior TOTAL Fonte: fictícia 5. Distribuição de freqüência da variável quantitativa: 5.1. Variável discreta: A variável discreta, normalmente, assume o comportamento que veremos a seguir, mas isso não significa que não poderemos dar a ela o tratamento que normalmente damos à variável contínua. Ex2: Uma Instituição financeira tem três operadores trabalhando diariamente com operações de ações negociadas na bolsa de valores. A tabela seguinte registra uma amostra aleatória de tamanho 30 do número diário de operações fechadas pelo operador B nos últimos dos anos. Vamos fazer a distribuição de freqüência dos referidos dados. Dados Brutos 14 12 13 11 12 13 16 14 14 15 17 11 14 13 14 15 13 12 14 13 14 13 15 16 12 12 13 13 12 12 Rol AÇÕES DIÁRIAS NEGOCIADAS PELO OPERADOR ‘B’ NA BOLSA DE VALORES Número diário de ações fi (freqüência absoluta) fr(%) (freqüência relativa) 3 TOTAL Fonte: Fictícia 5.2. Variável contínua: A variável contínua tem um comportamento um tanto diferente da variável discreta, porém vale ressaltar que o que faremos a seguir não é uma regra e, dependendo do tipo de dado que tivermos e do que queremos mostrar com ele, este roteiro poderá modificar-se e, inclusive, assumir o comportamento da variável discreta. Ex 3: Vamos fazer a distribuição de freqüência da variável estatura, de 40 funcionários da rede estadual de ensino, em 2004: Dados Brutos 150 162 156 167 160 153 154 164 158 170 161 155 155 166 160 152 163 156 157 169 161 155 164 160 160 151 162 156 168 160 161 155 164 158 172 161 163 165 168 173 Rol 150 151 152 153 154 155 155 155 155 156 156 156 157 158 158 160 160 160 160 160 161 161 161 161 162 162 163 163 164 164 164 165 166 167 168 168 169 170 172 173 ROTEIRO SUGERIDO PARA ELABORAÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA COM DADOS EM CLASSE I. Verificação de n - número total da amostra (população); II. Amplitude total (AT): é a diferença entre o maior e o menor valor observado. III. Determinação do número de classes (K): É importante que a distribuição conte com um número adequado de classes. Se o número de classe for excessivamente pequeno acarretará perda de detalhe, portanto, pouca informação se poderá extrair da tabela. Por outro lado, se forem utilizadas um número excessivo de classe, haverá alguma classe com freqüência nula ou muito pequena, não atingindo o objetivo de classificação que é tornar o conjunto de dados supervisionáveis. Não há uma regra exata para se determinar o número de classes, apenas orientações práticas para o analista. Por exemplo, se n for o número total de observações, a quantidade k de classes poderá ser obtida da seguinte maneira: a. Se o conjunto pesquisado for menor ou igual a 25 variáveis, o número de classes (k) será igual a 5, ou seja, para n 25, teremos, k = 5. 4 b. Se o conjunto pesquisado for maior que 25 variáveis, o número de classes (k) será calculado pela raiz quadrada de “n”, ou seja, para n 25, teremos, k n. Classe (a ├ b): é cada um dos subgrupos de valores do conjunto de dados observados, ou seja, são os intervalos de variação da variável. IV. Amplitude do intervalo de classe (i): é o comprimento da classe. O valor de (i) é calculado pelas equações a seguir, dependendo das variáveis que se tenha à disposição. I. k At i II. lilsi e) Limites de classe (li) e (ls): são os valores extremos de cada classe. Ex: Na classe 150 ├ 154 , o limite inferior, li = 150 e limite superior, ls = 154. f) Ponto médio das classes (Xi): é o valor representativo da classe para efeito de cálculo de certas medidas. Para fim de quantificação, o valor de (Xi) é a metade das somas entre o limite inferior e superior, ou seja, 2 lsli Xi ESTATURA (CM) DE 40 FUNCIONÁRIOS DA REDE ESTADUAL DE ENSINO MACAPÁ/AP-2004 ESTATURA Fi fr TOTAL Fonte: Fictícia Ao agruparmos os valores da variável em classe, ganhamos em simplicidade, mas perdemos em pormenores. Assim, quanto maior a tabela, mais informações detalhada temos; da mesma forma que quanto mais resumidas as tabelas, mais detalhes perdemos. O que pretendemos com a construção dessa nova tabela, é realçar o que há de essencial nos dados e, também, tornar possível o uso de técnicas analíticas para sua total descrição, até porque a estatística tem por finalidade específica analisar o conjunto de valores, desinteressando-se por casos isolados. OBS: Quando os dados são organizados em uma distribuição de freqüência, são comumente denominados de dados agrupados. Ex 4: O conjunto de dados a seguir refere-se a uma amostra aleatória de tamanho 25 das vendas diárias em milhares de uma empresa. Vamos construir uma distribuição de freqüências absolutas e relativas. 5 Rol 280 280 305310 320 330 330 340 341 355 360 365 369 370 370 370 371 375 380 390 400 400 401 420 430 Roteiro: 1. Número de observações n = 2. Amplitude Total AT = 3. Número de classes K = 4. Amplitude das classes I = VENDAS DIÁRIAS (EM MILHARES) DE UMA EMPRESA X - BRASIL/2007 VENDAS fi fr TOTAL 6. FREQUENCIAS ACUMULADAS A) Freqüência absoluta acumulada “abaixo de” (Fi): A freqüência absoluta acumulada “abaixo de” um valor individual ou de uma classe é a soma das freqüências simples absoluta da classe ou de um valor com a freqüência simples absoluta das classes ou dos valores anteriores. A expressão “abaixo de” refere-se ao fato de que as freqüências a serem acumulados correspondem aos valores menores ou anteriores ao valor ou a classe cuja freqüência acumulada se quer obter, incluindo no cálculo o valor ou a freqüência da classe. Quando se quer saber quantas observações existem até uma determinada classe ou valor individual, recorre-se a freqüência acumulada “abaixo”. 6 B) Freqüência relativa acumulada “abaixo de” (Fr): A freqüência relativa acumulada da classe ou do valor individual é igual a soma das freqüências simples relativa da classe ou do valor individual com as freqüências simples relativas das classes ou dos valores anteriores. As freqüências relativas acumuladas pode ser obtidas de duas formas: C) Acumulando as freqüências simples relativas de acordo com a definição de freqüência acumulada; D) Calculando as freqüências relativas diretamente a partir das freqüências absolutas de acordo com a definição de freqüências relativas. Vamos calcular agora as freqüências acumuladas dos exemplos anteriores: Variável Quantitativa AÇÕES DIÁRIAS NEGOCIADAS PELO OPERADOR ‘B’ NA BOLÇA DE VALORES Número diária de ações fi (freqüência absoluta) fr(%) (freqüência relativa) Fi (acum. Absoluta) Fr (acumul. Relativa) TOTAL Fonte: Fictícia VENDAS DIÁRIAS (EM MILHARES) DE UMA EMPRESA X - BRASIL/2007 Vendas fi fr(%) Fi Fr(%) TOTAL ... ... Fonte: Fictícia 7. Representação gráfica da distribuição de freqüência: 7 Atividade 1. Dá-se, a seguir, a distribuição dos pesos de 125 espécimes minerais coletados em uma excursão: Pesos (gramas) No de Espécimes 0 ├ 20 16 20 ├ 40 38 40 ├ 60 35 60 ├ 80 20 80 ├ 100 11 100 ├ 120 4 120 ├ 140 1 TOTAL 125 Fonte: fictícia Se possível, determine quantos espécimes pesam: a) No máximo 60 gramas; b) Mais de 60 gramas; c) Mais de 80 gramas; d) 80 gramas ou menos; e) Exatamente 70 gramas; f) Entre 60 e 100 gramas. 2. Conhecidas as notas de 50 alunos num teste cuja nota máxima é 100 pontos: 84 68 33 52 47 73 68 61 73 77 74 71 81 91 65 55 57 35 85 88 59 80 41 50 53 65 76 85 73 60 67 41 78 56 94 35 45 55 64 74 65 94 66 48 39 69 89 98 42 54 Obtenha uma distribuição de freqüência apropriada, calcule todos os tipos de freqüência e faça uma breve análise dos dados. 3. O diário de classe de um professor revelou o número de faltas de 60 alunos em uma disciplina de 36 horas: 0 0 2 6 10 6 0 6 3 2 2 0 6 6 6 10 0 3 6 5 6 6 0 2 0 0 6 6 10 3 0 6 0 2 6 10 3 6 0 0 6 5 2 3 0 0 2 6 6 3 6 10 3 0 2 0 6 6 0 6 a) Construa uma distribuição que mostre o número de faltas dos alunos: b) Calcule todos os tipos de freqüências; c) Faça uma breve análise dos dados, considerando que o percentual de faltas que caracteriza a reprovação e de 25% mais uma falta. 8 4. Examinando o histograma abaixo, que corresponde às notas relativas à aplicação de um teste de inteligência a um grupo de alunos, responda: a) Qual o intervalo de classe que tem a maior freqüência? b) Qual a amplitude total da distribuição? c) Qual o número total de alunos? d) Qual a freqüência do intervalo de classe 110 I 120? e) Quais os intervalos de classe que têm a mesma freqüência? f) Quais são os dois intervalos de classe tais que a freqüência de um é o dobro da freqüência do outro? g) Quantos alunos receberam notas de teste entre 90 (inclusive) e 110? h) Quantos alunos receberam notas não inferiores a 100? NOTAS RELATIVAS À APLICAÇÃO DE UM TESTE DE INTELIGÊNCIA A UM GRUPO DE ALUNOS 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 45 55 65 75 85 95 105 115 125 135 145 NOTAS N Ú M E R O D E A L U N O S FONTE: 9 MEDIDAS ESTATÍSTICAS 1. MEDIDAS DE TENDÊNCIA CENTRAL Segundo a autora, VIEIRA (1980, p.27), os dados quantitativos, apresentados em tabelas e gráficos, constituem a informação básica do problema em estudo. Mas é conveniente apresentar, além dos dados, medidas que mostrem a informação de maneira resumida. As medidas de tendência central, definidas neste módulo, dão o valor do ponto em torno do qual os dados se distribuem. Estas medidas se classificam em: A média aritmética (simples e ponderada), a mediana e a moda. 1.1. Média Aritmética Simples e Ponderada Representação: x (lê-se “x traço” ou “x barra”) A medida de tendência central mais comumente usada para descrever resumidamente uma distribuição de freqüência é a média, ou mais propriamente a média aritmética. Há vários tipos de médias, porém, para efeito de estudo para o Curso de Pedagogia, abordaremos apenas dois casos: A Média Aritmética Simples: A média aritmética simples para um conjunto de dados é igual ao quociente entre a soma dos valores do conjunto e o número total de valores. EX.: A Empresa Acme S.A. tem grande atuação nos mercados brasileiros e internacional. Com 1500 funcionários, a empresa vem expandindo seus negócios a cada ano. Um funcionário do setor de vendas fez um levantamento da variação mensal dos preços de uma determinada peça, conforme o pedido de um cliente. Os preços da peça são os seguintes: 0,67 0,66 0,67 0,69 0,65 0,68 0,67 0,71 0,73 0,69 0,67 0,66 Vamos calcular o preço médio da peça: CÁLCULOS: (Genericamente podemos escrever) A média aritmética simples será calculada sempre que os valores não estiverem agrupados, ou seja, quando aparecem representados individualmente, como é o caso, por exemplo, dos dados brutos. 10 b) Média Aritmética Ponderada: b1) Dados sem intervalo de classes - A média aritmética ponderada será calculada sempre que os dados estiverem agrupados, ou seja, representados numa tabela. O termo “ponderada” ocorre devido a necessidade de considerar que os valores existentes possuem freqüências ou pesos diferentes. Obtém-se uma média ponderada através do quociente entre os produtos dos valores da variável pelos respectivos pesos e a soma dos pesos. EX1.: Considerando o conjunto de dados anterior, analise as informações e responda: a) Qual a nota média ponderada dessa aluna no Curso? b) Qual a média aritmética apropriada para esse conjunto de dados? Por quê? NOTAS ATRIBUÍDAS A 20 ALUNOS DO CURSO DE ADMINISTRAÇÃO DA FAMAP - MACAPÁ/AP - 2004 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 8 8 8 9 Fonte: FICTÍCIA Como vimos, os dados acima podem ser agrupados em uma tabela, uma vez que os valores se repetem: NOTAS ATRIBUÍDAS A 20 ALUNOS DO CURSO DE ESPECIALIZAÇÃO EM METODOLOGIA DO ENSINO DA MATEMÁTICA MACAPÁ/AP - 2004 Notas(xi) fi fi.xi Total CÁLCULOS: (Genericamente podemos escrever) b2) Dados com intervalo de classes - Quando os valores estão agrupados em classe, a tabela requer a presença dos pontos médios (Xi) das classes, onde a média ponderadaé calculada através do produto entre o ponto médio da classe pela respectiva freqüência, soma-se os produtos e divide-se a soma pelo total de elementos do conjunto. 11 EX.2.: A partir da definição do cálculo da média aritmética ponderada, analise os dados abaixo e obtenha a média do conjunto. Distribuição de 175 empresas classificadas segundo o número de empregados – Macapá/2007 Número de empregados fi 0 ├ 10 5 10 ├ 20 20 20 ├ 30 35 30 ├ 40 60 40 ├ 50 30 50 ├ 60 15 60 ├ 70 10 Total 175 CÁLCULOS: (Genericamente podemos escrever) Atividade A partir dos dados abaixo, calcule a média aritmética em todos os casos: a) Idades, em anos, de nove acadêmicos do Curso de Pedagogia do Pólo da Serra do Navio: I = {23, 20, 24, 35, 36, 28, 32, 35, 40}. b) Nota de dez alunos do ensino médio na Prova do ENEM em 2004 N = { 35 ; 48 ; 51 ; 27 ; 39 ; 46 ; 52 ; 25 ; 32 ; 19 }. c) Rendimento escolar de uma 5a série na disciplina de português, referente ao primeiro bimestre do ano letivo de 2005: Nota fi xi . fi Fi 13 2 9 6 11 10 5 12 8 3 Total 33 ........ d) De salário, em reais, de 80 funcionários da educação atuando na rede pública durante o 1o semestre de 2005 Salário fi Xi Xi . fi 1100 ├ 1400 20 “A hora de encontrar momentos de quietude e tranqüilidade é quando nos parece mais difícil de fazê-lo” (Bruce e Stan) 12 1400 ├1700 15 1700 ├2000 12 2000 ├2300 8 2300 ├2600 25 Total 80 ........ 2. MEDIDAS DE DISPERSÃO Vimos anteriormente que um conjunto de valores pode ser convenientemente sintetizado por meio de procedimentos matemáticos em poucos valores representativos (médias, medianas e moda), tais valores podem servir de comparação para dar a posição de qualquer elemento do conjunto. Precisamos, às vezes, comparar fatos, como a reprodução de animal em um ano ou características de indivíduos, como sexo, tipo sanguíneo, altura, idade e outros. Para isso, necessitamos de uma média. Se soubermos, por exemplo, que a média de alturas das meninas recém nascidas de uma certa cidade é 47,3 cm e que, nesse mesmo local nasceu uma menina medindo 50 cm, podemos afirmar que ocorreu uma variabilidade ou uma dispersão, em relação à média. Dizemos que houve um desvio de 2,7 cm em relação à média (50 cm – 46,3 cm). 2.1. Desvio médio (Dm): EX: Consideremos os conjuntos referentes a presenças de alunos nas atividades de educação física do ensino fundamental, considerando as turmas X, Y e Z: X = {70, 70, 70, 70, 70}, Y = {68, 69, 70, 71, 72} Z = {5, 15, 50, 120, 160}. Qual a dispersão (d) ou variabilidade de cada um dos conjuntos abaixo Cálculo da média aritmética: Para o conjunto X: Para o conjunto Y: Para o conjunto Z: Cálculo de desvio médio para X, Y e Z: Conclusão: Dm = ( Ι d Ι)/ n Dm = ( Ι d Ι)/ n Dm = ( Ι d Ι)/ n 13 2.2. Desvio Padrão: a1) Desvio padrão para dados não agrupados O desvio padrão é a medida mais usada na comparação de diferenças entre grupos, por ser a mais precisa. Ele determina a dispersão dos valores em relação à média. EX: Consideremos as notas de dois grupos de estudos dispostas nas tabelas abaixo. Qual o desvio padrão para cada grupo Grupo A Grupo B Nota d d² Nota d d² 30 10 45 20 45 30 50 40 50 50 50 60 65 70 65 80 70 90 80 100 A média aritmética das notas são: Grupo A Grupo B Vamos preencher (completar) a tabela calculando os desvios e seus quadrados A média aritmética dos quadrados dos desvios chama-se variância (υ). Calculemos as variâncias das duas distribuições: A raiz quadrada da variância (υ) é o desvio padrão (Dp). Calculemos os desvios padrões das distribuições: Comparando os dois valores: Calculando a zona de normalidade: a2) Desvio padrão para dados agrupados Quando os dados estiverem os agrupados (em classe ou sem classe), apresentamos um método não apenas mais prático como mais preciso. Isso porque na maioria das vezes a média não é exata e tem que ser arredondada, assim cada desvio fica ligeiramente afetada de erro, devido a esse υ = ( d2) / n Dp = υ 14 arredondamento. O mesmo acontece com os quadrados, podendo os resultados dos cálculos ser menos exato do que quando aplicado a fórmula a seguir: 2 2 2 )( . x n xifi S Exemplo: Vamos calcular o desvio padrão e a zona de normalidade dos conjuntos a seguir utilizando a relação acima: Dados agrupados sem classe: NOTAS ATRIBUÍDAS A 20 ALUNOS DO CURSO DE ESPECIALIZAÇÃO EM METODOLOGIA DO ENSINO DA MATEMÁTICA MACAPÁ/AP - 2004 Notas(xi) fi 5 4 6 7 7 5 8 3 9 1 Total 20 Fonte: Dados Fictícios Dados agrupados com em classe: Imóveis urbanos alugados por uma imobiliária X, Macapá- 2007 Notas fi Xi fi.Xi Xi² fi.Xi² 2├ 4 10 4├ 6 40 6├ 8 80 8├ 10 50 10├ 12 20 200 15 Atividade 1) Um professor aplicou um teste a seus alunos e obteve os seguintes resultados: 30 40 45 30 30 50 35 30 40 45 40 35 50 60 50 50 30 60 50 60 30 40 50 45 a) Agrupe esse dados em uma distribuição de freqüência e baseado na tabela de dados agrupados, determine: a1) a média aritmética dos resultados a2) o desvio padrão a3) a zona de normalidade 2) Se a média das alturas de um grupo de pessoas é de 175 cm e o desvio padrão é de 20 cm, uma pessoa com estatura de 150 cm está dentro da normalidade? Por quê? 3) Numa escola, duas turmas conseguiram os seguintes resultados: Turma A: x = 45, S = 10 Turma B: x = 45, S = 3,5 Pergunta-se a) Qual a turma mais homogênea? Por quê? b) Um aluno com média 40 é considerado dentro da normalidade na turma A? E na turma B? Por quê? 4) Na aplicação de um teste de motricidade, os 45 alunos de uma turma conseguiram os seguintes resultados: Rol: 5 9 10 10 12 13 16 17 17 18 18 19 19 19 19 19 20 20 21 21 22 22 22 22 23 23 23 24 24 24 24 25 25 25 26 26 26 27 27 28 31 32 33 33 34 a) Faça a distribuição de freqüência com dados agrupados em classe; b) Calcule o desvio padrão e a zona de normalidade. 5) em um bairro da zona norte de Macapá, há três escolas estaduais ns quais a evasão escolar ocorre há cinco anos. As autoridades das escolasdivulgaram os dados de evasão bimestral em números de aluno, conforme abaixo: Escola A 16 10 12 17 14 18 25 37 29 14 Escola B 13 12 17 43 18 20 23 15 10 11 Escola C 11 17 15 16 10 28 39 33 8 9 Qual escola possui o menor numero médio de alunos evadidos? 16 6) Quer se estudar o número de erros detectados em faturas de uma empresa X. Para isso escolheu- se uma amostra de 50 faturas, encontrando-se o número de erros apresentados na tabela abaixo: Erros fi 0 25 1 20 2 3 3 1 4 1 Total 50 a) Qual o número médio de erros por fatura? b) Qual é o desvio padrão? c) Se no período em que foi extraída a amostra circularam 500 faturas, qual o número esperado de erros?
Compartilhar