Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE EDUARDO MONDLANE FACULDADE DE VETERINÁRIA BIOESTATÍSTICA Tema 2 Apresentação de dados e distribuição de frequências Frequências absolutas, relativas e acumuladas Aula Teórica 02 2. Introdução Ao colectar os dados referentes ao fenómeno objecto de estudo, normalmente o Analista se defronta com valores que se repetem algumas ou muitas vezes, sugerindo sua apresentação através de tabelas, onde somente apareçam valores distintos uns aos outros. Essa providência favorece evidentemente uma análise e interpretação mais rápida da natureza e comportamento do fenómeno observado. Um dos objectivos da Estatística Descritiva quando se trabalha com grandes quantidades de dados é obter uma significativa redução dos mesmos dados, para facilitar a sua análise. Neste caso, a Distribuição de Frequência é uma ferramenta estatística apropriada para a apresentação de grandes massas de dados, numa forma que torna mais clara a tendência central e a dispersão dos valores ao longo da escala de medição, bem como a frequência relativa de ocorrência dos diferentes valores. 2.1. Alguns conceitos importantes Para que se possa organizar os dados em frequência é necessário que eles estejam na sua forma bruta. Dados brutos – são os dados originais, que ainda não se encontram prontos para análise, por não estarem numericamente organizados. (Também são conhecidos como Tabela Primitiva). Exemplo 1: Considere o conjunto dos pesos (em kg) de 20 sacos de feijão, seleccionados em um celeiro de produtor local, em Mecanhelas, na província do Niassa. 45, 41, 42, 41, 42 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 Depois de obter os dados brutos no campo, é importante organiza-los em rol. O Rol é uma lista em que os valores númericos brutos estão dispostos em uma determinada ordem, crecente ou decrescente. Exemplo 2: Apresentando em ordem crescente o conjunto dos pesos dos 20 sacos de feijão do exemplo anterior temos: 41, 41, 41, 42, 42 43, 44, 45, 46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60. Existem 4 tipos de frequências pela qual podemos apresentar os dados i. Frequência simples ou absoluta (): é o valor que representa o número de observações em uma determinada classe ou em um determinado atributo de uma variável qualitativa. A soma das frequências simples é igual ao número total dos dados da distribuição. ii. Frequência relativa (): é o valor da razão (proporção) entre a frequência absoluta em uma determinada classe e a frequência total da distribuição. A soma das frequências relativas é igual a 1 (100%). iii. Frequência simples acumulada de uma classe (): é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma determinada classe. iv. Frequência relativa acumulada de uma classe (): é a frequência acumulada da classe, dividida pela frequência total da distribuição. 2.2. Distribuição de frequências de dados não agrupados em classe É a simples condensação dos dados conforme as repetições de seus valores. Este tipo de apresentação é utilizado para representar uma variável discreta ou contínua. Para uma tabela de tamanho razoável, esta distribuição de frequência é inconveniente, já que exige muito espaço. Na primeira coluna, encabeçado pelo índice i, aparecem os números correspondentes à ordem dos valores da variável. Na segunda coluna, encabeçada por xi, são anotados em ordem crescente apenas os valores distintos da variável. A terceira coluna é uma coluna auxiliar (opcional), utilizada para que se possa processar a contagem dos valores repetidos, sem grande esforço. A última coluna, encabeçada por fi, apresenta as frequências, que são os resultados numéricos provenientes da contagem. A soma de frequências é sempre igual ao número total de valores observados: k: é o extremo superior do intervalo de valores do índice i. fi,:é o número de observações de um valor n: é o número total de valores observados. Exemplo 3: Considerando o exemplo anterior, sobre o peso dos 20 estudantes, a tabela de distribuição de frequência será: Frequências 1 41 3 2 42 2 3 43 1 4 44 1 5 45 1 6 46 2 7 50 2 8 51 1 9 52 1 10 54 1 11 57 1 12 58 2 13 60 2 Soma --------- 20 Tabela1. Exemplo da distribuição de frequência de uma variável não agrupada em classe 2.3. Distribuição de frequências de dados agrupados em classe Quando a variável objecto do estudo é contínua, é sempre conveniente agrupar os valores observados em classes. Se por outro lado, a variável é discreta e o número de valores representativos dessa variável é muito grande, recomenda-se o agrupamento dos dados em classes. Neste último caso, o procedimento visa evitar certos inconvenientes, como: · Grande extensão da tabela, dificultando, tanto quanto os dados brutos, a leitura e a interpretação dos resultados apurados; · Aparecimento de diversos valores da variável com frequência nula; · Dificuldade de visualização do comportamento do fenómeno como um todo. Usando os dados do exemplo 1, abaixo a distribuição dos mesmos em classes Classes Frequências 1 41 |------ 45 7 2 45 |------ 49 3 3 49 |------ 53 4 4 53 |------ 57 1 5 57 |------ 61 5 Total 20 2.3.1. Elementos de uma distribuição de frequência com classe i. Classe: Intervalos nos quais os valores da variável analisada são agrupados. Cada classe é simbolizada por (i) e o número total de classe é simbolizado por (k). Ex: na tabela anterior k=5 e 49 |------- 53 é a 3ª classe, onde i=3. ii. Limites da classe: são extremos de cada classe. O menor número é o limite inferior de classe e o maior número, o limite superior de classe . Deste modo, o intervalo de classe quanto a sua natureza pode ser aberto, fechado ou misto. a. Intervalos abertos – os limites da classe (inferior e superior) não pertencem a ela. Exemplo de notação: 49 --- 53 b. Intervalos fechados – os limites de classe (superior e inferior) pertencem à classe em questão. Exemplo de notação: 49 |-----|53 c. Intervalos mistos – um dos limites pertence à classe, e o outro, não. Exemplo de notação: 49 |-----53 ou 49 ----|53. iii. Cálculo de número total de classes Para montar uma distribuição de frequência é necessário que primeiro se determine o número de classes (k) em que os dados serão agrupados. Não existe regra fixa para se determinar o número de classes (k). Contudo, neste material são apresentadas algumas: Regra 1: Por questões de ordem prática e estética sugere-se utilizar de 5 a 20 classes; Regra 2: o uso da fórmula de Sturges, que nos dá o número de classe em função do número de valores da variável: onde n é o número de itens que compõe a amostra Regra 3: Se onde n é o número total de observações Nota: De um modo geral, na resolução dos exercícios iremos usar a regra 2 e/ou regra 3, para determinar o número de classe em função do número de observações (n). Exemplo 4: considerando os dados do exemplo 1 podemos obter o número total de classe: Temos que n=20 então, pela regra 2, K=1+3.3*log20= 1+3.3*1.3= 5.29 5 iv. Amplitude Total ou “Range” (At) é a diferença entre o maior e o menor número do rol. A amplitude total pode ser denotada por: Exemplo 5: o maior peso dos 20 estudantes é de 60 kg e o menor peso é de 41 kg, a amplitude total será de 19 kg porque ( 60 kg - 41 kg= 19 kg). v. Amplitude do intervalo de classe (c): é o valor que representa a quantidade de números que se encontram entre o limite inferior e limite superior de uma classe, e é constante em todas as classes de uma mesma distribuição de frequências. A fórmula para o cálculo da c é: Onde: c – é a amplitude de classe; At – é a amplitude total de classe e k – é o nº total de classes. Nota: Na prática, é comum considera-se Xmin como limite inferior da 1ª Classe. Quando assim é, o intervalo de classe de ser calculado usando: c = . Exemplo 6: o c para o exemplo em estudo é: vi. Ponto Médio de classe (PM): é o valor que se encontra no meio dos limites de cada classe , onde Lsup= Limite superior daclasse; Linf= Limite inferior da classe; Assim, o limite inferior da primeira classe será: , onde Xmin é o menor valor de todas as observações da amostra. E os demais limites são obtidos somando-se c ao limite anterior. Exemplo 7: Elaboração de uma distribuição de frequências com classes. Os dados da tabela abaixo foram obtidos em uma pesquisa de mercado e correspondem ao tempo (T) em minutos que consumidores (C) de uma determinada operadora de telefonia móvel utilizariam em um mês. Elabore uma distribuição de frequências com classe. C T C T C T C T C T 1 104 9 122 17 129 25 144 33 183 2 108 10 142 18 138 26 151 34 138 3 138 11 106 19 122 27 146 35 115 4 101 12 201 20 161 28 82 36 179 5 163 13 169 21 167 29 137 37 142 6 141 14 120 22 189 30 132 38 111 7 90 15 210 23 132 31 172 39 140 8 154 16 98 24 127 32 87 40 136 Resolução: Passos para elaboração de uma distribuição de frequências com classes. Primeiro passo: Organizar os dados brutos em um ROL crescente: 82 111 132 142 167 87 115 136 142 169 90 120 137 144 172 98 122 138 146 179 101 122 138 151 183 104 127 138 154 189 106 129 140 161 201 108 132 141 163 210 Segundo passo: Calcular a amplitude total At: ; então Terceiro passo: calcular o número total de classe (k) O número de observações da amostra (n) é 40, então ou pelo Sturges Quarto passo: conhecido o número de classe, calcular a amplitude de cada classe: Quinto passo: calcular o limite inferior da primeira classe: Sexto passo: Determinar os intervalos de classes: 69.2 |--- 94.8 94.8 |--- 120.4 120.4 |--- 146.0 146.0 |--- 171.6 171.6 |--- 197.2 197.2 |--- 222.8 Apresentar a tabela com as classes e respectivas frequências i classe (consumidores) (proporção) 1 69.2|---94.8 3 3 0.075 0.075 2 94.8|---120.4 8 11 0.200 0.275 3 120.4|---146.0 16 27 0.400 0.675 4 146.0|---171.6 7 34 0.175 0.850 5 171.6|---197.2 4 38 0.100 0.950 6 197.2|---222.8 2 40 0.050 1.000 Total ------- 40 1.000 Docente: Paulo Ziaveia / Elísio Mabasso 1 i f r f i F r F n f k i i = å = 1 i i x ( ) i f ( ) i f ( ) inf L ( ) sup L n k log * 3 . 3 1 + = î í ì = ® ³ = ® < n k n k n 25 5 25 » min max X X A t - = 1 - = k A c t 75 . 4 1 5 19 = - = c 2 inf sup L L PM + = 2 min inf 1 c X L - = minutos 82 min = X 210 max = X min 128 82 210 min max = - = - = X X A t 6 32 . 6 40 » = = = n k classes 6 28 . 6 6 . 1 * 3 . 3 1 40 log * 3 . 3 1 log * 3 . 3 1 » = + = + = + = n K min 6 . 25 1 6 128 1 = - = - = k A c t 2 . 69 8 . 12 82 2 6 . 25 82 2 min inf = - = - = - = c X L i f i F r f r F
Compartilhar