Prévia do material em texto
Métodos Quatitativos I 4º Aula Distribuição de frequência Nesta aula estudaremos o que é ROL, as distribuições de frequência, seus elementos e seus tipos. Vocês sabem do que estamos falando? Conhecem ou já ouviram falar de algum? Sabem para que eles servem? Bons estudos! Objetivos de aprendizagem Ao término desta aula vocês serão capazes de: • fazer a distribuição de frequências; • aplicar a Regra de Sturges; • conhecer e saber calcular: ROL, fi (frequência simples), FAC (frequência acumulada, li (limite inferior), li (limite superior), h (amplitude de classes), AT (amplitude total). 23 1 - Distribuição de frequência: ROL 2 - Regra de Sturges Seções de estudo 1 – Distribuição de frequência: ROL 2 – Regra de Sturges Conceito: Segundo Crespo (2002), a esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva. Conceito: Denominamos frequência o numero de alunos que fica relacionado a um determinado valor da variável. Obtemos assim, uma tabela que recebe o nome de distribuição de frequência: Primeiramente, iremos abordar a melhor forma de descrever os dados estatísticos resultantes de variáveis quantitativas, após o levantamento, após a amostragem, de dados como altura dos alunos de uma turma, peso dos alunos, salários dos operários de uma empresa etc. Suponhamos que fizemos uma coleta de dados relativos às estruturas de quarenta alunos, que compõem uma amostra dos alunos da disciplina de Estatística, resultando a seguinte tabela de valores: Partindo dos dados acima, ou seja, da tabela primitiva, a averiguação dos dados fica difícil, pois os valores estão desordenados, e dessa forma averiguar em torno de que valor tende a se concentrar as estaturas, qual a menor ou qual a maior estatura ou, ainda, quantos alunos se acham abaixo ou acima de uma dada estatura, torna-se uma tarefa morosa e trabalhosa. Com o propósito de facilitar o trabalho, foi criada uma tabela organizada a qual damos o nome de Rol, onde os dados aparecem organizados de forma crescente ou decrescente, ficando da forma a seguir: Extraído do site: <http://www.ipanema.com/ livros/olha/page14.gif> 166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 TABELA ESTATURAS DE 40 ALUNOS Fonte: Retirado de Crespo (2002). 150 154 155 157 160 161 162 164 166 169 151 155 156 158 160 161 162 164 167 170 152 155 156 158 160 161 163 164 168 172 153 155 156 160 160 161 163 165 168 173 TABELA ESTATURAS DE 40 ALUNOS Da forma agora apresentada, poderemos verificar, com clareza e facilidade, qual a menor (150 cm) e a maior estatura (173 cm), que variação obteve entre a maior e a menor (173 – 150 = 23 cm). Dependendo da disponibilização desses dados na tabela, a variável altura torna-se mais visível, podendo ser melhor estudada. Observe como faremos a primeira distribuição de frequências dessas alturas. Iremos dispor os valores da altura ordenados em uma coluna e, ao lado de cada valor, o número de vezes, ou seja, a frequência em que eles aparecem. ALTURA DOS ALUNOS ESTATURA (cm) FREQ. 150 151 152 153 154 155 156 157 158 160 161 162 163 164 165 166 167 168 169 170 172 173 1 1 1 1 1 4 3 1 2 5 4 2 2 3 1 1 1 2 1 1 1 1 Total 40 Bem, mas, observando melhor, poderemos agrupar essas estaturas para que a tabela seja melhor utilizada, colocando os valores em intervalos de classes, que chamamos, a cada um deles de frequência de uma classe (número de valores da variável pertencentes à classe (i)). Segundo Crespo (2002), classes de frequência ou classes são intervalos de variável. Estamos a toda hora falando em classes... Mas como saber quantas classes estipular para cada tabela? Como subdividi- las? Para isso temos a Regra de Sturges, que pode nos auxiliar. Ela nos fornece o número de classes em função do número de valores da variável, número da amostra que obtivemos. i ≅ 1 + 3,3 . log n , onde: i é o número de classe; Métodos Quantitativos I 24 Observando a tabela poderemos constatar outro item: os limites de classe. Temos dois limites: o inferior (li) e o superior (Li). Se tomarmos como exemplo i = 1 (1ª classe) termos como li (limite inferior) 150 e Li (limite superior) 154. Temos, ainda, como medir o intervalo de uma classe através da Amplitude de um intervalo de classe ou intervalo de classe, por meio de hi = Li − li. Se tomarmos i = 2 como exemplo, teremos h2 = 158 – 154 = 4 cm de amplitude de intervalo de classe. Existe também como medirmos a amplitude total da distribuição (AT), que é a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo) – AT = L(max) – l(min). Para a tabela da estatura dos 40 alunos teremos: AT = 174 – 150 AT = 24 cm L(max) − l(min) i 173 − 150 6 23 6 ⊥ ⊥ ⊥ ⊥ ⊥ ⊥ ALTURA DOS ALUNOS ESTATURA (cm) FREQ. 150 154 154 158 158 162 162 166 166 170 170 174 4 9 11 8 5 3 Total 40 É importante observar dois pontos. Primeiramente, observa-se o símbolo ├─. Esse símbolo serve para delimitar o intervalo que estaremos trabalhando. Note que do lado esquerdo existe ├─, onde essa barra inclui o valor que está a sua esquerda. No caso da tabela, os valores 150 da classe 1, 154 da classe 2, 158 da classe 3, 162 da classe 4, 166 da classe 5 e 170 da classe 6, todos eles possuem esse símbolo, que serve para dizer que esse intervalo inicia-se por esse valor. Tomamos como exemplo a classe 1, onde apresenta 150 ├─ 154. Para essa classe existirão alturas compreendidas de 150 cm a 153 cm. Como do lado direito não aparece o símbolo ─┤, então a altura 154 não pertence a esse intervalo e sim ao próximo, pois aparecerá da forma 154 ├─ 158, e assim por diante. Dessa forma teremos valores compreendidos para cada classe: i = 1 (1ª classe) – 150, 151, 152, 153 i = 2 (2ª classe) – 154, 155, 156, 157 i = 3 (3ª classe) – 158, 159, 160, 161 i = 4 (4ª classe) – 162, 163, 164, 165 i = 5 (5ª classe) – 166, 167, 168, 169 i = 6 (6ª classe) – 170, 171, 172, 173 Outro ponto que devemos observar é a segunda coluna da tabela. Para cada intervalo estipulado, contaremos a quantidade de vezes que eles aparecem. Observem... Para os valores de 150 a 153 (1ª classe), aparecerão 4 vezes, sendo uma frequência de cada valor. Já na 2ª classe, 9 vezes, sendo 1 da altura 154 cm, 4 da 155 cm, 3 da 156 cm e 1 da 157 cm, totalizando 9 vezes, e assim sucessivamente. Isso é o que chamamos de frequência simples ou absoluta (fi). O resultado total deve permanecer 40, pois foi o total de alunos que formam a amostra inicial. Há também, o que chamamos de frequência acumulada (FAC), que é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma dada classe. ⊥ ⊥ ⊥ ⊥ ⊥ ⊥ ALTURA DOS ALUNOS ESTATURA (cm) FREQ. FAC 150 154 154 158 158 162 162 166 166 170 170 174 4 9 11 8 5 3 4 13 24 32 37 40 Total 40 Para procedermos com os cálculos de frequência acumulada, tomou-se como referência inicial a frequência da primeira classe (4), em seguida, somou-se o valor 4 à 2ª classe e resultou em 13, para a próxima somou-se 13 à 11, resultando 24 e assim por diante... Se considerarmos os valores máximo e mínimo, 173 e 150, e fizermos a diferença dos mesmos, teremos o que chamamos de Amplitude Amostral (AA), ou seja, AA = 173 – 150 = 23 cm. n é o número total de dados (amostra). No nosso exemplo da amostragem da estatura dos 40 alunos temos: i ≅ 1 + 3,3 . log 40 i ≅ 1 + 3,3 . 1,6 i ≅ 1 + 5,28 i ≅ 6,28 Como o resultado não foi exato, arredondamos para 6, pois 6,28 está mais próximo de 6 do que 7. Para sabermos a distância de um intervalo e outro utilizamos a seguinte fórmula: h = _____________ h = _________ h = ___ h = 3,8 Considerando que 3,8 está mais próximo de 4, adotamos 4 cm de “diferença” entre os intervalos. Observem a nova distribuição de valorese perceba que em cada classe teremos uma amplitude de 4, ou seja, meus limites inferior e superior terão variação de 4. Vejam como se apresentam os valores da tabela a seguir: 25 Para calcularmos o ponto médio (xi) de uma classe, somamos os limites inferior e superior e depois dividimos por dois. Vejam a seguir, um pouco mais de exemplo: • Exemplo 1: Para a tabela a seguir, façam a distribuição de frequências utilizando a Regra de Sturges: Segundo Crespo (2002), ponto médio de uma classe é o ponto que divide o intervalo de classe em duas partes iguais. 84 68 33 52 47 73 68 61 73 77 74 71 81 91 65 55 67 35 85 88 59 80 41 50 53 65 76 85 73 60 67 41 78 56 94 35 45 55 64 74 65 94 66 48 39 69 89 98 42 54 Vejam que em primeiro lugar é necessário colocar os valores em ordem crescente... ordená-los... fazer o ROL. Desta forma temos: 33 41 50 55 64 67 71 74 81 89 35 42 52 56 65 67 73 76 84 91 35 45 53 59 65 68 73 77 85 94 39 47 54 60 65 68 73 78 85 94 41 48 55 61 66 69 74 80 88 98 Depois da ordenação feita, agora resta aplicar a Regra de Sturges, vamos lá?!! Lembrem-se de que agora temos 50 termos, então devemos considerar N = 50. i ≅ 1 + 3,3 . log N i ≅ 1 + 3,3 . log 50 i ≅ 1 + 3,3 . 1,69 i ≅ 1 + 5,6 i ≅ 6,6 i = 7 aproximadamente Para sabermos a distância de um intervalo e outro utilizamos a seguinte fórmula: h = _____________ h = _________ h = ___ h = 9,28 Dessa forma iremos considerar ou h = 9,28 ou arredondamos este valor para cima e teremos h = 10, aproximadamente. Dessa forma teremos valores compreendidos para cada classe: i = 1 (1ª classe) – 33, 34, 35, 36, 37, 38, 39, 40, 41, 42 i = 2 (2ª classe) – 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 i = 3 (3ª classe) – 53, 54, 55, 56, 57, 58, 59, 60, 61, 62 i = 4 (4ª classe) – 63, 64, 65, 66, 67, 68, 69, 70, 71, 72 i = 5 (5ª classe) – 73, 74, 75, 76, 77, 78, 79, 80, 81, 82 i = 6 (6ª classe) – 83, 84, 85, 86, 87, 88, 89, 90, 91, 92 i = 7 (7ª classe) – 93, 94, 95, 96, 97, 98, 99, 100, 101, 102 L(max) − l(min) i 98 − 33 7 65 7 Notas dos alunos Notas fi 33 43 43 53 53 63 63 73 73 83 83 93 93 103 7 5 8 11 10 6 3 Total 50 ⊥ ⊥ ⊥ ⊥ ⊥ ⊥ ⊥ Montando a tabela, considerando os valores acima encontrados temos: • Exemplo 2: Conhecidas às notas de 50 alunos, obtenha a distribuição de frequência, tendo 30 para limite inferior da primeira classe e 10 para intervalo de classe. 84 68 33 52 47 73 68 61 73 77 74 71 81 91 65 55 67 35 85 88 59 80 41 50 53 65 76 85 73 60 67 41 78 56 94 35 45 55 64 74 65 94 66 48 39 69 89 98 42 54 Observem que primeiramente deverá fazer o ROL, ou seja, colocar todos os valores acima em ordem crescente, para depois distribuí-los na tabela. Em seguida terão que colocar as notas em intervalos conforme foi orientado pelo enunciado do exemplo, começando em 30 e tendo intervalos de 10 em 10. Se observarem o exemplo anterior, verão que teremos que contar quantos valores existem nos intervalos de cada uma das classes. Observem que na tabela a seguir, existem os valores pertencentes à cada uma das classes disponibilizadas!!! (1ª classe) 33 35 35 39 (7ª classe) 91 94 94 98 (2ª classe) 41 41 42 45 47 48 (3ª classe) 50 52 53 54 55 55 56 57 59 (1ª classe) 33 35 35 39 (4ª classe) 60 61 64 65 65 65 66 67 68 68 69 (5ª classe) 71 73 73 73 74 74 76 77 78 (6ª classe) 80 81 84 85 85 88 89 Notas dos alunos Notas Freq. fi 30 40 40 50 50 60 60 70 70 80 80 90 90 100 4 6 9 11 9 7 4 Total 50 ⊥ ⊥ ⊥ ⊥ ⊥ ⊥ ⊥ Vejam que ao final teremos em frequência a quantidade de números existentes em cada uma das classes. Importante lembrarem e observarem que podemos construir as tabelas, fazer a distribuição de frequências de duas formas: ou pela Regra de Sturges, ou considerando a sugestão do enunciado. Para as duas formas temos as tabelas válidas. Métodos Quantitativos I 26 Então vamos ver mais alguns exemplos?! • Exemplo 3: Relembrando alguns conceitos... Vejam a tabela a seguir e relembrem os dados... Áreas (m2) N0de lotes (fi ) 300 400 400 500 500 600 600 700 700 800 800 900 900 1000 1000 1100 1100 1200 14 46 58 76 68 62 48 22 6 Total 396 ⊥ ⊥ ⊥ ⊥ ⊥ ⊥ ⊥ ⊥ ⊥ a) A amplitude total – é a diferença do maior para o menor valor da distribuição. AT = 1200 – 300 = 900 b) O limite superior da quinta classe – o maior valor da quinta linha... ou seja= 800 c) O limite inferior da oitava classe – o menor valor da oitava linha... ou seja = 1000 d) O ponto médio da sétima classe. – para encontrar este valor, basta somar os valores (maior e menor) da sétima linha e dividir por 2... xi = __________ = _____ = 950 e) A amplitude do intervalo da segunda classe – é o valor da diferença do maior pelo menor valor da quinta linha. h = 500 – 400 = 100 f) A frequência da quarta classe – é o valor correspondente em fi da quarta linha. = 76 g) A frequência acumulada da quinta classe – para encontrar este valor, basta somar todos os valores de fi até a quinta linha... 14 + 46 + 58 + 76 + 68 = 262 1 – Distribuição de Frequência: ROL Nessa seção estudamos a forma que os dados são coletados e disponibilizados em uma tabela. Estudamos como podemos distribuir esses valores em tabela e que nome se dá a cada um desses valores. 900 + 1000 2 1900 2 Retomando a aula Parece que estamos indo bem. Espero que agora tenha fi cado mais claro o entendimento de vocês sobre distribuição de frequência. Vamos, então, recordar: Não esqueçam! Em caso de dúvidas, acessem as ferramentas “Fórum” ou “Quadro de Avisos” CRESPO. A. A. Estatística fácil. 18. ed. São Paulo: Saraiva, 2002. PINHEIRO, J. I. D. et al. Estatística básica – a arte de trabalhar com dados. Rio de Janeiro: Elsevier, 2009. VIEIRA, S. Elementos de Estatística. São Paulo: Ed. Atlas, 1999. Sala do Mestre. Disponível em: <http://goo.gl/tVXeS2>. Estatística geral. Disponível em: <http://goo.gl/y6J1S3>. Distribuição de frequência. Disponível em: <http://goo. gl/4LN3Na>. Vale a pena Vale a pena ler Vale a pena acessar 2 – Regra de Sturges Na seção 2, colocamos uma forma específica de estruturar esses dados em tabela. A regra de Sturges permite distribuirmos os dados de forma homogênea. Minhas anotações