Baixe o app para aproveitar ainda mais
Prévia do material em texto
12 Distribuição de Freqüência Variável Contínua Suponhamos que a observação das notas de 30 alunos em uma prova nos conduzisse aos seguintes valores: X: 3; 4; 2,5; 4; 4,5; 6; 5; 5,5; 6,5; 7; 7,4; 2; 3,5; 5; 5,5; 8; 8,5; 7,5; 9; 9,5; 5; 5,5; 4,5; 4; 7,5; 6,5; 5; 6; 6,5; 6 Observando estes valores notamos grande número de elementos distintos, o que significa que neste caso a variável discreta não é aconselhável na redução de dados. Nesta situação é conveniente agrupar os dados por faixas de valores, ficando a série com a seguinte apresentação: Classe Notas fi 1 2 4 4 2 4 6 12 3 6 8 10 4 8 10 4 30 Portanto, devemos optar por uma variável contínua na representação de uma série de valores quando o número de elementos distintos da série for grande. Construção da Variável Contínua A construção da variável contínua requer o conhecimento de alguns conceitos que vamos estabelecer aproveitando a tabela acima como exemplificação: 1. Amplitude Total de uma Seqüência é a diferença entre o maior e o menor elemento de uma seqüência. Representando a amplitude total por At, o maior elemento da seqüência X por Xmáx e o menor elemento por Xmín, a amplitude total é denotada por: At = Xmáx Xmín No exemplo da seqüência que deu origem a tabela acima, Chamas = 9,5 e Xmín = 2, portanto: At = 9,5 2 = 7,5 A amplitude total representa o comprimento total da seqüência e é dada na mesma unidade de medida dos dados da seqüência. 2. Intervalo de Classe é qualquer subdivisão da amplitude total de uma série estatística. No exemplo da tabela acima subdividimos a amplitude total em quatro classes, obtendo os intervalos de classe 2 4, 4 6, 6 8, 8 10. Note que na realidade não trabalhamos com a At = 7,5 e sim com a amplitude total ajustada para 8 como justificaremos adiante. 13 3. Limite de Classe: cada intervalo de classe fica caracterizado por dois números reais. O menor valor é chamado limite inferior da classe e será indicado por l. O maior valor é chamado limite superior da classe e será indicado por L. Por exemplo, na classe 2 4, l = 2 e L = 4. 4. Amplitude do Intervalo de Classe é a diferença entre o limite superior e o limite inferior da classe. Se usarmos h para representar a amplitude do intervalo de classe podemos estabelecer: h = L l Observações: 1) Na realidade, as classes não precisam necessariamente ter a mesma amplitude como no exemplo acima. Porém, sempre que possível, devemos trabalhar com classes de mesma amplitude. Isto facilita sobremaneira os cálculos posteriores. 2) Note que usamos para representar as classes, intervalos reais semi-abertos à direita. Isto significa que o intervalo contém o limite inferior, mas não contém o limite superior, ou seja, o intervalo de classe 2 4 contém os intervalos reais maiores ou iguais a 2 e menores que 4. Desta forma o último intervalo da série que é 8 10 não contém o valor 10. É por isso que não utilizamos a amplitude 7,5, pois se isto fosse feito, o limite superior da última classe seria 9,5 e como o limite superior não deve pertencer à classe, o elemento 9,5 da seqüência estatística original ficaria sem classificação. Como vamos utilizar este critério, precisaremos ajustar sempre o valor máximo da série ao definir a amplitude total. Outros critérios poderiam ser adotados como o intervalo real semi-aberto à esquerda ou mesmo o intervalo real aberto, mas nenhum destes critérios é melhor que o critério adotado. 5. Número de Classes: o número de classes a ser utilizado depende muito da experiência do pesquisador e das questões que ele pretende responder com a variável contínua. Isto pode ser verificado facilmente pelo próprio interessado ao longo desta exposição. Para efeito de nossos exemplos, utilizaremos o critério da raiz para a determinação do número de classes. Critério da raiz: Se a seqüência estatística contém n elementos e se indicarmos por K o número de classes a ser utilizado, então pelo critério da raiz: K = n Como o número K de classes deve ser necessariamente um número inteiro e como dificilmente n , é um número inteiro, deixaremos como opção para o valor K o valor inteiro mais próximo de n No exemplo utilizado n = 30 e conseqüentemente 30 = 5, 4777, portanto o valor inteiro mais próximo de 30 é 5. 14 A amplitude do intervalo de classe que designamos por h é determinada da seguinte forma: h = At e portanto h = 8 = 2 K 5 Observe que a opção por classes foi feita em função de um valor de h mais fácil de se operar. Veja que o melhor valor para se trabalhar em cálculos é o h = 2. Foi por isto que optamos por quatro classes. Conhecendo-se o valor Xmín = 2 e a amplitude de classes h = 2, concluímos que o limite da primeira classe é 4. Portanto, a primeira classe é o intervalo 2 4. O limite inferior da segunda classe é 4. Somando-se a amplitude de classe obteremos 6. Portanto, a segunda classe é 4 6. A terceira classe por analogia é 6 8 e a quarta classe é 8 10. Comentário: Existem outros critérios para a determinação do número de classes, como por exemplo a fórmula de Sturges. Segundo Sturges, o número K de classes é dado por: K = 1 + 3,3.log n Para valores de n muito grandes, esta fórmula apresenta mais vantagens que o critério da raiz, embora apresente o mesmo problema de aproximação do valor de K. Como acreditamos que na prática a experiência do pesquisador é que na verdade vai determinar o número de classes, optamos pelo método mais simples que é o critério da Raiz. 6. Freqüência Simples de uma Classe fi: chama-se freqüência simples de uma classe ao número de elementos da seqüência que são maiores ou iguais ao limite inferior desta classe e menores que o limite superior desta classe. No exemplo utilizado, a freqüência simples da primeira classe é o número de elementos da seqüência que são maiores ou iguais a 2 e menores do que 4. Note que os valores da seqüência nestas condições são os valores 3; 2,5; 2; 3,5. Portanto, a freqüência simples da primeira classe é 4. Da mesma forma determinamos as freqüências simples das demais classes, completando o quadro representativo da variável contínua. 7. PONTO MÉDIO DE UMA CLASSE (XI): é, como o próprio nome indica, o ponto que divide o intervalo de classe em duas partes iguais. É o valor que representa a classe. 2 Ll x iii Assim, o ponto médio da Segunda classe, em nosso exemplo, é: X2 = 4 6 = 5 2 15 Exemplo de Construção de uma Variável Contínua:1 Um teste para aferir o Quociente de Inteligência em determinada classe de alunos de uma Faculdade deu origem a seqüência de valores: 111 90 121 105 122 61 128 112 128 93 108 138 88 110 112 112 97 128 102 125 87 119 104 116 96 114 107 113 80 113 123 95 115 70 115 101 114 127 92 103 78 118 100 115 116 98 119 72 125 109 79 139 75 109 123 124 108 125 116 83 94 106 117 82 122 99 124 84 91 130 A primeira preocupação que temos, na construção de uma distribuição de freqüências, é a determinação do número de classes e, conseqüentemente, da amplitude e dos limites dos intervalos de classe. Para a construção da variável contínua, devemos determinar o número deelementos da seqüência. Verificamos que a seqüência possui n = 70 elementos. Pelo critério da raiz K = n . No caso, K = 70 = 8,37. O valor inteiro mais próximo é 8. O maior valor da seqüência é Xmáx = 139 e o menor valor da seqüência é Xmín = 61. Portanto, a amplitude total da seqüência é At = 139 61 = 78. h = At = 78 =� 10 K 8 A experiência do pesquisador, nesta situação, o levaria a distribuir essa aproximação, iniciando a representação da série em 60 e terminando em 140. O comprimento do intervalo de classe é h = 10 e o número de classes é K = 8. Aproveitando o que você já conhece, complete a tabela abaixo, apresentando a distribuição de freqüências da variável contínua representativa desta série. Intervalo de Classe fi fri % Fi Fri % xi xi fi 60 70 70 80 80 90 90 100 100 110 110 120 120 130 130 140 1 E. Medeiros, V. Gonçalves, A. C. Murolo em Estatística para os cursos de Economia, Administração e Ciências Contábeis, 2ª. ed., v. 1, p. 24-25. 16 A distribuição é uma representação tabular em que colocamos na primeira coluna os Intervalos de classe e na segunda coluna os valores das freqüências simples correspondentes. A coluna “classe” tem a finalidade apenas de facilitar a referência às classes, não fazendo parte da variável contínua. Histograma - variável contínua É um conjunto de retângulos justapostos, representados em um sistema de coordenadas cartesianas cujas bases são o intervalo de classes e cujas alturas são valores proporcionais as freqüências simples correspondentes (fi ). Exemplo: Consideremos a série: Intervalo de Classe Freqüência fi F. Acumulada Fi 0 |- 2 2 |- 4 4 |- 6 6 |- 8 8 |- 10 3 6 8 5 2 3 9 17 22 24 Então o histograma assume a forma: 0 2 4 6 8 10 12 1 2 3 4 5 6 7 8 fi Int. classe Deixamos propositalmente um espaço igual a um intervalo de classe no início e no final da representação gráfica. Também não colocamos o zero no eixo horizontal, na origem do sistema, apenas, para maior clareza na representação gráfica. 17 Polígono de Freqüências – variável contínua Unindo com segmentos de reta os pontos médios dos lados superiores de cada coluna de um histograma, obtemos uma linha poligonal. Note que os pontos médios dos lados superiores de cada coluna coincidem com os pontos médios de cada intervalo de classe. Para realmente obtermos um polígono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos médios das classes anteriores a primeira e posterior à última. 0 2 4 6 8 10 12 1 2 3 4 5 6 7 8 9 fi Int. classe Polígono de Freqüência Acumulada – variável contínua É traçado marcando-se as freqüências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. 2 4 6 8 10 0 5 10 15 20 25 Fi lim. sup. int. classe Curva de Freqüências ou Curva polida: É a representação gráfica de uma distribuição por meio de uma curva regular, que procura acompanhar o mesmo traçado e a mesma área subentendida pelo polígono. Em geral, os dados coletados em uma pesquisa dizem respeito a uma amostra extraída de uma população. Se imaginarmos que a amostra está se tornando cada vez maior e que a amplitude das classes esta ficando cada vez menor, teremos um maior número de pontos no polígono e a tendência deste polígono será a de se transformar numa curva. 18 0 2 4 6 8 10 2 3 4 5 6 7 8fi Int. de classe Considerando os dados de um dos exemplos anteriores onde: “Suponhamos que a observação das notas de 30 alunos em uma prova nos conduzisse aos seguintes valores": X: 3; 4; 2,5; 4; 4,5; 6; 5; 5,5; 6,5; 7; 7,4; 2; 3,5; 5; 5,5; 8; 8,5; 7,5; 9; 9,5; 5; 5,5; 4,5; 4; 7,5; 6,5; 5; 6; 6,5; 6 Determine: a) Distribuição de freqüências (começar por 2 e usar amplitude de classe igual a 2) b) Pontos médios das classes xi c) Histograma d) Polígono de freqüências e) Calcule a média Classes fi fri % Fi Fri % xi xi fi 2 4 4 6 6 --- 8 8 10 19 EXERCÍCIOS PROPOSTOS 1) Uma empresa automobilística selecionou ao acaso, uma amostra de 40 revendedores em todo o Brasil e anotou em determinado mês o número de unidades adquiridas por estes revendedores. Observe os seguintes dados: (V.C.) 10 15 25 21 6 23 15 21 26 32 9 14 19 20 32 18 16 26 24 20 7 18 17 28 35 22 19 39 18 21 15 18 22 20 25 28 30 16 12 20 Determine: a) Amplitude total b) Distribuição de freqüências (começar por 5 e usar amplitude de classe igual a 5) c) Pontos médios das classes xi d) Histograma e) Polígono de freqüências. f) Calcule a média 2) Considere os dados obtidos pelas medidas das alturas de100 pessoas, dadas em cm. 151 152 154 155 158 159 159 160 161 161 161 162 163 163 163 164 165 165 165 166 166 166 166 167 167 167 167 167 168 168 168 168 168 168 168 168 168 168 169 169 169 169 169 169 169 170 170 170 170 170 170 170 171 171 171 171 172 172 172 173 173 173 174 174 174 175 175 175 175 176 176 176 176 177 177 177 177 178 178 178 179 179 180 180 180 180 181 181 181 182 182 182 183 184 185 186 187 188 190 190 Pede-se: ( para a V.C.) a) Amplitude total b) Distribuição de freqüências (iniciar por 150 e usar amplitude de classe igual a 5) c) Histograma d) Polígono de freqüências e) Qual a porcentagem de elementos da classe: 170 cm e menores que 175 cm? f) Qual a porcentagem de elementos menores que 175 cm? g) Qual a porcentagem de elementos menores que 180? l) Calcule a média das alturas 20 3) Uma auditoria em uma grande empresa observou o valor de 50 notas fiscais emitidas durante um mês. Esta amostra apresentou os seguintes valore em reais: 15.315,00 23.440,00 6.551,00 13.253,00 25.312,00 35.780,00 42.320,00 34.782,00 27.435,00 17.661,00 20.414,00 23.313,00 26.432,00 30.515,00 27.610,00 8.598,00 12.417,00 22.300,00 25.400,00 21.200,00 16.820,00 38.000,00 40.300,00 15.800,00 18.300,00 21.780,00 32.414,00 32.000,00 18.700,00 19.600,00 22.540,00 22.010,00 30.000,00 21.380,00 24.780,00 29.000,00 30.400,00 12.319,00 36.728,00 36.483,00 27.312,00 35.318,00 18.620,00 38.661,00 40.681,00 19.302,00 23.300,00 21.350,00 28.412,00 21.313,00 Determine: (V.C.) a) Distribuição de freqüências(começar por 6551e usar amplitude de classe igual a 5110) b) Pontos médios das classes xi c) Histograma d) Polígono de freqüências e) Calcule a Média 4) Considere os dados obtidos pelas medidas das estaturas, dadas em cm. 166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153157 156 158 158 161 Determine: (V.C.) a) Distribuição de freqüências (iniciar por 150 e usar amplitude de classe igual a 4) b) Pontos médios das classes xi c) Qual a percentagem de alunos cujas estaturas são inferiores a 154 cm? d) Quantos alunos têm estatura abaixo de 162 cm? e) Qual a percentagem de alunos cujas estaturas são inferiores a 162 cm? f) Qual o limite superior da 2ª classe. g) Qual o limite inferior da 4ª classe. h) Qual o ponto médio da 3ª classe. k) Calcule a média 21 5) Complete o quadro e calcule a média das idades: Idade (anos) xi Número de Alunos fi fri % Fi Fri % 2 16 5 24,00 8 57,00 10 76 13 200 6) Complete os dados que faltam na distribuição de freqüência: CLASSES fi xi fri% Fi Fri 0|-2 4 1 4,00 2|-4 8 4|-6 5 18,00 30 27 7 27,00 8|-10 15 72 10|-12 83 10 13 10,00 93 14|-16 7,00
Compartilhar