Baixe o app para aproveitar ainda mais
Prévia do material em texto
Distribuição de Frequência – Variável Discreta É uma representação tabular de um conjunto de valores em que colocamos na primeira coluna em ordem crescente apenas os valores distintos de série e na segunda coluna, colocamos os valores das frequências simples correspondentes. xi fi 2 3 3,5 4 4,5 5 1 5 6 10 4 4 CONSTRUÇÃO DA VARIÁVEL DISCRETA A construção de uma variável discreta é bastante simples. Bastam observar quais são os elementos distintos da sequência, ordená-los, e colocá-los na primeira coluna da tabela. Exemplo de construção de uma variável discreta: A sequência abaixo representa a observação do número de acidentes por dia, em uma rodovia, durante 20 dias. X: Os valores distintos da sequência são: 0, 1, 2, 3. As frequências simples respectivas são: 8, 5, 5, 2. xi Fi 0 1 2 3 8 5 5 2 0 2 0 1 1 0 0 0 3 2 1 0 1 2 0 1 3 2 2 0 OBSERVAÇÕES: (1) Note que a coloração de um índice i para x e para f tem a finalidade de referência. Deste modo, x1 representa o primeiro valor distinto da série, x2 representa o segundo valor distinto da série, f1 representa a frequência simples do primeiro valor distinto da série, f2 representa a frequência simples 20 valor distinto da série e assim sucessivamente (2) Note que conseguiremos reduzir de 30 elementos que constituíram a série original para apenas 12 elementos. (3) Note também que a variável discreta só é uma forma eficiente de redução dos dados, quando o número de elementos distintos da série for pequeno. DEVEMOS OPTAR POR UMA VARIÁVEL DISCRETA NA REPRESENTAÇÃO DE UMA SÉRIE DE VALORES, QUANDO O NÚMERO DE ELEMENTOS DISTINTOS DA SÉRIE FOR PEQUENO. DISTRIBUIÇÃO DE FREQÜÊNCIA – VARIÁVEL CONTÍNUA Suponha que a observação das notas de 30 alunos em uma prova nos conduzissem aos seguintes valores: 6,5 5,0 6,0 6,5 6,0 3,0 4,0 2,5 4,0 4,5 6,0 5,0 5,5 6,5 7,0 7,5 2,0 3,5 5,0 5,5 8,0 8,5 7,5 9,0 9,5 5,0 5,5 4,5 4,0 7,5 Classes Notas Fi 1 2 3 4 [2;4[ [4;6[ [6;8[ [8;10[ 4 12 10 4 Observando estes valores notamos grande número de elementos distintos, o que significa que neste caso a variável discreta não é aconselhável na redução de dados. Nesta situação é conveniente agrupar os dados por faixas de valores. Esta apresentação da série de valores é denominada variável contínua. DEVEMOS OPTAR POR UMA VARIÁVEL CONTÍNUA NA REPRESENTAÇÃO DE UMA SÉRIE DE VALORES QUANDO O NÚMERO DE ELEMENTOS DISTINTOS DA SÉRIE FOR GRANDE. CONSTRUÇÃO DA VARIÁVEL CONTÍNUA A construção da variável contínua requer o conhecimento de alguns conceitos que vamos estabelecer aproveitando a tabela abaixo como exemplo: 3,0 4,0 2,5 4,0 4,5 6,0 5,0 5,5 6,5 7,0 7,5 2,0 3,5 5,0 5,5 8,0 8,5 7,5 9,0 9,5 5,0 5,5 4,5 4,0 7,5 6,5 5,0 6,0 6,5 6,0 Classes Notas fi 1 2 3 4 [2;4[ [4;6[ [6;8[ [8;10[ 4 12 10 4 Nomes dos dados que compõem a tabela de freqüências 1. CLASSE: são intervalos de variações das variáveis. As classes são representadas simbolicamente por i, sendo i = 1, 2, 3, ..., k (onde k é o número total de classes da distribuição). 1.1. AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT): é a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo): AT = L (max.) - l (min.). OBS: utilizamos sempre a amplitude amostral. 1.1.2 AMPLITUDE AMOSTRAL (AA): é a diferença entre o valor máximo e o valor mínimo da amostra: AA = L (max) - l (min). A amplitude total da distribuição, jamais coincide com a amplitude amostral. A amplitude total representa o comprimento total da seqüência e é dada na mesma unidade de medida dos dados da seqüência. 1.1.3. INTERVALO DE CLASSE: é qualquer subdivisão da amplitude total de uma série estatística. No exemplo da tabela subdividimos a amplitude total em quatro classes, obtendo os intervalos de classe [2; 4[ , [4; 6[ , [6; 8[ , [8; 10[. Note que na realidade não trabalhamos com a At = 7,5 e sim com a amplitude total ajustada para 8. 1.1.4. LIMITE DE CLASSE: são chamados de limites de classes os extremos de uma classe. Sendo que o menor número é o limite inferior (li) e o maior número o limite superior da classe. Uma classe é representada por: Li. 1.1.5 AMPLITUDE DE UM INTERVALO DE CLASSE: é a medida do intervalo que define a classe. Ela é obtida pela diferença entre os limites superior e inferior dessa classe (hi = Li - li). OBSERVAÇÕES * Na realidade, as classes não precisam necessariamente ter a mesma amplitude como no exemplo acima. Porém, sempre que possível, devemos trabalhar com classes de mesma amplitude. Isto facilita sobremaneira os cálculos posteriores. * Note também que usamos para representar as classes, intervalos reais semi-abertos à direita. Isto significa que o intervalo contém o limite inferior, mas não contém o limite superior, ou seja, o intervalo contém os valores iguais ou maiores do que 2 e menores do que 4. Sendo assim, o último intervalo da série que é [8; 10[ , não contém o valor 10. É por isso que não utilizamos a amplitude 7,5, pois se isto fosse feito, o limite superior da última classe seria 9,5 e como o limite superior não deve pertencer à classe, o elemento 9,5 da seqüência estatística original ficaria sem classificação. Como vamos utilizar este critério, precisaremos ajustar sempre o valor máximo da série ao definir a amplitude total. Outros critérios poderiam ser adotados como o intervalo real semi-aberto à esquerda ou mesmo o intervalo real aberto, mas nenhum destes critérios é melhor que o critério adotado. 1.2 NÚMERO DE CLASSES – INTERVALOS DE CLASSE Serve para limitar o tamanho da tabela que contém os dados coletados na pesquisa. O número de classes a ser utilizado depende muito da experiência do pesquisador e das questões que ele pretende responder com a variável contínua. Isto pode ser verificado facilmente pelo próprio interessado ao longo desta exposição. Temos em mão duas formas para determinar o número de classes de uma distribuição. Se a sequência estatística contém n elementos e se indicarmos por K o número de classes a ser utilizado, então pelo critério da raiz. K = n Como o número K de classes deve ser necessariamente um número inteiro e como dificilmente n , é um número inteiro, deixaremos como opção para o valor de K o valor inteiro mais próximo de n , uma unidade a menos ou a mais que este valor. No exemplo das trinta notas, n = 30 e consequentemente K = 30 = 5,477, portanto o valor inteiro mais próximo de 30 é 5. As opções para K então são: 4 ou 5 ou 6. A amplitude do intervalo de classe que designamos por h é denominada da seguinte forma: h = At K e, portanto h = 8 4 = 2 Observe que a opção por quatro classes, foi feita em função de um valor de h mais fácil de se operar. Existem outros critérios para a determinação do número de classes, como por exemplo, a fórmula de STRURGES: Essa fórmula é muito boa para valores de n muito grandes, esta fórmula apresenta mais vantagens que o critério da raiz, embora apresente o mesmo problema de aproximação do valor de K. Como acreditamos que na prática a experiência do pesquisador é que na verdade vai determinar o número de classes, optamos pelo método mais simples que é o critério da raiz. Quando já sabemos o número de classe, só nos resta resolver o problema da determinação da amplitude do intervalo de classe, o que conseguimos dividindo a amplitude total pelo número de classes. EXEMPLO DE CONSTRUÇÃO DE UMA VARIÁVEL CONTÍNUA Um teste para aferir o Quociente de Inteligência em determinada classe de alunos de uma faculdade deu origem asequência de valores X: K = 1 + 3,3. log n 111 90 121 105 122 61 128 112 128 93 108 138 88 110 112 112 97 128 102 125 87 119 104 116 96 114 107 113 80 113 123 95 115 70 115 101 114 127 92 103 78 118 100 115 116 98 119 72 125 109 79 139 75 109 123 124 108 125 116 83 94 106 117 82 122 99 124 84 91 130 Para a construção da variável contínua, devemos determinar o número de elementos da sequência. Verificamos que a sequência possui n = 70 elementos. Pelo critério da raiz K = 70 = 8,37. O valor inteiro mais próximo é 8. Portanto, temos opção para construir a variável contínua com 7 ou 8 ou 9 classes. O maior valor da sequência é L(máx)= 139 e o menor valor da sequência é l(mín)= 61. Sendo assim, a amplitude total da sequência é At = 139 – 61 = 78. No entanto, sabemos que pelo fato de o critério adotado do intervalo de classe ser semi- aberto à direita, devemos ajustar o valor L(máx). Se ajustássemos L(máx) para 140, a amplitude ajustada passaria a ser At = 140 – 61 = 79. Este valor não é divisível de forma inteira nem por 7 nem por 8 nem por 9, que são nossas opções de classes. Nesta situação devemos ajustar L(máx) para 141 obtendo a At = 141 – 61 = 80 que é divisível exatamente por 8, obtendo-se uma amplitude de intervalo de classe h dada por: h = At K = 80 8 =10 Observe que o ajuste foi de 2 unidades passando de 139 para 141. Assim o comprimento do intervalo de classe é h = 10 e o número de classes é K = 8. Computando as frequências simples de cada classe, construímos a variável contínua desta série. A variável contínua é conceituada como uma representação tabular em que colocamos na primeira coluna os intervalos de classe e na segunda coluna os valores das frequências simples correspondentes. A coluna “classe” tem a finalidade apenas de facilitar a referência às classes, não fazendo parte da variável contínua. O quadro final tanto da variável discreta como da variável contínua recebe o nome de distribuição de frequência. Mas o processo dado é ainda muito inconveniente, já que existe muito espaço, mesmo quando o número da variável (n) é de tamanho razoável. Sendo possível, a solução mais aceitável, pela própria natureza da variável contínua, é o agrupamento dos valores em vários intervalos denominados de classes. 2 - DISTRIBUIÇÃO DE FREQUÊNCIA – VARIÁVEL DISCRETA Uma vez que tenhamos colocado os dados na forma de uma distribuição, ele poderá rapidamente obter algumas informações adicionais e úteis para a compreensão da série, se considerar os seguintes conceitos: 2.1 TIPOS DE FREQUÊNCIAS 2.1.1 DISTRIBUIÇÃO DE FREQUÊNCIA (fi): denomina-se frequência o número de vezes que um determinado valor se repete. Uma tabela assim formada recebe o nome de distribuição de frequência. Σ fi = n 2.1.2 DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALOS DE CLASSES: Quando se trata de variáveis discretas de variação relativamente pequena, cada valor pode ser tomado como um intervalo de classe (intervalo degenerado) e, nesse caso, a distribuição é chamada distribuição sem intervalos de classe, tomando a seguinte forma: OBS: Se a variável toma numerosos valores distintos, é comum trata-la como uma variável contínua, formando intervalos de classe de amplitude diferente de um. Esse tratamento (arbitrário) abrevia o trabalho, mas acarreta algumas perdas de precisão. 2.1.3 FREQUÊNCIA RELATIVA (fri): são os valores das razões entre as frequências simples e a frequência total: fri = fi fi∑ “As frequências relativas possuem o propósito de permitir a análise ou de facilitar as comparações”. 2.1.4 FREQUÊNCIA ACUMULADA (Fi): é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma dada classe: Fk =f1 +f2 +f3 +...+ fk ou Fk = Σfi (i=1,2,3,...,k) 2.1.5 FREQUÊNCIA ACUMULADA RELATIVA (Fri): é a frequência acumulada da classe, ou seja, é a soma dos valores da frequência relativa. Fri = fr1 + fr2 + ... + frk Exemplo: Seja x a variável "número de cômodos das casas ocupadas por vinte famílias entrevistadas": 3 - DISTRIBUIÇÃO DE FREQÜÊNCIAS – VARIÁVEL CONTÍNUA No caso da variável contínua, pelo fato de termos intervalos de classe, semi-aberto à direita, as interpretações são diferentes. Portanto é necessário redefinirmos esse tipo de freqüência. Exemplo: Considere a distribuição de freqüência abaixo: DISCIPLINA: MÉTODOS QUANTITATIVOS PROFESSORA: KASSELANDRA SOARES ATENÇÃO: Observe as condições de nossas variáveis. Cada um dos diferentes objetos da nossa tabela nos permitirá fazer análises e por isso, as denominamos por variáveis. Algumas variáveis, como estado civil, cor dos olhos, cor dos cabelos, apresentam como resultado uma qualidade, atributo ou preferência da pessoa entrevistada. Variáveis dessa natureza recebem o nome de variáveis qualitativas. (as respostas correspondem às realizações dessa variável). Outras variáveis, como idade, peso, altura, apresentam como resposta um número, resultante, nesse exemplo, de mensuração. Variáveis assim definidas são chamadas variáveis quantitativas. Cabe ressaltar, por fim, que se os pesquisadores tivessem perguntando: “Quantas vezes por semana você costuma ir ao cinema?”, teríamos como objeto de estudo uma variável quantitativa, cujos valores assumidos são resultantes de contagens. EXERCÍCIOS 1) Qual é o objetivo de agrupados por frequência? _____________________________________________________________________ _____________________________________________________________________ 2) O que é uma variável discreta? _____________________________________________________________________ 3) Qual é a característica de um conjunto de dados que indique o uso de uma variável discreta ao se agrupar os dados por frequência? _____________________________________________________________________ 4) O que é uma variável contínua? _____________________________________________________________________ 5) Qual é a característica de um conjunto de dados que indique o uso de uma variável contínua ao se agrupar os dados por frequência? 6) Uma pesquisa sobre a idade, em anos de uma classe de calouros de uma faculdade, revelou os seguintes valores: 18 – 17 – 18 – 20 – 21 – 19 – 20 – 18 – 17 – 19 – 20 – 18 – 19 -18 – 19 – 21 – 18 – 19 – 18–18–19–19-21- 20-17-19-19-18-18-19-18-21-18-19-19-20-19 - 18 - 19 - 20 - 19 - 19 - 19 - 18 - 20 - 20-18-19-18-18 Agrupe, por frequência, estes dados. 7) Uma empresa automobilística selecionou ao acaso, uma amostra de 40 revendedores autorizados em todo o Brasil e anotou em determinado mês o número de unidades adquiridas por estes revendedores. Obtiveram os seguintes dados: Agrupe, por frequência, estes dados. Organize os dados em uma tabela de frequência. 8) Uma indústria embala peças em caixas com 100 unidades. O controle de qualidade selecionou 38 caixas na linha de produção e anotou em cada caixa o número de peças defeituosas. Obtiveram os seguintes dados: 2 0 0 4 3 0 0 1 0 0 11 2 1 1 1 1 1 1 0 1 2 0 2 0 0 0 0 0 0 0 0 0 0 0 0 1 0 Agrupe, por frequência, estes dados. 9) Uma organização de consumidores pesquisou o preço de um mesmo aparelho eletrodoméstico em 35 pontos de venda. Os resultados obtidos, em reais, foram: 234 355 238 345 248 274 328 280 225 299 345 254 350 283 300 332 299 285 300 310 280 275 285 285 320 296 324 315 300 294 285 349 252 280 285 a) Qual a diferença entre o maior e o menor preço? b) Que porcentagem a diferença representa em relação ao menor preço? _________________________________________________________________ _____ c) Reorganize esses dados em classes de amplitude igual a 25reais e calcule as frequências. 10) As tabelas abaixo mostram o montante de pagamentos efetuados em um banco durante um dia: Montante (R$) fi xi fri(%) Fi Fri(%) [500, 1000[ 28 [1000, 1500[ 12 [1500, 2000[ 32 [2000, 2500[ 50 [2500, 3000[ 38 [3000, 3500[ 32 [3500, 4000[ 7 a) Calcule as frequências acumuladas e as frequências acumuladas relativas, b) Quantos pagamentos foram inferiores a R$ 2.000,00? c) Qual a porcentagem aproximada de pagamentos inferiores a R$ 3.500,00. 11) A altura dos 40 alunos de uma classe é dada pela tabela abaixo: Altura (cm) Ponto médio(xi) fi fri (%) Fi [146,150[ 10 [150,154[ 7 [154,158[ 25 [158,162[ 12,5 [162,166[ 164 [166,170[ 15 40 a) Quantos alunos têm uma altura até 1,62 m? E até 1,70 m?
Compartilhar