Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Estatística 4ª Aula Profa. Rossana Silva rsilva5@area1.edu.br Distribuição de Freqüência 1 Tópicos Tabela primitiva Suponhamos termos feito uma coleta de dados relativos à estaturas de quarenta alunos, que compõem uma amostra dos alunos de um colégio A, resultando a seguinte tabela de valores. A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva. Dados Brutos Exemplo: tabela da pesquisa do IMC Rol Partindo desses dados, é difícil averiguar em torno de que valor tendem a se concentrar as estaturas, qual a menor ou a maior estatura, etc... A maneira mais simples de organizar os dados é através de uma certa ordenação (crescente ou decrescente). A tabela obtida após a ordenação dos dados recebe o nome de rol. Ordem crescente No Excel – Recurso Classificar e Filtrar Exemplo: Observe as informações da Tabela 5.2. (rol) e responda: É uma forma eficiente de apresentação de dados? E se fossem pesquisados 1.000 alunos? Vamos agora verificar como fica quando utilizamos a Distribuição de frequência. Distribuição de Frequência Distribuição de Frequência A DISTRIBUIÇÃO DE FREQUÊNCIA É UMA FORMA EFICIENTE E ADEQUADA PARA RESUMIR INFORMAÇÕES. Distribuição de Frequência Denominamos frequência (f) o número de alunos que fica relacionado a um determinado valor da variável. Obtemos, assim, uma tabela que recebe o nome de distribuição de frequência: Mas o processo dado ainda é inconveniente, já que exige muito espaço. Sendo possível, a solução mais aceitável, pela própria natureza da variável contínua, é o agrupamento dos valores em vários intervalos. Desse modo, estaremos agrupando os valores da variável em intervalos, sendo que, em Estatística, preferimos chamar os intervalos de classes. Chamando de frequência de uma classe o número de valores da variável pertencente à classe, os dados podem ser dispostos como segue, numa tabela denominada distribuição de frequência com intervalos de classes. Distribuição de Frequência Distribuição de Frequência com intervalos de classe Distribuição de frequência Elementos de uma distribuição de frequência Classes de frequência ou, simplesmente, classes, são intervalos de variação da variável. As classes são representadas simbolicamente por i, sendo i = 1, 2, 3, ..., k (onde k é o número total de classes de distribuição). 1. Classe 3ª Classe, i=3 K=6 2. Limites de classe Denominamos limites de classe os extremos de cada classe. O menor número é o limite inferior da classe (li) e o maior número, o limite superior da classe (Li). l3 =158 e L3= 162 3. Amplitude de um intervalo de classe Amplitude de um intervalo de classe, ou simplesmente intervalo de classe, é a medida do intervalo que define a classe. Ela é obtida pela diferença entre os limites superior e inferior dessa classe e indicada por hi. l3 =158 e L3= 162 h3=162-158 h3=4 cm 4. Amplitude Total da Distribuição Amplitude total da distribuição (AT) é a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo). Lmax = 174 lmin = 150 AT = 174-150 AT = 24 cm 5. Amplitude Amostral Amplitude amostral (AA) é a diferença entre o valor máximo e o valor mínimo da amostra: AA = 173 – 150 AA = 23 cm 6. Ponto médio de uma classe Ponto médio de uma classe (xi) é, como o próprio nome indica, o ponto que divide o intervalo de classe em duas partes iguais. Para obtermos o ponto médio de uma classe, calculamos a semi-soma dos limites da classe: X3 = 162 +158 2 X3 = 160 7. Frequência simples ou absoluta Frequência simples ou frequência absoluta ou, simplesmente, frequência de uma classe ou de um valor individual é o número de observações correspondentes a essa classe ou a esse valor. A frequência simples é simbolizada por fi. f2 = 9 Números de Classes – Intervalos de classe A primeira preocupação que temos, na construção de uma distribuição de frequência, é a determinação do número de classes e, consequentemente, da amplitude e dos limites dos intervalos de classe. Para a determinação do número de classes de uma distribuição podemos lançar mão da regra de Sturges, que nos dá o número de classes em função do número de valores da variável: n – número de valores Capa da Obra Essa regra nos permite obter a seguinte tabela, de acordo com o exemplo trabalhado nesse capítulo: Lembrando: no exemplo tínhamos 40 alunos Número de classes: 6 Números de Classes – Intervalos de classe Além da regra de Sturges, existem outras fórmulas empíricas que pretendem resolver o problema da determinação do número de classes que deve ter a distribuição. Entretanto, a verdade é que essas fórmulas não nos levam a uma decisão final; esta vai depender, na realidade, de um julgamento pessoal, que deve estar ligado à natureza dos dados, da unidade usada para expressá-los, etc... Números de Classes – Intervalos de classe Decidido o número de classes que deve ter a distribuição, resta-nos resolver o problema da determinação da amplitude do intervalo de classe, o que conseguirmos dividindo a amplitude amostral pelo número de classes: h = 173-150 =3,8 cm 6 h =4 cm Atenção: Apenas neste caso sempre arredondar para mais. Exercício 1. Dispor os números 17, 45, 38, 27, 6, 48, 11, 57, 34, 22 em um rol. Determine a amplitude total amostral. Exercício Capa da Obra Tipos de frequências Frequências simples ou absolutas (fi) são os valores que realmente representam o número de dados de cada classe. Capa da Obra Frequências relativas (fri) são os valores das razões entre as frequências simples e a frequência total: Qual a frequência relativa a terceira classe? fr3 = 11/40 = 0,275 ou 27,5% Capa da Obra Frequência acumulada (Fi) é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma dada classe: F3 = f1 + f2 + f3 F3 = 4 + 9 + 11 F3 = 24 Frequência acumulada relativa (Fri) de uma classe é a frequência acumulada da classe, dividida pela frequência total da distribuição: Fr3 = 24/40 Fr3 = 0,6 F3 = f1 + f2 + f3 F3 = 4 + 9 + 11 F3 = 24 Distribuição de frequência sem intervalos de classe Quando se trata de variável discreta de variação relativamente pequena, cada valor pode ser tomado como um intervalo de classe (intervalo degenerado) e, nesse caso, a distribuição é chamada distribuição sem intervalos de classe, tomando a seguinte forma: Distribuição de frequência sem intervalos de classe Distribuição de frequência sem intervalos de classe 4 Correção Exercício Representação gráfica de uma distribuição Uma distribuição de frequência pode ser representada graficamente pelo histograma, pelo polígono de frequência e pelo polígono de frequência acumulada. Histograma O histograma é formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. As larguras dos retângulos são iguais às amplitudes dos intervalos de classe. As alturas dos retângulos devem ser proporcionais às frequências das classes, sendo a amplitude dos intervalos iguais. Histograma Polígono de frequência O polígono de frequência é um gráfico em linha, sendo as frequências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe. Para obter um polígono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição. Polígono de frequência À distribuição da Tabela 5.6 corresponde o seguinte polígono de frequência: Assim, à distribuição da Tabela 5.6 corresponde o seguinte polígono de frequência acumulada: Polígono de frequência acumulada O polígono de frequência acumulada é traçado marcando-se as frequências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. Polígono de frequência acumulada Assim, à distribuição da Tabela 5.6 corresponde o seguinte polígono de frequência acumulada: A curva de frequência A curva de frequência. Curva polida Como, em geral, os dados coletados pertencem a uma amostra extraída de uma população, podemos imaginar as amostras tornando-se cada vez mais amplas e a amplitude das classes ficando cada vez menor, o que nos permite concluir que a linha poligonal tende a se transformar numa curva _ a curva de frequência. Podemos dizer que enquanto o polígono de frequência nos dá a imagem real do fenômeno estudado, a curva de frequência nos dá a imagem tendencial. A curva de frequência. Curva polida Assim, após o traçado de um polígono de frequência, é desejável que se faça um polimento, de modo a mostrar o que seria tal polígono com um número maior de dados. Esse procedimento não nos dará uma certeza absoluta de que a curva obtida _ a curva polida _ seja tal qual a curva resultante de um grande número de dados. Podemos, porém, afirmar que ela se assemelha mais à curva de frequência do que ao polígono de frequência obtido de uma amostra limitada. O polimento, geometricamente, corresponde à eliminação dos vértices da linha poligonal. Consegue-se isso com o emprego de uma fórmula bastante simples, a qual, a partir das frequências reais, nos fornece novas frequências _ frequências acumuladas _ que se localizarão, como no polígono de frequência, nos pontos médios. A curva de frequência A curva de frequência. Curva polida A fórmula que nos dá a frequência calculada (fci) é: A curva de frequência. Curva polida A curva de frequência. Curva polida As formas das curvas de frequência Curvas em forma de sino As curvas em forma de sino caracterizam-se pelo fato de apresentarem um valor máximo na região central. São muitos os fenômenos que oferecem distribuições em forma de sino: a estatura de adultos, o peso de adultos, etc... Distinguimos a curva em forma de sino simétrica e assimétrica. As formas das curvas de frequência - Curva simétrica Essa curva se caracteriza por apresentar o valor máximo no ponto central e os pontos equidistantes desse ponto terem a mesma frequência. Em forma de Sino As formas das curvas de frequência - Curva assimétrica Na prática, não encontramos distribuições perfeitamente simétricas. As distribuições obtidas de medições reais são mais ou menos assimétricas, em relação á frequência máxima. Assim, as curvas correspondentes a tais distribuições apresentam a cauda de um lado da ordenada máxima mais longa do que do outro. - Curva assimétrica Se a cauda mais alongada fica à direita, a curva é chamada assimétrica positiva ou enviesada à direita. Se a cauda se alonga à esquerda, a curva é chamada assimétrica negativa ou enviesada à esquerda. Assimetria + Assimetria - As formas das curvas de frequência Curvas em forma de jota As curvas em forma de jota são relativas a distribuições extremamente assimétricas, caracterizadas por apresentarem o ponto de ordenada máxima em uma das extremidades. As formas das curvas de frequência Curvas em forma de U As curvas em forma de U são caracterizadas por apresentarem ordenadas máximas em ambas as extremidades. As formas das curvas de frequência Distribuição retangular Essa distribuição, muito rara na verdade, apresenta todas as classes com a mesma frequência. Curva de frequência Bimodal Quando a curva de frequência tem dois máximos Curva de frequência Multimodal Quando a curva de frequência tem mais de dois máximos
Compartilhar