Baixe o app para aproveitar ainda mais
Prévia do material em texto
Histogramas e polígonos José Tadeu de Almeida Introdução Nesta aula, descreveremos algumas formas de apresentação gráfica de dados. A Estatística Descritiva, por meio de suas metodologias de análise, tem por objetivo realizar deduções e con- clusões a respeito de determinados fenômenos e sua ocorrência. Assim, a forma correta de sua expressão torna viável a compreensão precisa de eventos estatísticos. Estudaremos, dentre estas apresentações, os histogramas e polígonos de frequências. Objetivos de aprendizagem Ao final desta aula, você será capaz de: • entender o que são histogramas e polígonos de frequências. 1 Histograma Nesta aula, utilizaremos um referencial de aplicação para os estudos que desenvolveremos. Para isso, suponha que estamos verificando a altura de um grupo de cinquenta alunos de uma escola. A partir destes dados, elaboramos uma tabela de distribuição de frequências, que nos mostra o número de vezes que cada dado é observado dentro de uma classe, sendo a classe definida pelo intervalo de variação de uma variável (CRESPO, 2005): Tabela 1 - Frequência por intervalos Altura Frequência 110 ˫ 114 6 115 ˫ 119 11 120 ˫ 124 6 125 ˫ 129 5 130 ˫ 134 3 135 ˫ 139 5 140 ˫ 144 7 145 ˫ 149 7 Fonte: elaborada pelo autor, 2017. O histograma pode ser definido como uma forma de apresentação gráfica de dados, organi- zadas em um conjunto de retângulos dispostos em um gráfico de colunas, de modo que a altura destes retângulos corresponda à frequência, e os pontos médios coincidam com os pontos médios dos intervalos de classe. 2 Representação de um histograma O histograma associado à tabela de frequências por intervalos (ilustrada na figura anterior) pode ser visualizado a seguir. Figura 1 – Histograma 6 11 6 5 3 5 7 7 0 2 4 6 8 10 12 14 110 ˫ 114 115 ˫ 119 120 ˫ 124 125 ˫ 129 130 ˫ 134 135 ˫ 139 140 ˫ 144 145 ˫ 149 Fr eq uê nc ia Classes Fonte: elaborada pelo autor, 2017. Você pode perceber que, no histograma, normalmente as classes possuem a mesma ampli- tude (na figura 1, todas são iguais a 4: 110 a 114, 115 a 119...), de modo que a altura de cada retân- gulo é proporcional à sua frequência em relação àquela classe. Um histograma permite verificar com precisão a distribuição de frequências associadas a uma variável, identificando tendências sobre os dados coletados. No histograma ilustrado, vemos que a amplitude total da frequência de dados, calculada pela diferença entre o limite superior da última classe e o limite inferior da primeira classe, tem valor 149 – 110 = 39. SAIBA MAIS! Para aprofundar seus conhecimentos, leia o artigo “Utilizando o histograma como uma ferramenta estatística de análise da produção de água tratada de Goiânia”, dis- ponível em: <http://estprob.pbworks.com/w/file/fetch/53332540/artigo-histograma- -capacidade-proc.pdf>. Por consequência, o ponto que divide as classes em duas partes iguais, com a mesma amplitude, é dado por ( )149 - 110 2 = 129,5. Observamos que mais da metade dos dados está localizada no “lado esquerdo” do histograma, demonstrando que, dentro da amplitude total da distribuição de frequências, há mais alunos com menos da metade da altura máxima, definida pelo limite superior da última classe, uma vez que há 28 alunos com menos de 129,5 cm, e apenas 22 com mais de 129,5 cm. 3 Polígono de frequência O polígono de frequência é uma forma de apresentação gráfica de dados que permite ao pesquisador observar a frequência de dados de uma variável, por meio de um gráfico em linha. Ele é obtido na ligação dos pontos formados pelo ponto médio dos intervalos de classe, no eixo horizontal e as frequências observadas (no eixo vertical) (CRESPO, 2005). A partir desta avaliação, pode-se também visualizar o comportamento dos dados associados à variável; se eles tendem mais para a esquerda, para as classes inferiores, ou para a direita nas classes superiores, ou se são distribuídos proporcionalmente à média das classes, por exemplo. Um polígono de frequência, ainda, permite a observação da amplitude total da distribuição de frequências. É importante enfatizar que, para que o polígono (que é uma figura fechada) seja visualizado, é feito um ‘arremate’ nos seus limites inferior e superior, por meio da ligação dos pontos extremos das linhas obtidas aos pontos médios das classes anterior à primeira e posterior à última, ou seja, são clas- ses que não existem em sua tabela, mas são usadas para viabilizar a análise, criando-se o polígono. FIQUE ATENTO! Não traz impacto à análise atribuir, nos pontos extremos dos limites das classes, duas classes que possuam frequência zero, uma vez que uma classe que não exis- te não tem nenhuma frequência. 4 Representação de um polígono de frequência Um polígono de frequência associado à tabela de frequências por intervalo (citada no início da aula) pode ser visualizado na figura a seguir, na qual os pontos médios são representados no eixo horizontal e as frequências no eixo vertical. Figura 2 – Polígono de frequência 0 2 4 6 8 10 12 107 112 117 122 127 132 137 142 147 152 Fonte: elaborada pelo autor, 2017. Um polígono de frequência permite analisar as tendências de distribuição dos dados e frequências associados a uma variável de estudo; podemos verificar que os dados coletados concentram-se na metade inferior (ou esquerda) do plano de frequências, indicando que há uma concentração de dados abaixo da média relacionada à variável de pesquisa. 5 Polígono de frequência acumulada Um polígono de frequência acumulada mede as chamadas frequências acumuladas de dados associados a uma variável, que são a soma das frequências associadas a uma variável de maneira acumulada, ou seja, trata-se de somas que vão sendo realizadas à medida que são adicio- nadas classes a este somatório. EXEMPLO Utilizando o exemplo que estamos estudando, a frequência associada à primeira classe (consulte a tabela 1) tem o valor seis. Assim, a frequência acumulada das classes 1 e 2 é dada por 6 + 11 = 17. Para a terceira classe, o valor da frequência acumulada é de 17 + 6 = 23, e assim por diante, até que a frequência acumulada da última classe atinja 100% dos dados, ou seja, 50. Observe a tabela: Tabela 2 - Frequências acumuladas Altura Frequência acumulada 109 0 114 6 119 17 124 23 129 28 134 31 139 36 144 43 149 50 Fonte: elaborada pelo autor, 2017. O polígono de frequências acumuladas tenderá ao valor máximo no ponto relacionado à última classe, pois a frequência acumulada será correspondente ao total das frequências, ou 100% de frequência acumulada. Observe a figura a seguir, relativo ao nosso exemplo. Figura 3 – Gráfi co de frequências acumuladas 0 10 20 30 40 50 60 109 114 119 124 129 134 139 144 149 Frequência acumulada Fonte: elaborada pelo autor, 2017. SAIBA MAIS! Quando há um certo número de classes à direita, com uma frequência baixa, veremos que o polígono de frequências exibirá uma tendência de tornar-se uma reta. Isto é comum, por exemplo, quando analisamos os salários da população: como a parcela de pessoas que ganham altos salários é muito pequena, estas classes têm uma frequência bastante pequena em relação às classes de salários menores. A apresentação do polígono de frequências acumuladas é útil para verificarmos as concentrações das frequências em torno de determinadas classes. 6 Curvas de frequências Quando analisamos um polígono de frequências, observamos que ele nos traz os dados brutos associados às frequências. Para amostras e classes pequenas, como as que estamos utilizando, a tendência é que este polígono apresente arestas bem defi nidas. Porém, à medida que a amostra se amplia, estes ‘lados’ do polígono vãotendendo a tornarem-se mais oblíquos, formando curvas – as chamadas curvas de frequências. A curva de frequências mostra uma imagem tendencial da série de dados, enquanto o polígono de frequências mostra a imagem real dos mesmos (CRESPO, 2005). Esta operação de ‘polimento’ dos dados, ou seja, de remoção das ‘arestas’, é dada adicio- nando-se frequências àquelas observadas na tabela de distribuição de frequências, conhecidas como frequências calculadas, que se localizam nos pontos médios das frequências observadas, de acordo com a equação: i-1 i i+1 i f + 2f + fi-1 i i+1f + 2f + fi-1 i i+1fc =ifc =i 4 Em que: fci corresponde à frequência calculada da classe i; fi–1 é a frequência da classe imediata- mente anterior à classe i, dada por fi; e fi +1 é a frequência da classe imediatamente posterior à classe i. Assim, estamos dividindo quatro frequências por 4, identifi cando o ponto médio, que corres- ponde à frequência acumulada. EXEMPLO Vamos calcular a frequência calculada da primeira classe (fc1) do exemplo estuda- do nesta aula (da altura dos cinquenta alunos de uma escola), dada por: ( )0 1 2 1 0 + 6 × 2 + 11(0 + 6 × 2 + 11( )0 + 6 × 2 + 11)f + 2f + f0 1 2f + 2f + f0 1 2 23fc = = = = 5, 75fc = = = = 5, 75(fc = = = = 5, 75( )fc = = = = 5, 75)fc = = = = 5, 75fc = = = = 5, 750 1 2fc = = = = 5, 750 1 21fc = = = = 5, 751 0 + 6 × 2 + 11 fc = = = = 5, 75 0 + 6 × 2 + 11(0 + 6 × 2 + 11( fc = = = = 5, 75 (0 + 6 × 2 + 11( )0 + 6 × 2 + 11) fc = = = = 5, 75 )0 + 6 × 2 + 11)f + 2f + f fc = = = = 5, 75 f + 2f + f0 1 2f + 2f + f0 1 2fc = = = = 5, 750 1 2 f + 2f + f0 1 2 23fc = = = = 5, 75 23 4 4 4 fc = = = = 5, 75 4 4 4 fc = = = = 5, 75 Transpondo-se estes cálculos para todas as classes do nosso exemplo, temos a tabela a seguir. Tabela 2 - Frequências calculadas (fc) e reais (f) fc1 5,75 f1 6 fc2 8,50 f2 11 fc3 7,00 f3 6 fc4 4,75 f4 5 fc5 4.00 f5 3 fc6 5,00 f6 5 fc7 6,50 f7 7 fc8 5,25 f8 7 Fonte: elaborada pelo autor, 2017. A partir desta tabela, podemos verifi car a curva de frequência associada à série de classes. Figura 4 – Curva de frequência 2 3 4 5 6 7 8 9 10 11 12 100 110 120 130 140 150 160 Freq. reais Freq. calculadas Fonte: elaborada pelo autor, 2017. Como o nosso exemplo apresenta uma distribuição de frequências com valores menores nas classes centrais e maiores nas classes menores e maiores, observa-se que a curva de frequência apresenta um comportamento em onda, com dois pontos ‘de pico’, um modelo conhecido como bimodal. Caso os valores mais altos associados às frequências estivessem nas classes centrais, o gráfico tenderia a ser semelhante a um ‘sino’, com um ponto máximo, apenas. Observe: Figura 5 – Modelos de curvas de frequência 1 2 3 4 5 6 7 Fonte: elaborada pelo autor, 2017. Para simplificar nossa análise, colocamos os diferentes modelos de curvas de frequência em um mesmo plano. O modelo 1 é chamado de curva simétrica, ou seja, todas as frequências estão distribuídas de forma equidistante em relação ao ponto máximo. As curvas 2 e 3 são chamadas de curvas assimétricas, pois as frequências estão distribuídas de forma diferente ao longo da curva em relação ao ponto de máximo. Neste caso, o sentido do alongamento da curva determina o viés que ela assume. Dizemos que acurva 2 é enviesada à direita, e a 3 à esquerda. As curvas 4 e 5 são chamadas ‘em formato de J’, e resumem distribuições de frequências muito assimétricas. FIQUE ATENTO! Curvas em formato de J são muito usadas na Economia para associar relações como preços e demanda por mercadorias, por exemplo. No caso, a curva5 ilustra esta situação, pois quanto maior o preço, no eixo vertical, menor será o consumo, no eixo horizontal. A curva 6 configura a chamada ‘curva em U’, que ocorre quando a distribuição de frequências tem pontos de máximo nas extremidades da curva. FIQUE ATENTO! Curvas em U são costumeiramente associadas a equações do 2º grau. Além disso, elas são utilizadas em Economia, sobretudo para a determinação de certos custos de produção de bens. Por fim, a curva 7 configura a chamada distribuição retangular, que ocorre quando todas as frequências são absolutamente iguais. Nesse caso, a razão que demonstra a frequência observada será sempre uma constante. Fechamento Nesta aula, você teve oportunidade de: • conhecer alguns métodos de organização de dados por frequências, como histogramas e polígonos de frequência; • entender que a frequência acumulada é dada pela soma das frequências de diferentes classes, e conhecer as frequências calculadas, como forma de obter uma curva de frequência. Referências CRESPO, Antônio. Estatística fácil. 18. ed. São Paulo: Saraiva, 2005. KUROKAWA, Edson; BORNIA, Antonio Cesar. Utilizando o histograma como uma ferramenta esta- tística de análise da produção de água tratada de Goiânia. In: Anais do XXVIII Congresso Interame- ricano de Engenharia Sanitária e Ambiental, Cancún (México), out. 2002. Disponível em: <http:// estprob.pbworks.com/w/file/fetch/53332540/artigo-histograma-capacidade-proc.pdf>. Acesso em: 24 jan. 2017.
Compartilhar