Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística para os cursos de Engenharia, Ciências da Computação e Biomedicina. Anotações de Aula prof. Machado 3 Capítulo 2: Representações Gráficas A representação gráfica das séries estatísticas tem por finalidade representar os resultados obtidos, permitindo chegar-se a conclusões sobre a evolução do fenômeno ou sobre como se relacionam os valores da série. Não há uma única maneira de representar graficamente uma série estatística. A escolha do gráfico mais apropriado ficará a critério do analista. Contudo, os elementos: simplicidade, clareza e veracidade devem ser considerados quando da elaboração de um gráfico. Em nossos meios de comunicação os gráficos são apresentados com bastante criatividade, cuja finalidade é chamar atenção para o fenômeno apresentado. Costuma-se representar no eixo das abscissas (variável x) a grandeza tempo e os valores observados no eixo das ordenadas (y). Princípios para a construção de gráficos Além de saber analisar e extrair informações de um gráfico, se faz necessário, muitas vezes, que se saiba construir um gráfico a partir, por exemplo, de dados tabulados. Alguns princípios que devem ser seguidos na construção de gráficos são: • Estética - Uma vez que o aspecto marcante de um gráfico, como um meio de apresentação de dados, é o visual, deve-se fazê-lo com “capricho”, isto é: sem rasuras, sem elementos desnecessários, com curvas diferenciadas, centralizado, etc. • Título - Todo gráfico deve ter um título, informando sobre o que diz respeito os dados ali representados. Junto ao título, caso seja esta uma informação importante, deve ser mencionada a data em que os dados foram colhidos. • Eixos - Os nomes das variáveis (juntamente com as respectivas unidades), cujos valores serão lidos nos eixos do gráfico, devem ser colocados junto aos mesmos: Sob o eixo das abscissas, o nome e unidade de medida da variável independente e, ao lado do eixo das ordenadas, o nome e unidade da variável dependente. • Legenda - Quando, em um mesmo gráfico, estiverem sendo representadas duas ou mais distribuições ou grandezas diferentes, deve haver uma legenda que possibilite distingüí-las. • Escalas - A elaboração da escala horizontal e vertical deve seguir as seguintes regras: • Todos os valores assumidos pelas variáveis devem estar contidos no intervalo que vai do menor ao maior valor marcados na escala. • As marcações devem ser feitas de maneira uniforme, isto é, os valores marcados nos eixos devem estar uniformemente espaçados. • Quando se tratar de variáveis cardinais, as marcações devem representar intervalos uniformes destas variáveis. • Não é necessário indicar na escala os valores das variáveis de uma em uma unidade. Pelo contrário, o excesso de informação pode dificultar a leitura do gráfico. Conforme for o caso (e aqui deve-se seguir o bom senso), marca-se a escala a intervalos equiespaçados de 3 em 3 unidades, 5 em 5, 10 em 10, 100 em 100, etc. • Indicação de cortes - Quando o tamanho do papel não possibilitar que se represente todos os valores, desde a origem ao maior valor a ser marcado na escala, deve-se indicar isto colocando-se no eixo, entre a origem e o próximo valor o seguinte “símbolo”: Estatística para os cursos de Engenharia, Ciências da Computação e Biomedicina. Anotações de Aula prof. Machado 4 Exemplo Ilustrativo – Considere 5 laboratórios de Biofísica de uma universidade fictícia, denominados de L1, L2, L3, L4 e L5. Foi realizada uma pesquisa na qual listaram-se os nomes de cada um dos alunos(as) nos laboratórios e suas alturas, em cm. Essas informações estão resumidas nas tabelas 2.1 a 2.5. (p. 9 da apostila) Tabela 2.1: Laboratório L1 Tabela 2.2: Laboratório L2 Tabela 2.4: Laboratório L4 Nome do Aluno(a) Altura (cm) Nome do Aluno(a) Altura (cm) Nome do Aluno(a) Altura (cm) Alice Machado 162 Alexandre Souto 158 Alex Franco 158 Caio Ferreira 175 Ana Silva Dias 160 Beatriz Bento 160 Luiz Eduardo Santiago 180 Elias Fontes 162 Carina Freitas 161 Marcelo Silva 165 Fábio Dantas 175 Fábio Oliveira 163 Patrícia Villas 168 Marcos Freitas 176 Marcos Vieira 170 Ricardo Reis 162 Ricardo Ramos 172 Sérgio Crivo 175 Tabela 2.3: Laboratório L3 Tabela 2.5: Laboratório L5 Nome do Aluno(a) Altura (cm) Nome do Aluno(a) Altura (cm) André Freitas 157 Alexandre Freitas 162 Caio Cameron 160 Ana Maria Louveiro 170 Fernando Sampaio 163 Fabrício Zacarias 171 Fernando Zarindi 171 Fernando Silva 168 Luiz Carlos Figueira 180 Luciano Madeira 163 Luiz Fernando Dias 158 Luiz Gustavo Arias 177 Mário Maltez 162 Márcio Gouveia 183 Pedro Farias 170 Murilo Vias 153 Renato Longo 171 Renata Andrade 160 Ricardo Ribeiro 157 Ricardo Rudge 165 Sidney Alves 158 Zenon da Silva 180 Supondo que ni represente o número de alunos no laboratório i, temos: i = 1 (laboratório L1) n1 = 5 i = 2 (labor. L2) n2 = 6 i = 3 (labor. L3) n3 = 12 i = 4 (laboratório L4) n4 = 7 i = 5 (labor. L5) n5 = 10 Assim, o número total de alunos, denominado de n, é dado pela soma do número de alunos de cada laboratório, ou seja: Total de alunos: n = ∑ = 5 1i in = n1 + n2 + n3 + n4 + n5 = 5 + 6 + 12 + 7 + 10 = 40 Podemos determinar a porcentagem do número de alunos por laboratório a partir da freqüência relativa, ou seja: Tabela 2.6: Número de alunos por laboratório e sua porcentagens. x 100 Laboratório Nº de alunos (fi) fr f% L1 5 5/40 = 0,125 12,5% L2 6 6/40 = 0,15 15,0% L3 12 12/40 = 0,30 30,0% L4 7 7/40 = 0,175 17,5% L5 10 10/40 = 0,25 25,0% Total (∑∑∑∑) 40 1,00 100% Estatística para os cursos de Engenharia, Ciências da Computação e Biomedicina. Anotações de Aula prof. Machado 5 Podemos classificar os alunos em função da variável altura, independente do laboratório a que ele pertence. Tabela 2.7: Altura e número de alunos Alturas (cm) Nº de alunos 153 1 157 2 158 4 160 4 161 1 162 5 163 3 165 2 168 2 170 3 171 3 172 1 175 3 176 1 177 1 180 3 183 1 Total 40 Para simplificar o tamanho da tabela, podemos agrupar as alturas dos alunos por CLASSES. Assim: 1º) número de classes: k ≅ n ≅ 40 ≅ 6,32. Podemos adotar k = 6 ou k = 7 2º) amplitude total (ou Range): H = Xmáx. – Xmín. = 183 – 153 = 30 3º) amplitude de classe: h ≅ k H ≅ 6 30 = 5 4º) Construção da tabela: Tabela 2.8: Classes e distribuição das freqüências de alturas. Classes de alturas (cm) Nº de alunos por classe (fi) Ponto Médio (PM) Freqüência Relativa (fr) Freqüência Porcentual (f%) Frequencia Acumulada (fa) 150 |--- 155 1 152,5 0,025 2,5% 1 155 |--- 160 6 157,5 0,150 15,0% 7 160 |--- 165 13 162,5 0,325 32,5% 20 165 |--- 170 4 167,5 0,100 10,0% 24 170 |--- 175 7 172,5 0,175 17,5% 31 175 |--- 180 5 177,5 0,125 12,5% 36 180 |--- 185 4 182,5 0,100 10,0% 40 ∑∑∑∑ 40 ----- 1,000 100% ----- 5º) Construção do Histograma dos dados da tabela 2.8 Estatística para os cursos de Engenharia, Ciências da Computação e Biomedicina. Anotações de Aula prof. Machado 6 6 4 7 5 4 1 13 0 2 4 6 8 10 12 14 1 alturas (cm) fr e q ü ê n c ia s 6º) Construção doPolígono de freqüências simples das classes de alturas. 6 4 7 5 4 1 13 0 2 4 6 8 10 12 14 1 alturas (cm) fr e q ü ê n c ia s 7º) Construção do Polígono de freqüências acumuladas das classes de alturas (Ogiva de Galton) 1 7 20 24 31 36 40 0 5 10 15 20 25 30 35 40 45 1 2 3 4 5 6 7 150 155 160 165 170 175 180 185 150 155 160 165 170 175 180 185 152,5 157,5 162,5 167,5 172,5 177,5 182,5 Estatística para os cursos de Engenharia, Ciências da Computação e Biomedicina. Anotações de Aula prof. Machado 7 GRÁFICOS ESTATÍSTICOS (DESCRITIVOS) PRINCIPAIS TIPOS DE GRÁFICOS : 1. GRÁFICOS LINEARES OU DE CURVAS São gráficos em duas dimensões, baseados na representação cartesiana dos pontos no plano. Servem para representar séries cronológicas ou de localização (os dados são observados segundo a localidade de ocorrência), sendo que o tempo é colocado no eixo das abscissas (x) e os valores observados no eixo das ordenadas (y). Vendas da Companhia Delta 1971 a 1977 Ano Vendas (Cr$ 1.000,00) 1971 230 1972 260 1973 380 1974 300 1975 350 1976 400 1977 450 Fonte: Departamento de Marketing da Companhia Vendas da Companhia Delta 230 260 380 300 350 400 450 0 100 200 300 400 500 1971 1972 1973 1974 1975 1976 1977 Anos V en d as (C r$ 1. 00 0, 00 ) 2. GRÁFICO EM COLUNAS OU BARRAS São representados por retângulos de base comum e altura proporcional à magnitude dos dados. Quando dispostos em posição vertical, dizemos colunas; quando colocados na posição horizontal, são denominados barras. Embora possam representar qualquer série estatística, geralmente são empregados para representar as séries específicas ( os dados são agrupados segundo a modalidade de ocorrência). Estatística para os cursos de Engenharia, Ciências da Computação e Biomedicina. Anotações de Aula prof. Machado 8 PRODUÇÃO DE ALHO - BRASIL- 1988 0 5.000 10.000 15.000 Santa Catarina Minas Gerais Rio Grande do Sul Goiás São Paulo E s ta d o s toneladas A) Gráfico em Colunas População Brasileira ( 1940 – 1970) Ano População 1940 41.236.315 1950 51.944.398 1960 70.119.071 1970 93.139.037 Fonte: Anuário Estatístico - 1974 População do Brasil 0 20000000 40000000 60000000 80000000 100000000 1940 1950 1960 1970 ANOS P o p u la çã o B) Gráfico em Barras Produção de Alho – Brasil (1988) ESTADOS QUANTIDADES (t) Santa Catarina 13.973 Minas Gerais 13.389 Rio Grande do Sul 6.892 Goiás 6.130 São Paulo 4.179 Fonte: IBGE Estatística para os cursos de Engenharia, Ciências da Computação e Biomedicina. Anotações de Aula prof. Machado 9 3. GRÁFICO EM COLUNAS OU BARRAS MÚLTIPLAS Este tipo de gráfico é geralmente empregado quando queremos representar, simultaneamente, dois ou mais fenômenos estudados com o propósito de comparação. BALANÇA COMERCIAL BRASIL – 1984 - 1988 VALOR (US$ 1.000.000) ESPECIFICAÇÃO 1984 1985 1986 1987 1988 Exportação (FOB) 27.005 25.639 22.348 26.224 33.789 Importação 13.916 13.153 14.044 15.052 14.605 Fonte: Ministério das Economia 1 9 8 4 1 9 8 5 1 9 8 6 1 9 8 7 1 9 8 8 exportação importação0 10.000 20.000 30.000 40.000 U S $ M IL H Ã O ANOS BALANÇA COMERCIAL BRASIL - 1984-88 4. GRÁFICO EM SETORES É a representação gráfica de uma série estatística, em um círculo, por meio de setores circulares. É empregado sempre que se pretende comparar cada valor da série com o total. O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. Para construí-lo, divide-se o círculo em setores, cujas áreas serão proporcionais aos valores da série. Essa divisão poderá ser obtida por meio de uma regra de três simples e direta. Total ___________ 360º Parte___________ x º Estatística para os cursos de Engenharia, Ciências da Computação e Biomedicina. Anotações de Aula prof. Machado 10 REBANHOS BRASILEIROS 1988 ESPÉCIE QUANTIDADE (milhões de cabeça) Bovinos 140 Suínos 32 Ovinos 20 Caprinos 11 Total 203 Fonte: IBGE Temos: Para Bovinos: 203 -------------360º 140 ------------- x x = 248,2º x = 248º Para Suínos: 203 ------------360º 32 ----------- y y = 56,7º y = 57º Para Ovinos: 203 -----------360º 20 ---------- z z = 35,4º z = 35º Para Caprinos: 203 ----------360º 11 ---------- w w = 19,5º w = 20º REBANHOS BRASILEIROS - 1988 16% 10% 5% 69% Bovinos Suínos Ovinos Caprinos 5. GRÁFICO POLAR É a representação de uma série por meio de um polígono. É o gráfico ideal para representar séries temporais cíclicas, isto é, séries temporais que apresentam em seu desenvolvimento determinada periodicidade, como, por exemplo, a variação da precipitação pluviométrica ao longo do ano ou da temperatura ao longo do dia, a arrecadação da Zona Azul durante a semana, o consumo de energia elétrica durante o mês ou o ano, o número de passageiros de uma linha de ônibus ao longo da semana, etc. O gráfico polar faz uso do sistema de coordenadas polares. Estatística para os cursos de Engenharia, Ciências da Computação e Biomedicina. Anotações de Aula prof. Machado 11 PRECIPITAÇÃO PLUVIOMÉTRICA MUNICÍPIO DE RECIFE – 1989 MESES PRECIPITAÇÃO (mm) Janeiro 174,8 Fevereiro 36,9 Março 83,9 Abril 462,7 Maio 418,1 Junho 418,4 Julho 538,7 Agosto 323,8 Setembro 39,7 Outubro 66,1 Novembro 83,3 Dezembro 201,2 Fonte: IBGE PRECIPITAÇÃO PLUVIOMÉTRICA MUNICÍPIO DE RECIFE - 1989 0 200 400 600 Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro 6. ligamos os pontos encontrados com segmentos de reta; 7. se pretendemos fechar a poligonal obtida, empregamos uma linha interrompida. 6. CARTOGRAMA O cartogramaé a representação sobre uma carta geográfica. Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. Distinguimos duas aplicações: a) Representar dados absolutos (população) – neste caso, lançamos mão, em geral, dos pontos, em número proporcional aos dados. b) Representar dados relativos (densidade) – neste caso, lançamos mão, em geral, de Hachuras. 1. traçamos uma circunferência de raio arbitrário (em particular, da- mos preferência ao raio de com- primento proporcional à média dos valores da série; neste caso, x = 124,5); 2. construímos uma semi-reta ( de preferência na horizontal) partin- do de O (pólo) e com uma esca- la (eixo polar); 3. dividimos a circunferência em tantos arcos quantas forem as unidades temporais; 4. traçamos, a partir do centro O (pólo), semi-retas passando pe- los pontos de divisão; 5. marcamos os valores correspon- dentes da variável, iniciando pe- la semi-reta horizontal (eixo polar); Estatística para os cursos de Engenharia, Ciências da Computação e Biomedicina. Anotações de Aula prof. Machado 12 POPULAÇÃO PROJETADA DA REGIÃO SUL DO BRASIL – 1990 ESTADO POPULAÇÃO (hab.) ÁREA (km2) DENSIDADE Paraná 9.137.700 199.324 45,8 Santa Catarina 4.461.400 95.318 46,8 Rio Grande do Sul 9.163.200 280.674 32,6 Fonte: IBGE 7. GRÁFICOS PICTÓRICOS São gráficos através de figuras que simbolizam fatos estatísticos, ao mesmo tempo que indicam as proporcionalidades. Por serem representados por figuras, tornam-se atraentes e sugestivos, por isso, são largamente utilizados em publicidades. Regras fundamentais para a sua construção: a) Os símbolos devem explicar-se por si próprios; b) As quantidades maiores são indicadas por meio de um número de símbolos, mas não por um símbolo maior; c) Os símbolos comparam quantidades aproximadas, mas detalhes minuciosos; d) Os gráficos pictóricos só devem ser usados para comparações, nunca para afirmações isoladas. Estatística para os cursos de Engenharia, Ciências da Computação e Biomedicina. Anotações de Aula prof. Machado 13 PRODUÇÃO BRASILEIRA DE VEÍCULOS 1972 – 1975 (dados fictícios) ANO PRODUÇÃO 1972 9.974 1973 19.814 1974 22.117 1975 24.786 ANOS 1975 1974 1973 1972 PRODUÇÃO = 5.000 unidades GRÁFICOS ANALÍTICOS Os gráficos analíticos são usados tipicamente na representação de distribuições de freqüências simples e acumuladas. 1. HISTOGRAMA É a representação gráfica de uma distribuição de freqüências por meio de retângulos justapostos, onde no eixo das abscissas temos os limites das classes e no eixo das ordenadas os valores das freqüências absolutas (fi) 2. POLÍGONO DE FREQÜÊNCIAS É um gráfico de linhas que se obtém unindo-se os pontos médios dos patamares dos retângulos do HISTOGRAMA . Classes PM f i fr f% fa fra f%a 30 |--- 40 35 4 0,08 8 4 0,08 8 40 |--- 50 45 6 0,12 12 10 0,20 20 50 |--- 60 55 8 0,16 16 18 0,36 36 60 |--- 70 65 13 0,26 26 31 0,62 62 70 |--- 80 75 9 0,18 18 40 0,80 80 80 |--- 90 85 6 0,12 12 46 0,92 92 90 |--- 100 95 4 0,08 8 50 1,00 100 ΣΣΣΣ 50 1,00 100 Estatística para os cursos de Engenharia, Ciências da Computação e Biomedicina. Anotações de Aula prof. Machado 14 • freqüências simples (fi) 15 HISTOGRAMA 12 POLÍGONO DE FREQÜÊNCIAS 9 6 3 30 |--- 40 |--- 50 |--- 60 |--- 70 |--- 80 |--- 90 |---100 Classes PM: 35 45 55 65 75 85 95 OBSERVAÇÕES: a) O HISTOGRAMA e o POLÍGONO DE FREQÜÊNCIAS, em termos de fi , fr e f% têm exatamente o mesmo aspecto, mudando apenas a escala vertical; b) Observe que, como o primeiro valor da tabela é bem maior que zero, adotamos aproximá-lo do zero através da convenção: 30 3. POLÍGONO DE FREQÜÊNCIAS ACUMULADAS OU OGIVA DE GALTON É a representação gráfica que tem no eixo das abscissas os limites das classes e no eixo das ordenadas as freqüências acumuladas (fa ou f%a ) NOTA: Para obtermos o valor da mediana de uma série de valores em dados agrupados usamos uma fórmula, porém, através do gráfico de freqüências acumuladas (OGIVA DE GALTON) podemos obter esse valor. EXEMPLO: Seja a distribuição: Classes fi fa 02 |---- 04 3 3 04 |---- 06 5 8 06 |---- 08 10 18 08 |---- 10 6 24 10 |---- 12 2 26 Construir a OGIVA DE GALTON e, a partir dos dados, determine a valor da mediana da distribuição. Construir a OGIVA DE GALTON e, a partir dos dados, determine o valor da mediana da série. Estatística para os cursos de Engenharia, Ciências da Computação e Biomedicina. Anotações de Aula prof. Machado 15 f% fa OGIVA DE GALTON 100 26 24 0 2 4 6 8 10 12 (Classes) Md = 7 Para obtermos a mediana, a partir da OGIVA DE GALTON, tomamos em fa = 26 a freqüência percentual que irá corresponder à 100% ou seja, f%a = 100. Como a mediana corresponde ao termo central, localizamos o valor da fa que corresponde à 50% da f%a, que neste caso, é fa = 13. A mediana será o valor da variável associada a esse valor no eixo das abscissas ou seja, Md = 7 18 50 13 8 3
Compartilhar