Baixe o app para aproveitar ainda mais
Prévia do material em texto
Profª: Msc Nayane Caroline J.C.da Silva e-mail: nayanecardoso@gmail.com 20 UNIDADE II – REPRESENTAÇÕES TABULAR E GRÁFICA 2.1 TABELA: Tabelas são estruturas básicas para organização e apresentação de dados, muito utilizadas em textos científicos, pela imprensa, pelas empresas e pelos órgãos governamentais. O principal objetivo da organização de dados é viabilizar a produção de informações rápidas, de forma sintética, das variáveis em estudo, permitindo uma leitura simples e uma interpretação precisa. Uma tabela se apresenta da seguinte forma: Tabela 2.1 – Partos realizados pelo SUS, Brasil, 1996-2000 Normas para apresentação de tabelas: Título: conjunto de informações sobre a tabela (O quê? Quando? Onde?) localizada no topo da tabela. Corpo: linhas e colunas que contém os valores das variáveis em estudo. ✓ cabeçalho: parte superior que especifica o conteúdo das colunas. ✓ coluna indicadora: coluna que indica o conteúdo das linhas. ✓ casa ou célula: espaço destinado a uma só informação. Rodapé: elementos complementares da tabela. ✓ Fonte: identifica o responsável (pessoa física ou jurídica) ou responsável pelos dados numéricos. CORPO RODAPÉ TÍTULO CÉLULA Profª: Msc Nayane Caroline J.C.da Silva e-mail: nayanecardoso@gmail.com 21 ✓ Notas: é o texto que irá esclarecer o conteúdo estudado, que poderá ser de caráter geral ou especifico de uma tabela. ✓ Chamadas: símbolo remissivo atribuído a algum elemento de uma tabela que necessita de uma nota especifica. De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar : • um traço horizontal ( - ) quando o valor é zero; • três pontos ( ... ) quando não temos os dados; • zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada; • um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de determinado valor. • as tabelas não devem ser delimitadas à direita e à esquerda por traços verticais. • as tabelas devem ser numeradas com algarismos arábicos (1, 2, 3,....). • não se utiliza linhas horizontais no corpo da tabela. 2.2 SÉRIES ESTATÍSTICAS: É qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. 2.2.1 SÉRIE TEMPORAL: Identifica-se pelo caráter variável do fator cronológico. O local e a espécie (fenômeno) são elementos fixos. Esta série também é chamada de histórica ou evolutiva. Número de internações hospitalares, no município de Santana do Pará 2014 - 2017. PERÍODO Internações 2014 300 2015 400 2016 452 2017 480 TOTAL 1632 Fonte: DATASUS Profª: Msc Nayane Caroline J.C.da Silva e-mail: nayanecardoso@gmail.com 22 2.2.2 SÉRIE GEOGRÁFICA: Apresenta como elemento variável o fator geográfico. A época e o fato (espécie) são elementos fixos. Também é chamada de espacial, territorial ou de localização. Número de médicos por município de 2015. Município Nº de Médicos Redenção 620 Santana do Pará 480 Tucumã 340 TOTAL 1440 Fonte: DATASUS 2.2.3 SÉRIE ESPECÍFICA OU CATEGÓRICA: O caráter variável é apenas o fato ou espécie. Também é chamada de série categórica. Vendas no 1º bimestre de 2015 Laboratório UNIDADES VENDIDAS * Merck 1 8 Medley 1 2 TOTAL 3 0 Fonte: Elaborado pelo autor * Em mil unidades 2.2.4 SÉRIE CONJUGADA OU MISTA: Também chamadas de tabelas de dupla entrada. São apropriadas à apresentação de duas ou mais séries de maneira conjugada, havendo duas ordens de classificação: uma horizontal e outra vertical. O exemplo abaixo é de uma série Categórica -Categórica. Compras de Materiais de Limpeza e Expediente Ano 2017 Setor Unidades Compradas (R$) Limpeza Expediente Gerência 700 900 Estoque 635 750 Vendas 552 457 Rec. Humanos 488 322 Laboratórios 395 300 Total 2770 2729 Fonte: Luz LTDA Profª: Msc Nayane Caroline J.C.da Silva e-mail: nayanecardoso@gmail.com 23 2.2.5 SÉRIE DISTRIBUIÇÃO DE FREQÜÊNCIA: Essa série descreve os valores de variáveis em determinado local e data distribuídos em classes numéricas (ou não) com as respectivas freqüências, essa série será abordada posteriormente. Idade de pacientes/2017 Classe de idades Freqüência (fi) 5 |— 7 7 7 |— 9 5 9 |— 11 6 11 |— 13 4 13 |— 15 8 15 |— 17 7 17 |—| 19 3 Total 40 Fonte: Hospital Samaritano 2.3 GRÁFICO É uma forma de apresentação dos dados estatísticos cujo objetivo é o de produzir uma impressão mais rápida e viva do fenômeno em estudo. Os gráficos não seguem somente um comportamento linear, isto depende das varáveis, grandezas e dados estudados. Serão descritos a seguir quatro tipos de gráficos muito utilizados em estatística. ✓ Gráfico de barras ou colunas: são gráficos que utilizam barras horizontais ou verticais para representar os dados estatísticos. É adequado quando as variáveis forem qualitativas ou quantitativas discretas. Profª: Msc Nayane Caroline J.C.da Silva e-mail: nayanecardoso@gmail.com 24 ✓ Gráfico de linhas: este tipo de gráfico usa uma linha poligonal para representar os dados estatísticos. ✓ Gráfico de setores (pizza): este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação do dado no total. Profª: Msc Nayane Caroline J.C.da Silva e-mail: nayanecardoso@gmail.com 25 ✓ PICTOGRAMA ou PICTÓRICO - é construído a partir de figuras representativas da intensidade do fenômeno. Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo, pois sua forma é atraente e sugestiva. Os símbolos devem ser auto-explicativos. A desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno, e não de detalhes minuciosos. Profª: Msc Nayane Caroline J.C.da Silva e-mail: nayanecardoso@gmail.com 26 ✓ CARTOGRAMA - é um mapa que mostra informação quantitativa mantendo um certo grau de precisão geográfica das unidades espaciais mapeadas Profª: Msc Nayane Caroline J.C.da Silva e-mail: nayanecardoso@gmail.com 27 EXERCÍCIOS PROPOSTOS 1) A importância do desenvolvimento da atividade turística no Brasil relaciona-se especialmente com os possíveis efeitos na redução da pobreza e das desigualdades por meio da geração de novos postos de trabalho e da contribuição para o desenvolvimento sustentável regional. No gráfico são mostrados três cenários – pessimista, previsível, otimista – a respeito da geração de empregos pelo desenvolvimento de atividades turísticas. De acordo com o gráfico, em 2009, o número de empregos gerados pelo turismo será superior a: a) 602.900 no cenário previsível b) 660.000 no cenário otimista. c) 316.000 e inferior a 416.000 no cenário previsível d) 235.700 e inferior a 352.800 no cenário pessimista e) 516.000 e inferior a 616.000 no cenário otimista 2) Foram publicados recentemente, trabalhos relatando o uso de fungos como controle biológico de mosquitos transmissores da malária. Observou-se o percentual de sobrevivência dos mosquitos Anopheles sp. após exposição ou não a superfícies cobertas com fungos sabidamente pesticidas, ao longo de duas semanas. Os dados obtidos estão presentes no gráfico abaixo: Profª: Msc Nayane Caroline J.C.da Silva e-mail: nayanecardoso@gmail.com 28 No grupo exposto aos fungos, o período em que houve 50% de sobrevivência ocorreu entre os dias: a) 2 e 4 b) 4 e 6 c) 6 e 8 d) 8 e 10 e) 10 e 12 4) O psiquiatra Içami Tiba diz que amor em excesso não é bom na educação dos filhos. A revista Veja quis saber se os leitores concordam com essa afirmação. O resultado:Considerando que o diagrama representa os percentuais de respostas de 3700 pessoas, o número de pessoas que discordam do psiquiatra é: a) 3145 b) 2960 c) 2886 d) 2775 5) O gráfico abaixo mostra a produção diária de lixo orgânico de duas pessoas. O dia da semana que o gráfico mostra que as produções de lixo das duas pessoas foram iguais é: Profª: Msc Nayane Caroline J.C.da Silva e-mail: nayanecardoso@gmail.com 29 a) 2ª feira b) 4ª feira c) 6ª feira d) Sábado e) Domingo 6) Análise o gráfico a seguir: a)Quais variáveis estão envolvidas nesse estudo? b) Em que período o número de transplantes ficou abaixo de 50? c) A partir de quando se pode afirmar que o número de transplantes aumenta de ano para ano? Profª: Msc Nayane Caroline J.C.da Silva e-mail: nayanecardoso@gmail.com 30 2.4 DISTRIBUIÇÃO DE FREQUÊNCIA Uma distribuição de frequência (absoluta ou relativa) é um método de grupar dados por classes de ocorrência de modo a fornecer a quantidade de dados em cada classe. Em outras palavras, este tipo de análise estatística permite verificar a frequência (o quanto se repete) de determinado dado em um determinado intervalo de estudo. Com isso podemos resumir e visualizar um conjunto de dados sem precisar levar em conta os valores individuais. Este tipo de distribuição pode ser representado em forma de tabelas e gráficos. 2.4.1 TABELA PRIMITIVA E ROL Tabela Primitiva: É uma tabela ou relação de elementos que não foram numericamente organizados. É difícil formarmos uma idéia exata do comportamento do grupo como um todo, a partir de dados não ordenados. Exemplo: Considere os seguintes valores 45, 41, 42, 41, 42 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 Rol: É a tabela obtida após a ordenação dos dados (crescente ou crescente). 41, 41, 41, 42, 42 43, 44, 45, 46, 46,50, 50, 51, 52, 54, 57, 58, 58, 60, 60 Distribuição de frequência com intervalos de classe: Quando o tamanho da amostra é elevado, é mais racional efetuar o agrupamento dos valores em vários intervalos de classe. Classes Frequências 41 |------- 45 7 45 |------- 49 3 49 |------- 53 4 53 |------- 57 1 57 |------- 61 5 Total 20 Profª: Msc Nayane Caroline J.C.da Silva e-mail: nayanecardoso@gmail.com 31 2.4.2 ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA COM INTERVALOS DE CLASSE Classes de Frequência: são os intervalos de variação de uma variável. As classes são representadas simbolicamente da por i , sendo 1,2,3, ,i k= , onde k é o número total de classes. O número total de valores é denotado por n . Na tabela anterior, o intervalo 45 |------- 49 define a 2ª classe ( 2i = ), o intervalo 53 |------- 57 define a 4ª classe ( 4i = ) e assim por diante. Como a distribuição tem cinco classes e vinte valores, logo 5k = e 20n = . Limites de Classe: são os extremos de cada classe. Para uma determinada classe i , o menor número é o limite inferior ( il ) e o maior número é o limite superior ( iL ). No intervalo 49 |------- 53,... 3 49l = e 3 53L = . O símbolo |------- representa um intervalo fechado à esquerda e aberto à direita. O dado 53 do rol não pertence a classe 3 e sim a classe 4 representada por 53 |------- 57. Amplitude do Intervalo de Classe: é o tamanho do intervalo que define a classe. A amplitude da classe i é simbolizada por ih e é obtida através da diferença entre o limite superior e inferior da classe, ou seja, por i i ih L l= − No intervalo 49 |------- 53 temos que 3 53 49 4h = − = . Na distribuição de frequência com classe o ih será igual em todas as classes. Amplitude Total (AT): é a diferença entre o limite superior da última classe ( kL ) e o limite inferior da primeira classe ( 1l ). Matematicamente, escrevemos isso como 1kAT L l= − Profª: Msc Nayane Caroline J.C.da Silva e-mail: nayanecardoso@gmail.com 32 Como no nosso exemplo temos cinco classes ( 5k = ) segue da tabela que 5 1 61 41 20AT L l= − = − = . Amplitude Amostral: é a diferença entre o valor máximo e o valor mínimo da amostra, isto é, max minAA X X= − . Em nosso exemplo, 60 41 19AA = − = . Em uma distribuição de frequência com classe, a amplitude (AT) deve ser ligeiramente maior que amplitude amostral (AA) para que a distribuição tenha intervalos para incluir todos os valores da amostra. Ponto Médio de Classe: é o ponto que divide o intervalo de classe em duas partes iguais. O ponto médio da classe i é simbolizado por ix e calculado efetuando a média entre os limites da classe: 2 i i i l L x + = No intervalo 49 |------- 53, o ponto médio da terceira classe é 3 3 3 53 49 51 2 2 l L x + + = = = . 2.4.3 Método Prático para Construção de uma Distribuição de Frequências com classe 1º - Organize os dados brutos em um rol. 2º - Calcule a amplitude amostral AA. 3º - Calcule o número de classes Quando dispomos de uma tabela primitiva ou de um rol, precisamos estabelecer a quantidade e o intervalo das classes que vamos criar, de outro modo a distribuição de freqüência pode não ser útil para a nossa análise. Profª: Msc Nayane Caroline J.C.da Silva e-mail: nayanecardoso@gmail.com 33 Uma das maneiras de determinar o número de classes é usando uma regra que determina k em função de n : 𝑘 = √𝑛 lembrando que k é o número de classes e n o número de dados. No nosso exemplo, usando a regra temos 20n = , logo 𝑘 = √20 = 4,48 ≅ 5, portanto utilizamos 5 classes. Sabendo o número de classes, podemos calcular a amplitude do intervalo de classes através da amplitude total da amostra (AA) ℎ = 𝐴𝐴 𝐾 No nosso exemplo: ℎ = 19 5 = 3,8 ≅ 4 4º - Temos então o menor número da amostra, o número de classes e a amplitude do intervalo. Podemos montar a tabela, com o cuidado para não aparecer classes com frequência iguais a zero. No nosso exemplo: o menor número da amostra é 41, logo a primeira classe será representada por 41 |------- 45, pois 41 45h+ = . As classes seguintes respeitarão o mesmo procedimento. O primeiro elemento das classes seguintes sempre serão formadas pelo último elemento da classe anterior. 2.4.4 TIPOS DE INTERVALOS DE CLASSE Os intervalos de classes são especialmente recomendados para variáveis quantitativas contínuas. Para variáveis discretas, os procedimentos variam de acordo com a amplitude amostral dos dados. Os intervalos mais comuns são os seguintes: Intervalo 0 —| 10: compreende todos os valores entre 0 e 10, inclusive o 10 e exclusive o 0. Intervalo 0 |— 10: compreende todos os valores entre 0 e 10, inclusive o 0 e exclusive o 10. Intervalo 0 |—| 10: compreende todos os valores entre 0 e 10, inclusive o 0 e inclusive o 10. Profª: Msc Nayane Caroline J.C.da Silva e-mail: nayanecardoso@gmail.com 34 2.4.5 TIPOS DE FREQÜÊNCIA Frequência Simples ou Absoluta ( if ): são os valores que diretamente representam o número de dados de cada classe. A soma de todas as freqüências simples é igual ao número total dos dados da distribuição. Frequência Relativa ( Rif ): são os valores das razões entre as frequências simples ( if ) e a frequência total da distribuição ( n ) i Ri f f n = Na quinta classe do exemplo a frequência relativa é 5 0,25 20 = ou representado de outra forma, 25%. Frequência Acumulada ( iF ): é a soma das frequências simples de todas as classes com os valores inferiores ao limite superior do intervalo de uma determinada classe. Assim, ainda no exemplo acima, a frequência acumulada correspondente à terceira classe é 3 1 2 3 7 3 4 14F f f f= + + = + + = Frequência Acumulada Relativa ( RiF ): é a frequência acumulada da classe dividida pela frequência total da distribuição: i Ri F F n = Logo, para a terceira classe, temos 3 3 14 0,7 20 R F F n = = = ou 70%.Profª: Msc Nayane Caroline J.C.da Silva e-mail: nayanecardoso@gmail.com 35 A tabela completa do nosso exemplo fica assim: ...CLASSE ... if ... ... ix ... ..... Rif ... ..... iF .... ..... RiF ..... 41 |-------- 45 7 43 0,35 7 0,35 45 |-------- 49 3 47 0,15 10 0,50 49 |-------- 53 4 51 0,20 14 0,70 53 |-------- 57 1 55 0,05 15 0,75 57 |-------- 61 5 59 0,25 20 1 Total 20 1 2.4.6 REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO Em todos os gráficos utilizamos o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocamos os valores da variável e na linha vertical (eixo das ordenadas), as frequências. Histograma: é formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. A área de um histograma é proporcional à soma das frequências simples ou absolutas. Exemplo: Em uma escola onde 500 alunos da classe A – 2000 participam da disciplina de Estatística Básica. Num teste de múltipla escolha contendo 100 questões que visava verificar a aprendizagem destes na referida disciplina, obteve-se a seguinte frequência de notas (correspondente à quantidade de acertos). Profª: Msc Nayane Caroline J.C.da Silva e-mail: nayanecardoso@gmail.com 36 Tabela: Classe A-2000 com 500 alunos participantes da disciplina Estatística Básica. Para construção do histograma, desenhe o eixo cartesiano (x, y), onde na abscissa serão representadas as classes, que neste caso tem uma amplitude h igual a 10, e na ordenada, a frequência dos dados. A área de cada retângulo do gráfico representa a frequência de cada nota. Polígono de frequência: é um gráfico em linha, sendo as freqüências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe. Para realmente obtermos um polígono (linha fechada), devemos completar a figura, Profª: Msc Nayane Caroline J.C.da Silva e-mail: nayanecardoso@gmail.com 37 ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição. Exemplo: Represente em um polígono de frequência os dados da tabela abaixo referente ao tempo em minutos que uma amostra de 550 pessoas levou para realizar uma prova de estatística. Tabela: Tempo em minutos gasto por 550 pessoas para realizar uma prova de Estatística. Na construção de um polígono de frequências primeiramente podemos construir um histograma; depois marcamos no ‘telhado‘ de cada coluna o ponto central (ponto médio) e unimos sequencialmente estes pontos. Devem existir dois pontos na abscissa (eixo horizontal), um na lateral esquerda e outro na lateral direita, ligado aos pontos das barras das extremidades. Profª: Msc Nayane Caroline J.C.da Silva e-mail: nayanecardoso@gmail.com 38 EXERCÍCIOS PROPOSTOS 1) Os dados abaixo são referentes aos níveis de glicose de 30 crianças: 56 61 57 77 62 75 63 55 64 60 60 57 61 57 67 62 69 67 68 59 65 72 65 61 68 73 65 62 75 80 a) Construa uma distribuição de frequência b) Construa o histograma e o polígono de frequência 2) Os dados a seguir referem-se ao tempo, em horas, que 80 pacientes hospitalizados dormiram durante a administração de certo anestésico: a) Construa uma distribuição de frequência. b) Dê a interpretação para a frequência relativa de 3a classe. c) Qual o percentual de pacientes que dormiram menos de 12 horas? 3) Considere a distribuição de frequência transcrita a seguir: a) 65% das observações têm peso não inferior a 4 kg e inferior a 10 kg. b) Mais de 65 % das observações têm peso maior ou igual a 4 kg. c) Menos de 20 observações têm peso igual ou superior a 4 kg. d) A soma dos pontos médios dos intervalos de classe é inferior ao tamanho da população. e) 8% das observações têm peso no intervalo de classe 8 |____10
Compartilhar