Baixe o app para aproveitar ainda mais
Prévia do material em texto
U N I D A D E 2 E P I D E M I O L O G I A E B I O E S T A T Í S T I C A TABELAS, SÉRIES ESTATÍSTICAS E DISTRIBUIÇÃO DE FREQUÊNCIAS Helen Indianara Seabra Gomes AUTORA Luís Antônio Batista Tonaco REVISOR Seja bem-vindo Investigação sugere pesquisa, busca de informações e análise de dados. Tudo isso faz pensar em Estatística. Alguns conceitos e definições de Costa (2011) sobre uso da estatística podem ser vistos a seguir: O relacionamento da Estatística com as demais ciências é cada vez mais intenso e mais importante. Veja, por exemplo, que a estatística auxilia a Genética nas questões de hereditariedade; é valiosa na Economia, na análise da produtividade, da rentabilidade e estudos de viabilidade; é básica para as Ciências Sociais nas pesquisas socioeconômicas; é de aplicação intensa na Engenharia Industrial, no controle de qualidade e na comparação de fabricações, além de muito aplicada na engenharia agrícola, entre outras. A aplicação da Estatística intensificou-se nas últimas décadas, tornando-se o foco do estudo de especialistas para as áreas econômicas, sociais, culturais, políticas, educacionais, de saúde, do meio ambiente etc. Enfim, explícita ou implicitamente, a Estatística está presente em todos os aspectos da vida moderna, e essa presença só tende a crescer, pois o estudo estatístico colabora como indicador para trabalhar com diversos produtos, possibilitando maiores estratégias na busca e no planejamento de soluções. Quando a estatística é aplicada a dados provenientes de observações realizadas em diferentes aspectos das Ciências da Vida, como Medicina, Psicologia, Nutrição, Biologia, Farmácia, Enfermagem, Odontologia, Veterinária e Agronomia, é utilizado o termo bioestatística para distingui-la da aplicação de outras áreas do conhecimento. O objetivo do estudo estatístico pode ser também o de estimar uma quantidade ou testar uma hipótese, utilizando-se técnicas estatísticas convenientes as quais realçam toda a potencialidade da Estatística na medida em que vão permitir tirar conclusões acerca de uma população, baseando-se numa pequena amostra, dando-nos, ainda, uma medida do erro cometido. APRESENTAÇÃO 01 Conhecer e aplicar a representação tabular. Entender os elementos constituintes de uma tabela. Reconhecer, através da série estatística, a existência de seus fatores. Empregar a nomenclatura técnica no estudo e na interpretação da série estatística. Compreender a representação dos dados (amostrais e populacionais). Compreender e reconhecer os elementos de uma distribuição de frequência. Conhecer os tipos de frequência. Concluindo, a estatística tornou-se uma poderosa ferramenta para compreensão, análise e previsão de inúmeras situações na nossa vida. As empresas utilizam modelos estatísticos para calcular o fluxo de estoques, de consumo e de produção, objetivando adaptar-se rapidamente a um mercado em constante mutação. Para podermos nos situar de forma mais precisa possível nesse rápido processo de mudanças que enfrentamos, é necessária a utilização dessas ferramentas. Por isso, é necessário saber ler gráficos, interpretá-los, prever situações, analisar dados etc. A estatística ajudar-nos-á nesta tarefa. Nesta Unidade de aprendizagem, serão apresentados os conceitos iniciais e as fases do método estatístico. Ao final desta unidade, você deve apresentar os seguintes aprendizados: Objetivos da Unidade Objetivos da Unidade 01 CONHEÇA O CONTEUDISTA Helen Indianara é Bacharela em Estatística pela Universidade Federal do Pará (UFPA), mestre em Estatística pela Universidade de Brasília (UnB). É professora dos diversos cursos de graduação do Centro Universitário ICESP, foi professora de pós-graduação da Escola Nacional de Administração Pública (ENAP) (Especialização em análise de dados em políticas públicas). É membro do Núcleo de Avaliação Qualidade e Estratégia (NAQUE) do centro universitário ICESP em que atua como Estatística/Cientista de Dados em avaliações educacionais. É consultora na Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), onde atua como estatística e analista de dados de mestres e doutores da pós-graduação no Brasil, além de desenvolver estudos com dados de acessos ao portal de periódicos CAPES. Atualmente estuda MBA em Data Science e Analytics na USP/ESALQ. Helen Indianara Seabra Gomes 02 https://www.bing.com/ck/a?!&&p=64ef7ecea260b23bf00b316d642ac53231cf74ba67917f73e303115675c3dc5cJmltdHM9MTY1ODA2OTA3NyZpZ3VpZD1lMTg3NjBjMC05MzlmLTQ4NmQtYTYyNy02MTdlYjA0MTQ1MTgmaW5zaWQ9NTE2Nw&ptn=3&fclid=fb1c6e04-05de-11ed-ae88-d8ddb5cca455&u=a1aHR0cHM6Ly9tYmF1c3Blc2FscS5jb20vY3Vyc29zL21iYS1lbS1kYXRhLXNjaWVuY2UtZS1hbmFseXRpY3M&ntb=1 Apresentação de tabelas Tabelas Tabelas são recursos utilizados pela estatística, com o objetivo de organizar e facilitar a visualização e comparação dos dados. As tabelas permitem uma visão geral dos valores assumidos pelas variáveis dentro de certos parâmetros. A representação tabular é uma apresentação numérica dos dados. Nesse tipo de representação, os dados são dispostos em linhas e colunas e distribuídos de modo ordenado, segundo algumas regras práticas ditadas pelo Conselho Nacional de Estatística e pelo IBGE. A integração de valores que temos nas tabelas permite-nos ainda, a utilização de representações gráficas, as quais, normalmente, são uma forma mais benéfica e elegante de demonstrar as características que estão sendo analisadas. Elementos de uma tabela UNIDADE 2 03 Um traço horizontal (—) quando o valor for zero, não só quanto à natureza das coisas, como quanto ao resultado do inquérito. Três pontos (…) quando não temos os dados. Um ponto de interrogação (?) quando temos dúvida quanto à exatidão de determinado valor. Zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Se os valores são expressos em numerais decimais, precisamos acrescentar à parte decimal um número correspondente de zeros (0,0; 0,00; 0,000;...). Apresentação de séries estatísticas De acordo com a Resolução 886 da Fundação IBGE, nas casas ou células, devemos colocar: 1. 2. 3. 4. Observação: Os lados direito e esquerdo de uma tabela oficial devem ser abertos. Séries estatísticas Uma série estatística é toda tabela que apresenta um conjunto de dados ordenados que possuem uma característica em comum apresentada sob forma de tabela e/ou gráfico. Numa série estatística observa-se a existência de três elementos ou fatores: o tempo (cronologia), o espaço (lugar) e a espécie (fenômeno). Se houver variação de um desses elementos, a série estatística classifica-se em temporal, geográfica ou específica. Portanto, o nome da série depende dos elementos que variam, e eles podem ser divididos, conforme o que se apresenta a seguir. 04 E P I D E M I O L O G I A E B I O E S T A T Í S T I C A Série temporal, histórica, cronológica ou evolutiva Saiba mais sobre séries estatísticas em (117) ESTATÍSTICA #02 - Séries Estatísticas - YouTube É a série cujos dados estão em correspondência com o tempo, ou seja, variam com o tempo, enquanto o fato e o local permanecem constantes. Exemplo: 05 EPIDEMIOLOGIA E BIOESTATÍSTICA Série geográfica, territorial ou de localidade É a série cujos dados estão em correspondência com a região geográfica, ou seja, o elemento variável é o fator geográfico (a região), enquanto o tempo e o fato permanecem constantes. Exemplo Série específica ou categórica É a série cujos dados estão em correspondência com a espécie, ou seja, variam com o fenômeno. O local e o tempo permanecem constantes, enquanto o fato varia. Exemplo: https://www.youtube.com/watch?v=WGO4IUuwPvg 06 EPIDEMIOLOGIA E BIOESTATÍSTICA Séries mistas, conjugadas ou tabela de dupla entrada As combinações entre as séries anteriores constituem novas séries que são denominadas séries compostas ou mistas e são apresentadas em tabelas de dupla entrada, e permitem variar simultaneamente o tempo, o lugar e o fato, havendo duas ordens de classificação: uma horizontal e outra vertical.Exemplo: Distribuição de frequências Em um estudo estatístico, temos como maior interesse conhecer o comportamento da(s) variável(eis) presentes no estudo. Isto se torna fácil quando organizamos as respostas da variável em uma distribuição de frequências. Mas, o que é uma distribuição de frequências? Distribuição de frequências é uma tabela em que se resumem grandes quantidades de dados, determinando o número de vezes, que cada dado ocorre (frequência) e a porcentagem com que aparece (frequência relativa). O processo de contagem do número de vezes, que cada dado ocorre, fica facilitado se ordenarmos os dados. A uma sequência ordenada (crescente ou decrescente) de dados brutos damos o nome de Rol. Vamos formalizar os conceitos das frequências que utilizaremos na construção da distribuição de frequências: Frequência absoluta ou simplesmente frequência (f): é o nº de vezes que cada dado aparece na pesquisa. Frequência relativa ou percentual (fr): é o quociente da frequência absoluta pelo número total de dados. Esta frequência pode ser expressa em porcentagem. O valor de (fr x 100) é definido como fr (%). Veremos mais adiante que, em algumas análises, precisaremos das informações das frequências acumuladas: Frequência acumulada (fa): é a soma de cada frequência com as que lhe são anteriores na distribuição. Frequência relativa acumulada (fra): é o quociente da frequência acumulada pelo número total de dados. Esta frequência também pode ser expressa em porcentagem. O valor de (fra x 100) é definido como fra (%). A seguir apresentamos a estrutura de uma distribuição de frequências. 07 EPIDEMIOLOGIA E BIOESTATÍSTICA 08 EPIDEMIOLOGIA E BIOESTATÍSTICA As tabelas devem ser delimitadas, no alto e embaixo, por traços horizontais. Esses traços podem ser mais fortes do que os traços feitos no interior da tabela; as tabelas não devem ser delimitadas, à direita e à esquerda, por traços verticais; Podem ser feitos traços verticais no interior da tabela, separando as colunas; As tabelas devem ter significado próprio, isto é, devem ser entendidas mesmo quando não se lê o texto em que estão apresentadas; As tabelas devem ser numeradas com algarismos arábicos. Pode ser adotada a numeração progressiva por seções. Quando dois ou mais tipos de informação tiverem sido agrupados em um só conjunto, esse conjunto entra na tabela sob a denominação “outros”. O cabeçalho deve ser delimitado por traços horizontais; 1. 2. 3. 4. 5. EXEMPLO Um questionário foi aplicado aos dez candidatos a uma vaga no departamento financeiro de uma loja de departamentos e alguns dos resultados obtidos estão apresentados no quadro a seguir. Vamos organizar os dados das variáveis grau de escolaridade e idade em distribuição de frequências. As variáveis, ou seja, as características de interesse nos candidatos são: grau de escolaridade, idade e tempo de experiência na área da vaga. Candidato não é variável! Esta coluna simplesmente informa que são 10 candidatos, com suas respectivas características. Os números poderiam ser substituídos pelos nomes dos candidatos Resolução: A distribuição de frequências contém 3 colunas: a variável em estudo, a frequência e a frequência relativa (%). Toda tabela deve conter um título que explique o conteúdo da tabela. Também podemos utilizar como cabeçalho para a segunda coluna a palavra Frequência. Pelo Quadro 1, verificamos que há repetição das idades 26 (candidatos 3 e 7), 30 (candidatos 1 e 6) e 35 (candidatos 2 e 9). Por meio das informações contidas na Tabela 1.2, observamos que a idade mínima dos candidatos é 22 anos e a máxima é 35 anos. Podemos concluir, também, que 70% dos candidatos têm no máximo 30 anos (30 anos de idade ou menos). Podemos observar que a estrutura da distribuição de frequências é a mesma tanto para variáveis qualitativas quanto para variáveis quantitativas. No caso de variáveis quantitativas, colocamos os valores numéricos em ordem crescente. 09 EPIDEMIOLOGIA E BIOESTATÍSTICA O número de candidatos é 5 para o grau de escolaridade Ensino Médio, pois, analisando o Quadro 1 verificamos que 5 candidatos possuem esta escolaridade (candidatos 1, 4, 5, 7 e 10). A frequência relativa (%) para este grau de escolaridade é obtida fazendo 510X 100 = 50%. O mesmo procedimento é feito para encontrar os valores referentes ao grau de escolaridade Ensino Superior e Pós-Graduação. Analisando as informações, observamos que, dos 10 candidatos à vaga, 50% deles possuem Ensino Médio, seguidos por 30% com Ensino Superior e 20% com Pós- Graduação. A coluna da frequência acumulada é obtida somando cada frequência com as que lhe são anteriores e a frequência acumulada relativa (%) é obtida dividindo a frequência acumulada pelo número total de dados (X 100). Por exemplo, a frequência acumulada associada à idade 30 é obtida somando a frequência desta resposta com as frequências anteriores (1 + 1 + 2 + 1 + 2 = 7) e a frequência acumulada relativa (%) é obtida fazendo 710 X100=70% . Quando estamos analisando uma variável quantitativa contínua, é comum os valores não se repetirem. Se construirmos uma distribuição de frequências como na Tabela 1.2, ela ficará muito extensa e não atingiremos o objetivo de resumir o conjunto de dados. Nestes casos, é conveniente agrupar os dados em intervalos de classes. O mesmo procedimento pode ser feito quando a variável for quantitativa discreta e apresentar um número grande de dados, mas com valores com pouca repetição. Identificamos os seguintes valores em um intervalo de classe: Como dissemos anteriormente, em algumas análises precisamos da frequência acumulada, como na construção de um gráfico denominado Ogiva e no cálculo de medidas separatrizes para dados organizados em intervalos de classes. Construiremos, agora, uma distribuição de frequências com a frequência acumulada absoluta e a frequência acumulada relativa (%). 10 EPIDEMIOLOGIA E BIOESTATÍSTICA 1 1 Qual o número de classes que a tabela deve ter? Qual o tamanho (ou a amplitude) das classes? Podemos usar o bom senso e escolher arbitrariamente quantas classes e qual a amplitude que estas classes devem ter. Na construção de uma distribuição de frequências com intervalos de classes devemos ter respostas para estes dois questionamentos: Quando não tivermos nenhuma referência sobre qual deve ser o número de classes a se trabalhar, podemos utilizar o critério que é sugerido por vários autores. Chama-se regra da raiz: EPIDEMIOLOGIA E BIOESTATÍSTICA Para determinar a amplitude de cada classe calcularemos h ≅ Rk , em que R = valor máximo − valor mínimo. O valor de h será a amplitude da classe. Normalmente o valor encontrado para h não é inteiro. Nestes casos, podemos nos aproximar para o próximo para facilitar a construção das classes. Contar o número de observações que pertencem a cada intervalo de classe. Esses números são as frequências absolutas das classes. Calcular as frequências relativas de cada classe em que indica o número de classes que vamos construir e n é o número de observações do conjunto de dados. É muito comum o valor obtido para k não ser inteiro, então, vamos aproximar para o inteiro próximo de k. Para encontrar a amplitude e o número de observações em cada classe, vamos seguir os seguintes passos: Achar o mínimo e o máximo dos dados. De modo geral, a quantidade de classes não deve ser inferior a 5 e nem superior a 20. Se o número de classes for muito pequeno, perderemos informação, e com um número grande de classes, o objetivo de resumir os dados fica prejudicado. Construiremos intervalos de classe fechados à esquerda. A representação deste tipo de intervalo é: 12 Resolução: Apesar da variável em estudo (fração de colesterol de muito baixa densidade) ser apresentada na forma discreta, há uma variação grande de números. Se construirmos uma distribuição de frequências colocando os números do menor para o maior, a tabela ficará extensa. Então, nesta situação, é conveniente agrupar os dados em intervalos de classes. Primeiro,precisamos saber quantas classes vamos construir. Para isto, utilizaremos a fórmula: Então, construiremos 8 classes. Agora, vamos encontrar o tamanho (amplitude) de cada uma das classes: EPIDEMIOLOGIA E BIOESTATÍSTICA Por exemplo: Pertencem a este intervalo valores iguais ou superiores ao limite inferior do intervalo (neste exemplo, 5) e inferiores ao limite superior (neste exemplo, 10). Se houver o número 10 no conjunto de dados, ele entra no próximo intervalo de classe. Os dados abaixo referem-se à fração de colesterol de muito baixa densidade, em miligramas por decilitro (mg/dl), em indivíduos do sexo feminino. Vamos organizar este conjunto de dados numa distribuição de frequências. Portanto, vamos construir classes de amplitude 4 cada uma (arredondamos o valor de h para facilitar a construção das classes). Quando consideramos 4 como amplitude, o número de classes passa a ser 7 (esta alteração não gera problema algum!). 13 EPIDEMIOLOGIA E BIOESTATÍSTICA Neste exemplo construímos classes de mesma amplitude, mas isto não é obrigatório. Quando construímos classes de amplitudes diferentes, devemos tomar cuidado na construção de um gráfico denominado histograma, que veremos mais adiante. Agora que já aprendemos como apresentar os dados coletados em distribuições de frequências, vamos estudar como estes mesmos dados são utilizados na construção de gráficos. Nesta unidade, estudamos as tabelas que têm por finalidade expor sinteticamente e num só local os resultados sobre determinado assunto, de modo que se obtenha uma visão global mais rápida daquilo que está em análise. Também foi possível observarmos a existência dos fatores que fazem a distinção das séries estatísticas, os quais são de fundamental importância para a sua compreensão. Além de estudarmos que uma das formas de organizar os dados coletados em uma pesquisa pode ser através das tabelas de distribuição de frequências ou de gráficos, os quais permitem uma síntese adequada e uma melhor compreensão dos resultados. CONCLUINDO A UNIDADE 14 Saiba mais sobre tabela e distribuição de frequências: (129) Estatística - Distribuição de Frequências - Tabelas e Frequência Absoluta - YouTube Saiba mais sobre séries estatísticas: (129) ESTATÍSTICA #02 - Séries Estatísticas - YouTube SAIBA MAIS 15 https://www.youtube.com/watch?v=lhMDXCRyqu4 https://www.youtube.com/watch?v=WGO4IUuwPvg&t=365s Um estudo completo das distribuições de frequências é imprescindível porque este é o tipo de tabela mais importante para a Estatística Descritiva. A distribuição de frequências em classes é apropriada para apresentar dados quantitativos contínuos ou discretos com um número elevado de possíveis valores. É necessário dividir os dados em intervalos ou faixas de valores que são denominadas classes. O menor valor da classe é denominado limite inferior (li) e o maior valor da classe é denominado limite superior (Li). Para saber mais sobre a distribuição de frequências de forma explicativa assista o vídeo a seguir: (129) Distribuição de Frequência : Frequência, Frequência Relativa e Frequência Acumulada - YouTube DICA DO PROFESSOR 16 https://www.youtube.com/watch?v=MGXfZiviUmI SEU GABARITO Questão 1: Uma série estatística é toda tabela que apresenta um conjunto de dados ordenados que possuem uma característica em comum apresentada sob forma de tabela e/ou gráfico. Numa série estatística observa-se a existência de três elementos ou fatores: o tempo (cronologia), o espaço (lugar) e a espécie (fenômeno). Se houver variação de um desses elementos, a série estatística classifica-se em temporal, geográfica ou específica. Portanto, o nome da série depende dos elementos que variam, assinale a alternativa que define a série categórica. Fonte: Autor A) É a série cujos dados estão dispostos em correspondência com o tempo, ou seja, os dados são observados ao longo do tempo (varia o tempo) B) É a série cujos dados estão em correspondência com a espécie, ou seja, variam com o fenômeno. O local e o tempo permanecem constantes, enquanto o fato varia. C) É a série cujos dados estão em correspondência com a região geográfica, ou seja, o elemento variável é o fator geográfico (a região), enquanto o tempo e o fato permanecem constantes. D) As combinações entre as séries anteriores constituem novas séries que são denominadas séries compostas ou mistas e são apresentadas em tabelas de dupla entrada, e permitem variar simultaneamente o tempo, o lugar e o fato, havendo duas ordens de classificação: uma horizontal e outra vertical. E) É a série cujos dados estão dispostos em correspondência com o tempo e as variações climáticas. EXERCÍCIOS DE FIXAÇÃO 17 SEU GABARITO EXERCÍCIOS DE FIXAÇÃO Questão 2: A série cujos dados estão em correspondência com o tempo, ou seja, variam com o tempo, enquanto o fato e o local permanecem constantes é: Fonte: Autor A) específica B) geográfica C) mista D) temporal E) conjugada 18 Questão 3,4,5: Um dado foi lançado 20 vezes. Em cada jogada foram obtidos os seguintes pontos: EXERCÍCIOS DE FIXAÇÃO 19 Construa uma tabela com distribuição de frequências absolutas, frequências absolutas acumuladas, frequências relativas e frequências relativas acumuladas. Questão 3: Determine a amplitude amostral (AA). A) 10 B) 6 C) 7 D) 5 E) 50 Questão 4: A frequência simples absoluta do primeiro elemento: a) 2 b) 5 c) 10 d) 7 e) 6 Questão 5: A frequência simples relativa do primeiro elemento: a) 10% b) 20 c) 1 d) 20% e) 10 20 ANOTAÇÕES REFERÊNCIAS BIBLIOGRÁFICAS Costa, P. R. Estatística. Colégio Técnico Industrial. Santa Maria: UFSM, 2011. DAVID, R. A. Dennis, J. S. Thomas, A. W. Estatística Aplicada à Administração e Economia. 2. ed. São Paulo: Thomson, 2007. SIEGEL, S.; CASTELLAN, N. J. Estatística Não Paramétrica para Ciências do Comportamento. 2. ed. Porto Alegre: Artmed, 2006. TRIOLA, M. F. Introdução à Estatística. 7. ed. Rio de Janeiro: LCT (Livros Técnicos e Científicos) Editora S.A., 1999. VIEIRA, Sonia. Introdução à bioestatística. 5. ed. Rio de Janeiro: Campus, 2015. 21 1- Gabarito: B Justificativa do gabarito: É a série cujos dados estão em correspondência com a espécie, ou seja, variam com o fenômeno. O local e o tempo permanecem constantes, enquanto o fato varia. 2- Gabarito: D Justificativa do gabarito: Série temporal é a aquela cujos dados estão dispostos em correspondência com o tempo, ou seja, os dados são observados ao longo do tempo (varia o tempo). O local e a espécie (fenômeno) são elementos fixos. Esta série também é chamada de histórica ou evolutiva. 3- Gabarito: C Justificativa do gabarito: Calcula-se subtraindo o maior valor do menor valor AA = 6-1 = 5 4- Gabarito: A 5- Gabarito: A GABARITOS 22
Compartilhar