Baixe o app para aproveitar ainda mais
Prévia do material em texto
Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Universidade Regional Integrada do Alto Uruguai e das Missões - Erechim Curso de Odontologia Apostila de Bioestatística Versão 2016 Prof. Claodomir Antonio Martinazzo Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 2 Conteúdos Curriculares 1. INTRODUÇÃO - Bioestatística: conceitos e aplicações; - Estatística Vital: indicadores mais usados na área da Saúde Pública 2. LEVANTAMENTO, APURAÇÃO E APRESENTAÇÃO DE DADOS. - Classificação da variável de análise. Tipos de levantamentos de dados. Técnicas de apuração. Representação tabular e gráfica. 3. ANÁLISES DESCRITIVAS DA AMOSTRA - Medidas de tendência central; Medidas de variabilidade. 4. PROBABILIDADE - Noções sobre a teoria das probabilidades. - Probabilidade como medida de risco. Uso das probabilidades para avaliação de métodos diagnósticos. - Distribuições de probabilidade: distribuição binomial e distribuição normal. - Distribuição não gaussiana. 5. AMOSTRAGEM - Técnicas de seleção de amostras; Precisão e vício; Tamanho de amostra. 6. INFERÊNCIAS ESTATÍSTICAS - Noções sobre testes de hipóteses (paramétricos e não paramétricos). Testes de significância estatística: teste do qui-quadrado, teste t-student, ANOVA. - Testes não paramétricos. 7. CORRELAÇÃO E REGRESSÃO - Gráfico de dispersão; Coeficiente de correlação; Reta de regressão. METODOLOGIA: Aulas principalmente teóricas com caráter expositivo e/ou práticas, podendo ser assistidas por computador (no formato de apresentação de vídeos, fotos, textos, elaboração de tabelas e gráficos bem como cálculo das principais estatísticas, tanto descritivas quanto inferenciais). Serão propostas leituras de livros texto e artigos relacionados com assuntos de Análise Estatística com relação direta com o assunto deste Plano de Ensino. A fixação dos conteúdos será através de exercícios e trabalhos a distância. É imprescindível que os alunos utilizem calculadora científica durante a maioria das aulas da disciplina. BIBLIOGRAFIA BÁSICA ARANGO, Héctor Gustavo. Bioestatística: teórica e computacional. 3. ed. Rio de Janeiro: Guanabara Koogan, 2012. CALLEGARI-JACQUES, Sida M. Bioestatística: princípios e aplicações. Porto Alegre: Artmed, 2008. VIEIRA, Sônia. Introdução à bioestatística. 4. ed. Rio de Janeiro: Elsevier, 2008. BIBLIOGRAFIA COMPLEMENTAR: PESTANA, Maria Helena; GAGEIRO, João Nunes. Análise de dados para ciências sociais: a complementaridade do SPSS. 4.ed. Lisboa: Sílabo, 2008. JEKEL, James F; ELMORE, Joann G.; KATZ, David L. Epidemiologia, bioestatística e medicina preventiva. Porto Alegre: Artmed, 2002. 328 p. FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso de estatística. 6. ed. São Paulo: Atlas, 2010. MANLY, Bryan F.J. Métodos estatísticos multivariados: uma introdução. 3. ed. Porto Alegre: Bookman, 2008. TRIOLA, Mario F. Introdução à estatística. 10. ed. Rio de Janeiro: Livros Técnicos e Científicos, 2011. NOTAS: Duas provas escritas, individuais, sem consulta (Peso 1,0 cada uma = 2,0). (Diversos trabalhos que totalizarão mais 1,0). No final serão três notas. Trabalho Gráficos: Até 19/09/2016, de um a três alunos (peso = 0,4). Trabalho Estatística Descritiva com Planilha Eletrônica: 0,3. Outros trabalhos: Data: ??/??/16 (Peso = 0,3) Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 3 1.0 NOÇÕES ELEMENTARES 1.1 DEFINIÇÕES A palavra estatística surge da expressão em Latim statisticum collegium palestra sobre os as- suntos do Estado, de onde surgiu a palavra em lín- gua italiana statista, que significa "homem de es- tado", ou político, e a palavra alemã statistik, de- signando a análise de dados sobre o Estado. A pa- lavra adquiriu um significado de coleta e classifi- cação de dados, no início do século 19. Inúmeras são as definições com que os autores conceituam a Estatística, tendo em vista seus processos, objeti- vos e aplicações. São aqui destacadas, entre tantas, as que melhor esclarecem sua finalidade, seu âmbi- to e sua significação. “Conjunto dos processos que têm por objeto a observação, a classificação formal e a análise dos fenômenos coletivos ou de massa e, por fim, a in- dução das leis a que tais fenômenos obedecem glo- balmente” (Milton da Silva Rodrigues). “Apresentação numérica, tabular ou gráfica dos resultados da observação dos fenômenos de massa.” “A Estatística é parte da Matemática Apli- cada que se ocupa em obter conclusões a partir de dados observados” (Ruy Aguiar da Silva Leme). “A Estatística é o estudo numérico dos fatos sociais” (Levasseur). “A Estatística não é senão a História em re- pouso; a História não é senão a Estatística em mo- vimento” (Schlözer). “A Estatística é coleta, apresentação, análise e interpretação de dados numéricos” (Croxton e Cowden). "É a ciência que tem por objetivo orientar a coleta, o resumo, a apresentação, a análise e a in- terpretação de dados" (Callegari-Jacques, 2003). “A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, orga- nização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de deci- sões”. Algumas frases célebres têm sido arquivadas pelos estatísticos, entre as quais: “Faça o Brasil a Estatística que deve ter e a Estatística fará o Brasil como deve ser” (Teixeira de Freitas). “ Em uma palavra, se a Economia sabe indi- car como produzir, a Estatística pode dizer quanto produzir. Aquela ensina a movimentar a máquina econômica das nações, esta regula a velocidade conveniente.” Bioestatística é a Estatística aplicada às ciências que estudam aspectos vitais (referentes à vida), como a Medicina, Enfermagem, Biologia, Educação Física, Odontologia, Farmácia, Nutrição, Fisioterapia e Psicologia. Em odontologia, algumas pesquisas podem ser sobre: - taxa de sobrevivência de implantes; - fluorose; - cálculo dental; - ensaios mecânicos destrutivos estáticos de tração; - ensaios mecânicos destrutivos estáticos de compressão; - ensaios mecânicos destrutivos estáticos de cisalhamento; - ensaios mecânicos destrutivos estáticos de flexão; - ensaios mecânicos destrutivos estáticos de dureza; - ensaios mecânicos destrutivos dinâmicos por fadiga; - ensaios não destrutivos (visual, pressão e vazamento, líquido penetrante, radiografia com raios x, rugosidade superficial) - saúde bucal coletiva; - índice CEO-D e CPO-D; - etc. Fatos Vitais – são chamados fatos vitais os que relacionam à população, compreendendo os nascimentos, casamentos, óbitos, doenças e outros. Seu estudo é de domínio da Bioestatística ou estatística vital. Esses dados são coletados de duas maneiras: a) Por meio de censos b) Por meio de registros Os censos são realizados periodicamente e os registros são feitos pelos cartórios ou repartições sanitárias no caso de doenças. Unidade Experimental e unidade de observação Bioestatística –Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 4 - é a menor unidade a fornecer uma informação. As unidades podem ser pessoas, animais, plantas, objetos, fatos, etc. Dados - são as informações (numéricas ou não) obtidas de uma análise experimental ou de observação. 1.2 ESTATÍSTICA - PARÂMETRO E ESTIMADOR O objetivo da Estatística é estudar conjuntos para tirar parâmetros, que possibilitarão decisões. Parâmetro é um elemento numérico usado para caracterizar todo o conjunto (população). Assim, por exemplo: Um aluno presta várias provas de uma determinada disciplina, conseguindo, ao término do ano, um conjunto de notas; tais notas formam os elementos do conjunto. Serão substituídos por um único elemento, por um parâmetro que, no caso, é a média aritmética, e que possibilitará anunciar a todos os interessados se o aluno obteve ou não habilitação nessa disciplina. OBSERVAÇÃO: Os parâmetros em geral, são desconhecidos, e desejamos estimar a partir de uma amostra. Ao conjunto de pessoas, de escolas, de notas, de leitos de um hospital etc., que constitui o todo para permitir o cálculo do parâmetro, é dado o título de universo. O universo é, assim, o conjunto constituído por todos os elementos; tais elementos são reunidos em subconjuntos denominados populações. Assim: - o conjunto de escolas de Ensino Fundamental e Médio do Rio Grande do Sul é um universo que contém populações de escolas urbanas, de escolas com uma só sala de aula, de escolas agrícolas etc. População é, pois, um total de objetos ou de pessoas que apresentam as mesmas características dentro de um mesmo universo. Normalmente não é possível inferir conclusões pesquisando uma população inteira, como por exemplo, todos os eleitores de um país. É necessário definir certa parcela da população para fazer a pesquisa e a partir dessa parcela (representativa) que chamaremos de amostra poderemos tirar uma conclusão para tendência de todo o eleitorado (estimador estimativa). A Figura 1.1 mostra um esquema que caracteriza o trabalho da estatística. Observa-se que, aplicando-se técnicas adequadas de amostragem são selecionadas unidades experimentais ou de observação que fornecerão informações que permitirão, a partir de inferência estatística, conclusões sobre as características de população. Figura 1.1 - Esquema do trabalho com estatística. Fonte: ignorada. Estatística é ciência, quando estuda populações; é método, quando serve de instrumento a outra ciência. É também arte, ciência-método e método-ciência, segundo vários tratadistas: A estatística apresenta duas grandes áreas de atuação: A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva, enquanto a análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial. Em geral, as pessoas, quando se referem ao termo estatística, o fazem no sentido da organização e descrição dos dados (Estatística do Ministério da Educação, estatística dos acidentes de trafego etc.), desconhecendo que o aspecto essencial da Estatística é o de proporcionar métodos inferenciais, que permitam conclusões que transcendam os dados obtidos inicialmente. Importante O papel da Estatística na pesquisa científica é contribuir com o investigador na formulação das hipóteses estatísticas e fixação das regras de decisão, no fornecimento de técnicas para um eficiente delineamento de pesquisa, na colheita, tabulação e análise dos dados (estatística descritiva) e em fornecer Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 5 testes de hipóteses a serem realizados de tal modo que a incerteza da inferência possa ser expressa em um nível probabilístico pré-fixado (inferência estatística). 1.3 COLETA DE DADOS Determinadas as características mensu- ráveis do fenômeno que se quer pesquisar, ini- ciamos a coleta dos dados. A coleta pode ser direta e indireta. Direta (fonte primária): quando as informa- ções são colhidas diretamente pelo pesquisa- dor ou por seus auxiliares. Indireta (fonte secundária): quando o pesquisador recorre a relatórios, revistas, livros ou dados cole- tados por instituições especializadas. A coleta direta pode ser: Contínua – quando feita continuamente, tal como a de nascimentos e óbitos e a frequência dos alunos às aulas. Periódica – quando feita em intervalos constantes de tempos, como os censos (de 10 em 10 anos) e as avaliações “mensais” dos alunos. Ocasional – quando realizada para atender uma emergência, por exemplo, uma epidemia. 1.4 APLICAÇÕES A aplicação prática da Estatística às diversas áreas do conhecimento humano comprova sua uti- lidade, destacadamente nos ramos onde a experi- mentação é de fundamental importância – como, por exemplo: nas áreas da saúde onde coletam-se dados de pessoas, de animais e de fenômenos físicos e químicos. Interessam aos pesquisadores dessas áreas dados sobre mortalidade infantil, eficiência de medicamentos, incidência de doenças, causas de morte e outros; em pesquisas de mercado (que propor- ção de pessoas prefere o carro da marca X ou que proporção de fumantes prefere o cigarro da marca A); em Sociologia (que porcentagem do to- tal de domicílios rurais possui eletricidade?); na indústria (que fração dos artigos comprados ou produzidos apresenta algum defei- to?). Exercício 01: Nos itens de (a) – (d) identifique a população e a amostra. a) Um levantamento realizado com 400 estudantes dos cursos de graduação da URI-Campus de Erechim descobriu que 5% deles realizaram algum tipo de trabalho voluntário (Fonte: Dados fictícios). b) Um estudo feito com 500 homens de 20 a 25 anos da cidade de Erechim/RS descobriu que 60% deles são fumantes (Fonte: Dados fictícios). c) Foi realizado na Itália um estudo com 33.043 crianças que buscava encontrar uma ligação entre anor- malidades do ritmo cardíaco e a síndrome da morte súbita na infância (Fonte: New England Journal of Medicine). d) Um levantamento feito com 1.023 famílias nos EUA descobriu que 65% delas assinam o serviço de te- levisão a cabo. Exercício 02: Nos itens de (a) – (e), determine se o valor numérico é um parâmetro ou uma estimativa. Explique seu raciocínio. a) ____% dos alunos matriculados na disciplina de Bioestatística do curso de Odontologia, turma 2013, da URI-Campus de Erechim, são do sexo feminino. b) A estatura média de 25 dentre os 120 estudantes do curso de Odontologia da URI-Campus de Erechim é de 167 cm (Fonte: Dados fictícios). c) O salário médio mensal de 10 dentre os 30 dentistas de certa cidade é de R$ 10.200,00 (Fonte: Dados fictícios). d) Em um levantamento feito com uma amostra de usuários de computador, 10% afirmaram que seus computadores apresentaram um defeito que necessitou ser consertado por um serviço técnico. e) Em um levantamento feito com mil adultos nos EUA, 47% disseram que usar telefone celular ao vo- lante deve ser ilegal (Fonte: Rasmussem Research). Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 6 Exercício 03: Decida qual parte do estudo representa o ramo descritivo daestatística. Quais conclusões podem ser obtidas do estudo usando a estatística inferencial? a) Uma amostra grande de homens com 48 anos de idade foi estudada durante 18 anos. Entre 60% e 70% dos homens solteiros estavam vivos aos 65 anos de idade. Entre os homens casados, 90% estavam vivos aos 65 anos. Que parte do estudo representa o ramo descritivo da estatística? Que conclusões podem ser tiradas desse estudo usando a estatística inferencial? (Fonte: The Jounal of Family Issues) b) Um levantamento realizado com 1017 homens e mulheres pelo Opinion Research Corporation Interna- tional descobriu que 76% das mulheres e 60% dos homens haviam feito um exame físico durante o ano anterior (Fonte: Men’s Health). Exercício 04: Pretende-se obter uma amostra dos alunos de uma Universidade para estimar a proporção que tem trabalho remunerado. Qual é a população em estudo? Qual é o parâmetro que se quer estimar? Você acha que se obteria uma boa amostra dos alunos no restaurante universitário? No ponto de ônibus mais próximo? Nas portas das salas de aula? Ou você tem alternativa melhor? 1.5 VARIÁVEL É qualquer quantidade ou característica que pode assumir diferentes valores numéricos. Por exemplo, um questionário de uma pesquisa contém as seguintes perguntas: Pergunta Variável Qual a sua idade? Qual o número de pessoas de sua família? Qual a renda familiar? Qual é o seu estado civil? Você tem emprego fixo? Qual o tempo de trabalho na empresa? - Idade - Tamanho da família - Renda familiar - Estado civil - Emprego - Tempo de trabalho. As variáveis a serem utilizadas em pesquisas dependem do objetivo de estudo. Geralmente são utilizadas variáveis demográficas (sexo e idade), socioeconômicas (renda familiar e escolaridade materna), comportamentais (dieta – refeições por dia, idade de introdução do açúcar, mamadeiras por dia; higiene – escovações por dia, uso de dentifrícios) e biológicas (placa, cárie, gengivite, fluorose, cálculo). Classificação das Variáveis Ao se fazer um estudo estatístico de um determinado fato ou grupo, tem-se que considerar o tipo da variável. Pode-se ter variáveis qualitativas ou quantitativas. As variáveis qualitativas (ou atributos) são as que descrevem os atributos de um indivíduo, tais como: sexo, estado civil, grau de instrução, etc. Já as variáveis quantitativas são as provenientes de uma contagem ou mensuração, tais como: idade, salário, peso, etc. As variáveis qualitativas e as quantitativas dividem-se em dois tipos (Quadro 1): Quadro 1 – Classificação das variáveis. Variáveis Tipos Descrição Exemplos Quantitativas Discretas Dados oriundos de contagem. Número de funcionários; número acidentes de trabalho ocorrido durante um mês. Contínuas Dados oriundos de medição. Medidas de altura e peso; idade. Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 7 Qualitativas ou Categóricas Nominal Não existe nenhuma ordenação. O valor numérico associado com a categoria não tem significado real. Para dados na escala nominal, o interesse é na quantidade ou na proporção de cada categoria. Os métodos estatísticos não são aplicados neste caso, ou seja, não se pode calcular médias, variâncias, etc. Cor dos olhos, sexo, estado civil, religião. Por exemplo: 1 – Sexo Masculino; 2 – Sexo feminino. O 1 e o 2 não tem significado. Ordinal Obedece a certa ordenação. As características são ordenadas (de maneira crescente ou decrescente) em situações para as quais a posição associada é importante. As operações aritméticas possíveis são: a contagem e a comparação Grau de instrução; classe social; Faixa etária. Outros exemplos: a) O conceito de um estudante em uma disciplina da PG pode ser ótimo (4), bom (3), regular (2), ruim (1); b) Presença de albumina na urina, indicada por: 0, +, ++, +++. Observação: A rigor, no tratamento estatístico das variáveis categóricas, não existe diferença se ela for nominal ou ordinal, o cuidado que devemos ter é que quando se está trabalhando com uma variável ordinal, é aconselhável man- ter a ordem natural das categorias, da menor para maior, na hora da apresentação, seja em tabelas ou em gráficos. CUIDADO: Para a variável peso de um lutador de boxe, se for anotado o peso marcado na balança, a variável é quantitativa contínua, se o peso for classificado segundo as categorias do boxe, a variável é qualitativa ordinal. A cada fenômeno corresponde um nu mero de resultados possíveis. Assim, por exemplo: - para o fenômeno "sexo" são dois os resultados possíveis: sexo masculino e sexo feminino; - para o fenômeno "número de filhos" há um número de resultados possíveis expressos através dos números naturais; 0, 1, 2, 3, 4, ... , n; De um modo geral as medidas dão origem a variáveis contínuas e as contagens ou enumerações, a variáveis discretas. Designamos as variáveis por letras latinas, em geral, as últimas: x, y, z. 1)Classifique as variáveis: A. Cor dos cabelos.............................................. B. Número de filhos .......................................... C. O ponto obtido na jogada............................... D. Diâmetro externo............................................ E. Cor dos olhos. ................................................. F. Precipitação pluviométrica, durante um ano. G. Número de ações negociadas. ....................... H. Largura de uma trave de futebol......................... I. Peso de um lutador de boxe medido na balança ........................................................................ J. Sexo dos filhos. .............................................. K. Produção de algodão ..................................... L. Número de livros.............. ............................. M. Número de defeitos por unidade. .................. N.Peso de um lutador de boxe em categoria........ ....................................................................... O. Peso dos jogadores de um time de futebol......... ........................................................................ P. Estatura dos jogadores de um time de basquete. ......................................................................... Q. Grupo sanguíneo........................................... R. Grau de Instrução: ......................................... S. Peso dos jogadores de um time de futebol: .... ............................................................................ T. Renda familiar (em reais):............................... U. Número de dentes cariados por criança: ....... ............................................................................ V. IMC médio de crianças: ..................................... X. Resistência mecânica de uma porcelana: ........... ........................................................................... Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 8 1.6 – Arredondamento de Dados –Norma ABNT NBR 5891/Dez. 1977 REGRAS: 1ª)Quando o algarismo imediatamente seguinte ao último algarismo a ser conservado for inferior a 5, o último algarismo a ser conservado permanecerá sem modificação.. Ex: 7,348 (para décimos) 7,3 2ª)Quando o algarismo imediatamente seguinteao último algarismo a ser conservado for superior a 5, ou, sendo 5, for seguido de no mínimo um algarismo diferente de zero, o último algarismo a ser conservado deverá ser aumentado de uma unidade. Ex: 1,2734 (para décimos) 1,3 3ª) Quando o primeiro algarismo após aquele que vamos arredondar for 5, seguido apenas de zeros, conservamos o algarismo se ele for par ou aumentamos numa unidade se ele for ímpar, desprezando os seguintes. Ex.: 6,250 (para décimos) 6,2 6,350 (para décimos) 6,4 OBS: Se o 5 for seguido de outros algarismos dos quais, pelo menos um é diferente de zero, aumentamos uma unidade no algarismo e desprezamos os seguintes. Ex: 8,3502 (para décimos) 8,4 8,4523 (para décimos) 8,5 4ª) Quando, ao arredondarmos uma série de parcelas, a soma ficar alterada, devemos fazer um novo arredondamento (por falta ou excesso), na maior parcela do conjunto, de modo que a soma fique inalterada. Ex: 17,4% + 18,4% + 12,3% + 29,7% + 22,2% = 100% Arredondando para inteiro temos: 17% + 18% + 12% + 30% + 22% = 99% faltando 1% Ficamos com: 17% + 18% + 12% + 31% + 22% = 100% 1)Arredonde os seguintes valores para uma e duas casas decimais: a) 42,8745 = = b) 25,088678 = = c) 53,99357 = = d) 76,25000002 = = e) 25,6550156 = = f) 24,75450 = = g) 24,65050 = = h) 45,45006 = = i) 25,34545 = = j) 38,9919 = = K) 12, 45507 = = l) 49,9198 = = m)4,550000 = = 2)Arredonde cada um dos numerais abaixo, conforme a precisão pedida: a. Para o décimo mais próximo: 23,46 = _____ 48,85002 = _____ 12,3 = _____ 45,09 = _____ 0,321 = _____ 9036,658 = _____ 55,55 = _____ 7447,61= ___ 0,51 = _____ 36,78 = _____ 43,75 = _____ 77,543= ____ b. Para o centésimo mais próximo: 46,727 = _____ 253,658 = _____ 123,842 = _____ 37,485 = _____ 8,498 =_____ 0,876 =_____ 0,785 =_____ 299,951 = _____ 0,321 = _____ 9036,658 = _____ 55,556 = _____ 7447,645 = _____ c. Para a unidade mais próxima: 26,6 = _____ 67,50 = _____ 68,2 = _____ 39,49 = _____ 128,5 =_____ 49,98 =_____ 4,20 = _____ 806,54 = _____ 3,21 = _____ 90,65 = _____ 54,55 = _____ 47,415= ____ Ver manual de seu modelo de calculadora no site do rodapé no item . 1. Defina estatística e dê dois exemplos em que a estatística é útil. 2. Em que duas grandes áreas a ciência Estatística Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 9 pode ser dividida? Descreva sucintamente do que trata cada uma destas áreas. 3. Cite pelo menos uma situação em que os dados são coletados através de: a) levantamentos contínuos b) levantamentos periódicos. c) levantamentos ocasionais 4. Defina: a) população b) amostra c) censo d) amostragem 5. Para ser útil, que características devem ter uma amostra? 6. Em uma pesquisa realizada em uma escola, identificou-se os seguintes indicadores: (1) idade (2) anos de estudo (3) ano de escolaridade (4) renda (5) sexo (6) local de estudo (7) conceito obtido na última prova de biologia (8) Quantidade de livros que possui (9) Número de dentes cariados em uma criança (10) Número de escovações diárias (11) Número médio de escovações diárias das crianças da escola. a) Das variáveis acima, quais são as quantitativas e quais são as qualitativas? b) Das variáveis quantitativas, diga quais são discretas? 7. Foi encomendado um estudo para avaliação de uma entidade de ensino superior. Para isso, aplicou-se um questionário e obtiveram-se respostas de 110 alunos. Indique: a) a variável em estudo; c) a população em estudo; b) a amostra escolhida; Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 10 2.0. SÉRIES ESTATÍSTICAS 2.1. QUADRO1 Um projeto de pesquisa pressupõe um planejamento detalhado do que deve ser feito com os dados coletados. Todas as etapas do processo de pesquisa são efetuadas visando à análise dos dados, por meio do qual serão tiradas conclusões, feitas recomendações e tomadas decisões. Inicialmente os dados dos questionários ou de qualquer outra forma de coleta devem ser organizados em Quadros, em que são listadas as informações obtidas para cada participante. O quadro é completamente fechado e não se propõe a resumir os dados. É classificado como ilustração de acordo com a ABNT (2002) NBR 14724. De acordo com a NBR 14724 (2011), a identificação deve ser feita na parte superior precedida da palavra Quadro, seguida do número de ordem no texto, em algarismos arábicos, travessão e respectivo título. Após o quadro insere-se a fonte, mesmo quando for do próprio autor. Essas normas podem ser observadas no livro Trabalhos Acadêmicos da Edifapes – da Concepção à Apresentação, 3ª ed. Este livro propõe-se a unificar a formatação dos trabalhos em nível de URI-Campus de Erechim. Deve ser seguido na apresentação de trabalhos internos. A terceira edição traz as modificações inseridas na NBR 14724 em 2011. Figura 2.1 – Características de estudante da Universidade Santa Úrsula que utilizam Métodos Anticoncepcionais. Sujeito Sexo Idade Estado Civil Nível de Instrução Quem toma a medida Qual a medida tomada 1 F 28 C Superior Mulher Pílula 2 M 29 S 2º grau Mulher Tabela 3 f 36 S Superior Mulher Ligadura ...* 47 F 42 C Superior Mulher Ligadura 48 F 30 C 2º grau Mulher Ligadura 49 F 46 C 1º grau Mulher Ligadura 50 F 29 C 2º grau Mulher Pílula * Foi feito um corte no Quadro. O quadro completo pode ser encontrado na fonte acima. Fonte:BUNCHAFT&KELLNER, Estatística sem Mistérios, Ed. Vozes, Petrópolis: 1997, pág. 31 –34. A descrição a seguir é válida para qualquer ilustração (ABNT 2011 NBR 14724 adaptada por Trabalhos Acadêmicos da Edifapes – da Concepção à Apresentação (2013). Elas devem: a) ser inseridas no texto, se possível o mais perto do trecho a que se referem; b) a chamada da ilustração, no texto, será feita pela indicação da palavra correspondente ao tipo de ilustração (Figura, Quadro, Fotografia, Mapa, etc.), seguida do respectivo número. Por exemplo: ... o Quadro 1 mostra ... c) ter numeração arábica sequencial ao longo do texto. O número pode ser precedido pelo número do capítulo. Exemplo: Quadro 2.1. Significa: quadro 1 do capítulo 2; d) o título deve preceder a ilustração de forma breve e clara; e) as notas de rodapé devem ser inseridas, em fonte menor (10) após a ilustração; e) as legendas devem ser digitadas em fonte menor (fonte 10); 1 Para maiores informações consulte BUNCHAFT&KELLNER, Estatística sem Mistérios, Ed. Vozes, Petrópolis: 1997, pg. 31 –34. Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 11 e) a fonte, mesmo que seja o autor, deve ser escrita após o gráfico e notas ou legendas se for o caso; f) após a ilustração, o texto deve iniciar a um espaço de 1,5 abaixo da fonte; 2.2. TABELAS Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveispodem assumir, para que tenhamos uma visão global da variação desta ou destas variáveis. E isso ela consegue, inicialmente, apresentando esses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo, permitindo-nos determinações administrativas e pedagógicas mais coerentes e científicas. Tabela é um quadro que resume um conjunto de observações. Uma tabela compõe-se de: a. corpo– conjunto de linhas e colunas que contém informações sobre a variável em estudo; b. cabeçalho – parte superior da tabela que especifica o conteúdo das colunas; c. coluna indicadora – parte da tabela que especifica o conteúdo das linhas; d. linhas – retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas; e. casa ou célula – espaço destinado a um só número; f. título – conjunto de informações, as mais completas possíveis, respondendo as perguntas: O que?, Quando?, Onde?, localizado no topo da tabela. Tabela 2.1 – Produção de café. Brasil – 1991-1995. Título Considerações: O título da tabela deve indicar a natureza e a abrangência geográfica e/ou temporal dos dados. É co- locado na parte superior, precedido da palavra Tabela e de seu número de ordem seguido de travessão. O tama- nho a fonte é 12; As tabelas são numeradas consecutivamente e in- dependentemente das ilustrações, em algarismos arábi- cos. A numeração pode ser subordinada ou não a capí- tulos ou seções de um documento; A tabela não deve ser fechada lateralmente (sem fios laterais); Não há obrigatoriedade de linha (fio) vertical entre as colunas, mas esta pode ser utilizada desde que seja necessário o que ocorre quando a tabela apresenta muita informação (muitas colunas e/ou muitas linhas); Não devem ser utilizados traços (fios) horizontais separando as linhas com exceção do cabeçalho e da úl- tima linha; As linhas pontilhadas facilitam a leitura, mas não são obrigatórias; Convém colocar a informação referente ao total em primeiro lugar, por se tratar em geral do dado mais im- portante; Nenhuma célula deve ficar em branco; a ausência do dado é expressa por um traço (-) e a falta de conhe- cimento deste (dado ignorado) é expressa por três pon- tos (...); Quando há dúvida quanto a um fato numérico, po- de-se ainda segui-lo de um ponto de interrogação (?). Notas e chamadas são utilizadas para clarificar os dados. As notas fornecem informações de natureza ge- ral, destinadas a explicitar ou a esclarecer o conteúdo da tabela ou a indicar a metodologia adotada no levan- tamento de dados, enquanto as chamadas se referem a Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 12 informações específicas. Ambas são colocadas no roda- pé da tabela, abaixo da fonte, sendo as notas listadas as- sim: 1, 2, 3 etc, e as chamadas (1), (2), (3) etc. Seu em- prego deve ser evitado ao máximo, dado que contrariam o princípio de síntese proposto na elaboração de tabelas e gráficos; quando absolutamente necessárias devem ser redigidas de maneira muito concisa, indicando clara- mente os dados da tabela a que se referem. A fonte da tabela deve ser citada após o fio ou li- nha de fechamento da mesma. Recomenda-se a citação da fonte quando reproduzidas de outros documentos. A prévia autorização do autor se faz necessária, não sendo mencionada na mesma. Quando os dados apresentados na tabela foram levantados pelo autor do trabalho por meio de uma pesquisa de campo(questionários, formu- lários, entrevistas), pode-se utilizar como fonte as ex- pressões o autor ou pesquisa de campo; As tabelas devem estar centralizadas em relação às margens esquerdas e direitas; Quando as dimensões da tabela forem maiores do que a folha A4, a impressão poderá ser feita em folha A3, para ser dobrada posteriormente, ou reduzida medi- ante fotocópia. O tamanho da fonte dos dados numéricos da tabela é 10. As tabelas devem ser inseridas o mais próximo possível do trecho a que se referem; se a tabela não couber em uma folha, deve ser continuada na folha se- guinte e, nesse caso, não é delimitado por traço horizon- tal na parte inferior, sendo o título e o cabeçalho repeti- dos na folha seguinte. Quando uma tabela, por excessiva altura, tiver de ocupar mais de uma página, não deve ser delimitada na parte inferior, repetindo-se o cabeçalho na página se- guinte. Neste caso, deve-se usar no alto do cabeçalho ou dentro da coluna indicadora a designação Continua ou Conclusão, conforme o caso; A Tabela 2.2 resume os dados citados no exemplo do Quadro 2.1. Tabela 2.2 - Utilização de medida anticoncepcio- nal de acordo com o estado civil – USU – 1995 Medida Total Estado Civil Solteiro Casado Pílula .................... 18 12 6 Tabela .................. 10 9 1 Ligadura ............... 10 2 8 Coito Interrompido 5 5 - Diu ....................... 3 - 3 Preservativo ......... 3 3 - Diafragma ............ 1 - 1 Total 50 31 19 Fonte: WILMER, C., CASTELLO, G. & DE FARIAS, A. De acordo com o livro Trabalhos Científicos, editado pela EDIFAPES, guia para os trabalhos na URI – Campus de Erechim, quando você insere uma tabela num texto deve fazê-lo como no exemplo a seguir: “A Tabela 2.3, de acordo com LUIZ, Costa e Nadanovsky, 2005, mostra a distribuição do problema ortodôntico da oclusopatia (índices oclusais e suas variantes).” Tabela 2.3. Condição oclusal de escolares de 5 anos de idade. Oclusopatia 1996 2002 Nenhuma 51,0 49,5 Leve 22,9 27,8 Moderada/Severa 26,1 21,6 Total 100,0 100,0 Fonte: Adaptado de: Luiz, R. R. et. al. Epidemiologia e Bioestatística na Pesquisa Odontológica. Conforme varie um dos elementos da série, podemos classificá-la em histórica, geográfica e específica. 2.2.1 – Classificações das Séries Estatísticas As séries estatísticas ou tabelas são classificadas de acordo com o conteúdo apresentado. Utiliza-se como base de classificação, a coluna indicadora. 2.2.1.1 – Séries históricas, cronológicas, temporais ou marchas. Descrevem os valores da variável, em determinado local, discriminados segundo intervalos de tempo variáveis. Exemplo: Tabela 2.4 – Preço do acém no varejo – São Paulo – 1989-1992 Anos Preço médio (US$) 1989 2,24 1990 2,73 1991 2,12 1992 1,89 Fonte: APA. 2.2.1.2– Séries geográficas, espaciais, territoriais ou de localização. Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 13 Descrevem os valores da variável, em determinado instante, discriminados segundo regiões. Exemplo: Tabela 2.5 – Duração média dos estudos superiores - 1994 Países Número médio de anos Itália 7,5 Alemanha 7,0 França 7,0 Holanda 5,9 Inglaterra Menos de 4 FONTE: Revista Veja. 2.2.1.3– Séries específicas ou categóricas Descrevem os valores da variável, em determinado tempo e local, discriminados segundo especificações ou categorias. Exemplo: Tabela 2.6 – Frequência absoluta dos óbitos por câncer bucal e glândulas salivares segundo a localização anatômica da lesão. Município de são Paulo, 1980 – 2000. Localização anatômica N° de casos Assoalho 328 Gengiva 96 GlândulasSalivares 348 Lábio 78 Língua 1945 Mucosa oral 24 Não especificada 660 Palato 318 Retromolar 101 Vestíbulo 4 Fonte: Adaptado de: Luiz, R. R. et. al. Epidemiologia e Bioestatística na Pesquisa Odontológica, 2005. 2.2.1.4– Séries Conjugadas – Tabela de Dupla Entrada Muitas vezes temos necessidade de apresentar, em uma única tabela, a variação de valores de mais de uma variável, isto é, fazer uma conjugação de duas ou mais séries. Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla entrada. Em uma tabela desse tipo ficam criadas duas ordens de classificação: uma horizontal (linha) e uma vertical (coluna). Os gráficos podem ser de barras múltiplas ou colunas múltiplas (justapostas ou sobrepostas). Tabela 2.7 – Balança comercial do Brasil. 1989 – 1993. Especifica- ções Valor (US$ 1 000 000) 1989 1990 1991 1992 1993 Exportação 34383 31414 31620 35793 38783 Importação 18263 20661 21041 20554 25711 Fonte: Ministério da Fazenda A conjugação, no exemplo dado, foi série geográfica-série histórica, que dá origem à série geográfico-histórica. Podem existir, se bem que mais raramente, pela dificuldade de representação, séries compostas de três ou mais entradas. 2.2.1.5– Distribuição de Frequências Por se tratar de um conceito estatístico de suma importância, terá tratamento especial, em separado. Exemplo: Tabela 2.8 – Duração da prova de Estatística II da turma COMEX 2004 – URI – Campus de Erechim – 2005. Duração (minutos) Nº de alunos 40├47 15 47├54 9 54├61 11 61├68 4 68├75 9 75├82 9 82├89 3 Total 60 Fonte: o autor. 1) Classifique as séries: Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 14 A) Tabela 2.9 – Produção de borracha natural – 1991-93 Anos Quantidade (ton) 1991 29.543 1992 30.712 1993 40.663 Fonte: IBGE. B) Tabela 2.10 – Avicultura brasileira – 1992. Espécies Número (1000 cabeças) Galinhas 204.160 Galos, frangos, frangas e pintos 435.465 Codornas 2.488 Fonte: IBGE. C) Tabela 2.11 – Vacinação contra a poliomielite 1993. Regiões Quantidade Norte 211.209 Nordeste 631.040 Sudeste 1.119.708 Sul 418.785 Centro-Oeste 185.823 Fonte: Ministério da Saúde. D) Tabela 2.12 – Aquecimento de um motor de avião de marca X. Tempo (min) Temperatura (ºC) 0 20 1 27 2 34 3 41 4 49 5 56 6 63 Fonte: Dados Fictícios. E) Tabela 2.13 – Produção brasileira de aço bruto 1991-93 Processos Quantidade (1000 t) 1991 1992 1993 Oxigênio básico 17.934 18.849 19.698 Forno elétrico 4.274 4.637 5.065 EOF 409 448 444 Fonte: Instituto Brasileiro de Siderurgia. 2) Verificou-se, em 1993, o seguinte movi- mento de importação de mercadorias: 14.839.804 t, oriundas da Arábia Saudita, no valor de US$1.469.104.000; 10.547.889 t, dos Estados Unidos, no valor de US$6.034.946.000; e 561.024 t, do Japão, no valor de US$1.518.843.000. Con- feccione a série correspondente e classifique-a, sa- bendo que os dados acima foram fornecidos pelo Ministério da Fazenda. 2.2.2 - Dados Absolutos e Dados Relativos Os dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação senão a contagem ou medida são chamados dados absolutos. A leitura dos dados absolutos é sempre enfadonha e inexpressiva; embora esses dados traduzam um resultado exato e fiel, não tem a virtude de ressaltar de imediato as suas conclusões numéricas. Daí o uso imprescindível que faz a Estatística dos dados relativos. Dados relativos: é o resultado de comparações por quociente (razões) que se estabelecem entre dados absolutos e tem por finalidade realçar ou facilitar as comparações entre quantidades. Traduzem-se os dados relativos, em geral, por meio de percentagens, índices, coeficientes e taxas. Consideremos a série: Tabela 2.14 – Matrículas nas escolas da cidade A 1995 Categorias Número de alunos Por 1 % 1º GRAU 19.286 2º GRAU 1.681 3º GRAU 234 TOTAL 21.201 1,0000 100,00 Fonte: Dados fictícios. Considere o próximo exemplo: Tabela 2.15 – Matrículas nas escolas da cidade A e B – 1995 Categor ias Cidade A Cidade B Nº alunos % Nº alunos % 1º Grau 19.286 38.660 2º Grau 1.681 3.399 3º Grau 234 424 Total 21.201 100,0 42.483 100,0 Fonte: Dados Fictícios Qual das cidades tem, comparativa- mente, maior número de alunos em cada grau? Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 15 OBSERVAÇÃO: Do mesmo modo que tomamos 100 para base de comparação, também podemos tomar outro número qualquer, entre os quais destacamos o número 1. É claro que, supondo o total igual a 1, os dados relativos das parcelas serão todos menores que 1. Em geral quando usamos 100 para base, os dados são arredondados até a primeira casa decimal; e quando tomamos 1 por base, são arredondados até a terceira casa decimal. 1) Complete a tabela a 2.16: Tabela 2.16 – Alunos matriculados em escolas fictícias – 1995. Escolas Nº De alunos Dados relativos Por 1 Por 100 A 175 0,098 9,8 B 222 C 202 D 362 E 280 F 540 TOTAL 1781 1,000 100,0 Dados fictícios. 2) Uma escola apresentava, no final do ano, o se- guinte quadro: Tabela 2.17 – Matrículas na escola XYZ – 1999. SÉRIES Matrículas Março Novembro % 1ª 480 475 2ª 458 456 3ª 436 430 4ª 420 420 Total 1794 1781 Fonte: Dados fictícios a) Calcule a taxa de evasão por série. b) Calcule a taxa de evasão da escola. 2.3 – REPRESENTAÇÃO GRÁFICA Com palavras, números ou desenhos podem-se mostrar às pessoas interessadas o resultado da pesquisa, antes mesmo de aplicarem-se sobre os dados as operações matemáticas, que permitirão a interpretação final por parte da equipe encarregada do levantamento estatístico. A exposição por palavras é dita descritiva, a numérica é também conhecida como tabular e, finalmente, os desenhos constituem a exposição gráfica. Um relatório final reúne, quase sempre, as três modalidades de exposição, apresentando: gráficos, para ilustrar ou acentuar determinados itens: tabelas, para resumir a massa de dados observados no período de atividades; e palavras, para orientar a leitura, comentar as tabelas analisar os gráficos e concluir o relatório. Muitos gráficos, os mais comuns, são construídos seguindo o sistema de coordenadas cartesianas, enquanto outros obedecem ao sistema de coordenadas polares. O sistema de coordenadas cartesianas pede o traçado de dois eixos (orientados). A moldura de um gráfico é retangular. “Para que um retângulo seja harmonioso é necessário que a altura seja o segmento áureo da base”, o que equivale a dizer: - Altura: largura: 0,618: 1. O segmento áureo representa a medida ideal dos olhos ao queixo no rosto bem conformado, sendo a distância da testa ao queixo igual à unidade, segundo afirmavam desde longa data aqueles que buscaram as medidas ideais no corpo humano. Regra prática: A altura deve ser um número inteiro entre 60% e 70% da largu- ra. 2.3.1 – Gráfico em Linha ou em Curva Este tipo de gráfico representa a sériehistórica, exclusivamente. Requer, entretanto, Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 16 que tal série apresente um número significati- vo de informações (5 ou mais), ou melhor, pa- ra 5 ou número menor de ocorrências um ou- tro gráfico deve ser construído, o gráfico de colunas. Vejamos a construção do gráfico em curvas, representativo da seguinte série temporal: Exemplo: Tabela 2.18 – Taxa de analfabetismo no Brasil – pessoas com 15 anos ou mais – 1998-2003. Anos Taxa de Analfabetismo (%) 1998 13,8 1999 13,3 2000 12,9 2001 12,4 2002 11,8 2003 11,6 Fonte: IBGE – Pesquisa Nacional por Amostra. Figura 2.2 – Taxa de analfabetismo entre brasileiros de 15 ou mais anos – 1998-2003. Fonte: IBGE, Pesquisa Nacional por Amostra de Domicílios 1998/2003. 1) Trace o gráfico da seguinte série histórica: Tabela 2.19 – Comércio Exterior – Brasil – 1984-1993. Anos Quantidade (1000 t) Exportação Importação 1984 141.737 53.988 1985 146.351 48.870 1986 133.832 60.597 1987 142.378 61.975 1988 169.666 58.085 1989 177.033 57.293 1990 168.095 57.184 1991 165.974 63.278 1992 167.295 68.059 1993 182.561 77.813 Fonte: Min. Indústria, Comércio e Turismo. 2.3.2. Gráfico em Colunas ou em Barras É a representação de uma série por meio de retângulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras). Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados. Assim estamos assegurando a proporcionalidade entre as áreas dos retângulos e os dados estatísticos. É um tipo de gráfico recomendado para analisar as informações absolutas de séries geográficas, especificativas e ainda algumas séries temporais (estas, com cinco ou menos datas) Quando somos forçados a dispor as colunas horizontalmente (a largura da coluna é insuficiente para conter a designação da mesma), temos o chamado gráfico em barras, que inicialmente é planejado como sendo o gráfico em colunas. A fim de facilitar o planejamento e a construção do gráfico, recomendamos: Sempre que possível, exceção feita às séries temporais onde sempre prevalece a ordem cronológica, ordenar as colunas de modo decrescente, da esquerda para a direita; consequentemente, as barras, se for o caso, também ficam ordenadas de modo decrescente, porém de cima para baixo; 10,5 11,0 11,5 12,0 12,5 13,0 13,5 14,0 1998 1999 2000 2001 2002 2003 Anos T a x a d e A n a lf a b e ti sm o ( % ) Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 17 O gráfico de Barras é mais alto do que largo. Na sequência temos um exemplo de gráfico de colunas e um gráfico de barras. Exemplo de gráfico de colunas: Tabela 2.20 – BRASIL – Quantidade Importada no Comércio Exterior – 1979-83 ANOS Quantidade (1000 t ) 1979 75328 1980 71855 1981 64066 1982 60718 1983 55056 Fontes: Banco do Brasil e Ministério da Fazenda. Figura 2.3 – BRASIL – Quantidade Importada no Comércio Exterior – 1979-83. Fontes: Banco do Brasil e Ministério da Fazenda. Exemplo de gráfico de colunas. Trace o gráfico da seguinte série geográfica: Tabela 2.21 – Casos registrados de intoxicação humana, segundo a causa determinante. Brasil, 1993. Causa Frequência Ignorada 1103 Outras 1959 Abuso 2604 Profissional 3735 Suicídio 7965 Acidente 29601 Fonte: Vieira, S., 1980. Figura 2.4– Casos registrados de intoxicação humana, segundo a causa determinante. Brasil, 1993. Fonte: Vieira, S., 1980. 2.3.3 – Gráfico em colunas ou Barras múltiplas Este tipo é geralmente empregado quando queremos representar, simultaneamente, dois ou mais fenômenos estudados com o propósito de comparação. Abaixo podemos observar uma tabela de dupla entrada representada graficamente de duas maneiras. Tabela 2.22 – Proporção da população por sexo, grandes grupos de idade. Por Sexo Percentual (%) 1980 1990 1996 2000 Mulheres 50,31 50,63 50,69 50,78 Homens 49,68 49,36 49,3 49,22 Fonte: IBGE, Censo Demográfico 1980, 1991 e 2000 e Contagem da População 1996. Colunas sobrepostas. As colunas maiores devem ficar atrás. Estes gráficos foram feitos no Excel. No LibreOffice ou a coluna maior fica atrás, mas à direita da tabela menor. 0 10000 20000 30000 40000 50000 60000 70000 80000 1979 1980 1981 1982 1983 Q u a n ti d a d e ( 1 0 0 0 t ) Anos 0 10000 20000 30000 40000 Ignorada Outras Abuso Profissional Suicídio Acidente C a u s a Freqüência Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 18 Figura 2.4 – Proporção da população por sexo, grandes grupos de idade. Fonte: IBGE, Censo Demográfico 1980, 1991 e 2000 e Contagem da População 1996. Colunas justapostas. Figura 2.5 – População total e proporção da população por sexo, grandes grupos de idade e situação de domicílio. Fonte: IBGE, Censo Demográfico 1980, 1991 e 2000 e Contagem da População 1996. 1) Trace o gráfico da seguinte série histórico- específica: Tabela 2.23 – Produto Interno Bruto Brasileiro. Trimestre /Ano Taxa Acumulada a ao longo do ano (%) Agropecuá- ria Indús- tria Servi- ços 1° - 2004 5,8 5,5 2,4 2° - 2004 5,9 5,9 2,8 3° - 2004 5,9 6,3 3,2 4° - 2004 5,3 6,2 3,3 1° - 2005 4,2 3,1 2,0 Fonte: IBGE, Departamento de Contas Nacionais - DECNA. 2.3.4. Gráfico em Setores ou Pizza Até agora todos os gráficos apresentados foram traçados de acordo com o sistema baseado nas coordenadas cartesianas. No entanto, temos ainda o sistema de coordenadas polares, onde cada ponto do plano é marcado em função de duas coordenadas, uma linear (raio vetor) e outra angular (ângulo polar). O gráfico em setores tem finalidade de analisar as informações percentuais de séries geográficas ou especificativas, com ”poucas” ocorrências (para que ele não se apresente confuso, dificultando a sua interpretação). A escolha do gráfico em retângulos ou em setores é opcional. Para uniformizar o traçado de um gráfico em setores, visando o melhor efeito estético, recomendamos, a título de sugestão: – iniciar o ponto de origem de marcação dos se- tores, no ponto correspondente às 12 horas do relógio (ou o norte da bússola) ; – marcar os setores, sempre que possível, de modo decrescente e no sentido horário; – indicar as percentagens de cada setor no inte- rior do mesmo; – evitar, quando possível, o uso de convenções, para simplificar o gráfico. Tomemos como exemplo a série específica que mostra a região dos implantes (Tabela 2,24 e Figura 2.6) Tabela 2.24 – Implantes por região. Região n Pré-maxila 35 Maxila 27 Mandíbula 28 Intermentoniana 10 Total100 Fonte: Adaptado de Luiz, Costa e Nadanovsky, Epidemiologia e Bioestatística na Pesquisa Odontológica, 2005. Figura 2.6 – Implantes por região. Fonte: Adaptado de Luiz, Costa e Nadanovsky, Epidemiologia e Bioestatística na Pesquisa Odontológica, 2005. 48,0 48,5 49,0 49,5 50,0 50,5 51,0 1980 1990 1996 2000 Anos Pe rc en tu al Mulheres Homens 48,0 48,5 49,0 49,5 50,0 50,5 51,0 1980 1990 1996 2000 Anos Pe rc en tu al Mulheres Homens 35,0% 28,0% 27,0% 10,0% Pré-maxila Mandíbula Maxila Intermentoniana Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 19 Além de ordenação de modo decrescente, escolhida para os setores, a marcação dos mesmos seguindo a ordem geográfica indicada na série também pode ser adotada. 1) Trace o gráfico correspondente à seguinte série: Tabela 2.25 – BRASIL – População recenseada, segundo as Grandes Regiões – 1980 Grandes Regiões População recenseada (1 000 hab) Norte 6.025.914 Nordeste 25.412.887 Sudeste 52.556.212 Sul 19.379.229 Centro-Oeste 7.738.842 Fonte: IBGE 2.3.5. Gráfico em Vetores É o gráfico ideal para representar séries temporais cíclicas, isto é, séries temporais que apresentam em seu desenvolvimento determinada periodicidade, como, por exemplo, a variação da precipitação pluviométrica ao longo do ano ou da temperatura ao longo do dia, a arrecadação da Zona Azul durante a semana, o consumo de energia elétrica durante o mês ou o ano, o número de passageiros de uma linha de ônibus ao longo da semana etc. O gráfico polar faz uso do sistema de coordenadas polares. Usando o Excel o nome é RADAR e o traçado do gráfico é interno à circunferência. Exemplo: Tabela 2.26 – Precipitação pluviométrica – Recife – 1993 MESES Quantidade (mm) Janeiro 49,6 Fevereiro 93,1 Março 63,6 Abril 135,3 Maio 214,7 Junho 277,9 Julho 183,6 Agosto 161,3 Setembro 49,2 Outubro 40,8 Novembro 28,6 Dezembro 33,3 Fonte: Ministério da Agricultura Figura 2.7 – Precipitação pluviométrica – Recife – 1993. Fonte: Ministério da Agricultura. OBSERVAÇÃO: Quando os números absolutos a serem representados forem muito grandes, no lugar de pontos podemos empregar hachuras. OBSERVAÇÃO: Existem livros específicos que tratam de gráficos. Nós vimos os principais e mais utilizados. Os gráficos têm sido classificados de modo variável, mas os especialistas no assunto não discordam a respeito de: - Diagrama. Toda e qualquer representação gráfica. Ela tem sido a palavra que engloba os 0 100 200 300 Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 20 gráficos que acabamos de ver, que na verdade, são gráficos lineares e gráficos de áreas, bem mais numerosos e variados; - Estereograma. Gráfico representado por sólidos (três dimensões); - Cartograma. Representação gráfica no ma- pa; - Pictogramas Representações por figuras simbólicas; - Gráficos de organização conhecidos tam- bém como os organogramas das empresas. Recomendações práticas sobre alguns diagramas 1. Gráfico em curvas. É um gráfico apropri- ado para as séries temporais. É traçado normal- mente quando são dadas cinco ou mais datas. 2. Gráfico em colunas ou barras. É traçado para as séries especificativas e geográficas e, ain- da, para as séries temporais com cinco e menos da- tas. O espaço entre colunas ou barras não deve ser exagerado. Assim, recomendamos para a largura reservada a cada espaço entre colunas ou barras um comprimento que varie de 1/3 a 2/3 do com- primento escolhido para a largura de cada coluna ou barra. Sempre que possível, quando não houver uma outra ordem a ser imposta, como na série temporal, por exemplo, as colunas deverão ser or- denadas de modo decrescente, da esquerda para a direita. Consequentemente, as barras ficarão tam- bém ordenadas de modo decrescente, de cima para baixo. O gráfico em barras deve ser planejado co- mo se fosse em colunas e, quase sempre, ele é tra- çado quando a largura reservada para a coluna é insuficiente para a designação da ocorrência que a mesma representa. 3. Gráficos: histograma, polígono de fre- quência e ogiva de Galton. São gráficos caracte- rísticos das distribuições de frequência. No plane- jamento do histograma e do polígono de frequên- cia, devemos deixar espaço reservado a indicação do corte do gráfico quando não houver a coinci- dência da origem (zero). A ogiva de Galton é construída, principalmente, quando desejamos analisar a distribuição de frequência tendo em vis- ta informações percentílicas como são as separa- trizes (mediana, quartis, decis e percentis). 4. Gráficos em setores e em retângulos. Ambos devem ser traçados quando desejarmos analisar as diversas ocorrências de uma série em termos relativos ou percentuais. São recomenda- das, principalmente, para as séries especificativas e geográficas, ambas com poucas ocorrências (até sete). Levando em conta a estética e também para uma melhor ideia do conjunto, devemos: a) no gráfico em retângulos, ordenar os retângu- los de modo decrescente, da esquerda para a direi- ta; b) no gráfico em setores, tomar como partida de marcação dos setores o ponto correspondente às 12 horas do relógio de onde deverá partir o primeiro raio. Adotar ainda a ordenação dos setores, do maior para o menor, no sentido dos ponteiros do relógio (sempre que possível). 5. Gráfico polar ou gráfico em vetores. De- ve ser utilizado quando desejamos analisar as vari- ações das diversas ocorrências de uma série com- parativamente com um valor médio. É recomenda- do para representar certos tipos especiais de séries temporais (principalmente) e algumas séries espe- cificativas e geográficas. Correntemente, é mais usado na análise de séries mensais com 6, 8 ou 12 meses. Nota: Para traçar de modo correto e completo um gráfico cartesiano, não devemos nos esquecer do que o gráfico deve possuir: – título completo (no texto, não no corpo do gráfico); – linhas de chamada; – especificação e graduação dos eixos; – indicações das escalas vertical e hori- zontal (no caso do histograma, do polí- gono de frequência e da ogiva de Gal- ton); – referência a origem (ponto zero). 1 – Desenhe o gráfico mais apropriado para cada tabela (Use o Excel ou outro editor gráfico). Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 21 A) Tabela 2.28 – Brasil – Principais Exportadores de Carne Bovina – 2000. Frigoríficos Porcentagem Outros 52% Bertin 22% Independência 12% Friboi 9% Minerva 5% Fonte: Mercado (Folha de São Paulo) B) Tabela 2.29- Maiores Países em Extensão Territorial do Mundo País Área (km²) Índia 3.287.782 Austrália 7.682.300 Brasil 8.547.403 Estados Unidos 9.372.614 China9.536.499 Canadá 9.970.610 Rússia 17.075.400 Fonte: Almanaque Abril 2000 2) A Figura mostra a evolução das matrículas na Educação Superior com Deficiência Física. Figura – Alunos matriculados na Educação Superior com Deficiência Física Fonte: Referenciais de acessibilidade na Educação Superior e a avaliação in loco do Sistema Nacional de Avaliação da Educação Superior (SINAES). a) Calcule a variação percentual no nú- mero de matrículas na Educação Supe- rior com Deficiência Física de 2007 a 2010. b) Calcule a variação percentual no número de matrículas na Educação Superior com Defici- ência Física de 2010 a 2011. 780 916 1052 1387 1706 2040 2233 2475 3527 4382 5734 5946 0 1000 2000 3000 4000 5000 6000 7000 20 00 20 01 20 02 20 03 20 04 20 05 20 06 20 07 20 08 20 09 20 10 20 11 Q u an ti d ad e Anos Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 22 2.5. DISTRIBUIÇÃO DE FREQUÊN- CIAS Uma das vantagens das tabelas estatísticas é a de condensar as informações necessárias ao estudo que estamos fazendo. Pode acontecer que na coleta de dados os valores se repitam. Em tabelas simples só aparecem valores diferentes uns dos outros. Vamos conhecer um tipo de tabela que condensa uma coleção de dados conforme a frequência ou repetição de seus valores. 1 – Altura de alunos da turma 150 151 152 153 154 155 155 155 156 156 156 157 158 158 160 160 160 160 160 161 161 161 161 162 162 163 163 164 164 164 165 166 167 168 168 169 170 170 172 173 2 – Quando temos dados que não foram numericamente organizados chamamos de dados brutos. 3 – Rol – é a organização dos dados brutos em ordem crescente ou decrescente. 4 – Amplitude total ou range (R): R = X maior – X menor É a diferença entre o maior e o menor valor observado. R = 173 - 150 = 23 5 – Número de classes (K) – Para determinarmos o número de classes (linhas) da tabela podemos lançar mão da regra de Sturges, que nos dá o número de classes em função do número de valores da variável: K = 1 + 3,22 . log n Onde n = tamanho da amostra. K = 1 + 3,22 log 40 K = 6,16 Como o número de classes é um número inteiro devemos o número inteiro inferior ou superior ao valor obtido para K. No exemplo é melhor utilizarmos o 6 pois está mais próximo de 6,16 do que de 7. 6 – Amplitude do intervalo de classe (h) – Define através de um número quais são os limites numéricos para cada classe. K R h No exemplo: 83,3 6 23 h OBS.: Arredondar sempre para o maior inteiro se os dados forem inteiros ou para o maior dé- cimo, centésimo,... , se os números não forem inteiros, portanto, o valor de h para o exemplo será 4. 7 – Tabela de distribuição de frequências Tabela 2.3 – Distribuição de frequências das alturas de 40 alunos da Escola XYZ. Alturas Fi xi Fac Fi (%) FacR (%) 150 ├154 4 152 4 10,0 10,0 154 ├158 8 156 12 20,0 30,0 158 ├162 11 160 23 27,5 57,5 162 ├166 8 164 31 20,0 77,5 166 ├170 5 168 36 12,5 90,0 170 ├174 4 172 40 10,0 100,0 Total 40 - - 100,0 - Fonte: Dados Fictícios 8 – Fi – Frequência absoluta do intervalo de classe: - É a quantidade de elementos de ca- da classe, ou: - É a quantidade de vezes que cada elemento se repete. - 9 - xi – Ponto médio do intervalo de classe. É a média aritmética dos extremos. 2 lils Xi Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 23 ls = limite superior e li = limite inferior. 10 – Fac – Frequência acumulada É o somatório das frequências absolutas classe a classe. 11 – fi – frequência relativa- % São os valores das razões entre as frequências simples e a frequência total: 100. Fi Fi fi 12 – FacR – Frequência acumulada relativa É a frequência acumulada da classe, dividida pela frequência total da distribuição. 100. Fi Fac FacR 13 – Histograma - Diagrama em colunas justapostas (classes X Fi), cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidem com os pontos médios dos intervalos de classe. Figura 2.9 - Distribuição de frequências das alturas de 40 alunos da Escola XYZ. Fonte: Dados Fictícios. Notas: A área de um histograma é proporcional à soma das frequências. No caso de usarmos as frequências relativas, obtemos um gráfico de área unitária. Quando queremos as comparar duas distribuições, o ideal é fazê-lo pelo histograma de frequências relativas. 14 – Polígono de frequências– diagrama em linha, sendo as frequências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe (Xi Fi). Figura 2.10 - Polígono de frequências das alturas de 40 alunos da Escola XYZ. Fonte: Dados Fictícios. 15 – Gráfico de frequência acumulada ou ogiva (Xi X Fac) - é traçado marcando-se as frequências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. Figura 2.10 - Polígono de frequências das alturas de 40 alunos da Escola XYZ. Fonte: Dados Fictícios. 0 2 4 6 8 10 12 148 152 156 160 164 168 172 176 Altura (cm) F re q ü ên ci a 0 5 10 15 20 25 30 35 40 45 148 152 156 160 164 168 172 Altura (cm) F re q ü ên ci a Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 24 1) Num determinado dia, o aluno x do curso de Educação Física e professor da academia de ginásticas y, resolveu testar os seus 25 melhores alunos na parte de flexão, obtendo os resultados2: Construa a tabela de distribuição de fre- quências e os gráficos: histograma, polígo- no de frequências e ogiva. 2) Contratado como estagiário de uma academia de ginástica para atuar no departamento de natação, um aluno do curso de Educação Física resolveu testar os 30 primeiros alunos matriculados, antes de qualquer trabalho técnico com o grupo. Marcou o dia, sob o mesmo tempo e modalidade polichinelo, registrou os resultados, conforme apresentação abaixo²: Construa a tabela de distribuição de fre- quências e os gráficos: histograma, polígo- no de frequências e ogiva. 3) No quadro a seguir estão os tempos de uma das provas de Estatística II do Comércio Exterior – 2004 – URI – Campus de Ere- chim. A partir dos mesmos construa uma tabela de distribuição de frequências e os gráficos: histograma, polígono de frequên- cias e ogiva. 2 Adaptado de: http://www.pluridoc.com/Site/FrontOffice/ De- fault.aspx? module=Files/FileDescription&ID=6549&state =FD 40 40 42 42 42 43 43 43 43 44 44 45 45 46 46 47 48 48 48 48 49 50 51 53 54 55 56 56 56 57 59 59 59 59 59 61 61 62 67 68 68 70 70 71 71 72 72 73 75 75 76 77 77 78 79 80 81 82 84 84 4) Os dados da Tabela referem-se à taxa de hemoglobina (g/100 ml) em 560 homens normais. Tabela 2.3 – Taxa de hemoglobina (g/100ml) em 560 homens normais. Hemoglobi na Frequência absoluta Frequência relativa (%) Fi Fac fi Fac 12,5 ├ 13,5 6 13,5 ├ 14,5 34 14,5 ├ 15,5 134 15,5 ├ 16,5 212 16,5 ├ 17,5 129 17,5 ├ 18,5 39 18,5 ├ 19,5 6 Total 560 - - 100,0 Fonte: Dados Fictícios a) Complete tabela (Considere os resultados da frequência relativa (simples e acumulada) com duas casas decimais). b) Determine a taxa média de hemoglobina dos homens normais. Interprete o resultado obtido. c) Determine a porcentagem de observações: a) no intervalo 14,5 ├ 17,5; b) menores do que 14,5; c) Iguais ou maiores que 17,5. 5) Considere a seguinte distribuição de frequências: Tabela - Número de casos registrados de linfomas do sexo feminino, segundo a idade, Brasil, 1975. Alturas Fi 00 ├ 05 02 05 ├ 20 09 20 ├ 50 34 50 ├ 65 28 65 ├ 100 12 Total 85 Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 25 Fonte: Brasil (Ministério da Saúde) Responda: a) Quantos casos de linfomas, do sexo feminino, foram registrados na faixa de idade entre 5 (inclusive) e 50 (exclusive) anos? b) Quantos casos de linfomas, do sexo feminino, foram registrados na faixa de idade entre 50 (inclusive) e 65 (exclusive) anos? c)Qual a porcentagem de casos de linfomas, do sexo feminino, que foram registrados na faixa de idade entre 20 (Inclusive) e 100 (exclusive) anos? 6) Considere a seguinte distribuição de frequência: Tabela - Nascidos vivos, na cidade de Erechim, no ano de 1998 segundo a idade das mães. Idade das mães (anos) Número de nascidos vivos 10 ├ 14 11 15 ├ 19 279 25 ├ 24 393 30 ├ 29 390 35 ├ 34 289 40 ├ 39 173 40 ├ 44 40 45 ├ 49 04 Total 85 Fonte: Brasil (Ministério da Saúde) a) Qual o total de nascidos vivos no ano de 1998 na cidade de Erechim? b) Qual o número de nascidos vivos em que a idade da mãe varia de 15 a 19 anos? c) Qual oi percentual de nascidos vivos em que a idade da mãe varia de 30 a 34 anos? d) Classifique a variável número de "nascidos vivos". 7) Para analisar o desempenho de seus alunos em uma prova, um professor dividiu as notas obtidas em classes de 3 (Inclusive) a 4 (exclusive), de 4 (Inclusive) a 5 (exclusive), e assim por diante. Com os resultados, ele produziu o histograma da Figura. Analisando esse histograma, pode-se afirmar que: a) a maior nota na prova foi 7 b) a nota média foi 6. c) 50% dos alunos obtiveram nota menor que 5 d) um dos alunos obteve nota maior do que nove. e) Exatamente 5 alunos obtiveram nota menor que 6. 8) Uma psicóloga realizou com os alunos da 1ª série do ensino médio de um colégio um estudo sobre orientação profissional. Após algumas dinâmicas e entrevistas, condensou as informações sobre a intenção de carreira dos alunos no gráfico: Quando os mesmos alunos estavam na 3ª série, a psicóloga repetiu o estudo com eles e notou que, em relação à sondagem anterior, 5/16 dos interessados em Humana migraram para Exatas e 3/40 para Biológicas. Admitindo que não haja outras migrações: a) construa o novo gráfico de setores correspondente, destacando os ângulos; b) determine quantos alunos migraram de Humanas para Exatas, sabendo que o número dos participantes da dinâmica foi 400. 0 2 4 6 8 N ú m er o d e al u n o s 3 4 5 6 7 8 9 Notas 40,0% 35,0% 25,0% Humanas Biológicas Exatas Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 26 8) O gráfico, publicado pela revista Veja de 28/07/1999, mostra como são divididos os 188 bilhões de reais do orçamento da União entre os setores de saúde, educação, previdência e outros. Figura - Distribuição de R$ 188 bilhões do orçamento da União. Fonte: Veja, 28/07/1999 Se os bilhões de reais gastos com a previdência fossem totalmente repassados aos demais setores, de modo que 50 % fossem totalmente destinados à saúde, 40% à educação e os 10% restantes aos outros, determine o aumento que o setor de saúde teria: a) em reais b) em porcentagem, em relação ao valor inicial, aproximadamente. 9) O gráfico mostra a distribuição dos funcionários de uma escola integrada por nível de ensino e por sexo. Com base no gráfico, assinale V (verdadeira) ou F (falas) nas proposições seguintes e justifique as falsas: a) O número de funcionários do sexo feminino que trabalham na escola representa mais de 2/3 do total de funcionários. ( ) b) O número de funcionários do sexo masculino que trabalham na faculdade supera o número total de homens que trabalham no Ensino Infantil e Fundamental. ( ) c) No Ensino Fundamental os homens correspondem a menos de 15% do total de funcionários. ( ) d) O número de mulheres que trabalham no Ensino Fundamental é 150% maior que o número de mulheres que Trabalham no Ensino Médio. ( ) 58% 24% 10% 8% Outroos Previdência Saúde Educação 48 63 27 22 6 16 32 24 0 20 40 60 80 Infantil Fundamental Médio Superior Número de Funcionários G ra u d e En si n o Masculino Feminino Bioestatística – Noções de Estatística Descritiva e Inferencial – URI – Campus de Erechim Professor: Claodomir Antonio Martinazzo – mclao@uri.com.br 27 3.0. MEDIDAS DE TENDÊNCIA CENTRAL Pelo apresentado nos capítulos anteriores, vemos que à Estatística cabe a análise de fenômenos mensuráveis. Temos, assim, diante de nós, informações numéricas, obtidas nas fases iniciais do trabalho estatístico (planejamento, coleta, crítica, apuração e exposição), que deverão ser analisadas, agora na fase do trabalho estatístico que chamamos interpretação. Cabe-nos, assim, a determinação dos índices estatísticos que atuarão como indicadores do comportamento do fenômeno que estamos pesquisando. Para facilitar o cálculo desses índices, achamos útil incluir uma introdução à notação de somatório (), que virá por certo facilitar o entendimento e a simplificação das fórmulas, as quais irão traduzir as medidas estatísticas usadas na interpretação do conjunto de dados. Introdução ao Símbolo Somatório () Para indicar um conjunto de N dados X1,X2, X3,..., XN é usual tomarmos o símbolo Xi, onde i, denominado índice, representa quaisquer dos números 1, 2, 3,..., N e indica o número de ordem dos diferentes valores. Assim, por exemplo, se tivermos os números 4, 28, 13, 18 e 10, a notação X4 representa o quarto deles, ou seja,X4 = 18. Se, no entanto, quisermos representar a soma dos X; valores, isto é,X1 +X2
Compartilhar