Baixe o app para aproveitar ainda mais
Prévia do material em texto
Fazemos parte do Claretiano - Rede de Educação BIOESTATÍSTICA Olá! Meu nome é Cláudio Pereira Bidurin, sou bacharel e mestre em Estatística pela Universidade Federal de São Carlos. Tenho experiência em indústrias e no setor público, bem como em consultorias e assessorias no desenvolvimento de análises de experimentos e modelagem estatística. Atuo também como professor de Estatística no Ensino Superior desde 1994 e no Centro Universitário Claretiano desde 2001, em cursos presenciais e na EaD. Coloco-me à disposição para contribuir com você, aluno da EaD, para uma aprendizagem significativa. e-mail: bidurin@claretiano.edu.br Claretiano – Centro Universitário Rua Dom Bosco, 466 - Bairro: Castelo – Batatais SP – CEP 14.300-000 cead@claretiano.edu.br Fone: (16) 3660-1777 – Fax: (16) 3660-1780 – 0800 941 0006 www.claretianobt.com.br Cláudio Pereira Bidurin Batatais Claretiano 2016 BIOESTATÍSTICA © Ação Educacional Claretiana, 2015 – Batatais (SP) Todos os direitos reservados. É proibida a reprodução, a transmissão total ou parcial por qualquer forma e/ou qualquer meio (eletrônico ou mecânico, incluindo fotocópia, gravação e distribuição na web), ou o arquivamento em qualquer sistema de banco de dados sem a permissão por escrito do autor e da Ação Educacional Claretiana. CORPO TÉCNICO EDITORIAL DO MATERIAL DIDÁTICO MEDIACIONAL Coordenador de Material Didático Mediacional: J. Alves Preparação: Aline de Fátima Guedes • Camila Maria Nardi Matos • Carolina de Andrade Baviera • Cátia Aparecida Ribeiro • Dandara Louise Vieira Matavelli • Elaine Aparecida de Lima Moraes • Josiane Marchiori Martins • Lidiane Maria Magalini • Luciana A. Mani Adami • Luciana dos Santos Sançana de Melo • Patrícia Alves Veronez Montera • Raquel Baptista Meneses Frata • Rosemeire Cristina Astolphi Buzzelli • Simone Rodrigues de Oliveira Revisão: Cecília Beatriz Alves Teixeira • Eduardo Henrique Marinheiro • Felipe Aleixo • Filipi Andrade de Deus Silveira • Juliana Biggi • Paulo Roberto F. M. Sposati Ortiz • Rafael Antonio Morotti • Rodrigo Ferreira Daverni • Sônia Galindo Melo • Talita Cristina Bartolomeu • Vanessa Vergani Machado Projeto gráfico, diagramação e capa: Bruno do Carmo Bulgarelli • Eduardo de Oliveira Azevedo • Joice Cristina Micai • Lúcia Maria de Sousa Ferrão • Luis Antônio Guimarães Toloi • Raphael Fantacini de Oliveira • Tamires Botta Murakami • Wagner Segato dos Santos Videoaula: Fernanda Ferreira Alves • José Lucas Viccari de Oliveira • Marilene Baviera • Renan de Omote Cardoso Bibliotecária: Ana Carolina Guimarães – CRB7: 64/11 DADOS INTERNACIONAIS DE CATALOGAÇÃO NA PUBLICAÇÃO (CIP) (Câmara Brasileira do Livro, SP, Brasil) 574.015195 B484b Bidurin, Cláudio Pereira Bioestatística / Cláudio Pereira Bidurin – Batatais, SP : Claretiano, 2016. 244 p. ISBN: 978-85-8377-474-7 1. Estatística. 2. Tabulação de dados. 3. Medidas estatísticas. 4. Inferências estatísticas. 5. Modelos estatísticos. I. Bioestatística. CDD 574.015195 INFORMAÇÕES GERAIS Cursos: Graduação Título: Bioestatística Versão: dez./2016 Formato: 15x21 cm Páginas: 244 páginas SUMÁRIO CONTEÚDO INTRODUTÓRIO 1. INTRODUÇÃO ................................................................................................... 11 2. GLOSSÁRIO DE CONCEITOS ............................................................................ 15 3. ESQUEMA DOS CONCEITOS-CHAVE ............................................................... 18 4. REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................... 21 5. E-REFERÊNCIAS ................................................................................................ 21 UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS 1. INTRODUÇÃO ................................................................................................... 25 2. CONTEÚDO BÁSICO DE REFERÊNCIA ............................................................. 26 2.1. ESTATÍSTICA VERSUS MATEMÁTICA ...................................................... 26 2.2. POPULAÇÃO ESTATÍSTICA VERSUS AMOSTRA ...................................... 29 2.3. TIPOS DE EXPERIMENTOS UTILIZADOS NAS ÁREAS BIOLÓGICAS E DA SAÚDE ................................................................................................. 32 2.4. MÉTODOS DE AMOSTRAGEM ................................................................ 35 2.5. TIPOS DE VARIÁVEIS ............................................................................... 37 2.6. COLETA DE DADOS .................................................................................. 39 2.7. TABULAÇÃO DOS DADOS ........................................................................ 40 2.8. GRÁFICOS DE FREQUÊNCIAS .................................................................. 47 3. CONTEÚDO DIGITAL INTEGRADOR ................................................................ 54 3.1. PRODUZINDO AMOSTRAS ALEATÓRIAS ................................................ 55 3.2. EXPERIMENTOS SIMPLES-CEGOS E DUPLO-CEGOS .............................. 55 3.3. HISTOGRAMAS E POLÍGONO DE FREQUÊNCIAS ................................... 56 4. QUESTÕES AUTOAVALIATIVAS ....................................................................... 57 5. CONSIDERAÇÕES ............................................................................................. 59 6. E-REFERÊNCIAS ................................................................................................ 59 7. REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................... 60 UNIDADE 2 – MEDIDAS ESTATÍSTICAS 1. INTRODUÇÃO ................................................................................................... 63 2. CONTEÚDO BÁSICO DE REFERÊNCIA ............................................................. 64 2.1. MEDIDAS DE TENDÊNCIA CENTRAL ....................................................... 64 2.2. RELAÇÃO ENTRE AS MEDIDAS DE TENDÊNCIA CENTRAL .................... 78 2.3. MEDIDAS SEPARATRIZES ........................................................................ 80 2.4. MEDIDAS ESTATÍSTICAS DE DISPERSÃO ................................................ 87 2.5. MEDIDAS PARA DADOS QUALITATIVOS ................................................. 103 2.6. USO DE RECURSOS TECNOLÓGICOS PARA O CÁLCULO DA MÉDIA E DO DESVIO-PADRÃO ................................................................................ 108 3. CONTEÚDO DIGITAL INTEGRADOR ................................................................ 113 3.1. MÉDIA GEOMÉTRICA E MÉDIA HARMÔNICA ....................................... 113 3.2. CÁLCULO DA MEDIANA E DA MODA PARA DADOS AGRUPADOS ....... 114 3.3. CÁLCULO DA VARIÂNCIA E DO DESVIO-PADRÃO PARA DADOS AGRUPADOS ............................................................................................. 115 4. QUESTÕES AUTOAVALIATIVAS ....................................................................... 115 5. CONSIDERAÇÕES ............................................................................................. 117 6. E-REFERÊNCIAS ................................................................................................ 117 7. REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................... 118 UNIDADE 3 – INFERÊNCIA ESTATÍSTICA 1. INTRODUÇÃO ................................................................................................... 121 2. CONTEÚDO BÁSICO DE REFERÊNCIA ............................................................. 121 2.1. INFERÊNCIA ESTATÍSTICA ....................................................................... 121 2.2. TESTES DE HIPÓTESES .............................................................................139 2.3. USO DE RECURSOS TECNOLÓGICOS ...................................................... 178 3. CONTEÚDO DIGITAL INTEGRADOR ................................................................ 186 3.1. ESTIMATIVAS PARA A VARIÂNCIA E DESVIO-PADRÃO.......................... 186 3.2. TESTES PARA DIFERENÇAS ENTRE PROPORÇÕES ................................. 187 3.3. TAMANHO DE AMOSTRAS E CORREÇÕES PARA POPULAÇÕES FINITAS .....187 3.4. ERROS DO TIPO I E TIPO II ...................................................................... 188 3.5. TESTES NÃO PARAMÉTRICOS ................................................................. 189 4. QUESTÕES AUTOAVALIATIVAS ....................................................................... 189 5. CONSIDERAÇÕES ............................................................................................. 191 6. E-REFERÊNCIAS ................................................................................................ 192 7. REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................... 192 UNIDADE 4 – MODELOS ESTATÍSTICOS 1. INTRODUÇÃO ................................................................................................... 207 2. CONTEÚDO BÁSICO DE REFERÊNCIA ............................................................. 208 2.1. MODELO DE REGRESSÃO LINEAR SIMPLES ........................................... 208 2.2. MONTAGEM DO MODELO DE REGRESSÃO LINEAR .............................. 211 2.3. ESTIMAÇÃO DOS PARÂMETROS DO MODELO LINEAR ........................ 215 2.4. MEDIDAS DE ADEQUABILIDADE DO MODELO LINEAR ........................ 221 2.5. USO DE RECURSOS TECNOLÓGICOS ...................................................... 233 3. CONTEÚDO DIGITAL INTEGRADOR ................................................................ 238 3.1. A CONSTRUÇÃO DAS ESTIMATIVAS DOS PARÂMETROS ...................... 238 3.2. MODELO DE REGRESSÃO LINEAR MÚLTIPLO ........................................ 238 3.3. MODELOS COM DIFERENTES FORMAS FUNCIONAIS ........................... 239 3.4. REGRESSÃO LINEAR NO EXCEL ............................................................... 240 4. QUESTÕES AUTOAVALIATIVAS ....................................................................... 240 5. CONSIDERAÇÕES FINAIS ................................................................................. 242 6. E-REFERÊNCIAS ................................................................................................ 242 7. REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................... 243 9 CONTEÚDO INTRODUTÓRIO Conteúdo População e Amostra. Tipos de Variáveis. Organização de dados. Estatística Descritiva. Distribuições de Probabilidade. Amostragem. Estimação de Parâ- metros. Testes de Hipóteses. Análise de Variância. Teste Qui-quadrado. Análi- se de Correlação e Regressão Linear Simples. Bibliografia Básica BLAIR, R. C.; TAYLOR, R. A. Bioestatística para Ciências da Saúde. São Paulo: Pearson Education do Brasil, 2013. BONAFINI, F. C. Estatística. São Paulo: Pearson Education do Brasil, 2012. LARSON, R.; FARBER, B. Estatística Aplicada. 4. ed. São Paulo: Pearson Prentice Hall, 2010. Bibliografia Complementar ARANGO, H. G. Bioestatística: teórica e computacional. 2. ed. Rio de Janeiro: Guanabara Koogan, 2005. BEIGUELMAN, B. Curso Prático de Bioestatística. 5. ed. Ribeirão Preto: FUNPEC, 2002. CALLEGARI-JACQUES, S. M. Bioestatística: princípios e aplicações. Porto Alegre: Artmed, 2003. LEVIN, J.; FOX, J. A.; FORDE, D. R. Estatística para Ciências Humanas. 11. ed. São Paulo: Pearson Education do Brasil, 2012. MOTTA, V. Bioestatística. 2. ed. Caxias do Sul: Educs, 2006. 10 © BIOESTATÍSTICA CONTEÚDO INTRODUTÓRIO É importante saber Esta obra está dividida, para fins didáticos, em duas partes: Conteúdo Básico de Referência (CBR): é o referencial teórico e prático que deverá ser assimilado para aquisição das competências, habilidades e atitudes necessárias à prática profissional. Portanto, no CBR, estão condensados os principais conceitos, os princípios, os postulados, as teses, as regras, os procedimentos e o fundamento ontológico (o que é?) e etiológico (qual sua origem?) referentes a um campo de saber. Conteúdo Digital Integrador (CDI): são conteúdos preexistentes, previamente sele- cionados nas Bibliotecas Virtuais Universitárias conveniadas ou disponibilizados em sites acadêmicos confiáveis. São chamados "Conteúdos Digitais Integradores" por- que são imprescindíveis para o aprofundamento do Conteúdo Básico de Referên- cia. Juntos, não apenas privilegiam a convergência de mídias (vídeos complementa- res) e a leitura de "navegação" (hipertexto), como também garantem a abrangência, a densidade e a profundidade dos temas estudados. Portanto, são conteúdos de estudo obrigatórios, para efeito de avaliação. 11© BIOESTATÍSTICA CONTEÚDO INTRODUTÓRIO 1. INTRODUÇÃO Prezado aluno, seja bem-vindo! Iniciaremos o estudo de Bioestatística, em que você apren- derá técnicas de representação, análise e interpretação de dados, muito úteis em situações de análise decisória em pesquisas de campo e experimentais, comuns na prática da sua futura profissão. Vamos trabalhar o conteúdo de maneira bem detalhada para melhor entendimento dos cálculos envolvidos. Todo conhe- cimento adquirido até aqui servirá de alguma forma para a apre- ensão das técnicas e ferramentas estatísticas. Sempre que sentir necessidade, revise as propriedades matemáticas em geral, em especial aquelas trabalhadas no Ensino Médio. O que é Estatística? E Bioestatística? A Estatística é uma ciência voltada para a análise de dados, sejam eles quantitativos ou qualitativos. Em geral, esses dados são obtidos em situações de pesquisas de campo, pesquisas la- boratoriais, experimentos em geral. Além disso, tais pesquisas e experimentos são realizados com base em estudos amostrais. O grande problema é que o interesse do avaliador ou pes- quisador é conhecer a realidade em que trabalha, e não uma parte dela, a amostra. Assim, os dados e resultados obtidos na amostragem necessitam ser transformados, generalizados, em dados gerais, populacionais. Estes são os propósitos da Estatística. Inicialmente, forne- cer ao pesquisador elementos para uma boa amostragem e pla- nejamento dos experimentos; depois, fornecer técnicas de análi- se dos dados amostrais, denominadas de Estatística Descritiva e, 12 © BIOESTATÍSTICA CONTEÚDO INTRODUTÓRIO por fim, técnicas de generalização dos dados, que denominamos de Estatística Inferencial. Como boa parte dos cálculos apresenta algum grau de complexidade, além de eles serem tratados do ponto de vista al- gébrico, faremos também uma abordagem com o uso de tecno- logias, sejam elas calculadoras científicas, planilhas eletrônicas ou aplicativos específicos. Neste contexto, a Bioestatística é a concepção da Estatísti- ca centralizada em pesquisas e experimentos com variáveis rela- cionadas às Ciências Biológicas ou à Saúde. A amostragem e os processos de tabulação de dados Na Unidade 1, discutiremos de maneira introdutória as di- ferentes formas de composição de uma amostra, que devem ga- rantir certa representatividade da população de origem, ou seja, a função da amostra é sintetizar as informações da população em um grupo menor de elementos. Para uma amostragem mais adequada, é importante que alguns elementos do processo de pesquisa estejam bem definidos. Um desses elementos é o processo de coleta dos dados, ou seja, como serão obtidos os valores, como serão analisados os sujeitos ou espécimes. Para enriquecer o debate, detalharemos diversas formas convencionais de planejar um experimento, de acordo com o objetivo da pesquisa. Além disso, outro aspecto importante é saber identificar quais variáveis e informações serão observadas na coleta dos dados. As variáveis podem ser qualitativas (ordinais ou nominais), quando não expressam quantidades ou medições,ou quantitativas (inteiras ou fracionárias), quando expressam quantidades ou medições. 13© BIOESTATÍSTICA CONTEÚDO INTRODUTÓRIO Ainda na Unidade 1, abordaremos as metodologias de or- ganização dos dados coletados, que chamamos de tabulação. Ta- belas de frequências simples e por intervalo, bem como os grá- ficos e frequências, farão parte do conteúdo a ser desenvolvido. Medidas estatísticas Além das técnicas de organização dos dados, tabulação, existem os cálculos de medidas estatísticas como recurso para a descrição dos resultados amostrais. Na Unidade 2, discutiremos as medidas estatísticas de tendência central, em especial as mé- dias, as medidas estatísticas de ordem e as medidas estatísticas de dispersão (ou de variabilidade), como o desvio-padrão. Cada medida possui características próprias, formas de cálculos diferenciados e interpretação particular, sendo apresen- tada de maneira detalhada. Para a obtenção de cada medida, usam-se a calculadora científica e/ou o MS-Excel. Há também medidas associadas a variáveis qualitativas, como, por exemplo, o risco relativo. O objetivo das medidas descritivas é caracterizar os dados amostrais e permitir a generalização para os dados populacio- nais, o que é conseguido com o uso da Estatística Inferencial. Estatística Inferencial Na Unidade 3, apresentaremos diversos mecanismos de inferência estatística, todos com um só propósito – partir dos dados amostrais para entender o comportamento dos dados populacionais. 14 © BIOESTATÍSTICA CONTEÚDO INTRODUTÓRIO Temos basicamente duas formas de generalizar os dados amostrais para a população: construção de estimativas e realiza- ção de teste de hipóteses. Ambas necessitam, além dos dados e das medidas amos- trais, de um parâmetro probabilístico que tem a função de es- tabelecer confiabilidade, probabilidade de acerto para os resul- tados. Dependendo das condições do problema e dos objetivos da inferência, podemos ter quatro diferentes fontes desse parâ- metro probabilístico: a distribuição normal padronizada, a dis- tribuição t-Student, a distribuição F-Snedecor e a distribuição Chi-quadrado. Não é nosso objetivo discutir as propriedades e caracte- rísticas de cada uma delas. Tais distribuições serão encaradas apenas como ferramentas de trabalho para a construção das inferências. Modelos estatísticos Além das medidas estatísticas e dos procedimentos de in- ferência, para finalizar, na Unidade 4, vamos trabalhar com os modelos estatísticos. O processo de modelagem consiste na in- vestigação da relação de dependência entre duas variáveis. Por meio dos modelos de regressão linear, podemos inves- tigar a ocorrência ou não de uma relação de causa e efeito entre duas variáveis de interesse, como, por exemplo, questionar se a temperatura influencia ou não o ritmo de crescimento de deter- minada planta. Assim como nos outros casos, faremos uso de recur- sos tecnológicos para facilitar a aplicação das ferramentas de modelagem. 15© BIOESTATÍSTICA CONTEÚDO INTRODUTÓRIO Vamos iniciar nossos estudos? Convidamos você a percor- rer as unidades de estudo, sem se esquecer de sempre revisar conceitos de Matemática aprendidos durante sua vida escolar. Ainda, é prudente estudar neste momento o Glossário de Con- ceitos para se familiarizar com os termos que serão trabalhados ao longo desta obra. 2. GLOSSÁRIO DE CONCEITOS O Glossário de Conceitos permite uma consulta rápida e precisa das definições conceituais, possibilitando um bom domí- nio dos termos técnico-científicos utilizados na área de conheci- mento dos temas tratados. 1) Amostra aleatória estratificada: procedimento de seleção da amostra que leva em conta as características da popula- ção e as mantém de forma proporcional na amostra. 2) Amostra aleatória por conglomerados: procedimen- to de seleção da amostra utilizado quando existe um agrupamento físico ou geográfico dos elementos, com características similares às da população total. 3) Amostra aleatória simples: procedimento de seleção da amostra que leva em conta um processo de sorteio simples e direto dos elementos da população. 4) Amostra aleatória sistemática: procedimento de sele- ção da amostra utilizado quando os elementos da po- pulação se encontram dispostos em forma de lista ou de catálogo. 5) Amostra: é um subconjunto, uma parte representativa da população; em outras palavras, utilizamos apenas uma parcela das informações disponíveis para avaliar o todo. 16 © BIOESTATÍSTICA CONTEÚDO INTRODUTÓRIO 6) Amostragem: processo prático que visa à seleção de parte da população para a realização dos estudos. Sem- pre deve ser aleatória para permitir análises inferenciais. 7) Dados brutos: são os dados ou informações coletados na população ou na amostra e que ainda não foram trabalhados de nenhuma maneira. 8) Estimativa: é um dos procedimentos de inferência es- tatística. Na construção das estimativas, partimos dos valores amostrais (estimadores pontuais) e construí- mos uma estimativa por intervalo de confiança para o valor do parâmetro populacional, utilizando, para isso, a margem de erro. 9) Gráficos de frequências: são uma das formas de exe- cutar a tabulação dos dados. Os gráficos seguem a mesma lógica das tabelas, mas fazem uma represen- tação por figuras. Podem ser de colunas, de barras, de setores, polígonos ou histogramas. 10) Medidas de dispersão ou de variabilidade: são medi- das aplicadas a dados quantitativos que visam avaliar a dispersão dos dados em torno da média. Podem ser de variabilidade absoluta (como o desvio-padrão) ou de variabilidade relativa (como o coeficiente de variação). 11) Medidas de ordem: são medidas aplicadas a dados quantitativos ordenados que visam representar a va- riável por meio de agrupamentos segundo um percen- tual de interesse. 12) Medidas de tendência central: são medidas aplicadas a dados quantitativos que têm como objetivo resumir a informação da variável por meio de apenas um valor representativo. 17© BIOESTATÍSTICA CONTEÚDO INTRODUTÓRIO 13) Modelos estatísticos: são utilizados para estabelecer a relação de dependência entre variáveis quantitativas, em forma de funções matemáticas. A regressão linear é uma das técnicas que utilizamos para a construção desses modelos. 14) População estatística: é o conjunto total (100%) de fontes de pesquisas, por meio do qual são estudadas todas as fontes possíveis. 15) Risco relativo: é uma medida calculada para dados qualitativos que usa como referência os valores de uma tabela cruzada. Serve para avaliar o quanto o ris- co de ocorrência de um fenômeno está associado a de- terminado perfil do sujeito. 16) Tabela cruzada: é um tipo de tabela apropriada para dados qualitativos em situações em que o interesse é avaliar a relação de dependência entre as respos- tas de duas diferentes características dos sujeitos. É utilizada para o cálculo do risco relativo e do teste de independência. 17) Tabelas de frequências: são uma das formas de execu- tar a tabulação dos dados. Nas tabelas, representamos os dados em forma de categorias, e para cada cate- goria associamos uma contagem e uma porcentagem. Podem ser simples ou com intervalos. 18) Tabulação: procedimento no qual o objetivo é organi- zar e resumir os dados brutos, para facilitar o entendi- mento da informação pesquisada. Pode ser realizada por meio de tabelas ou gráficos. 19) Teste de hipóteses: é um dos procedimentos de infe- rência estatística. Nos testes, o interesse é se avaliar a 18 © BIOESTATÍSTICA CONTEÚDO INTRODUTÓRIO possibilidade de os valores populacionais serem iguais, diferentes, maiores ou menores do que determinados valores hipotéticos, ou ainda, se duas ou mais popula- ções possuem valores iguais ou não. 20) Variáveis qualitativas: são informações retiradas da população ou da amostra que não representam quan- tidades (contagens ou medições). Podem ser ordinais, quando possuem uma ordem natural (como o grau de instrução), ou nominais, quandonão possuem uma or- dem (como o gênero de uma pessoa). 21) Variáveis quantitativas: são informações retiradas da população ou da amostra que representam quan- tidades (contagens ou medições). Podem ser inteiras (como o número de carros de uma família) ou fracio- nárias (como o salário de uma pessoa). 3. ESQUEMA DOS CONCEITOS-CHAVE O Esquema a seguir possibilita uma visão geral dos con- ceitos mais importantes deste estudo. Ao segui-lo, você poderá transitar entre um e outro conceito e descobrir o caminho para construir o seu conhecimento. Você pode notar, na Figura 1, que o esquema estabelece duas ações iniciais antes de entrar efetivamente no conteúdo. Isso ocorre pelo fato de a pesquisa ser uma ferramenta prática e não teórica; assim, necessita de um cenário que permita sua aplicação. Para tanto, é necessário que exista um problema a ser re- solvido, um objetivo ou meta a ser atingido ou hipóteses a serem investigadas. 19© BIOESTATÍSTICA CONTEÚDO INTRODUTÓRIO Para a investigação das hipóteses e a verificação dos ob- jetivos, necessitamos da definição do tipo de experimento que será executado. Definido o experimento, é importante estabelecer se a coleta de dados será total (populacional) ou parcial (amostra). Em se tratando de amostragem, deve ser escolhida a técnica da amostragem, sempre aleatória. No processo de amostragem, serão coletados os dados ne- cessários para a verificação dos objetivos e hipóteses. Por essa razão, é importante que o pesquisador tenha bem definido quais variáveis serão investigadas, podendo trabalhar com variáveis qualitativas e quantitativas. Dependendo dos objetivos e das hipóteses de interesse, e também do tipo de variável pesquisada, a análise estatística se abre em duas vertentes: uma com medidas descritivas apropria- das para variáveis quantitativas e outra com medidas apropria- das para variáveis qualitativas. Em qualquer um dos caminhos a serem seguidos, a se- quência de análise passa pela estatística inferencial, momento em que projetamos os dados amostrais para o conhecimento da população. Ainda, dependendo dos objetivos e das hipóteses, podem ser construídos modelos estatísticos quando o interesse vai além da caracterização das variáveis individualmente, passando para a necessidade de relacionar as variáveis entre si. 20 © BIOESTATÍSTICA CONTEÚDO INTRODUTÓRIO Figura 1 Esquema dos Conceitos-chave de Bioestatística. 21© BIOESTATÍSTICA CONTEÚDO INTRODUTÓRIO 4. REFERÊNCIAS BIBLIOGRÁFICAS ARANGO, H. G. Bioestatística: teórica e computacional. 2. ed. Rio de Janeiro: Guanabara Koogan, 2005. BEIGUELMAN, B. Curso Prático de Bioestatística. 5. ed. Ribeirão Preto: Funpec, 2002. BLAIR, R. C.; TAYLOR, R. A. Bioestatística para Ciências da Saúde. São Paulo: Pearson Education do Brasil, 2013. BONAFINI, F. C. Estatística. São Paulo: Pearson Education do Brasil, 2012. CALLEGARI-JACQUES, S. M. Bioestatística: princípios e aplicações. Porto Alegre: Artmed, 2003. LARSON, R.; FARBER, B. Estatística Aplicada. 4. ed. São Paulo: Pearson Prentice Hall, 2010. LEVIN, J.; FOX, J. A.; FORDE, D. R. Estatística para Ciências Humanas. 11. ed. São Paulo: Pearson Education do Brasil, 2012. MOTTA, V. Bioestatística. 2. ed. Caxias do Sul: Educs, 2006. VIEIRA, S. Introdução à Bioestatística. 4. ed. Rio de Janeiro: Elsevier, 2008. ______. Bioestatística: tópicos avançados. 3. ed. Rio de Janeiro: Elsevier, 2010. 5. E-REFERÊNCIAS ARAÚJO, M. I.; BALIEIRO, A. A. S. Bioestatística. Universidade Federal do Amazonas. Disponível em: <http://home.ufam.edu.br/miaraujo/Estat%20Aplic%20Cienc%20 Sociais/Apostila_Bioestat.pdf>. Acesso em: 29 jun. 2015. LOPES, P.A. Estatística para laboratórios. Anvisa, 2011. Disponível em: http://www.ufjf. br/baccan/files/2011/05/estatistica_aplicada_paulo.pdf>. Acesso em: 29 jun. 2015. ROCHA, H. A. L.; CARVALHO, E. R. Conceitos básicos em Epidemiologia e Bioestatística. Faculdade de Medicina – Universidade Federal do Ceará. Disponível em: <http://www.epidemio.ufc.br/ files/ConceitosBasicosemEpidemiologiaeBioestatistica.pdf>. Acesso em: 29 jun. 2015. VELARDE, L. G. C. Noções de Bioestatística. Departamento de Estatística – UFF. Disponível em: <http://www.uff.br/poscienciasmedicas/images/arquivos/apostila_ estatistica.pdf>. Acesso em: 29 jun. 2015. © BIOESTATÍSTICA 23 UNIDADE 1 O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS Objetivos • Compreender as concepções da análise estatística. • Entender as diferenças entre os vários métodos de planejamento de pes- quisas e de amostragem. • Entender as diferenças entre os tipos de dados. • Compreender as técnicas de tabulação de dados. Conteúdos • Diferenças entre Matemática e Estatística. • Conceitos de população e amostra. • Tipos de experimentos e de amostragem. • Dados qualitativos e quantitativos e seus tipos. • Procedimentos de preparação dos dados para análises. • Tabelas e gráficos de frequências. • Tabelas de contingência. Orientações para o estudo da unidade Antes de iniciar o estudo desta unidade, leia as orientações a seguir: 1) Tenha sempre à mão o significado dos termos e expressões explicitados no Glossário de Conceitos e suas ligações pelo Esquema dos Conceitos-chave para o estudo desta unidade e de todas as outras desta obra. Isso facilitará sua aprendizagem e o seu desempenho. 24 © BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS 2) Estabeleça uma relação de identidade da obra com o PEGE e procure de- senvolver as atividades e interatividades dentro do cronograma previsto para não prejudicar o andamento de seus estudos. 3) Leia os livros da bibliografia indicada para ampliar seus estudos em re- lação aos conceitos básicos de Bioestatística e coteje-os com o material didático, discutindo a unidade com seus colegas e com o tutor. Pesquise novas fontes e troque experiências com eles, pois todo conhecimento é bem-vindo e ajudará no seu aprendizado. 25© BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS 1. INTRODUÇÃO Nesta unidade, vamos estudar, de forma bem detalhada, os conceitos básicos da Estatística que darão sustentação à cons- trução das técnicas de representação, interpretação, análise e decisões com base em dados obtidos em procedimentos gerais de coleta de dados. Antes de passarmos aos conceitos, vale a pena uma reflexão sobre alguns aspectos. Em primeiro lugar, por que o nome da obra é Bioestatísti- ca? A Estatística é uma ciência que trata da coleta, representação e análise de dados, sendo adaptada conforme a necessidade da origem dos dados. Se os dados possuem uma origem nas áreas das Ciências Sociais Aplicadas, como Economia e Administração, temos um conjunto de técnicas analíticas que são desenvolvidas para possibilitar a interpretação dos dados dentro do contexto das áreas. Contudo, se os dados forem gerados no campo das Ciên- cias Biológicas e da Saúde, muitos aspectos apresentam diferen- ças em relação a outras áreas, tornando a Estatística mais es- pecializada para esses dados. Assim, surge a Bioestatística, que reúne as técnicas apropriadas para o estudo de dados relacio- nados a situações associadas à Biologia, Enfermagem, Medicina, entre outras. Durante o desenvolvimento do conteúdo, vamos trabalhar com exemplos associados a situações relacionadas às Ciências Biológicas e à Saúde, procurando evidenciar quais as técnicas e ferramentas apropriadas para cada situação, bem como a forma de interpretar os resultados obtidos. 26 © BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS Para começar a nossa caminhada, é necessário discutir di- versos aspectos introdutórios e teóricos para melhor compreen- são do desenvolvimento das demais unidades. Vamos discutir, inicialmente, a diferença entre Estatística e Matemática; depois, vamos avaliar o problema das fontes de informações e métodos de obtenção dos dados e, para finalizar, as diferentes formas de apresentação dos dados obtidos.Sempre que necessário, faremos uma discussão do uso de recursos tecnológicos no intuito de melhorar a aplicação dos conceitos, bem como uma discussão de como trabalhar os con- ceitos discutidos aqui na perspectiva do ensino, já que muitos dos conceitos de Estatística podem auxiliar no processo de en- sino das matérias específicas, para aqueles que estão cursando uma Licenciatura. Vamos iniciar nossa caminhada discutindo as diferenças entre Estatística e Matemática. 2. CONTEÚDO BÁSICO DE REFERÊNCIA O Conteúdo Básico de Referência apresenta, de forma su- cinta, os temas abordados nesta unidade. Para sua compreensão integral, é necessário o aprofundamento pelo estudo do Conteú- do Digital Integrador. 2.1. ESTATÍSTICA VERSUS MATEMÁTICA Você pode estar se perguntando: qual a diferença entre Matemática e Estatística? Podemos responder a essa questão de várias maneiras diferentes, mas vamos mostrar a diferença dis- 27© BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS cutindo a essência de cada uma delas. Para melhor visualização e compreensão, vamos fazer uma ilustração bem simples. Suponha que você esteja participando de uma festa de ani- versário e que na festa tenha sido servido um bolo fatiado, com cobertura e recheio, disposto em uma forma retangular, como mostrado na Figura 1. Figura 1 Ilustração do bolo do exemplo. Em dado momento da festa, você resolve comer um peda- ço do bolo. Reflita sobre a seguinte situação: sendo um bolo com recheio e cobertura, você teria preferência por algum pedaço em particular, um dos pedaços do canto por conter, talvez, menos recheio, ou um pedaço mais central, por conter mais recheio ou cobertura? Suponhamos que você tenha dado a primeira mordida no pedaço de bolo. Nesse instante, uma pessoa pede sua opinião sobre o bolo, perguntando: "O bolo está bom?". Em geral, a ten- dência é de as pessoas responderem algo como: "O bolo está bom", ou então "O bolo não está bom". 28 © BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS É claro que as respostas irão variar, dependendo do pala- dar de cada um, dos gostos particulares, mas o importante nesse momento é avaliar o seguinte: é correto apresentar uma respos- ta afirmativa? Pense um pouco. Como é possível afirmar que o bolo está ou não bom, já que você comeu apenas um pedaço do bolo? Você pode estar pensando: "Isso é possível, pois o bolo é todo igual ou, em ter- mos mais científicos, homogêneo; de forma que o sabor do pe- daço será o mesmo para o bolo inteiro". Simples? Nem tanto. Pense um pouco mais e volte ao ins- tante em que estava escolhendo o seu pedaço. Se as pessoas costumam preferir um pedaço a outro por alguma razão, estão partindo do pressuposto de que o bolo é heterogêneo, ou seja, que alguns pedaços possuem mais recheio ou cobertura que ou- tros, que a textura ou a maciez são diferentes, enfim, alguma característica que o torna desigual. Contudo, após pegar o pedaço e responder ao questiona- mento feito por aquela pessoa, o bolo passa a ser homogêneo. Assim, cometemos um erro grave acreditando na homogeneida- de a ponto de generalizar nossa opinião. Se de fato o bolo fosse 100% homogêneo, a resposta afir- mativa estaria correta e isso é exatamente o que se procura na Matemática, situações 100% constantes e precisas, de forma que o resultado é sempre o mesmo, ou seja, qualquer pedaço levaria à mesma conclusão qualquer pessoa que estivesse expe- rimentando o bolo. Mas, na prática, isso não ocorre. Além do fato de que cada um pode ter uma opinião diferente, divergente, o bolo não é ho- 29© BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS mogêneo, impedindo que a conclusão particular seja generali- zada de forma 100% correta. Nesses casos, temos a Estatística. Assim, enquanto a Matemática lida com situações variá- veis, exatas e totalmente sob controle, a Estatística lida com as chamadas variáveis aleatórias, sujeitas a erros e com controle apenas parcial de sua variação. Agora, você consegue pensar em uma situação típica de seu curso em que o cenário da Estatística esteja presente? Cer- tamente você poderá pensar em vários casos em que a resposta de uma análise apresentará uma variação totalmente fora de seu controle, que pode mudar repentinamente. Por exemplo, pode- mos pensar no peso e na altura de recém-nascidos, no número de peixes em um lago, na altura de uma árvore, nas chances de uma pessoa ficar diabética, nos impactos do consumo de cigar- ros em relação à prevalência de doenças cardíacas, no ritmo de crescimento de uma cultura de bactérias etc. Durante o desenvolvimento do conteúdo, discutiremos di- versos casos relacionados ao estudo desse tipo de variável. Bem, já que estabelecemos o pano de fundo que dá origem à análise estatística, vejamos agora os dois primeiros conceitos importantes: População Estatística e Amostra. 2.2. POPULAÇÃO ESTATÍSTICA VERSUS AMOSTRA Como a Estatística é um conjunto de ferramentas e técni- cas para análise e interpretação de dados, é natural supor que dependemos da existência de um conjunto de dados para dar início às análises estatísticas. 30 © BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS Ainda para a obtenção desses dados, é natural supor que todo processo metodológico foi desenvolvido, o qual abordare- mos adiante, e que no desenvolvimento desse processo foram identificadas as fontes de informação, ou seja, de onde serão re- tirados os dados. Quanto às fontes, sem mais detalhes, temos duas situa- ções gerais que explanaremos a seguir. A primeira é considerar todas as fontes disponíveis, cole- tar 100% dos dados existentes sobre aquilo que se quer estudar. Quando fazemos isso, estamos considerando a População Esta- tística. Por exemplo, se o interesse é avaliar algumas característi- cas em fumantes brasileiros, a população seria todos os fuman- tes existentes no Brasil ou, ainda, se o interesse for verificar o volume de resíduos sólidos depositados em folhas de certo tipo de vegetação, para se avaliar a poluição atmosférica, a popula- ção seria composta por todas as folhas de todas as unidades des- se tipo de vegetação. Agora, pense um pouco. É viável, na maioria dos casos, pesquisar todos os elementos, todas as fontes? Via de regra, se pesquisarmos todas as fontes sobre a po- pulação, teríamos três problemas: o tempo gasto para coletar os dados, o alto custo envolvido no processo e a possibilidade de desconhecimento de parte dos elementos. Por isso, torna-se inviável o estudo de toda a população. População Estatística é o conjunto total de elementos dis- poníveis com pelo menos uma característica em comum e de interesse, contendo N elementos (o que tende a ser muito gran- de). A população pode ser classificada como finita ou infinita (em relação ao número de elementos) e discreta ou contínua 31© BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS (em relação ao tipo de elementos). Não confundir o conceito de População Estatística com o de População Humana. População Estatística deve ser entendida como qualquer tipo de agrupa- mento, não só de pessoas, mas também de objetos, empresas, espécimes animais e vegetais, entre outros. Utilizando o conceito de população, garantimos benefícios importantes para a precisão dos resultados finais, já que toda informação disponível passa a ser conhecida. Como nem sempre seremos capazes de pesquisar todos os elementos, as análises serão feitas com apenas uma parte repre- sentativa deles, o que chamamos de Amostra Aleatória. Amostra Aleatória é um subconjunto da população, uma parte representativa do todo, que deve necessariamente con- servar todas as características dos elementos da população. Em geral, deve ser bem definida para viabilizar a coleta dos dados de maneira finita. Por meio da amostra, se coletada de forma correta, podemos chegar ao conhecimentode toda a população. O uso de amostra gera redução nos custos e no tempo de coleta dos dados, além de uma menor complexidade devido ao tama- nho limitado, mas em compensação gera maior erro nas análises. Como não temos todos os elementos, existirá uma chance de os resultados não serem significativos a ponto de represen- tar a população. Assim, é fundamental estruturar corretamente a amostragem, a fim de minimizar a margem de erro dos dados. Nem toda amostra é útil para análises estatísticas. A amostra deve ser representativa, ou seja, deve ser um retrato em minia- tura da população. Garantindo um procedimento correto de amostragem, podemos analisar o comportamento das variáveis por meio da 32 © BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS análise estatística descritiva e construir estimativas confiáveis e precisas a respeito das variáveis pela análise estatística inferen- cial, que é o processo do qual tiramos conclusões sobre o com- portamento populacional de uma variável, baseado no compor- tamento particular observado e estudado na amostra. A composição de uma amostra deve considerar critérios rigorosos para possibilitar resultados mais confiáveis. Em Esta- tística, lidamos com amostras probabilísticas, que nos permitem trabalhar com estimativas e determinar de forma correta o erro amostral. 2.3. TIPOS DE EXPERIMENTOS UTILIZADOS NAS ÁREAS BIOLÓ- GICAS E DA SAÚDE Antes de discutirmos os métodos de amostragem, vamos apresentar as formas mais comuns de pesquisas utilizadas nas áreas da Saúde e de Ciências Biológicas, que levam à necessi- dade de se fazer amostragem, ou seja, tornam indispensável um protocolo de coleta de dados e informações para análises e diagnósticos. Em geral, a utilização de procedimentos de coletas de da- dos pode ser dividida em duas modalidades. Existem situações em que o pesquisador simplesmente anota uma observação ou informação, como, por exemplo, contar o número de árvores em uma área verde, medir o peso de uma pessoa, perguntar se uma pessoa pratica ou não atividade física etc. Nesses casos, afirma- mos que temos um Estudo Observacional, que compreende situações em que a informação é registrada sem interferência, influência, do pesquisador. 33© BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS Uma segunda abordagem é quando existe uma interferên- cia direta do pesquisador sobre a fonte de informação e, con- sequentemente, sobre a informação coletada. Isso ocorre, por exemplo, quando temos o interesse de verificar se uma dieta alimentar é melhorada quando se inclui um novo medicamen- to, ou se determinada epidemia é controlada quando é feito um trabalho de imunização, ou ainda se existem diferenças no cres- cimento de plantas ou na produtividade agrícola com base na manipulação genética. Em todos esses casos, o pesquisador observa o fenômeno mediante uma interferência no processo, ou seja, a inclusão de algum fator que deve gerar modificações nas respostas. Esses ca- sos são chamados de Estudos Experimentais. Tanto um quanto o outro podem ser planejados com o ob- jetivo de avaliar o futuro conhecendo-se o passado, ou então, conhecendo-se o estado atual, verificar quais fatores do passado chegaram ao resultado presente. Quando estamos interessados em verificar, partindo do presente, dada determinada condição sobre as fontes, quais serão os impactos no futuro, estamos nos referindo aos Estudos Prospectivos. Por exemplo, suponha que um sujeito sofra de uma dor lombar crônica e seja orientado a seguir um tratamento com acupuntura, com a expectativa de que em médio prazo as dores diminuam, este é um tipo de ava- liação prospectiva. Quando estamos interessados em descobrir as causas pas- sadas para eventos no presente, como estudar as políticas am- bientais, os mecanismos de fiscalização, as políticas econômicas que levaram ao estado atual de desmatamento da Amazônia, es- tamos nos referindo aos Estudos Retrospectivos. 34 © BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS Outra forma de diferenciar as pesquisas e/ou estudos que resultam nas coletas de dados é quanto ao fator de continuidade dos estudos. Podemos, por exemplo, estar interessados em ava- liar três cidades quanto ao espaço total de áreas verdes e verifi- car o impacto disso na qualidade do ar. Ao medir, em determina- do instante de tempo, uma única vez, cada informação em cada cidade, para podermos comparar, estamos realizando um estudo de Corte Transversal. Agora, se medirmos a área verde e a qualidade do ar em uma cidade, em diversos instantes de tempo, por exemplo, mensalmente, durante 10 anos, para avaliar a evolução, ou não, da qualidade do ar, estamos fazendo um estudo de Corte Longitudinal. No escopo das modalidades descritas anteriormente, po- demos destacar dois tipos de experimentação mais comuns nas áreas biológicas e da saúde. O primeiro tipo é chamado de Estu- dos de Coorte, em que um grupo de sujeitos (ou qualquer outro tipo de fonte) é selecionado por apresentar uma mesma caracte- rística, como, por exemplo, a tendência em adquirir determinada doença. O grupo é avaliado ao longo do tempo, dividindo-se em uma parte que sofre os efeitos de fatores de risco para a aquisi- ção da doença e uma parte que não sofre os efeitos, por exem- plo, uma parte que ingere bebidas alcoólicas e a outra não, com o objetivo de se verificar a influência desse fator. Outro tipo de experimentação é o chamado Estudo com Grupo Controle. A diferença do estudo de um grupo controle para o de coorte é que, no grupo controle, parte dos sujeitos (fontes) não recebe ou é afetada pelos fatores de risco ou inter- ferência do pesquisador. Por exemplo, para evidenciar a eficá- cia de uma medicação, seleciona-se um grupo de portadores de 35© BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS uma doença, fazendo com que uma parte receba a medicação e outra apenas uma imitação do medicamento, chamada de pla- cebo. O objetivo é verificar se de fato o medicamento fez algum efeito sobre aqueles que tomaram (Grupo), se comparado com os resultados de quem não tomou o medicamento (Controle). É claro que a escolha por um ou outro método depende dos objetivos e das propostas de trabalho, mas todos são feitos com um só intuito, o de levantar os dados necessários para obter as respostas desejadas e necessárias para se tomar uma decisão e, em todos os casos, é importante delinear uma amostragem e efetuar análises sob a óptica da Estatística. 2.4. MÉTODOS DE AMOSTRAGEM Para a realização de análises estatísticas que possibilitem a generalização dos resultados amostrais para resultados gerais (populacionais), a fim de controlar o erro amostral, é impor- tante que a amostra das fontes seja feita de maneira aleatória, probabilística. A Amostra Aleatória (ou Probabilística) visa garantir que todos os elementos da população tenham uma probabilidade conhecida de serem selecionados, a fim de tornar a amostra da população o mais representativa possível e também evitar que o pesquisador influencie e manipule a seleção de maneira intencional. Existem diversas formas de se obter uma Amostra Alea- tória, de acordo com os objetivos da coleta de dados e das ca- racterísticas da população. Um tipo básico de Amostra Aleatória muito utilizada é a técnica de Amostragem Aleatória Simples, que possui como característica básica uma metodologia basea- 36 © BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS da em sorteio simples, que pode ser simulado utilizando tabelas de números aleatórios. Por exemplo, se em uma clínica existem 500 pacientes cadastrados, portadores de certa doença, e o pes- quisador necessita selecionar uma amostra de 100, basta rea- lizar um sorteio dentro do cadastro, sortear 100 nomes dentre 500 nomes. Isso evidencia que não houve escolha intencional de qual pacienteanalisar, ou seja, foi uma escolha aleatória e todos tiveram a chance de ser sorteados. Partindo da Amostra Aleatória Simples, podemos sofisticar os procedimentos de acordo com as necessidades e/ou caracte- rísticas das populações. Caso exista a necessidade de manuten- ção proporcional de determinado perfil da população na amos- tra, são utilizadas as Amostras Aleatórias Estratificadas. Por exemplo, se em um estudo genético existe o interesse em verifi- car se o tipo de sangue pode influenciar, ou não, a potencializa- ção de determinado gene, não podemos simplesmente sortear os sujeitos para os testes, já que, por exemplo, se na população a maioria é de sujeitos com sangue do tipo A, fator RH positivo, na amostra este perfil também deveria ser maioria. Assim, cada tipo de sangue e RH forma um extrato e o sorteio é realizado dentro de cada extrato, a fim de manter a proporcionalidade de cada um. Outra forma de trabalhar a amostragem é quando os da- dos de interesse possuem uma particularidade geográfica, como, por exemplo, as distribuições de animais em uma reserva, a con- centração de colônias de formigas, a distribuição de portadores de diabetes em uma cidade. Nesses casos, podemos optar por uma amostragem que, em vez de sortear sujeitos em uma gran- de área, sorteie áreas menores dentro de uma área maior, pes- quisando todos dentre a área sorteada. Por exemplo, em vez de sortear pessoas pela cidade toda, podemos sortear alguns bair- 37© BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS ros e pesquisar todos dentro dos bairros. Isso só é possível se a variável de interesse não sofrer influência da região, como, por exemplo, ser diabético ou hipertenso. Esse tipo de amostragem é conhecido como Amostra Aleatória por Conglomerados. Independentemente do método a ser utilizado na constru- ção da Amostra Aleatória, um fato é certo: a presença do Erro Amostral. Assim, devemos considerar que a amostra possui uma chance de não gerar dados corretos sobre a população. Sob esse aspecto, além do fato de o pesquisador necessi- tar determinar de forma adequada seu planejamento e amos- tragem, a caracterização adequada das variáveis, dados, a serem pesquisadas é fundamental para minimizar o erro final. Com as leituras propostas no Tópico 3. 1., você vai com- plementar seus conhecimentos sobre a seleção aleatória. An- tes de prosseguir para o próximo assunto, realize as leituras indicadas, procurando assimilar o conteúdo estudado. 2.5. TIPOS DE VARIÁVEIS A partir deste ponto, vamos nos referir aos dados cole- tados pelo pesquisador, para avaliar os cenários de interesse, como uma Variável. De forma simples e direta, podemos separar as variáveis em dois grupos, que estudaremos a seguir. Variáveis Qualitativas (ou Variáveis Categóricas) são as que não representam quantidades, não são expressas numeri- camente. São variáveis que expressam qualidades, presença ou ausência de determinado atributo, representam características pessoais, códigos, ou seja, dados ou informações que não repre- 38 © BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS sentam uma contagem ou uma medição numérica. As variáveis qualitativas podem ser subdivididas em nominais ou ordinais. As Variáveis Qualitativas Nominais são aquelas em que as informações não representam uma ordem específica, como, por exemplo, o estado civil de uma pessoa, sua religião, a cor da pelagem de um animal, o tipo sanguíneo de uma pessoa, a comi- da preferida, e assim por diante. Já as Qualitativas Ordinais são aquelas que apresentam alguma ordem entre as informações, como, por exemplo, o grau de satisfação quanto a um aspecto qualquer (ótimo, bom, regular e ruim), o grau de escolaridade (fundamental, médio, superior e pós-graduação), a faixa etária (criança, jovem, adulto, terceira idade), e assim por diante. Mesmo representando uma variável qualitativa por meio de números, ela permanece quantitativa. Por exemplo, isso ocor- re se avaliarmos o gênero de uma pessoa, masculino e feminino. Podemos chamar masculino de 0 e feminino de 1, para facilitar os registros, mas continua sendo uma variável qualitativa, visto que não é possível somar os números, eles apenas representam uma codificação. Variáveis Quantitativas (ou Variáveis Numéricas) são vari- áveis que representam quantidades expressas numericamente, permitindo somas e demais cálculos matemáticos. São variáveis que expressam contagem ou medições. As Variáveis Quantitati- vas podem ser subdivididas em inteiras (discretas) ou fracioná- rias (contínuas). Variáveis Quantitativas Inteiras são aquelas fruto de con- tagens de objetos, espécimes ou sujeitos e não admitem na ob- servação da variável que se obtenham números com casas de- cimais, ou seja, a observação só gera números inteiros, como, por exemplo, o número de vezes que uma cobaia se alimentou 39© BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS após receber um dado estímulo, o número de recém-nascidos de baixo peso, o número de pacientes com determinada doença, o número de espécies animais em extinção, e assim por diante. Já as Quantitativas Fracionárias estão associadas a medições de valores que naturalmente podem assumir valores com casas de- cimais, tais como o seu peso ou a sua altura, o volume de sangue em seu corpo, a sua temperatura em graus Celsius, a quantidade de dióxido de carbono despejado na atmosfera por hora etc. A diferenciação entre variáveis qualitativas e quantitativas é importante por conta das restrições de algumas ferramentas e métodos estatísticos que estudaremos mais adiante. Em alguns casos, só podemos aplicar em variáveis qualitativas; em outros, apenas em quantitativas, e alguns em ambas. Assim, tais termi- nologias serão utilizadas sistematicamente daqui por diante. De posse da metodologia experimental ou de coleta defi- nida, escolhida a melhor forma de efetuar a amostragem e quais as variáveis de interesse, o pesquisador pode iniciar o processo de coleta de dados. Vejamos a seguir algumas observações sobre esse processo. 2.6. COLETA DE DADOS Como todas as análises estatísticas serão feitas com base nos dados coletados, é importante que a metodologia utilizada nessa coleta seja cientificamente correta e que os instrumentos necessários para a observação das variáveis, sejam eles quais fo- rem, se apresentem eficientes e eficazes. Podemos resumir, então, um tipo de procedimento meto- dológico que favorece uma coleta de dados pertinente: 40 © BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS 1) Com base nos objetivos iniciais definidos, identificar com clareza qual a população de interesse e estru- turar como será o procedimento amostral, caso seja necessário. 2) Com base nos objetivos iniciais definidos, listar quais as variáveis de interesse, sejam qualitativas ou quanti- tativas, e preparar todos os instrumentos necessários para a coleta dos dados (questionários, formulários, protocolos de exames, materiais de laboratório, pre- paração de campo etc.). 3) Realização de um estudo-piloto, um ensaio inicial de teste, cujo propósito é avaliar a eficácia dos instrumen- tos de coleta ou mesmo do processo amostral. 4) Coleta de dados: colocar em prática os instrumentos e as metodologias já revisadas após a pesquisa-piloto. 5) Análise crítica dos dados coletados: essa fase tem por objetivo verificar possíveis ocorrências de dados equi- vocados tanto na coleta direta dos dados quanto na fase de digitação ou de registro dos dados. Seguir até a fase cinco com sucesso significa que os dados coletados estão prontos para o processo de análise, interpreta- ção e diagnósticos necessários para as conclusões e decisões. Iniciaremos nosso estudo discutindo algumas formas de trabalhar a tabulação dos dados. 2.7. TABULAÇÃO DOS DADOS O processo chamado de Tabulação de Dados é, na verdade, um meio de seorganizar os dados obtidos no processo de coleta. 41© BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS Os dados originais, sem nenhuma organização ou ordenação, são chamados de Dados Brutos e, quando necessário, podem ser or- ganizados em forma de distribuições de frequências, que podem ser feitas por meio de tabelas e/ou gráficos de frequências. Tanto as tabelas quanto os gráficos utilizam o conceito de frequência, que consiste no resultado, na contagem de um agru- pamento realizado com os dados para resumir, simplificar os da- dos, a fim de organizá-los de maneira mais eficiente. Uma tabela de frequências é um arranjo dos dados, em li- nhas e colunas; nas linhas, são colocados os agrupamentos feitos com os dados, denominados Categorias da Variável, e nas colu- nas, são colocadas as frequências, a primeira sendo a Frequência Absoluta (fa), que é o número de elementos da amostra presen- tes em cada categoria, e a segunda é a Frequência Relativa (fr%), que é a conversão da frequência absoluta em porcentagem. Para a montagem das tabelas, devemos esclarecer dois itens de grande importância: 1) Dependendo do tipo da variável e do número de cate- gorias, podemos ter dois tipos diferentes de tabela: Ta- bela de Frequências Simples, utilizada quando temos variáveis qualitativas ou variáveis quantitativas inteiras com poucas categorias, ou Tabela de Frequências em Intervalos, quando temos variáveis quantitativas intei- ras com muitas categorias ou variáveis quantitativas fracionárias. 2) A construção de uma tabela deve respeitar algumas normas, estabelecidas em conjunto pelo IBGE e pelo Conselho Federal de Estatística. Nas tabelas, as laterais devem ser abertas e, no corpo da tabela, onde temos as categorias, não colocamos linhas horizontais. 42 © BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS Para exemplificar a montagem dos dois tipos de tabelas, vamos levar em conta as seguintes informações: Baider, Taba- relli e Mantovani (2001), em um artigo intitulado "O banco de sementes do solo durante a regeneração da Floresta Atlântica no sudeste do Brasil", desenvolveram um estudo para determinar a densidade de sementes viáveis e a composição de espécies no banco de sementes de quatro trechos de Floresta Atlântica, por meio da coleta de 57 amostras de solo. Com base nesse artigo, vamos supor que os dados a seguir representem os resultados obtidos em apenas 30 amostras de solo (dados simulados pelo autor). Variável 1: Tipo de floresta/vegetação existente no local da coleta, podendo ser vegetação com 5 anos (V5), vegetação com 18 anos (V18), vegetação com 27 anos (V27) e floresta madura (FM). Os dados brutos para cada uma das 30 amostras de solo foram: V5 V27 V18 V18 V18 V18 V18 V18 V5 V5 V18 V5 V5 FM FM FM FM V5 FM V18 FM FM V5 V5 FM V27 V27 V5 FM V5 Variável 2: Número de espécimes herbáceas existentes na região da coleta. Os dados brutos para cada uma das 30 amostras de solo foram: 13 12 13 12 11 11 12 12 9 12 12 10 11 11 9 9 13 13 10 11 10 11 12 13 12 13 10 10 9 11 43© BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS Variável 3: Densidade de sementes. Os dados brutos para cada uma das 30 amostras de solo foram: 515,6 477,6 466,8 515,2 504,7 598,4 551,7 498,7 692,9 562,8 545,9 587,1 425,8 422,9 433,8 545,8 558,1 651,2 401,2 448,1 545,2 560,3 525,7 659,7 541,2 656,8 399,2 650,0 682,3 598,4 Temos, então, uma variável qualitativa (Variável 1) e uma variável quantitativa inteira (Variável 2), ambas representadas por uma tabela de frequências simples, e uma variável quanti- tativa fracionária (Variável 3), representada por uma tabela de frequências em intervalos. Vamos iniciar pela Variável 1. Inicialmente, temos de sepa- rar as categorias, que, no caso, são os tipos de floresta/vegeta- ção do local, ou seja, V5, V18, V27 e FM. Depois, temos de contar o número de ocorrências de cada uma (fa), verificando que: V5 – possui uma frequência absoluta (fa) igual a 10; V18 – possui uma frequência absoluta (fa) igual a 8; V27 – possui uma frequência absoluta (fa) igual a 3; FM – possui uma frequência absoluta (fa) igual a 9. Conhecendo as frequências absolutas, temos de transfor- má-las em percentuais, utilizando para isso a seguinte relação, considerando n como o total de elementos na amostra, que no exemplo é igual a 30: % 100fafr n = ⋅ Assim, temos: 44 © BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS Para V5: 10% 100 33,33% 30 fr = ⋅ = ; Para V18: 8% 100 26,67% 30 fr = ⋅ = ; Para V27: 3% 100 10,00% 30 fr = ⋅ = ; Para FM: 9% 100 30,00% 30 fr = ⋅ = . Transcrevendo as informações para a estrutura da tabela, respeitando as normas já discutidas anteriormente, temos como resultado a Tabela 1. Tabela 1 Distribuição das amostras de solo, segundo o tipo de floresta/vegetação. TIPO DE FLORESTA/VEGETAÇÃO fa fr% V5 10 33,33 V18 8 26,67 V27 3 10,00 FM 9 30,00 Total 30 100,00 Note que a tabela está com as laterais abertas e sem linhas horizontais separando as marcas de café (as categorias), como determina a norma. Repetindo esse mesmo processo para a Variável 2, número de espécimes herbáceas, com o cuidado de colocar as categorias numéricas em ordem crescente, chegaremos à Tabela 2. 45© BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS Tabela 2 Distribuição das amostras de solo, segundo o número de espécimes herbáceas. NÚMERO DE ESPÉCIMES HERBÁCEAS Fa fr% 9 4 20,00 10 5 26,67 11 7 16,67 12 8 23,33 13 6 13,33 Total 30 100,0 Trabalhando com a terceira variável, que é quantitativa fracionária, é possível notar, observando os dados brutos, que existem muitos números diferentes, muitas categorias, e isso in- viabiliza a tabela simples, gerando a necessidade de se trabalhar os dados de forma intervalar. Para a construção dos intervalos, temos o seguinte procedimento: 1) Calcular a amplitude total (At) dos dados, que é defini- da pela diferença entre o maior valor do conjunto e o menor valor do conjunto: – At Maior Menor= . No caso da variável 3, a amplitude será: 692,9 – 399,2 293,7At = = 2) Calcular o número de intervalos (K) a serem cons- truídos, utilizando a fórmula de Sturges, dada por: 10 1 3,3K Log n= + ⋅ , cujo resultado deve ser um número inteiro arredondado para menos. No caso da variável 3, temos 30n = , então: 46 © BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS 101 3,3 30 1 3,3 1,477 1 4,874 5,874 5 K Log K = + ⋅ = + ⋅ = + = ⇒ = 3) Calcular o tamanho de cada intervalo (T) dividindo-se a amplitude total por K, arredondando o valor com o mesmo número de casas decimais dos dados e com ar- redondamento sempre para mais. No exemplo, temos 293,7At = e 5K = , então: 293,7 / 5 58,74 58,8T T= = ⇒ = Assim, devemos montar 5 intervalos de tamanho 58,8. Os intervalos devem ser de tal forma que o limite inferior pertence- rá ao intervalo (fechado) e o limite superior não pertencerá ao intervalo (aberto), sendo utilizado o símbolo para representar tal situação. Para a construção do primeiro intervalo, iniciamos sempre pelo menor valor dos dados e somamos T para obter o limite su- perior. O próximo intervalo será iniciado pelo limite superior do intervalo anterior e somamos novamente Ti. Prosseguimos as- sim até o último intervalo. Assim, temos os seguintes intervalos: Primeiro Intervalo: 399,2 458,0 Segundo Intervalo: 458,0 516,8 Terceiro Intervalo: 516,8 575,6 Quarto Intervalo: 575,6 634,4 Quinto Intervalo: 634,4 693,2 Contando o número de valores em cada intervalo (fa) e transformando em porcentagem (fr%), temos a Tabela 3. 47© BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS Tabela 3 Distribuição das amostras de solo, segundo a densidade de sementes. DENSIDADE DE SEMENTES Fa fr% 399,2 458,0 6 20,00458,0 516,8 6 20,00 516,8 575,6 9 30,00 575,6 634,4 3 10,00 634,4 693,2 6 20,00 Total 30 100,00 Com os dois tipos de tabelas de frequências definidos an- teriormente, podemos tabular qualquer tipo de variável, bastan- do optar pelo tipo mais adequado. Além das tabelas, podemos fazer a mesma tabulação utilizando gráficos de frequências. 2.8. GRÁFICOS DE FREQUÊNCIAS Utilizar tabelas de frequências para a representação dos resultados de pesquisas e estudos de determinada variável é bastante comum. Contudo, podemos também representar os dados, ou mesmo as tabelas em forma de figuras e/ou diagra- mas, utilizando os Gráficos de Frequências. Os principais tipos de gráficos de frequências são: gráfico de colunas, gráfico de bar- ras e gráfico de setores. O gráfico de colunas é utilizado apenas para as tabelas de frequências simples; no eixo horizontal, são representadas as categorias e, no eixo vertical, os percentuais. A representação gráfica é feita por meio de retângulos com base nas categorias. O gráfico de barras é similar ao gráfico de colunas, com apenas 48 © BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS uma diferença – as categorias são colocadas no eixo vertical e as porcentagens no eixo horizontal. Já o gráfico de setores não utili- za eixos, distribuindo os percentuais de forma proporcional den- tro de uma circunferência. Este gráfico pode ser utilizado tanto para tabelas simples quanto para tabelas de intervalos. Por uma questão de norma, os gráficos de colunas e de bar- ras, quando utilizados para representar uma única tabela, devem ter todos os seus retângulos de mesma cor separados por um pe- queno espaço, isto é, não podem ficar colados uns nos outros. Além desses gráficos, existem outros tipos, como o histo- grama, o polígono de frequência, entre outros, bem como gráfi- cos que não são classificados como de frequências, como o grá- fico de séries e o gráfico de dispersão, que não serão discutidos neste momento. Para ilustrar a construção dos gráficos, vamos utilizar a pla- nilha eletrônica MS-Excel, em sua versão 2010. O primeiro passo é digitar a tabela que se quer representar graficamente na plani- lha. Vamos utilizar como exemplo a Tabela 1 (Figura 2). Figura 2 Tabela 1 digitada na planilha MS-Excel. 49© BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS O segundo passo é selecionar as informações para a ela- boração do gráfico. Note que a tabela contém três informa- ções: as categorias, a frequência absoluta e a frequência per- centual. Utilizamos as categorias e os percentuais nos gráficos. Assim, temos de selecionar as informações pertinentes às ca- tegorias, pressionar a tecla CTLR e selecionar os percentuais. Ficará assim: Figura 3 Tabela 1 com as categorias e os percentuais selecionados. Com a seleção efetuada, basta que você selecione a opção INSERIR no menu do MS-Excel que aparecerão as opções gráficas disponíveis. Para construir o gráfico de colunas, basta clicar so- bre a opção COLUNAS e escolher um dos modelos apresentados pelo programa. Se escolher a primeira opção, por exemplo, o re- sultado será o seguinte: 50 © BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS Figura 4 Gráfico de colunas que representa a Tabela 1. Rapidamente o programa já apresenta o gráfico pronto; no entanto, algumas melhorias devem ser efetuadas, como colocar os títulos nos eixos e eliminar a legenda que está localizada do lado direito. Para inserir o título no eixo das categorias (eixo horizontal), deixe o gráfico selecionado e abra o menu LAYOUT, selecione a opção TÍTULO DOS EIXOS, coloque o mouse sobre a primeira op- ção que aparece e selecione a opção TÍTULO ABAIXO DO EIXO. Pronto, basta digitar o título desejado, como, por exemplo, Tipo de Floresta/Vegetação. Para inserir o título no eixo das porcentagens (eixo verti- cal), basta repetir o processo, colocar o mouse sobre a segunda opção que aparece, selecionar TÍTULO GIRADO e digitar o título desejado, como, por exemplo, Percentual de Amostras de Solos. 51© BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS Note que, do lado direito do gráfico, aparece a descrição "Série 1", que é a chamada Legenda. Sua utilização só é necessá- ria quando, em um mesmo gráfico, tivermos mais de uma tabe- la sendo representada. Como temos apenas a representação de uma única tabela, a legenda deve ser retirada. Para isso, selecio- ne novamente o seu gráfico, entre no menu LAYOUT, selecione a opção LEGENDA e, depois, a opção NENHUMA. O gráfico, com as alterações, ficará igual ao apresentado a seguir. Figura 5 Gráfico de colunas editado. Para criar um gráfico de barras, o procedimento é exata- mente o mesmo: basta entrar no menu INSERIR e selecionar a opção BARRAS, escolher o modelo e fazer as alterações necessá- rias. Para a Tabela 1, temos o seguinte: 52 © BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS Figura 6 Gráfico de barras para a Tabela 1, editado. Em relação ao gráfico de setores, o procedimento inicial é o mesmo: entrar no menu INSERIR, selecionar a opção PIZZA (o MS-Excel não adota a nomenclatura Gráfico de Setores) e esco- lher o modelo. Contudo, como o gráfico não utiliza eixos, temos apenas a opção de colocar um título geral para o gráfico. Como os setores (fatias) do gráfico têm cores diferentes, neste caso a legenda deve ser mantida. Seguindo os passos, chegamos a: 53© BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS Figura 7 Gráfico de setores para a Tabela 1. Note que o gráfico não possui os valores das porcentagens que aparecem na tabela. Desse modo, você tem de inserir tais valores, fazendo o seguinte: deixe o gráfico selecionado e entre no menu LAYOUT, selecione a opção RÓTULO DE DADOS e depois a opção EXTREMIDADE EXTERNA, obtendo o seguinte resultado: Figura 8 Gráfico de setores para a Tabela 1, editado. 54 © BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS O exposto até aqui representa apenas uma parcela de alter- nativas possíveis por meio dos recursos disponíveis no MS-Excel, mas não é objetivo deste material explorá-los com profundidade. Você pode experimentar todos os recursos disponíveis e melhorar cada vez mais a aparência dos gráficos. O procedimento de tabulação de dados é um ponto de par- tida no que se refere à análise dos dados coletados. Nas unida- des seguintes, trabalharemos diversas formas de analisar mais especificamente os dados coletados nas amostras. Antes de realizar as questões autoavaliativas propostas no Tópico 4, você deve fazer as leituras propostas no Tópico 3. 3., para conhecer mais sobre histogramas e polígonos de frequências. Vídeo complementar ––––––––––––––––––––––––––––––– Neste momento, é fundamental que você assista ao vídeo complementar. • Para assistir ao vídeo pela Sala de Aula Virtual, clique no ícone Videoaula, localizado na barra superior. Em seguida, selecione o nível de seu curso (Graduação), a categoria (Disciplinar) e o tipo de vídeo (Complementar). Por fim, clique no nome da disciplina para abrir a lista de vídeos. • Para assistir ao vídeo pelo seu CD, clique no botão "Vídeos" e selecione: Bioestatística – Vídeos Complementares – Complementar 1. –––––––––––––––––––––––––––––––––––––––––––––––––– 3. CONTEÚDO DIGITAL INTEGRADOR O Conteúdo Digital Integrador representa uma condição necessária e indispensável para você compreender integralmen- te os conteúdos apresentados nesta unidade. 55© BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS 3.1. PRODUZINDO AMOSTRAS ALEATÓRIAS Discutimos a existência de diversas técnicas de planeja- mento amostral, mas não há como negar que todos os métodos requerem a utilização dos procedimentos de seleção aleatória, seja dentro de um extrato ou de conglomerados. Dependendodo tipo de população e de como as informa- ções populacionais estão mapeadas, catalogadas ou registradas, o procedimento de sorteio, seleção aleatória dos elementos, pode ser facilitado ou não. Estude a referência indicada a seguir para complemen- tar seus conhecimentos sobre a seleção aleatória, em especial quanto à utilização das tabelas de números aleatórios e também com o uso da amostragem sistemática. • TOREZANI, W. Apostila de Estatística I. Vila Velha: Facul- dade Univila, 2004. Ver parte II – Amostragem. Dispo- nível em: <http://www.ifba.edu.br/dca/Corpo_Docen- te/MAT/ICCL/APOSTILA_DE_ESTAT_STICA.pdf>. Acesso em: 01 jul. 2015. 3.2. EXPERIMENTOS SIMPLES-CEGOS E DUPLO-CEGOS Em ensaios e experimentos nas áreas de Biológicas e da Saúde, é muito comum a utilização das técnicas de estudos em coorte e de grupos-controle. Uma questão que sempre se discute na formatação dos experimentos é sobre o nível de conhecimen- to dos sujeitos e o que está ocorrendo durante a execução des- tes, sejam os sujeitos analisados ou os próprios pesquisadores. Existem duas metodologias denominadas simples-cegos e duplo-cegos, que consideram a possibilidade de uma parte ou 56 © BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS de todos os envolvidos não conhecerem exatamente todas as informações sobre o experimento, a fim de minimizar as inter- ferências externas e de se comprovar efetivamente a eficácia de determinada intervenção. Estude o artigo indicado a seguir para obter uma visão mais detalhada desses dois tipos de experimentos e considera- ções complementares sobre os ensaios nas áreas de Biológicas e da Saúde. • ESCOSTEGUY, C. C. Tópicos metodológicos e estatísti- cos em ensaios clínicos controlados randomizados. Arq. Bras. Cardiol., v. 72, n. 2, 1999. Disponível em: <http:// publicacoes.cardiol.br/abc/1999/7202/72020002.pdf>. Acesso em: 01 jul. 2015. 3.3. HISTOGRAMAS E POLÍGONO DE FREQUÊNCIAS Dependendo do tipo de dados ou de tabelas que se queira representar graficamente, podemos encontrar um gráfico cha- mado Histograma, que pode ser transformado em outro deno- minado Polígono de Frequências. Verifique as referências citadas a seguir e amplie seus co- nhecimentos sobre os gráficos, complementando o conteúdo discutido até aqui. • BLAIR, R. C.; TAYLOR, R. A. Bioestatística para Ciências da Saúde. São Paulo: Pearson Education do Brasil, 2013. Ver capítulo 2, item 2. 5. [obra disponível na Biblioteca Digital Pearson, com acesso pela SAV]. • BONAFINI, F. C. Estatística. São Paulo: Pearson Educa- tion do Brasil, 2012. Ver tópico de Estatística Descritiva, 57© BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS p. 12-17. [obra disponível na Biblioteca Digital Pearson, com acesso pela SAV]. • LARSON, R.; FARBER, B. Estatística Aplicada. 4. ed. São Pau- lo: Pearson Prentice Hall, 2010. Ver capítulo 2. [obra dispo- nível na Biblioteca Digital Pearson, com acesso pela SAV]. • LEVIN, J.; FOX, J. A.; FORDE, D. R. Estatística para Ciên- cias Humanas. 11. ed. São Paulo: Pearson Education do Brasil, 2012. Ver capítulo 2, p. 57-69. [obra disponível na Biblioteca Digital Pearson, com acesso pela SAV]. 4. QUESTÕES AUTOAVALIATIVAS A autoavaliação pode ser uma ferramenta importante para você testar o seu desempenho. Se encontrar dificuldades em responder às questões a seguir, você deverá revisar os conteú- dos estudados para sanar as suas dúvidas. 1) Dentre os motivos apontados a seguir, qual não pode ser considerado um fator que justifique a utilização de dados populacionais, ou seja, analisar 100% dos dados disponíveis? a) Maior confiabilidade nos resultados. b) Menor margem de erro. c) Melhor conhecimento sobre os aspectos estudados. d) Mais rápido do que analisar uma amostra. e) Possibilidade de aumentar a probabilidade de resultados corretos. 2) Para avaliar a eficiência de uma nova ração para engorda de peixes, dois tanques foram preparados, cada um com 100 exemplares de determinada espécie. Em um tanque, os peixes foram alimentados por um protocolo convencional; no outro, o protocolo de alimentação incluiu a nova ração. Esse tipo de experimentação é classificado como: a) longitudinal e de coorte. b) transversal e de grupo-controle. c) prospectivo e de coorte. 58 © BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS d) retrospectivo e de grupo-controle. e) Nenhuma das anteriores 3) Das variáveis listadas a seguir, qual não pode ser classificada como qualitativa? a) Espécies de plantas existentes em uma praça. b) Volume de chuva precipitada em determinado dia. c) Classificação de um solo quanto à presença de nutrientes. d) Tipo de presas preferidas por determinado predador. e) Cor da pelagem de gatos domésticos. 4) Das variáveis listadas a seguir, qual pode ser classificada como quantitativa fracionária? a) Número de pássaros existentes em uma reserva. b) Quantidade de pessoas vivendo em áreas sem tratamento de esgoto. c) Índice de colesterol HDL no sangue. d) Número de afluentes de um rio. e) Quantidade de colônias formadas em uma placa de petri. Gabarito Confira, a seguir, as respostas corretas para as questões au- toavaliativas propostas: 1) d. Como a população é, em geral, composta por uma quantidade muito gran- de de elementos, estudá-la por completo gera uma grande quantidade de informação, aumentando a precisão e diminuindo o erro, mas, em com- pensação, demora mais do que analisar apenas uma amostra. 2) b. Como temos apenas uma análise estática para cada tanque com a finali- dade de comparação, ou seja, eles não estão sendo analisados ao longo do tempo, o estudo é transversal. Como apenas um dos tanques receberá o tratamento (ração) e o outro não, temos um estudo de grupo-controle. 59© BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS 3) b. Variáveis Qualitativas são aquelas que não expressam quantidades, con- tagens ou medições. 4) c. Variáveis Quantitativas Fracionárias são aquelas que expressam quanti- dades, números, que admitem casas decimais e podem ser fracionadas. 5. CONSIDERAÇÕES Chegamos ao final da primeira unidade de Bioestatística, na qual você teve a oportunidade de estudar um pouco sobre as técnicas de planejamento de coleta de dados e tipos de amostra- gem, bem como sobre os tipos de dados e tabulação. Veja agora o Conteúdo Digital Integrador, que é importan- te para que você procure complementar seus estudos, consul- tando as referências bibliográficas indicadas e outros materiais. Na próxima unidade, você começará os estudos sobre as ferramentas de análise estatística, aplicadas aos estudos bioló- gicos e da saúde. 6. E-REFERÊNCIAS ARAÚJO, M. I.; BALIEIRO, A. A. S. Bioestatística. Universidade Federal do Amazonas. Disponível em: <http://home.ufam.edu.br/miaraujo/Estat%20Aplic%20Cienc%20 Sociais/Apostila_Bioestat.pdf>. Acesso em: 01 jul. 2015. LOPES, P. A. Estatística para laboratórios. Anvisa, 2011. Disponível em: <http://www. ufjf.br/baccan/files/2011/05/estatistica_aplicada_paulo.pdf>. 01 jul. 2015. ROCHA, H. A. L.; CARVALHO, E. R. Conceitos básicos em Epidemiologia e Bioestatística. Faculdade de Medicina – Universidade Federal do Ceará. Disponível em: <http://www. epidemio.ufc.br/files/ConceitosBasicosemEpidemiologiaeBioestatistica.pdf>. Acesso em: 01 jul. 2015. 60 © BIOESTATÍSTICA UNIDADE 1 – O USO DA ESTATÍSTICA E O PROCESSO DE TABULAÇÃO DE DADOS VELARDE, L. G. C. Noções de Bioestatística. Departamento de Estatística – UFF. Disponível em: <http://www.uff.br/poscienciasmedicas/images/arquivos/apostila_ estatistica.pdf>. Acesso em: 01 jul. 2015. 7. REFERÊNCIAS BIBLIOGRÁFICAS ARANGO, H. G. Bioestatística: teórica e computacional. 2. ed. Rio de Janeiro: Guanabara Koogan, 2005. BAIDER, C.; TABARELLI, M.; MANTOVANI, W. O banco de sementes do solo durante a regeneração da Floresta Atlântica no sudeste do Brasil. Revista Brasileira de Biologia, v. 61,
Compartilhar