Prévia do material em texto
ACESSE AQUI O SEU LIVRO NA VERSÃO DIGITAL! PROFESSORAS Dra. Izabel Galhardo Demarchi Me. Renata Cristina Souza Chatalov Bioestatística e Epidemiologia https://apigame.unicesumar.edu.br/qrcode/8985 FICHA CATALOGRÁFICA C397 CENTRO UNIVERSITÁRIO DE MARINGÁ. Núcleo de Educação a Distância. DEMARCHI, Izabel Galhardo; CHATALOV, Renata Cristina Souza. Bioestatística e Epidemiologia. Izabel Galhardo Demarchi, Renata Cristina Souza Chatalov. Maringá - PR.: Unicesumar, 2021. 328 p. “Graduação - EaD”. 1. Bioestatística 2. Epidemiologia 3. Ciências Biológicas. EaD. I. Título. CDD - 22 ed. 615 CIP - NBR 12899 - AACR/2 ISBN 978-65-5615-521-0 Impresso por: Bibliotecário: João Vivaldo de Souza CRB- 9-1679 Pró Reitoria de Ensino EAD Unicesumar Diretoria de Design Educacional NEAD - Núcleo de Educação a Distância Av. Guedner, 1610, Bloco 4 - Jd. Aclimação - Cep 87050-900 | Maringá - Paraná www.unicesumar.edu.br | 0800 600 6360 PRODUÇÃO DE MATERIAIS DIREÇÃO UNICESUMAR NEAD - NÚCLEO DE EDUCAÇÃO A DISTÂNCIA Reitor Wilson de Matos Silva Vice-Reitor Wilson de Matos Silva Filho Pró-Reitor de Administração Wilson de Matos Silva Filho Pró-Reitor Executivo de EAD William Victor Kendrick de Matos Silva Pró-Reitor de Ensino de EAD Janes Fidélis Tomelin Presidente da Mantenedora Cláudio Ferdinandi Diretoria Executiva Chrystiano Mincoff, James Prestes, Tiago Stachon Diretoria de Graduação e Pós-graduação Kátia Coelho Diretoria de Cursos Híbridos Fabricio Ricardo Lazilha Diretoria de Permanência Leonardo Spaine Head de Graduação Marcia de Souza Head de Metodologias Ativas Thuinie Medeiros Vilela Daros Head de Tecnologia e Planejamento Educacional Tania C. Yoshie Fukushima Head de Recursos Digitais e Multimídias Franklin Portela Correia Gerência de Planejamento e Design Educacional Jislaine Cristina da Silva Gerência de Produção Digital Diogo Ribeiro Garcia Gerência de Recursos Educacionais Digitais Daniel Fuverki Hey Supervisora de Design Educacional e Curadoria Yasminn T. Tavares Zagonel Supervisora de Produção Digital Daniele Correia Coordenador de Conteúdo Sidney Edson Mella Junior Revisão Textual Meyre Aparecida Barbosa da Silva Editoração Matheus Silva de Souza Ilustração Bruno Cesar Pardinho, Geison Odlevati Ferreira Fotos Shutterstock. Tudo isso para honrarmos a nossa missão, que é promover a educação de qualidade nas diferentes áreas do conhecimento, formando profissionais cidadãos que contribuam para o desenvolvimento de uma sociedade justa e solidária. Reitor Wilson de Matos Silva A UniCesumar celebra os seus 30 anos de história avançando a cada dia. Agora, enquanto Universidade, ampliamos a nossa autonomia e trabalhamos diariamente para que nossa educação à distância continue como uma das melhores do Brasil. Atuamos sobre quatro pilares que consolidam a visão abrangente do que é o conhecimento para nós: o intelectual, o profissional, o emocional e o espiritual. A nossa missão é a de “Promover a educação de qualidade nas diferentes áreas do conhecimento, formando profissionais cidadãos que contribuam para o desenvolvimento de uma sociedade justa e solidária”. Neste sentido, a UniCesumar tem um gênio importante para o cumprimento integral desta missão: o coletivo. São os nossos professores e equipe que produzem a cada dia uma inovação, uma transformação na forma de pensar e de aprender. É assim que fazemos juntos um novo conhecimento diariamente. São mais de 800 títulos de livros didáticos como este produzidos anualmente, com a distribuição de mais de 2 milhões de exemplares gratuitamente para nossos acadêmicos. Estamos presentes em mais de 700 polos EAD e cinco campi: Maringá, Curitiba, Londrina, Ponta Grossa e Corumbá), o que nos posiciona entre os 10 maiores grupos educacionais do país. Aprendemos e escrevemos juntos esta belíssima história da jornada do conhecimento. Mário Quintana diz que “Livros não mudam o mundo, quem muda o mundo são as pessoas. Os livros só mudam as pessoas”. Seja bem-vindo à oportunidade de fazer a sua mudança! Aqui você pode conhecer um pouco mais sobre mim, além das informações do meu currículo. Graduada em Engenharia Ambiental e Sanitária, Tecnolo- gia Ambiental, com especialização em Gestão Ambiental e Mestrado em Engenharia Urbana. Docente desde 2012, nos cursos de Engenharia Civil e Engenharia Elétrica. No final de 2012 iniciou as atividades na educação à distância. Tem experiência com a disciplina de estatís- tica há mais de 8 anos e vasta experiência na escrita de materiais nesta área. Além da área de Bioestatística, tem afinidade também pela área de tratamento de efluentes, resíduos sólidos e licenciamento ambiental. Lattes: http://lattes.cnpq.br/7312835687328748 http://lattes.cnpq.br/7312835687328748 https://apigame.unicesumar.edu.br/qrcode/8463 Aqui você pode conhecer um pouco mais sobre mim, além das informações do meu currículo. Doutora em Ciências da Saúde pela Universidade Esta- dual de Marin gá-UEM (2015) e graduação em Farmácia (2005) com habilitação em Análises Clínicas (2006) pela Universidade Estadual do Oeste do Pa raná-UNIOESTE. Atualmente, é professora assistente na Universidade Estadual de Maringá. Tem experiência em Saúde Pú- blica, Epidemio logia e Imunologia Clínica, desde 2009. Desenvolve projetos de pes quisa, extensão e de ensino nas áreas de Epidemiologia e Imunologia Clínica, com ênfase em doenças infecciosas. http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4267101H6 Quando identificar o ícone de QR-CODE, utilize o aplicativo Unicesumar Experience para ter acesso aos conteúdos on-line. O download do aplicativo está disponível nas plataformas: Google Play App Store Ao longo do livro, você será convidado(a) a refletir, questionar e transformar. Aproveite este momento. PENSANDO JUNTOS EU INDICO Enquanto estuda, você pode acessar conteúdos online que ampliaram a discussão sobre os assuntos de maneira interativa usando a tecnologia a seu favor. Sempre que encontrar esse ícone, esteja conectado à internet e inicie o aplicativo Unicesumar Experience. Aproxime seu dispositivo móvel da página indicada e veja os recursos em Realidade Aumentada. Explore as ferramentas do App para saber das possibilidades de interação de cada objeto. REALIDADE AUMENTADA Uma dose extra de conhecimento é sempre bem-vinda. Posicionando seu leitor de QRCode sobre o código, você terá acesso aos vídeos que complementam o assunto discutido PÍLULA DE APRENDIZAGEM Professores especialistas e convidados, ampliando as discussões sobre os temas. RODA DE CONVERSA EXPLORANDO IDEIAS Com este elemento, você terá a oportunidade de explorar termos e palavras-chave do assunto discutido, de forma mais objetiva. https://apigame.unicesumar.edu.br/qrcode/3881 BIOESTATÍSTICA E EPIDEMIOLOGIA Você já teve a curiosidade de conhecer um pouco mais sobre o que faz um profissional da área da saúde? Pensou? Me diga quais áreas você irá atuar: Diagnóstico, Medica- mentos, Imagenologia, Alimentos, Industria, Epidemiologia, Área Ambiental? Você sabia que as técnicas utilizadas na área de Bioestatística e Epidemiologia poderão te ajudar em seu cotidiano, na maioria das tuas áreas de atuação? Você sabe como? Com os conhecimentos obtidos na disciplina de Bioestatística e Epidemiologia, você aplicará os conceitos destas áreas no campo da biologia e da saúde, sendo essencial para problematização, para o planejamento, coleta de dados, análise crítica e principal- mente como ferramenta para auxílio da tomada de decisão e gestão de saúde. Na disciplina da Bioestatística muitas vezes, você vai trabalhar com análise de dados, certo? Para isso é importante que você entenda como “tratar” esses dados provenien- tes de uma pesquisa. Assim, sugerimos que você faça uma pesquisa no site do IBGE e veja quais são as regras para construir um quadro e uma tabela. Depois faça uma análise dos dados populacionais, e também, no painel de indicadoressobre a questão de saúde e saneamento do Brasil. Esta aproximação servirá de base para trabalharmos os conceitos da epidemiologia. Você percebeu como é fácil construir uma tabela a partir de dados fidedignos? É impor- tante que você não se esqueça das regras específicas, pois delas dependem um bom resultado e interpretação adequada das informações levantadas. Neste estudo iniciaremos com a oportunidade de conhecer a origem da Bioestatística, sua definição, sua importância, bem como entender que as técnicas estatísticas são essenciais para uma pesquisa. Além disso, você vai compreender como fazer uma coleta de dados utilizando as principais técnicas de amostragem, como construir tabe- las e compreender suas regras. Vamos aprender também a elaborar gráficos e fazer sua leitura e interpretação. É fundamental entender como ocorre a análise dos dados oriundos de uma pesquisa para que se possa analisar situações quanto à frequência, incidência, ocorrências, dentre outras variáveis. Informações de como trabalhar com as medidas de posição, separatrizes, variabilidade podem ajudar em experimentos, em resultados e em possíveis situações que envolvam as incertezas, e são imprescindíveis para futura atuação profissional. Na parte de bioestatística, finalizamos com um as- sunto muito importante para sua formação, a inferência estatística, que visa por meio de testes, analisar uma amostra e fazer projeções para a população. Na segunda parte deste livro estudaremos os princípios básicos de epidemiologia. Esta ciência traz ferramentas fundamentais para os profissionais de saúde, e possui interfaces com outras disciplinas, como a estatística, a geografia, a ecolo gia, a ética, a sociologia e a clínica. Inicialmente apresentaremos os conceitos, objetivos e perspectivas históricas da epidemiologia, incluindo a compreensão do processo saúde-doença, os fatores etiológicos (preditores), a causa lidade e as medidas preventivas. Na sequência estudaremos os métodos epidemiológicos utilizados para a compreensão da distribuição das doenças, a coleta de dados das populações/indivíduos, os indicadores de saúde e a estrutura e funções da Vigilância Epidemiológica. As medidas de frequência, preva- lência e incidência serão detalhadas na Unidade III, permitindo que você compreenda a distri buição dos casos de acordo com a duração e tempo da doença. Além disso, também serão definidas e interpretadas nesta unidade as medidas de associação. Na Unidade IV, definiremos os desenhos de estudos epidemiológicos, compreendendo os principais estudos descritivos e analíticos. Serão apresentados os estudos do tipo transversal, caso-controle, coorte e ensaios clínicos humanos e não humanos (os ditos experimentais). Por fim, na última unidade mostraremos algumas das aplicações da epidemiologia na saúde, como a Epidemiologia Moderna, Genética, Ambiental, Clínica baseada em evidências, Social, e Hospitalar. Abordaremos também a aplicação da epidemiolo gia para o planejamento e gestão em saúde, que subsidiam as tomadas de decisões das políticas públicas ou privadas, para a avaliação dos serviços de saúde ofereci dos à população. Na prática, este conhecimento traz a você, futuro(a) profissional de saúde, um dife- rencial. Você pode perceber que em seu campo profissional certamente utilizará a Bioestatística e Epidemiologia de várias maneiras, como por exemplo, para testar uma hipótese, para analisar condições determinantes a saúde da população, para conduzir experimentos científicos tecnicamente na análise de fenômenos e nas aplicações no campo das ciências biológicas, exatas e da saúde. Como você pode ter observado, os conhecimentos de Bioestatística e Epidemiologia são fundamentais na formação do profissional de saúde. Você já sabia de toda sua impor- tância? Já conhecia suas aplicações? Podemos constatar que sem uma devida analisa e trabalho dos dados, somos apenas uma pessoa com opinião. Vamos mergulhar juntos no universo desta disciplina, para que você seja um profissional diferenciado. Vamos lá? APRENDIZAGEM CAMINHOS DE 1 2 43 5 13 71 41 117 VISÃO GERAL E PRINCÍPIOS DA BIOESTATÍSTICA 6 199 INDICADORES DE SAÚDE E A VIGILÂNCIA EPIDEMIOLÓGICA MEDIDAS DE POSIÇÃO E DISPERSÃO TABELAS E GRÁFICOS CORRELAÇÃO REGRESSÃO LINEAR E INFERÊNCIA ESTATÍSTICA EPIDEMIOLOGIA: DEFINIÇÃO, OBJETIVOS E PERSPECTIVAS HISTÓRICAS 155 7 225 8 255 PRINCIPAIS DESENHOS DE ESTUDOS EPIDEMIOLÓGICOS MEDIDAS DE FREQUÊNCIA E DE ASSOCIAÇÃO 9 287 EPIDEMIOLOGIA APLICADA EM SAÚDE 1 Olá, aluno(a), esta unidade será essencial para sua trajetória profis- sional na área da saúde. Por meio dela, você terá oportunidade de conhecer a origem da Bioestatística, sua definição, sua importância bem como entender que as técnicas estatísticas são essenciais para uma pesquisa, além disso, você compreenderá como fazer uma coleta de dados utilizando as principais técnicas de amostragem. Vamos lá? Visão Geral e Princípios da Bioestatística Me. Renata Cristina Souza Chatalov 14 UNICESUMAR Ao iniciar a leitura deste material, você deve estar se perguntando, por que eu, futuro(a) profissional da saúde, preciso da Bioestatística? Qual a sua importância? Como ela pode influenciar minha vida? Será que realmente utilizarei a Bioestatística no meu dia a dia como profissional da saúde? Para que possamos compreender, utilizaremos um exemplo bem amplo e possível para todos os profissionais da saúde. Imagine que você, já graduado em Ciências Biológicas, estará atuando em sala de aula como docente de disciplinas comuns à formação das futuras gerações de profissionais da saúde, é provocado por seus alunos a realizar um experimento. Isso mesmo, um experimento, no qual os alunos coloquem em prática o que estão aprendendo. Você tem uma ideia bem interessante, propondo aos seus alunos: vamos fazer uma pesquisa de campo? Rapidamente, os alunos ficam todos animados, com a possibilidade de fazer uma pesquisa de campo. Assim, você como professor da disciplina, inicia uma provocação com a sua turma, fazendo as seguintes perguntas: Qual será o problema de pesquisa? Quais serão os objetivos desta pesquisa? Porque faremos essa pesquisa? O que faremos com os resultados disso tudo? Qual o tema? Qual a relevância desse tema? Quanto custará? Aonde vamos? Diante de tantas perguntas, as respostas que devem ser apresen- tadas pelos estudantes parecem simples, contudo, para que a sua provocação seja efetiva e a reflexões dos discentes sejam significa- tivas para a aprendizagem deles, será necessário, que os estudantes alcancem tais respostas, com base em um planejamento. Logo, antes de realizar o experimento com seus alunos, ter um planejamento de pesquisa e um método (como será feita a pesquisa) fazem-se neces- sários. Mas como a bioestatística pode me ajudar com essa questão? Para isso, convido você a fazer a leitura do artigo intitulado Qual a importância da Bioestatística e da Epidemiologia na área da saúde? a fim de conhecer um dos exemplos para a aplicação da Bioestatística. Nesse artigo, você verá que a Bioestatística está presente em diversas áreas de nossa vida, entre elas, a Epide- miologia. Nessa leitura, é evidenciada a relação da Bioestatística e da Epidemio- logia em aspectos, como quantificação e análise dos eventos em saúde. Acesse o Qrcode a seguir: https://apigame.unicesumar.edu.br/qrcode/8444 15 UNIDADE 1 Sabemos que a dengue ainda é uma epidemia em várias regiões do mundo. Sendo assim, considere que você já é um profissional da saúde e está atuando na Secretaria de Saúde de seu município e deseja realizar um experimento a respeito dos casos de dengue em um dos bairros do município. Porém o bairro em questão possui 35 mil pessoas, segundo dados da prefeitura. Você tem o prazo de uma semana para fazer a pesquisa e dispõem de pouca mão de obra e poucos recursos financeiros. Neste contexto, você se questiona: como será possível fazer essa pesquisa? É aí que a Bioestatísticapode ajudar. Uti- lizando técnicas de estatística, como a amostragem, na qual você poderá selecionar algumas pessoas que farão parte da sua amostra, mas que seja representativa para toda população do bairro. Considere esta situação hipotética apresentada e, para que possamos nos ambientar com tal prática, que tal nos apropriarmos de uma das aplicações da Bioestatística e colocarmos a mão na massa? Vamos lá? Faça uma pesquisa com os membros de sua família, perguntando se eles têm tomado cuidado com ações preventivas contra dengue. Diante de tudo isso que discutimos até o momento, faça suas anotações em um Diário de Bordo. Aqui, neste espaço, você pode anotar suas primeiras impressões até o momento. Escreva os resultados de sua pesquisa com seus familiares, anotando, também, as dificuldades para realizar a pesquisa e os pontos a melhorar. Faça esta reflexão. DIÁRIO DE BORDO 16 UNICESUMAR Até o momento, estudamos que o futuro profissional da saúde, usará a Bioestatística na prática, e que ela é fundamental para sua formação. Mas o que ela significa? Como podemos conceituá-la? A Bioesta- tística é um ramo da estatística que traz aplicações no campo das Ciências Biológicas e da Saúde, sendo fundamental para problematização, planejamento, coleta de dados, crítica e sumarização dos dados, avaliação, análise e interpretação de todos os dados que resultam nas pesquisas de campo (RODRI- GUES; LIMA; BARBOSA, 2017). Conhecer a Bioestatística é essencial para as áreas da: Epidemiologia, à Ecologia, à Psicologia Social e à Medicina baseada em evidência. Se a Bioestatística, porém, deriva da própria Estatística, como definir Estatística? Para Parenti, Silva e Silveira (2017, p. 13): “ Estatística é a ciência por meio da qual se faz inferências sobre um fenômeno aleatório específico com base em uma amostra relativamente limitada. A área de estatística tem duas subáreas: estatística matemática e estatística aplicada. A estatística matemática se preocupa com o desenvolvimento de novos métodos de inferência estatística e requer conhecimento detalhado de matemática complexa para a sua execução. A estatística aplicada envolve a aplicação dos métodos de estatística matemática em assuntos espe- cíficos, como economia, psicologia e saúde pública. Desde a Antiguidade, a estatística está presente na vida do homem. Ela é utilizada como fonte de dados, que, por sua vez, são dados ou teorias utilizadas para explicar uma informação de alguma coisa. Para Parenti (2018, p. 14): 17 UNIDADE 1 “ É a ciência que tem por objetivo orientar a coleta, o resumo, a apresentação, a análise e a interpretação de dados. Apesar de estarmos habituados à análise de informações populacionais, principalmente quando tratamos de censos demográficos, ela também pode ser usada como fonte em outras ciências e, no nosso caso, especialmente nas ciências ligadas à vida e aos seres vivos. Podemos observar que a estatística está voltada para problematização de estudos, coleta de dados, tabulação, apresentação e análise de dados. No futuro, o pensamento estatístico será tão necessário para a cidadania eficiente como saber ler e escrever. (H. G. Wells) Depois que vimos o que significa a estatística e como ela pode ser útil em nossa vida, com um va- lor importante para todos nós conheceremos suas duas vertentes. A estatística pode ser dividida em estatística descritiva e inferencial. A estatística descritiva, segundo Arango (2011), é a parte da estatística que é encarregada do levantamento, organização, classificação e descrição dos dados em tabelas, gráficos ou outros recursos visuais, além do cálculo de parâmetros representativos desses dados. Enquanto a estatística inferencial trata do ramo da estatística, que tem por intuito fazer afirmações a partir de dados observados, ou seja, fazer projeções para uma população com dados baseados em amostras. Assim, mais do que dados, a estatística dá-nos oportunidade de olhar as informações coletadas, fazer análise de modo crítico e pode ser utilizada dentro da área das Ciências Biológicas e da Saúde em vários contextos, tais como levantamento de dados, diagnósticos, contagem de ocorrências, análise de dados pandêmicos, comprovação da utilização de medicamentos, entre outros (PARENTI, 2018). No nível da iniciação, a estatística não deve ser apresentada como um ramo da Matemática. A boa estatística não deve ser identificada com rigor ou pureza matemáticos, mas ser mais, estreitamente, relacionada com pensamento cuidadoso. Em particular, os alunos devem apreciar como a Estatística é associada com o método científico: “observamos a natureza e formulamos questões, cogitamos dados que lançam luz sobre essas questões, analisamos os dados e comparamos os resultados com o que tínha- mos pensado previamente, levantamos novas questões e assim sucessivamente” (HOGG, 2001, p. 342). Geralmente, um profissional da Estatística deve ter bons conhecimentos matemáticos, além de interpre- tação para criação de novos métodos estatísticos. Por outro lado, Hogg (2001) apresenta-nos que a eficácia no ensino de estatística para acadêmicos de áreas não exatas dará-se conforme forem relacionados os 18 UNICESUMAR conteúdos com as habilidades e as competências em questão bem como a utilização de exemplos voltados à área de formação. Sendo assim, a Bioestatística é uma ramificação da estatística aplicada que utiliza métodos estatísticos para problemas biológicos e médicos. Evidentemente, estas áreas da estatística se sobrepõem de alguma maneira. Em alguns casos, por exemplo, em razão de uma aplicação da Bioestatística, os métodos padrão não se aplicam e devem ser modificados. Nessas situações, os bioestatísticos empenham-se para desenvolver novos métodos. Nas áreas das Ciências Biológicas e da Saúde, não é diferente, nestas áreas, cabe aos pesquisadores a avaliação dos dados, a interpretação de resultados e a análise das conclusões, com aplicações, por exemplo, em atividades desenvolvidas em determinado ambiente. Além disso, em tais áreas, a Bioestatística oferece a possibilidade de análise e interpretação de informações sobre medicamentos, equipamentos, avaliação de protocolos e artigos científicos (GLANTZ, 2014). Uma boa maneira de aprender a Bioestatística e seu papel no processo de pesquisa é seguir o fluxo de uma pesquisa desde o início do estágio de planejamento até a conclusão, momento em que, geralmente, a pesquisa com os resultados alcançados é publicada. Assim, a questão está em como direcionar o aprendizado da estatística de maneira que o profissional da área da saúde possa utilizar estes conceitos. Para isso, é importante que você conheça todas as etapas do método científico. O método científico é um conjunto de estratégias, ferramentas e ideias resultantes da expe- riência humana e consequentes do acúmulo de saberes, que, estruturadas e sistematizadas, possibilitam alcançar um objetivo, que é responder a uma pergunta, afinal, toda pesquisa científica é baseada em uma pergunta. Fonte: Parenti, Silva e Silveira (2017, p. 25). A seguir, veremos alguns exemplos da utilização do método científico com perguntas, tais como: • Qual é a incidência de dengue na cidade de São Paulo? • Quantos casos da covid-19 ocorreram na cidade de Curitiba? • Se uma pessoa consumir alimentos transgênicos, ela poderá elevar o risco de doenças gástricas? Uma Variável corresponde ao que estamos estudando, ela pode ser dividida em: qualitativa e quanti- tativa. Uma variável qualitativa nominal é referente a um atributo, enquanto uma variável qualitativa ordinal refere-se a uma ordem, hierarquia. Por sua vez, uma variável quantitativa contínua refere-se a medições, e uma variável quantitativa discreta trata de contagem. 19 UNIDADE 1 Figura 1 - Variável qualitativa x Variável quantitativa / Fonte: o autor. Descrição da Imagem: a Figura 1 apresenta um fluxograma da Variável. Ela está dividida em duas variáreis: a qualitativa e a quantitativa. A variável qualitativaestá dividida em nominal e ordinal. Para a variável qualitativa nominal temos uma característica única, e, na variável qualitativa ordinal, a hierarquia. Já a variável quantitativa discreta, trata-se de contagem e, para a variável quantitativa, contínua as medições. Assim, o método científico nos traz maneiras para respondermos as perguntas que estão presentes em nossos estudos, e a estatística está presente em seus passos, que são: a) Fazer observações: nesta etapa da pesquisa, é preciso olhar a todas as variáveis ao redor do pesquisador, fazer anotações, investigação, definir o algo de sua pesquisa, delimitar sua pesquisa. b) Definir uma questão: nesta etapa do método científico, o pesquisador especificará o que quer saber em relação ao que está sendo estudado. É importante que a questão em si seja tangível. c) Formular uma hipótese: nesta etapa, o pesquisador irá fundamentar seu conhecimento prévio para explicar o fenômeno observado, direcionando para um parâmetro a ser estudado. Nesta etapa o pesquisador pode utilizar alguns testes estatísticos, tais como testes de hipóteses. d) Coletar dados: depois que são definidos e delimitados todos os critérios da pesquisa, será definido como serão coletados os dados, e nesta etapa, a estatística ajudará o pesquisador, pois, na prática, muitas vezes, ele utilizará amostras, e a estatística traz as maneiras de como fazer essas coletas. e) Analisar os dados: nesta fase, depois de coletar os dados, é preciso analisar os dados coletados, fazer a tabulação para apresentação em tabelas e gráficos. f) Conclusões: depois de passar por todas as etapas anteriores, o pesquisador faz sua conclusão do seu estudo, é importante observar que a estatística é uma ferramenta que ajudará na tomada de decisões. 20 UNICESUMAR Podemos observar com mais detalhes a seguir, na Figura 2: Figura 2 - Etapas para a construção de uma pesquisa científica / Fonte: o autor. 21 UNIDADE 1 Assim, quando a Estatística é apresentada a um aluno de graduação, ele poderá perguntar: Se a Esta- tística é essencial às pesquisas, ela é importante para quem quer atuar no meio científico? A resposta a este questionamento é sim. Em especial quando falamos em construção do conhecimento. Na prática, é preciso estudar sempre, estar atualizado, à medida que novos estudos, sobretudo, da sua área de in- teresse ou atuação são divulgados. Nesse entendimento, um profissional que trabalha em sala de aula pode utilizar a pesquisa em sua área de atuação e se basear em conhecimentos estatísticos, para fazer uma publicação científica, por exemplo. Assim, a estatística também tem função de auxiliar a pesquisa científica e precisa estar alinhada aos conhecimentos e ao objeto de estudo, como: estudar uma dada enfermidade, a ação de um medicamento, entre outros. Dessa maneira, a Bioestatística está relacionada aos segmentos de ciências da vida, como: Ciências Biológicas, Enfermagem, Ecologia, Saúde Pública, Saúde Coletiva, Epidemiologia, Genética, entre outros. Dessa forma, “um pesquisador, ao agrupar as informações de determinado estudo, nor- malmente, ele trabalhará com os resultados provenientes de uma coleta de dados, como contagens, experimentos e outros” (PARENTI, 2018, p. 4). Esses dados são chamados de dados primários uma vez que o primeiro a ter acesso aos mesmos é o próprio pesquisador, ou a sua equipe. Considera-se que o pesquisador tenha trabalhado de forma a garantir um nível adequado de qualidade de dados e que as limitações dos mesmos sejam conhecidas. São usuais, no entanto, nos estudos, os dados secundários provenientes de outras fontes, tais como: pu- blicações de artigos em periódicos científicos, artigos ou comunicações em eventos científicos ou institutos de pesquisa e estatísticas. Como os dados secundários não foram obtidos, diretamente, pelo pesquisador e sua equipe, verifica-se que a qualidade deles pode estar prejudicada. Contudo, pelo menos nos exemplos de Descrição da Imagem: a Figura 2 apresenta as etapas para a construção de uma pesquisa científica. Apresenta- mos a fase 1 - Fazer observações. Nesta fase, o pesquisador é motivado pela pesquisa e interessado em conhecer melhor o mundo em que vive. Faz a observação dos fatos, fenômenos, comportamentos e atividades e percebe que muitas coisas já são conhecidas e outras ainda não. Além disso, define o objeto de investigação, que é o alvo da sua pesquisa, o que ele deseja investigar de fato. Caso o objeto de estudo seja passível de mensurações, o pesquisador começa a perceber que a estatística vai ser bastante útil em seu processo de construção de conheci- mento. Por exemplo: diante dos tempos atuais, um pesquisador quer saber a dinâmica do novo Corona vírus em uma cidade, para isso, o pesquisador deve compreender esse vírus, a partir de quantificações de novos casos da doença, número de internações hospitalares, número de óbitos, quanto foi gasto para controlar e prevenir. Na fase 2, apresentamos como definir uma questão. Nesta etapa, o pesquisador especificará o que quer saber em relação ao que está sendo estudado. O pesquisador define, pontualmente, sua pergunta de estudo e precisa ser bem objetiva, estabelecendo quem serão os sujeitos da pesquisa e se haverá comparações entre grupos. Trata-se de uma etapa essencial para que se possa escolher como será utilizada a estatística de análise de dados, que se será baseada principalmente na pergunta formulada e no desenho estabelecido. A seguir vem a fase 3 - Formular uma hipótese. Aqui o pesquisador fundamentará seu conhecimento prévio para imaginar o que poderia explicar o fenômeno observado, isto é, o que poderia responder àquela questão que já foi definida anteriormente. Caso essa hipótese seja direcionada a um parâmetro, aqui os testes estatísticos poderão ajudar o pesquisador. Coleta de dados está na fase 4. Nesta fase, depois de definidos todos os critérios que delimitarão a população, o pesqui- sador deverá estabelecer como será feita a coleta de dados, e tem à disposição técnicas baseadas na estatística de amostragem para que possam auxiliar o pesquisador selecionar a amostra que representará essa população. A penúltima fase, a quinta fase é a Análise de dados. O pesquisador avalia os dados coletados na pesquisa, podendo extrapolar dados amostrais. Podem ser apresentados sob forma de tabelas e gráficos e técnicas estatísticas. Na última fase, que é a 6, temos a Conclusão. A partir das informações obtidas, o pesquisador pode fazer compara- ções com estudos prévios fazendo reflexões sobre o estudo realizado por ele. Essas técnicas estatísticas podem orientar os pesquisadores nas tomadas de decisões. 22 UNICESUMAR fontes de dados secundários que foram mencionados, espera-se que a qualidade seja elevada. No caso de periódicos científicos, a qualidade está relacionada, normalmente, ao prestígio da publicação. É importante, que nesta jornada de construção e consolidação do saber e de sua trajetória acadêmica, você compreenda e internalize que a qualidade das informações presentes nos periódicos e nos artigos são de extrema impor- tância. Não é necessário mencionar, aqui, o cuidado que se deve expressar com pesquisas e informações provenientes de fontes não confiáveis. Cabe mencionarmos os impactos e os perigos relacionados com a propagação de informações irreais, em especial no contexto da saúde. Provavelmente, você recebeu alguma corrente no WhatsApp, no início da pandemia do novo coronavírus, contendo alguma informação sem a devida indicação da fonte científica e que parecesse, no mínimo, duvidosa. Acertei? Isso aconteceu com grande parte da população e nos faz refletir sobre a problemática envolvida em tal prática. Nesse contexto, como profissionais da saúde, devemos, por obrigações éticas, pautar nossas decisões mediante a consulta de pesquisas confiáveis publicadas e divulgadas em periódicos com relevância e robustez científica. Para que possamos nos habituar à consulta de fontes confiáveis ede prestígio científico, o uso de plataformas específicas se faz necessá- rio, como é o caso da plataforma Sucupira, que possibilita, por meio de sua ferramenta de consulta, verificar o Qualis do periódico, pelo qrcode: Para acessar, use seu leitor de QR Code. Para entendermos melhor a análise estatística, dois conceitos são primordiais ao entendimento da análise estatística de dados: população e amostra. Uma população (N) refere-se a um conjunto de elementos que têm, pelo menos, uma característica em comum, como todos os acadêmicos dos cursos da área de saúde da UniCesumar. Uma popula- ção pode ser composta de um número tão grande de elementos que, muitas vezes, não conseguimos quantificar. Nesse caso, dizemos que a população é de tamanho infinito. Supondo que faremos uma pesquisa para investigar hábitos alimentares dos funcionários de um hospital, podemos entender que nossa população (que estamos estudando) é finita, porque teremos o número de pessoas que trabalham neste hospital. No entanto, se tivermos como objetivo de pesquisa investigar os hábitos alimentares dos indivíduos adultos residentes em uma grande cidade, o tamanho populacional pode ser bastante amplo. Quando temos um estudo em que usamos toda a população, denominamos censo. Entretanto, em boa parte dos estudos, a obtenção de todos os dados de todos os elementos da população pode ser inviável, devido às dificuldades de acesso aos indivíduos, o tempo para concluir a coleta das informa- ções, os custos financeiros e entre outras limitações. Nesse caso, utilizam-se informações provenientes de uma amostra, ou seja, de uma parte da população. https://apigame.unicesumar.edu.br/qrcode/8445 23 UNIDADE 1 Assim, podemos definir amostra (n) como sendo um subconjunto finito da população, isto é, uma parte representativa da população, por exemplo: se como população temos todos os alunos dos cursos de Saúde da UniCesumar, uma amostra seriam os alunos do primeiro ano do curso. Uma característica importante da amostra que não podemos esquecer, é que ela seja representativa da população da qual foi retirada, isto é, deve ter características similares às daquela população. Uma amostra representativa é uma miniatura da população, como podemos observar na Figura 3. No en- tanto uma amostra que não representa, adequadamente, a respectiva população é chamada enviesada ou tendenciosa. Figura 3 - Seleção de uma amostra Um Censo refere-se a um levantamento ou registro estatístico de certa população, de acordo com alguns critérios, tais como: sexo, idade, religião, estado civil e profissão. No entanto esse conceito está relacionado com a definição clássica de Censo, ou seja, a ideia de Censo Demo- gráfico. De acordo com a definição de população que foi dada anteriormente, que população é um conjunto de elementos com, pelo menos, uma característica em comum, a contagem populacional pode estar relacionada ao número de estabelecimentos industriais, rebanhos de animais, tamanho de propriedades rurais, número de estabelecimentos bancários etc. Esses cen- sos são denominados: Censo Industrial, Censo Agropecuário e Censo Comercial e de Serviços. (IBGE) Descrição da Imagem: a figura apresenta dois círculos e, em cada círculo, existem grupos de indivíduos com diferentes características. O grupo maior é destinado à representação de uma população e está ao lado esquer- do, enquanto o grupo menor que se refere à amostra e se posiciona à direita. Há uma seta que sai da população para a amostra, representando uma parcela da população, contudo, nesta amostra, observam-se características representativas da população. 24 UNICESUMAR Façamos, juntos, uma nova reflexão. Considere o seguinte cenário hipotético. Você objetiva realizar uma pesquisa para avaliar os hábitos relacionados à saúde dos habitantes adultos de uma cidade de porte médio e, para tanto, realizou a coleta de dados, por meio de entrevistas realizadas na praça de alimentação de um shopping Center do município em questão. É importante considerar que, nesse caso hipotético descrito, a amostra selecionada, ou seja, o públi- co presente na praça de alimentação de um shopping pode fazer com a que pesquisa não alcance seu objetivo de verificar os hábitos alimentares de uma população, direcionando você a uma conclusão errada sobre tais hábitos. E por que isso aconteceu? Porque não houve nenhum critério para a seleção desta amostra. Uma das formas de se garantir que a amostra seja representativa quanto à população, consiste na utilização de técnicas estatísticas, com as quais, ainda em nosso exemplo hipotético apresentado, poderíamos dividir a cidade em setores, em bairros, e para cada setor seria selecionado determinado número de habitantes para participarem da pesquisa. Dessa maneira, você conseguiria uma amostra mais representativa da população. É preciso observar que, por mais cuidados que tenhamos na seleção dos elementos que farão parte da amostra, ela jamais será, perfeitamente, igual à população em todas as suas características, visto que ela é uma fatia da totalidade dos indivíduos. Entretanto uma estratégia importante para obtermos amostras tão representativas quanto possível consiste em usar os chamados planos probabilísticos, que, com base em técnicas estatísticas, definem como os indivíduos serão melhor selecionados para a composição da amostra. Agora que já sabemos a definição de população e amostra, que tal analisar um exemplo para diferenciar, na prática, estes termos que estudamos? Vamos lá? Uma médica pediatra quer fazer uma análise estatística do uso de medicamentos homeopáticos por pacientes de um a três anos de idade. Ela deseja comparar os efeitos do uso destes medicamentos com os alopáticos. Os medicamentos homeopáticos são produzidos de forma diferente dos fitoterápicos, através de dinamização. Neste tipo de terapia, são, também, utilizados, além de princípios ativos de origem vegetal, outros de origem animal, mineral e sintética. Um tratamento homeopático não busca eliminar apenas os sintomas da doença, e sim estimular o organismo a se fortalecer. Logo, o tratamento homeopático é eficaz para curar o doente, e não apenas aliviá-lo. Já o tra- tamento alopático busca, por meio de medicamentos de ação química, eliminar os sintomas e manifestações da doença por meio do chamado princípio dos contrários. Por exemplo: uso de laxantes na prisão de ventre. Fonte: CRFESP (2019). 25 UNIDADE 1 Para que possamos avançar, considere o exemplo presente em nosso elemento #Explorando Ideias# apresentado anteriormente. Suponha que a médica inicia sua pesquisa definindo a população para estudo (todos os seus pacientes que se enquadrem na faixa etária apresentada). Depois disso, ela selecio- nará dois tipos de amostras diferentes para oferecer a medicação ao paciente, assim terá como amostras: • Amostra 1: que será composta pelos pacientes cujos pais optaram por medicamentos ho- meopáticos. Sistematicamente, sua análise terá como indicador o número de vezes em que as crianças apresentaram alguma alteração na saúde no período de um ano bem como o tipo de doença que apresentaram. • Amostra 2: será composta pelos pacientes cujos pais não utilizam medicamentos homeopáticos nos tratamentos indicados pela pediatra. Para dar continuidade em sua pesquisa, a médica realiza os registros e as verificações necessárias ao longo de um ano, de acordo com a proposta inicial da pesquisa, e, ao término deste prazo, ela poderá, por intermédio dos dados obtidos, verificar se a sua hipótese inicial foi comprovada, ou não. Assim, os dados poderão ser utilizados em desdobramentos da mesma pesquisa, ou provocar a necessidade de uma nova coleta de dados. A vantagem deste tipo de análise é que ele oportuniza ao profissional mais segurança na tomada de decisões, além de melhores e mais confiáveis argumentos junto aos pacientes e aos clientes e maior sucesso nas abordagens escolhidas. Você pode estar se perguntando agora, mas, e na prática, comofica? Um ganho para os profissionais das áreas de Biológicas e da Saúde consiste no conhecimento sobre diferentes experimentos de uma maneira mais clara e objetiva para obtenção de dados concretos que podem interferir na qualidade do seu trabalho. Façamos uma nova reflexão, com base em um novo cenário hipotético: “ Considere que um profissional da saúde trabalhe em dois laboratórios que ficam localiza- dos em regiões distintas, porém, em uma mesma cidade. No laboratório 1, o profissional atende pacientes de baixa renda que quase não fazem consultas nem exames. Já no labo- ratório 2 o mesmo profissional, atende pacientes que tem uma rotina elevada de consultas e exames. Assim, note que esse profissional consegue, ainda que intrinsicamente, analisar como está a frequência na procura de exames, em relação aos dois laboratórios e conse- quentemente, em relação ás duas regiões da mesma cidade. Para tanto, esse profissional considera que a população será composta pelos pacientes do laboratório 1 e laboratório 2, já a amostra será composta pelos pacientes que procuraram atendimento nos últimos 6 meses. Caso queira verificar com detalhamento, descrição e por meio da Estatística, esse profissional poderá elaborar uma tabela para cada laboratório, para agrupar os dados que vão servir de parâmetro. Ao finalizar sua pesquisa, o profissional poderá analisar e levantar informações que lhe possibilitem concluir com propriedade estatística em qual dos laboratórios será necessário um maior estoque, mais colaboradores, dentre outras informações voltadas a gestão (PARENTI, 2018, p. 17-18). 26 UNICESUMAR De acordo com Parenti, Silva e Silveira (2017), o conceito de variáveis é referente a características individuais do que estamos estudando como unidade ou objeto de estudo, como: o gênero, o peso, a estatura. Dessa maneira, as variáveis representam quaisquer características que possam modificar o resultado da pesquisa. Em Bioestatística, assim como em Estatística, como já mencionado anteriormente que as variáveis estão classificadas em: quantitativas e qualitativas. Assim, as quantitativas são referentes a atributos que podem ser medidos ou mensurados, e as qualitativas somente a atributos (que não sejam numéricos). Retomando estes conceitos, dizemos que: • Variáveis quantitativas: referentes a valores numéricos, por exemplo: peso, altura, número de espécies em uma floresta, nú- mero de nascidos vivos em uma maternidade, enfim, as variáveis quantitativas se adequam às necessidades da pesquisa e repre- sentam valores referentes ao universo pesquisado. Podem ser divididas em discretas ou contínuas. As variáveis quantitativas discretas são referentes a contagens ou números inteiros, como por exemplo: número de nascidos vivos em uma maternidade, número de óbitos de uma cidade. Também podem ser classifica- das em contínuas, que são referentes a mensurações ou medidas, tais como: peso de uma pessoa, estatura de um indivíduo, entre outros. • Variáveis qualitativas: referentes a atributos não mensuráveis, como gênero, etnia, entre outros. Podem ser divididas em no- minais ou ordinais. Uma variável é qualitativa nominal quando temos, por exemplo, uma espécie. Já uma variável é qualitativa ordinal quando são referentes a atributos que podem ser clas- sificados de acordo com uma hierarquia, como a prestação de um serviço, sendo do melhor ao pior. As variáveis quantitativas e qualitativas são muito utilizadas em todos os tipos de pesquisas que usam dados estatísticos (CRESPO, 2009). A seguir, vejamos alguns exemplos que podem auxiliar no entendimento da finalidade e do conceito de cada uma, assim como as diferenças entre elas. Vamos supor que temos que fazer uma pesquisa que tenha por objetivo analisar a relação entre o hábito de fumar e o desenvol- vimento de doenças pulmonares. Para essa pesquisa, fará-se presente uma série de variáveis diferentes com as quais poderemos trabalhar, tais como (Figura 4): 27 UNIDADE 1 Figura 4 - Análise das variáveis / Fonte: a autora. Descrição da Imagem: a figura 4 apresenta as análises das variáveis. De cima pra baixo: Variáveis quantitativas discretas: analisar a relação entre o número de cigarros que são consumidos por dia por cada um dos pacientes com a idade de início do consumo de cigarros e a idade atual; Variáveis quantitativas contínuas: avaliar o peso dos pacientes bem como o estado de saúde; Variáveis qualitativas nominais: fazer uma relação entre o gênero dos investigados ao hábito de fumar; Variáveis qualitativas ordinais: fazer um registro quanto o grau/estágio da doença pulmonar que os pacientes se encontram, classificando-os em: inicial, intermediário e terminal. Dessa forma, é fundamental e muito importante destacar qual será a variável que o pesquisador es- colherá para analisar no seu objeto de estudo. Parenti, Silva e Silveira (2017) trazem-nos conceitos de pesquisa experimental, que objetivam identificar as relações entre duas variáveis. No método experimental, deve-se provocar variações na ocorrência de uma variável e verificar se ela é a causa de algum efeito em outra, por exemplo: podemos utilizar diferentes medicamentos para determinada doença e observar os seus resultados. Na pesquisa correlacional, não tem como provocar mudanças nas variáveis, assim, o pesquisador observa as alterações e seus efeitos, elencando as variáveis que serão observadas, por exemplo: avaliar os efeitos das alterações naturais de temperatura em determinado ambiente e nos seres que vivem ali. A pesquisa de levantamento tem variáveis não interferentes, como uma pesquisa eleitoral, que terá como universo a população da cidade, do estado ou do país. A amostra deve ser composta por número representativo de cada segmento da sociedade, por exemplo pessoas que podem votar que farão parte desta amostra. Existem, ainda, outros tipos de pesquisa que atendem às necessidades específicas de cada objeto de estudo e que terão suas características próprias, como os estudos de caso e as observações. 28 UNICESUMAR Neste sentido, é relevante que o pesquisador tenha em mente: Qual é o meu objeto de pesquisa? Qual é meu público-alvo? Quais hipóteses desejo comprovar com a minha pesquisa? Que tipo de pesquisa se adéqua melhor ao meu objeto de estudo? Respondidas estas questões, o pesquisador pode pensar em quais metodologias poderá usar para sua investigação. Com a escolha da metodologia, virão as decisões sobre como tratar os dados estatísticos levantados, que tipos de questões deverão ser feitas, se os dados serão quantitativos ou qualitativos e, assim, sucessivamente. Como você pôde perceber, falamos bastante do conceito de amostra. Mas por que esse conceito é tão importante dentro de uma pesquisa? Na prática, temos situações em que não se torna viável o uso de uma população, e o pesquisador precisa utilizar uma amostra. Mas quais são essas situações? De acordo com Barbetta (2014), as técnicas de amostragem são utilizadas quando temos: 1. Economia: geralmente, nas pesquisas, é muito mais econômico trabalharmos com amostra, ou seja, com uma pequena parcela da população, do que como um todo. Supondo que você precisa fazer uma pesquisa em um bairro que tem 25 mil pessoas, imagine o custo para entrevistar todas as pessoas que fazem parte da população deste bairro? Fica mais econômico selecionarmos uma amostra, ou seja, uma parte de moradores do bairro para fazer parte da entrevista, do que trabalharmos com 25 mil pessoas. 2. Tempo: muitas vezes, o pesquisador não tem tempo suficiente para estudar toda população, por exemplo, ele tem por objeto de pesquisa saber se as pessoas em um bairro fazem reciclagem. Nesse bairro tem 25 mil pessoas, e o pesquisador tem cinco dias para fazer a pesquisa, nesse caso, ele deverá recorrer a uma técnica de amostragem para dar continuidade à sua pesquisa. 3. Confiabilidade e operacionalidade: quando o pesquisador precisa reduzir o número de elementos, na qual ele poderá dar maisênfase aos casos individuais estudados. Para Barbetta (2014), entretanto, existem situações em que as técnicas de amostragens não são viáveis, tais como: Ao decidir realizar uma pesquisa na área da saúde, é imprescindível que o pesquisador conhe- ça as normas estabelecidas pelo Conselho Nacional da Saúde por intermédio da Resolução Nº 01/88, de 13 de junho de 1988. Essas normas referem-se a questões éticas que envolvem pesquisas com seres humanos, em relação à dignidade, à adequação aos princípios éticos e científicos, à privacidade do indivíduo e aos possíveis riscos que o estudo possa acarretar. Fonte: Brasil (1988, on-line). 29 UNIDADE 1 1. Quando a população pequena: nesse caso, quando a população é pequena, fica melhor estu- dar todos os elementos do que uma parte apenas, imagine a situação: um professor tem quinze alunos em uma turma e quer saber quantos praticam a reciclagem em suas casas. Nesse caso, por se tratar de uma população pequena, vale a pena o professor trabalhar com todos seus quinze alunos, do que com uma parte deles apenas. 2. Quando a característica é de fácil mensuração: este caso ocorre por exemplo, quando a po- pulação é de fácil acesso, e quando não compensa elaborar um plano de amostragem. Considere que um professor quer saber dentre os alunos de sua escola, quantos são a favor de participar da feira de ciências, para isso, ele pode entrevistar, ou colocar urnas na escola e incentivar a participação de todos na própria escola. 3. Necessidade de alta precisão: por exemplo, o Instituto Brasileiro de Geografia e Estatística (IBGE) faz o censo demográfico, a cada dez anos, para conhecer as características da popula- ção brasileira. Nesse caso, a pesquisa é feita com toda população, e não com parte da amostra. Segundo Arango (2011), um conceito importante que se deve ter em mente quando se trata de le- vantamento de dados é o de que o sucesso nas conclusões tiradas acerca da população com base nas informações colhidas de uma ou mais amostras depende da criteriosa seleção desta(s). Dessa forma, se os dados forem mal coletados, certamente, carregarão suas distorções para qualquer análise que se faça deles. Toda pesquisa tem suas limitações, nos seus resultados, decorrentes da metodologia empregada na investigação. Para termos sucesso nas conclusões em uma pesquisa, é preciso ter a metodologia bem descrita bem como o passo a passo do estudo. Basicamente, existem dois tipos de validade, validade interna e validade externa. A validade interna diz se as conclusões de uma pesquisa são corretas para a amostra estudada. Essa va- lidade é pré-requisito para a validade externa. A validade externa diz se as conclusões de uma pesquisa são aplicáveis à população da qual a amostra se originou ou a outras populações. A limitação dos resultados de uma pesquisa científica deve ser discutida à luz dos possíveis erros metodológicos (vieses) que constituem ameaças à validade da pesquisa. Busca-se, então, um nível de confiança que é possível depositar nos resultados e conclusões a partir de uma análise criteriosa dos possíveis erros e suas causas. Chamamos de viés um erro sistemático (vício, distorção) e não intencional, proveniente de questões metodológicas. Existem dois fatores que influenciam no correto levantamento dos dados: a representatividade e a fidedignidade. 30 UNICESUMAR A representatividade é um fator associado à forma de amostragem. Assim, de uma maneira qual, quando selecionamos uma amostra, buscamos reproduzir as características observáveis da população. Este procedimento é conhecido como critério de proporcionalidade e, quando ele é considerado, diz-se que a amostra é representativa da população em questão. No entanto, para que isto seja possível, as características da população devem ser, previamente, conhecidas. Contudo a disponibilidade de in- formações prévias sobre a estrutura populacional para um estudo nem sempre é a ideal, de forma que, normalmente, a fonte de informação acaba sendo um outro estudo ou dados estatísticos secundários, extraídos de institutos de pesquisa, por exemplo. Na falta de informações sobre a composição da população em estudo, trata-se de que a escolha seja a mais isenta possível, adotando-se algum critério de aleatoriedade (escolha ao acaso), como um sorteio (ARANGO, 2011). Todavia, quando os dados necessários para o conhecimento dos atributos da população estão disponíveis e são ignorados ou manipulados, a amostra resultante seria considerada tendenciosa. Conclusões e estimativas efetuadas com base nessa amostra não possuiriam consistência. Para entender melhor este conceito, vejamos o exemplo: imagine um estudo feito por biólogos e biomédicos para verificar a incidência de Escherichia coli em determinado município. O exame da água é fundamental para distribuição, principalmente quando destinada ao consumo humano. Assim, parece claro que o estudo deverá ser realizado por amostragem domiciliar da água, pois seria inviável testar todos os domicílios. Supondo ainda que existem outras informações, como: a classificação das áreas geográficas (rural e urbana, por exemplo), a localização dos bairros, a população dos bairros e a taxa de atendimento com água tratada. Podemos observar o resultado com o exemplo de amostragem com as informações no Quadro 1. Quadro 1 - Exemplo de amostragem com informações População (N) Número de Habitantes Taxa de Atendimento com Água Tratada Rural 1.000 0% Urbana 9.000 89% Bairro A 2.000 100% Bairro B 2.000 87% Bairro C 5.000 80% Fonte: adaptado de Arango (2011). Com essas informações, uma amostra representativa da população de domicílios deveria observar que: • Todos os locais sejam alcançados pela pesquisa, observando-se a distribuição geográfica (área urbana, com seus três bairros e área rural). Não sendo possível, por simples conveniência, efetuar a pesquisa somente em domicílios urbanos no bairro A. • Seja considerada, nesse caso, a população de cada setor geográfico. A amostra deverá ser cons- tituída de partes proporcionais idênticas às da população. Assim, 10% da amostra seriam cons- tituídos por domicílios rurais, 20% do bairro A etc. Na falta das populações, poderiam ser empregados pesos para a constituição da amostra, de acordo com o pesquisador. • Exista total aleatoriedade na escolha dos domicílios. 31 UNIDADE 1 Estes aspectos são importantes para evitar caracterizar a amostra como tendenciosa e, consequen- temente, adquirir credibilidade, sem espaço para gerar conclusões duvidosas. Outro aspecto que deve ser levado em conta no trabalho de levantamento de dados e cons- tituição das amostras é o da fidedignidade dos dados ou das informações, relacionada com a precisão dos dados ou com a sua qualidade. A falta de precisão pode ser ocasionada por vários motivos. De uma maneira geral, podemos ter as situações: equipamentos que não sejam aferidos corretamente, falta de calibração de equipa- mentos, questionário mal elaborado (no caso de entrevistas, com perguntas tendenciosas) e falhas na hora da coleta. No primeiro caso, o uso de balança mal calibrada, réguas com defeito, coletor de amostra (de água, por exemplo) inadequado, amostras em mau estado de conservação pode causar erros nas medições. Existem, também, alguns exames laboratoriais, como os que implicam contagem e estão sujeitos à falha. Nesses casos, durante o levantamento dos dados da amostra, é recomendado, para minimizar as falhas, utilizar os mesmos aparelhos. Já no segundo caso, existem informações que carregam grande margem de erro. Por exemplo, suponha que um questionário contenha a seguinte pergunta: Quanto tempo faz desde que você foi ao médico pela última vez? Mesmo que a pessoa entrevistada tenha boa vontade em responder e não esteja tencionando falsear a resposta, ela pode encontrar dificuldades em realmente precisar o tempo solicitado pela pergunta. A razão da resposta do entrevistado poder apresentar uma falha de informação é simplesmente o fato de queum conjunto de informações não é, devidamente, registrado e, para obtê-las, às vezes, não existe alternativa a não ser contar com a memória do en- trevistado. Outro exemplo de uma questão que poderia suscitar erros seria: Já dirigiu embriagado? Tratando-se de um tema que, em boa parte dos casos, cria constrangimento ao entrevistado, ou ele pode falsear a sua resposta, exagerando ou escondendo a verdadeira informação. Pelos mais variados motivos, desde a precária memória em alguns casos, passando pelo medo e a própria fantasia do entrevistado, é comum a falta de precisão das respostas. Por este motivo, os questioná- rios de levantamento de dados devem ser elaborados com extremo cuidado, evitando perguntas vagas ou que deem margem a respostas muito subjetivas. Naturalmente, seus resultados devem ser tomados com grande cautela. Agora que já sabemos que a amostragem é importante nas pesquisas e que é utilizada na prática, conheceremos algumas técnicas estatísticas de amostragem. Já estudamos em nossa disciplina, que a população (N) refere-se ao universo da pesquisa, como sendo um conjunto de elementos que tenha pelo menos uma característica em comum (CRESPO, 2009). E a amostra (n) é uma parte da população. Por exemplo, ao utilizarmos como população todos os pacientes internados em determinado hospital, pode-se definir que serão parte da pesquisa apenas os internados em leitos ímpares ou os que permanecerem internados por mais de dois dias. O critério de escolha para a determinação da amostra seguirá as necessidades e os objetivos da pesquisa, desde que sejam imparciais, não tendenciosos e representativos da população. Para isso, deve-se definir a população que se busca e a característica investigada. 32 UNICESUMAR As técnicas de amostragem podem ser divididas em probabilísticas e não probabilísticas. A amostra- gem probabilística considera que todos os elementos da população tenham a mesma probabilidade (diferente de zero) de compor a amostra. A não probabilística é definida por elementos não aleatórios. Uma amostragem probabilística é aquela em que todos os elementos da população tem a mesma chance de compor a amostra, podendo ser dividida em: a) Amostragem casual simples ou aleatória simples: refere-se a um evento de seleção simples, como o caso de um sorteio. Para compreendermos por meio de exemplos, considere a população o total de pacientes que se consultam em um hospital X. Com o objetivo de investigar os tipos de patologias que os pacientes apresentam, um sorteio é realizado para direcionar os selecionados a um estudo clínico. Ao realizar um sorteio, compreendemos que a amostragem foi realizada de forma casual simples ou aleatória simples. Vejamos outro exemplo: a população de outro estudo é composta por pacientes de um hospital (500 pessoas), considere que o pesquisador almeja desenvolver uma pesquisa com 10% desta população, ou seja, a amostra será composta por 50 pacientes deste hospital. Para tanto, ele realizará um sorteio simples dos 50 pacientes que comporão a amostra, o que caracteriza uma seleção por amostragem casual simples. Na Figura 5, podemos observar um exemplo de um sorteio simples, de amostragem aleatória. No exemplo hipotético, temos doze pessoas, enumeradas de um a doze, considere que deste total obtere- mos uma amostra composta por quatro pessoas. Considere que, após um sorteio simples, as pessoas selecionadas foram os indivíduos com os números: 2, 5, 8 e 11. Logo, estas pessoas passam a compor a amostra. A definição da amostra de uma pesquisa clínica é dividida em quatro fases: • Critérios de inclusão: quais são as características necessárias para a participação do estu- do. Por exemplo: no estudo de determinada patologia, estarão incluídos os pacientes que apresentam os sintomas há menos de cinco anos. • Critérios de exclusão: quais características podem eliminar os candidatos ao estudo. No exemplo, estarão excluídos todos os pacientes que apresentam sintomas há mais de cinco anos. • Escolha da técnica de amostragem: o que dependerá dos objetivos a que a pesquisa se propõe. • Consentimento livre e esclarecido: em que o paciente ou sujeito participante da pesquisa afirma conhecer as condições e o seu desejo de contribuir. Fonte: Pereira (2003). 33 UNIDADE 1 Figura 5 - Amostragem casual simples, sorteio simples Descrição da Imagem: a fi- gura representa um sorteio simples no qual temos doze pessoas enumeradas de um a doze. Uma seta indica a rea- lização de um sorteio no qual as pessoas sorteadas passam a compor a amostra. A nova composição da amostra se dá com os representantes da po- pulação enumerados com os números 2, 5, 8 e 11. b) Amostragem sistemática: os elementos são escolhidos a partir de um fator que se repete. Para que ocorra, a população deve estar ordenada de forma aleatória, como em uma lista ou fila. Por exemplo, a partir das fichas de consultas da mesma Unidade Básica de Saúde (UBS), retira-se a 15, depois a 30, a 45, e assim sucessivamente, até atingir um número de pacientes desejado, que deve ser proporcional ao número da população de pacientes atendidos. Ou define-se que a pesquisa se dará com os pacientes que estiveram em consulta no mês de maio. Para exem- plificar, você pode observar a Figura 6, na qual temos treze pessoas em uma fila (ordenada). Considere que selecionaremos uma amostra composta por cinco pessoas. Para tanto, podemos utilizar a equação 1 a seguir: n NI= Uma ferramenta importante para a realização de seleção de amostras aleatórias são os de- nominados números aleatórios. Estes são números, compreendidos em um intervalo, cuja probabilidade de serem selecionados é igual, como em um sorteio. Em programas como o Excel®, a função geradora de números aleatórios permite definir o intervalo do sorteio e por tipo de número, inteiro ou real. Para isto utiliza a função ALEATORIO ou ALEATORIOENTRE, de- pendendo da versão. No último caso, a função é acompanhada de um argumento que permite mudar o intervalo do sorteio. Por exemplo: ALEATORIOENTRE (a, b) sorteia números entre a e b. (H. G. Arango) 34 UNICESUMAR Em que: I = intervalo N = População n = amostra Para isso, temos: 5 13I= Portanto, escolheremos (ou sortearemos) a primeira pessoa que comporá a amostra, e contará o in- tervalo de 3 em 3. Supondo que determinamos que a primeira pessoa da fila será a primeira a compor a amostra, somaremos mais três, a próxima pessoa será a número 4, depois, somaremos mais 3, será a número 7, somamos mais 3 e teremos a pessoa na posição 10, e, por último, somamos mais 3 e teremos a pessoa na posição 13. Assim, a amostra torna-se sistemática, ou seja, foi definido por meio de um sis- tema antes de selecionar a amostra, que esta será composta pelos indivíduos nas posições: 1, 4, 7, 10 e 13. Figura 6 - Amostragem Sistemática Descrição da Imagem: na figura, temos a amostragem Sistemática em que se observa uma imagem composta por 13 pessoas, foi calculado, anteriormente, que o sistema será de 3 em 3, ou seja, sistematizado para a seleção dos indivíduos que estão na posição: 1, 4, 7, 10 e 13 que passam a compor a amostra. c) Amostragem estratificada: será a amostragem escolhida quando a população estiver es- tratificada. O tamanho dos estratos deve ser proporcional aos seus tamanhos na população de origem. Como a população de um hospital é composta por 500 pessoas, divididas em 200 homens e 300 mulheres, supondo que o pesquisador, deseja 10% de uma amostra, assim, a amostra será composta por 50 pessoas, divididas em: 20 homens e 30 mulheres. Na Figura 7, temos um modelo de amostragem estratificada, em que os grupos foram divididos para, em seguida, serem selecionados uma amostra. 35 UNIDADE 1 Figura 7 - Amostragem Estratificada Descrição da Imagem: na figura, temos a amostragem estratificada, na qual temos um grupo de pessoas dividi- das em dois grupos, o primeiro grupo composto doze pessoas, e o segundo grupo composto por nove pessoas. Descriçãoda Imagem: a figura 8 é composta por cinco grupos de três pessoas, sendo destacado dois grupos compostos por três pessoas. d) Amostragem por conglomerados: o agrupamento se dará por proximidade física, indepen- dentemente de outras características, ou seja, por um conglomerado. Por exemplo: a amostra será composta por um grupo de pacientes do hospital A, que moram na mesma rua da unidade. Na Figura 8, você pode observar um exemplo de amostragem por conglomerados, supondo que há pessoas em locais diferentes, e você fez um sorteio com dois locais diferentes, sua amostra será composta por essas pessoas nestes locais diferentes. Figura 8 - Amostragem por conglomerados 36 UNICESUMAR Temos um resumo das técnicas de amostragem probabilística com suas divisões bem como suas pala- vras chaves e um exemplo. Podemos perceber que a amostragem probabilística (Figura 9), que se trata daquela amostragem que todos os elementos podem fazer parte da amostra é dividida em: amostra- gem casual simples - sorteio simples; amostragem sistemática - definição de um sistema; amostragem estratificada - subdivisão de grupos e amostragem por conglomerados - territórios. Figura 9 - Resumo das técnicas de amostragem probabilística / Fonte: a autora. Descrição da Imagem: na figura, temos um resumo da amostragem probabilística; primeiro temos a amostragem casual, que é um sorteio simples, como: Sortear 5% de uma população de 100 pessoas. Temos a amostragem sistemática, que é a definição de um sistema, e como exemplo temos: Amostra composta por 25 casas em um intervalo definido de cinco em cinco. Temos a amostragem estratificada composta pela subdivisão de grupos, e como exemplo temos: População composta por 1000 pessoas, 800 homens e 200 mulheres, definido 10%. Portanto, 80 homens e 20 mulheres. Por fim, temos a amostragem por conglomerados, que é locais/cluster, como exemplo temos: em uma cidade sortear um bairro dentre todos os conglomerados. Além disso, a amostragem também pode ser não probabilística, isso significa que existe uma escolha deliberada dos elementos da amostra e, dependendo dos critérios do pesquisador, temos: • Amostragem por acessibilidade ou por Conveniência: a seleção se dará a partir de elementos que estejam ao alcance do pesquisador. Essa amostragem não tem verdadeiro valor estatístico e serve mais como forma de buscar dados iniciais para a pesquisa, como a amostra ser composta por um grupo de dados formado com perguntas feitas a pessoas em um shopping da cidade. Na Figura 10, você pode observar que as pessoas participantes da amostra são selecionadas de acordo com os critérios estabelecidos pelo pesquisador. 37 UNIDADE 1 Figura 10 - Amostragem por conveniência Descrição da Imagem: na figura, temos a amostragem por conveniência e temos um grupo de 15 pessoas, e a pessoa sorteando, por conveniência 5, pessoas destacadas na figura. • Amostragem por julgamento ou intencional: neste caso, a seleção ocorre a partir do julga- mento do pesquisador, por exemplo, quando se quer fazer uma pesquisa com o intuito de se comprovar que o consumo de carne tem influência sobre a saúde das pessoas. Escolhe-se Porto Alegre - RS como base para a coleta da amostragem por se considerar que seja a capital onde mais se consome este alimento no Brasil. • Amostragem por cotas: neste caso, oferece mais rigor à coleta, sendo que a fixação das cotas deve seguir critérios que caracterizam a amostra como representativa da população. No exemplo da carne, primeiro é feita uma análise da população de Porto Alegre e, depois, são definidas as proporções entre homens, mulheres, as faixas etárias e os estratos sociais. Em seguida, serão entrevistados um número de pessoas correspondente à proporcionalidade de cada um desses grupos. Dessa maneira, haverá uma amostragem significativa de toda a população da cidade. Temos um resumo das técnicas de amostragem não probabilística (Figura 11) com suas divisões bem como suas palavras chaves e um exemplo. Podemos perceber que a amostragem por conveniência ou acessibilidade é aquela em que os elementos que comporão a amostra estão de fácil acesso do pesquisador; a amostragem por julgamento é aquela em que há interferência, ou seja, julgamento do pesquisador, e, na amostragem por cotas, as cotas são fixas pelo pesquisador, em seguida, é feita a coleta de dados que comporão a pesquisa. 38 UNICESUMAR Amostragem não probabilística Amostragem por conveniência ou acessibilidade Amostragem por julgamento Amostragem por cotas Elementos a partir do alcance do pesquisador Julgamento do pesquisador Fixa cotas Ex.: Aplicação de questionários/ entrevistas em uma escola para levantamentos de dados iniciais. Ex.: De�ne proporções e cotas, para então fazer a coleta de dados. Ex.: Um pesquisador passa a integrar um grupo de pesquisa de um laboratório em especí�co por compreender que o laboratório tem condições e expertise em sua área de interesse. Figura 11 - Amostragem não probabilística / Fonte: a autora. Assim podemos observar que as técnicas de amostragem podem ser muito úteis para os pesquisadores, Parenti, Silva e Silveira (2014) salientam que é importante que os investimentos em pesquisa possam ser ampliados, aproximando a teoria do cotidiano, e que o tipo de pesquisa e as ferramentas usadas em geral não requerem alto investimento, mas a geração de informações adequadas a respeito de doenças e tratamentos fará a diferença na vida de cada um. Dessa forma, podemos citar várias linhas de investimentos necessários nos dias de hoje, como o aumento da resistência bacteriana, a ausência de tratamentos eficazes para doenças endêmicas em países pobres, como a dengue, as pesquisas em saúde mental, entre outros. Os diferentes tipos de amostragem podem se mostrar bastante úteis no cotidiano dos profissionais da área biológica e da saúde, pois auxilia tanto na administração de consultórios e clínicas quanto na determinação de estratégias de tratamentos, medicamentos e outras. Dependendo dos objetivos propostos pela pesquisa, o desafio é determinar que tipo de amostragem escolher para que os dados obtidos sejam um reflexo real da investigação. É possível perceber que as pesquisas, geralmente, requerem atenção especial dos profissionais da área biológica e da saúde tanto para atualização e frequente busca por alternativas e novos procedimentos quanto para alimentar a própria necessidade de busca. O médico, o enfermeiro, o farmacêutico, o biólo- go, enfim, todos os profissionais dessa área devem estar atentos às possibilidades e aos conhecimentos desenvolvidos em pesquisas. Descrição da Imagem: a Figura 11 apresenta-nos a amostragem não pro- babilística, iniciando pela Amostragem por conve- niência ou acessibilidade, que se trata de elemen- tos a partir do alcance do pesquisador. Temos, por exemplo, a aplicação de questionários/entrevistas em uma escola para le- vantarmos dados iniciais. Depois, a amostragem por julgamento, que se trata de julgamento do pesquisa- dor. Temos como exemplo: um pesquisador supõe que o departamento de Biolo- gia tem mais publicações e ele pesquisa lá a partir dis- so. Por fim, a Amostragem por cotas, nas quais são fi- xadas as cotas, por exem- plo: define proporções e cotas para, então, fazer a coleta de dados. 39 UNIDADE 1 Você percebeu que a Bioestatística será bem aplicada em seu futuro profissional? Ao escolher as áreas das Ciências Biológicas e da Saúde verá que, para realizar uma pesquisa, será necessário entender o conceito de população (N) e amostra (n) bem como entender os meios de pesquisa e a técnica de amostragem que será utilizada. Como exemplo você pode fazer uma pesquisa com seus alunos em um colégio, com o objetivo de saber se eles praticam ou não a reciclagem. Mas, no momento em que for fazer essa pesquisa, se o colégio tem 5.000 alunos, e você tem um tempo curto para fazê-la, pode recorrer a uma técnica de amostragem queestudamos aqui nesta unidade, na disciplina de Bioestatística e fazer essa pesquisa com uma amostra representativa da população. Além disso, quando você vai a campo, por exemplo, fazer uma coleta de água em um rio para verificar a qualidade da água, ao retirar essa amostra de água (está utilizando uma técnica de amostragem) e ao leva-la ao laboratório para estudar parâmetros físico-químicos e microbiológicos, saindo o resultado, ao interpretar, você estará fazendo uma projeção da qualidade da água daquele rio, então, você utilizou a técnica de estatística inferencial. Você sabia que os professores da área das Ciências Biológicas e da Saúde podem contribuir para a conscientização e prevenção para saúde ao trabalhar educação ambiental em sala de sala de aula? Tra- ta-se de um tema muito importante e que traz engajamento entre as turmas. Imagine que você fará um trabalho com seus alunos sobre caracterização de resíduos sólidos (lixo) e composição gravimétrica, para isso, existe uma norma específica, a NBR 10.007/2004, que traz vários métodos, e você pode fazer com seus alunos. Em nossa roda de conversa, traremos uma explicação dessa norma e como fazer o mé- todo de quarteamento. Ouça e replique com seus alunos, vamos lá? O artigo Desenho da Amostra da Pesquisa Nacional de Saúde 2013, publicado pela revista científica Epidemiologia Serviços de Saúde, no ano de 2015, aborda a questão da importância de um plano amostral, uma população alvo, e técnicas de amostragem bem como a con- dução de uma pesquisa. O trabalho apresenta a forma como foram elaborados os questionários propostos na pesquisa, as técnicas de amostragem e a tabulação dos resultados oriundos da pesquisa. Recomendo a leitura para aprofundamento, por meio de um estudo científico dos aspectos que estudamos nesta unidade. Boa leitura! Para acessar, use seu leitor de QR Code. https://apigame.unicesumar.edu.br/qrcode/8446 https://apigame.unicesumar.edu.br/qrcode/8458 40 M A P A M EN TA L Olá, aluno (a), chegamos à avaliação e, aqui, você fará um Mapa de Empatia que consiste em fazer a autoavaliação de uma forma mais divertida de tudo que foi estudado até agora nesta unidade. Vamos lá? Você se identificará e se perguntará como fará um mapa sobre as técnicas de estatística e amostragem. Vejamos, você poderá pensar em como estas informações tratadas nesta unidade como as técnicas de estatística poderão ajudar você em uma pesquisa, em que se tem as etapas de planejamento, coleta de dados, agrupamento dos dados (tabelas e gráficos) análise e avaliação podem ajudar em uma pesquisa científica, em sua vida profissional ou, até mesmo, em sala de aula. Também, verá como as técnicas de amostragem podem ajudar a trabalhar, corretamente, com uma amostra que seja representativa da população. Então, comece escrevendo seu nome, sua idade e preencha com comentários, tópicos ou perguntas sobre si mesmo dentro do quadro da empatia. E, no final, você verá o tanto de coisas que descobrirá sobre este tema proposto. Assim, utilize o Mapa de Empatia para refletir e se expressar nas questões a seguir: O que pensa e sente? Qual a importância da Bioestatística para sua formação? Como você pode aplicar isso tudo que você aprendeu em sala de aula? O que vê? O que você já viu em relação na prática utilizando técnicas estatísticas? O que escuta? O que você já tinha ouvido falar sobre Bioestatística? Você já tinha ouvido falar em técnicas de amostragem? Consegue entender suas importâncias nas pesquisas? O que fala e faz? O que você achou do conteúdo estudado até o momento? Faz sentido um futuro professor da área da Saúde ou da área das Ciências Biológicas estudar técnicas de Estatística? Quais são suas aplicações? As dores Quais são suas dificuldades? Você acha que vem coisas mais difíceis na disciplina? Consegue entender como os conceitos e exemplos são essenciais para sua compreensão? Os ganhos O que você ainda acha que tem que estudar para entender melhor a Bioestatística? 2 Olá, aluno(a), esta unidade será fundamental para sua futura atua- ção profissional na área das Ciências Biológicas e da Saúde. Aqui, aprenderá a construir tabelas bem como compreenderá suas re- gras. Além disso, aprenderá a elaborar gráficos e fará suas leitura e interpretação. Tabelas e Gráficos Me. Renata Cristina Souza Chatalov 42 UNICESUMAR Para começarmos a nossa jornada nesta unidade, compartilharei uma experiência profissional para que possamos problematizar e, consequentemente, refletir. A primeira vez que participei de uma pesquisa de campo foi para fazer um diagnóstico para elaboração de um Plano de Gerenciamento de Resíduos Sólidos (PGRS), em uma empresa de revenda de peças para automóveis. Para aprovei- tar ao máximo o tempo na empresa e a visita in loco, elaborei um check list bem simples que trazia informações sobre: tipo de resíduo, quantidade gerada (kg/mês) e como estava sendo feita a destinação final deste resíduo neste momento. Depois de fazer a visita, coletar os dados, foi preciso trabalhar nesses dados, afinal, não poderia entregar à empresa o check list em que fiz a coleta de dados. Assim, a partir dos dados coletados, elaborei uma tabela bem organizada dentro das normas da ABNT e também fiz um gráfico apontando o resíduo que era gerado em maior quantidade, assim, poderia indicar o que meu cliente poderia fazer para cumprir a legislação e minimizar os custos que ele tinha com a destinação final de resíduos. Agora que contei uma experiência vivenciada por mim, nesta situação apresentada, como você acredita que eu deveria ter traba- lhado com dados a partir de coletas? Como eu deveria ter construí- do uma tabela? E os gráficos? Assim, os gráficos e as tabelas são as principais formas de apresentação dos resultados de uma pesquisa. Conhecer as re- gras e as normas específicas que regem a construção de tabe- las, além de aprender o passo a passo para sua construção é importante e imprescindível para a compreensão e, também, para orbitarmos neste universo estatístico e bioestatístico. É importante, também, compreendermos, corretamente, como construir e inter- pretar gráficos. Podemos perceber que a Bioestatística pode ajudar com as regras e as etapas para a construção de uma tabela ou um gráfico. Sabemos que muitos alunos têm a dificuldade de lidar com tabelas e gráficos. 43 UNIDADE 2 Para isso, convido você a fazer a leitura do artigo intitulado Análise e inter- pretação de tabelas e gráficos estatísticos. A fim de utilizar dados interdisci- plinares. Nesse artigo, você verá o ensino e a aprendizagem da Estatística bem como a utilização de procedimentos e conceitos. Acesse o qrcode a seguir: Como apresentamos na Unidade 1, os dados sobre a dengue, daremos continuidade no mesmo exemplo, tudo bem? Sabemos que esta nossa situação é hipotética, e você, graduando (a) na área de Biológicas e da Saúde, que está atuando em sala de aula, quer fazer um experimento a respeito dos casos de dengue do seu bairro. Desta forma, faça uma pesquisa em forma de formulário com dez pessoas, que podem ser membros de sua família ou mesmo colegas de trabalho, contendo a seguinte pergunta: Você já teve dengue?, com isso, as possíveis respostas do seu formulário serão: ( ) Sim ou ( ) Não. Organize estes dados com a quantidade de pessoas que responderam sim e a quantidade de pes- soas que responderam não. Em seguida, construa uma tabela ou um gráfico, mediante os resultados desta pesquisa e, ao fazê-lo, você já estará utilizando mais uma técnica apresentada pela bioestatística. Diante disso, convido você, a fazer suas anotações em um Diário de Bordo, a fim de anotar suas primeiras impressões até o momento. Escreva os resultados de sua pesquisa, depois de fazer o gráfico ou a tabela, reflita sobre como você pode trabalhar essa questão em sala de aula ou em outra ocupaçãodentro do seu segmento de trabalho. DIÁRIO DE BORDO https://apigame.unicesumar.edu.br/qrcode/8447 44 UNICESUMAR Em nosso encontro anterior, estudamos a importância da pesquisa e como a Bioestatística pode-nos auxiliar no planejamento, na coleta de dados, nas técnicas de amostragem. Mas, e depois, o que fa- zemos com os dados? Eles podem ser apresentados sob forma de tabelas e gráficos. Vamos começar pelas tabelas. Uma apresentação tabular de dados é a representação das informações por intermédio de uma tabela. Uma tabela é um meio bastante eficiente de mostrar dados levantados, facilitando a sua com- preensão e interpretação. Além disso, auxilia o entendimento global e o relacionamento entre as variáveis representadas. Conheça as normas para apresentação dos dados em tabelas bem como definições, termi- nologia e simbologia: IBGE – Normas de apresentação tabular (IBGE, 1993). NBR 14724:2011 - Informação e documentação - Trabalhos acadêmicos – Apresentação (ABNT, 2011). Na construção de tabelas, os dados são apresentados em colunas verticais e linhas horizontais, con- forme a classificação dos resultados da pesquisa. Algumas orientações preliminares são as seguintes (ARANGO, 2011, p. 31): 45 UNIDADE 2 1. Para construção de uma tabela é importante que ela seja: simples, clara e objetiva. Assim, é apropriado que grandes volumes de informação sejam descritos em várias tabelas, ao invés de serem apresentados em uma única tabela; 2. Uma tabela precisa ser auto-explicativa, ou seja, sua compreensão não deve ser vin- culada do texto. Dessa forma, nenhuma “casa” da tabela deve ficar em branco, sempre apresentando um símbolo ou número, caso houver duas ou mais tabelas em um texto, deverão receber um número de identificação, que será referido no texto. 3. As colunas externas de uma tabela não devem ser fechadas. 4. Na parte superior e inferior, as tabelas devem ser fechadas por linhas horizontais. 5. A utilização de linhas verticais para separação de colunas no corpo da tabela é op- cional. 6. Ao fazer arredondamentos de números, é importante que seja mantida uniformidade quanto ao número de casas decimais. 7. Os totais e os subtotais devem ser destacados, como por exemplo, em negrito. 8. A tabela deve ser maior no sentido vertical que no horizontal. Contudo, se uma tabela apresentar muitas linhas e poucas colunas (estreita demais), convém separá-la em uma maior quantidade de colunas. Neste caso, as colunas deverão ser separadas por linhas duplas. Sendo assim, uma tabela pode ser dividida, hierarquicamente, em dois componentes chamados: prin- cipais e secundários. Os componentes principais são (ARANGO, 2011, p. 32): 1. Corpo: referente ao conjunto das informações, dos dados que foram coletados e que aparecem no decorrer da tabela, no sentido horizontal e vertical. 2. Coluna indicadora: é a divisão em sentido vertical, onde aparece a designação da natureza do conteúdo da linha. 3. Cabeçalho: indica a natureza do conteúdo de cada coluna. 4. Casa: refere-se as divisões que aparecem no corpo da tabela. Segundo Arango (2011, p. 32), as partes secundárias compreendem: 1. Título: geralmente apresentado na parte superior da tabela, devendo ser sempre o mais claro e completo possível. Para isso, é importante que o título responda as perguntas: O quê? Quando? Onde? relativas ao fato estudado. 2. Rodapé: é um espaço na parte inferior da tabela, utilizado para colocar informações necessá- rias referentes aos dados. Geralmente no rodapé, são colocadas as informações sobre a fonte (origem) dos dados e/ou informações complementares que podem auxiliar na leitura na tabela, para que a mesma não fique carregada de informações. 3. Notas: também devem ser colocadas no rodapé, depois da fonte, de forma sintética. Normal- mente as notas têm caráter geral, referindo-se à totalidade da tabela. Devem ser enumeradas em algarismos romanos, quando existirem duas ou mais de duas (as vezes o asterisco é utilizado). 46 UNICESUMAR 4. Chamadas: as chamadas têm caráter particular, referindo-se a um item específico da tabela. São enumeradas em algarismos arábicos, entre parênteses (podem também ser utilizados símbolos gráficos). Depois de compreendidas as partes secundárias, observaremos a simbologia comumente utilizada em tabelas estatísticas, como mostra o exemplo do Quadro 1 e seus significados. Quadro 1 - Símbolos utilizados em tabelas estatísticas Símbolo Significado Função - Hífen Quando o valor numérico é nulo ... Reticências Quando não dispõe de dado ? Interrogação Quando há dúvida sobre a exatidão do valor 0; 0,0 ou 0,00 Zero Quando o valor for menor que 0,5 # Parágrafo Quando o dado retifica informação anteriormente publicada X Letra x Quando o dado for omitido para evitar identificação Fonte: adaptado de Arango (2011). E, na tabela, quanto aos números, é importante observar que: 1. Todo número inteiro constituído de mais de três algarismos deve ser agrupado de três em três, da direita para a esquerda, separando cada grupo por um ponto (p. ex.: 56.342.901). 2. Exceto: I. Algarismos que representam o ano (p. ex.: 2010). II. Números de telefone (p. ex.: 3222-2222). III. Placas de veículos (p. ex.: AAA 2222). 3. A parte decimal de um número deverá ser separada da parte inteira pela vírgula (p. ex.: 0,56). 4. A unidade de medida não leva o “s” do plural nem o ponto final como abreviação (p. ex.: cm, m, kg etc.). 5. 4. Os símbolos de medida aparecem depois do número, sem espaço entre eles (p. ex.: 4,2m; 3h). Agora que você já viu todos os elementos que compõem uma tabela, que tal vermos um exemplo? Já estudamos que uma tabela tem como objetivo apresentar os dados agrupados, de maneira que uma pessoa interessada pode visualizar e compreender o que querem dizer aqueles dados. Você conhecerá, agora, os principais tipos de tabelas, que podem ser: Simples. e) Dupla entrada. f) Distribuição de frequência. Uma tabela simples é aquela em que contém a variável que estamos estudando com sua respectiva con- tagem, ou seja, com sua frequência. A Tabela 1 apresenta uma tabela simples, com seus elementos básicos: 47 UNIDADE 2 Você sabe qual é a diferença entre Tabela e Quadro? Um quadro, geralmente, traz informa- ções qualitativas (podendo trazer informações quantitativas em alguns casos) e é fechado nas bordas laterais, enquanto uma tabela traz informações quantitativas, referentes a contagens, a frequências, e as bordas laterais são abertas. Além disso, uma tabela simples pode ser temporal, geográfica ou específica (categórica). Uma tabela é considerada temporal quando as observações da variável ocorrem de acordo com tempo. A Tabela 2 traz um exemplo de série temporal ou histórica: Tabela 2 - Casos de dengue no decorrer dos anos em uma cidade Ano Número de casos de dengue 2010 20 2011 30 2012 45 2013 25 2014 50 Total 170 Fonte: o autor. Uma tabela simples, também, pode ser geográfica, quando a variável analisada é referente ao local ou território. Um exemplo de série geográfica pode ser observado na Tabela 3. Título Coluna Casa ou célula Linhas Rodapé Corpo Topo Tabela 1 - Casos de dengue nos bairros de uma cidade no mês de fevereiro de 2020 Bairro Número de casos Centro 12 Zona 01 2 Zona 02 3 Zona 03 5 Zona 04 1 Total 23 Fonte: o autor. Como podemos observar, no exemplo da Tabela 1, há todos os elementos básicos apresentados. 48 UNICESUMAR Tabela 3 - Alunos matriculados em um curso de Ciências Biológicas no estado do Paraná no ano de 2010 Cidade Número de alunos matriculados Maringá 500 Londrina 450 Apucarana 300 Ponta Grossa 400 Curitiba 650 Total 2.300 Fonte: o autor. Uma tabela simples, também, pode ser específica ou categórica, quando a variável analisada é referente a categorias específicas. Um exemplo de série geográfica pode ser analisado na Tabela 4. Tabela 4 - Número de alunos de uma instituição de ensino superior (EAD) no ano de 2015 Curso Número de alunosmatriculados Economia 150 Administração 380 Ciências Biológicas 275 Agronomia 250 Engenharia Civil 140 Total 1.195 Fonte: o autor. Uma tabela, também, pode ser de dupla entrada, isso significa que temos a necessidade de apresentar em uma única tabela, mais dados estudados em uma variável, para isso, é preciso fazer uma junção de duas ou mais séries (CRESPO, 2009). Ao fazer esta junção dos dados para serem apresentados em uma única tabela, teremos: duas ordens de classificação, uma vertical (na coluna) e uma horizontal (nas linhas). Para apresentar uma tabela de dupla entrada, temos a Tabela 5, que trata do número de matrículas da Educação Básica do ano de 2019, e os dados estão apresentados (dupla entrada) a seguir: 49 UNIDADE 2 Tabela 5 - Número de Matrículas da Educação Básica, por Etapa de Ensino, segundo a Região Geográfica, a Unidade da Federação e o Município - 2019 Região Etapa de Ensino Educação Infantil Ensino Fundamental Ensino Médio Educação Profissional Técnica de Nível Médio Educação Profissional - Formação Inicial Continuada (FIC) Educação de Jovens e Adultos (EJA) Educação Especial Norte 690.631 3.015.573 781.394 124.007 2.651 346.815 117.487 Nordeste 2.349.305 7.889.261 2.112.466 554.150 14.414 1.338.224 352.573 Sudeste 3.919.235 10.349.288 2.992.471 786.331 8.617 985.163 449.539 Sul 1.347.509 3.550.498 986.056 317.365 12.069 378.387 232.504 Centro -Oeste 666.098 2.119.110 593.504 93.121 2.024 225.079 98.864 Brasil 8.972.778 26.923.730 7.465.891 1.874.974 39.775 3.273.668 1.250.967 Fonte: adaptada de Inep (2020, on-line). Na Tabela 5, podemos observar que a região (coluna) é referente às regiões no Brasil, já as etapas de ensino: Educação Infantil, Ensino Fundamental, Ensino Médio, Ensino Profissional, Educação de Jovens e Adultos e Educação Especial são analisados, também, nas colunas e linhas. Temos, então, um exemplo de tabela com a dupla entrada, ou seja, mais que uma variável sendo estudada, na qual pode- mos analisar as regiões brasileiras (geográficas) e etapas de ensino (categorias). Lembre-se de que, em uma tabela de dupla entrada: cada uma das respostas combinadas fica agregada em uma única célula. Agora que você já conhece as tabelas simples bem como os tipos de série e a dupla entrada, que tal aprendermos a construir uma tabela do zero? Mas, antes, precisamos relembrar alguns conceitos matemáticos fundamentais aqui na Bioestatística, pois os cálculos das frequências precisam de duas grandezas: razão e proporção. Definir razão pode se tornar uma tarefa inglória se formos atrás de todos os significados para este termo (ARANGO, 2011). Aqui, trataremos da parte que aplicaremos na disciplina de Bioestatística, vejamos alguns exemplos: Supondo que um corpo tem seis metros de comprimento, e outro corpo três metros, ao dividirmos o comprimento de um pelo outro, teremos: 6 3 2= Ainda, podemos afirmar que, o corpo é duas vezes o tamanho do menor, ou, ainda, que tem a metade do comprimento do maior, e esta divisão chamamos de razão. A razão 1 2 pode ser representada como 1:2, o que significa que cada metro do corpo menor cor- responde a 2 metros do corpo maior. 50 UNICESUMAR Outro exemplo: dos 1.200 pacientes que procuram a emergência hospitalar na última semana, 240 eram idosos. A razão de idosos que procuraram a emergência esta semana foi de: 240 1200 240 240 1200 240 1 5 � � � � � ( ) ( ) Isto é, a cada cinco pacientes, um deles era idoso. Segundo Parenti (2017, p. 49): “ Os conceitos de razão e proporção estão relacionados entre si. Assim, a razão entre o quociente (divisão) entre dois números e a proporção é a igualdade entre duas razões. As proporções são aplicadas em situações em que as informações devem ser comparadas e são calculadas pelo uso de ‘regra de três simples’. Para entender melhor a proporção, vejamos o exemplo a seguir: para produzir 600 pães no refeitório de um hospital, são utilizados 100 kg de farinha. Sendo assim, quantos pães podem ser feitos com 25 kg de farinha? 600 100 25 100 600 25 100 1500 1500 100 150 x x x x x = = = = = . . Assim, podemos dizer que é possível produzir 150 pães com 25 kg de farinha. Agora que já relembramos os conceitos matemáticos necessários para construir uma tabela de frequências, você aprenderá passo a passo como elaborar. Vamos lá? Primeiramente, trabalharemos com a organização dos dados: você organiza dados numéricos criando disposições ordenadas ou distribuídas. Para preparar seus dados coletados com o intuito de organizá-los, inicialmente, decidiremos se precisaremos analisar suas variáveis numéricas com base em grupos que sejam criados pelos valores de uma segunda variável categórica. Esta decisão afetará o modo como você prepara os dados. De acordo com Levine, Stephan e Szabat (2016), caso decida analisar suas variáveis numéricas em grupos que sejam definidos pelos valores de uma segunda variável categórica, você deve, então, decidir se utilizará um formato empilhado ou não empilhado. Em um formato empilhado, todos os valores de uma variável numérica aparecem em uma única coluna, enquanto uma segunda coluna, em sepa- rado, contém os valores categorizados que identificadas a qual subgrupo pertence cada um dos valores numéricos. Em um formato não empilhado, os valores de uma variável numérica são divididos por subgrupos e colocados em colunas separadas. 51 UNIDADE 2 Vamos ao exemplo supondo que você pretende comparar os custos em restaurantes localiza- dos na cidade com os custos em restaurantes localizados em bairros. Para preparar esses dados de forma não empilhada, poderia ser criada uma coluna para a variável custo com alimentação e outra coluna para a variável localização, uma variável categórica com os valores de cidade e bairros. Observe o custo de 20 refeições, no Quadro 2 a seguir: Quadro 2 - Disposição de dados não empilhados Custos de Refeições em Restaurantes no Centro da Cidade (em R$) 25 21 35 50 60 50 50 50 40 60 70 50 25 29 33 35 35 35 50 50 Custos de Refeições em Restaurantes em bairros da Cidade (em R$) 35 20 20 20 25 25 30 40 40 30 25 25 20 35 35 25 20 20 40 35 Fonte: o autor. Você pode observar que, desta forma, fica um pouco mais complexo trabalharmos com os dados. Este modelo de não empilhados foi apresentado para que você tenha ciência de como trabalhar com os dados. Mas se observarmos esses dados, fica difícil tomarmos conclusões acerca dos custos das refeições, como qual valor (em R$) que mais aparece (mais se repete), certo? Nem qual percentual deste valor pago dentre estas 20 refeições. Podemos facilitar a análise dos nossos dados quando trabalhamos com a disposição de dados ordenados, ou seja, quando colocamos os dados em rol. Segundo Levine, Stephan e Szabat (2016), uma disposição ordenada organiza os valores de uma variável em ordem de classificação, partindo do menor valor para o maior, ou seja, organizamos os dados em uma lista (crescente). Uma disposição ordenada pode ajudar a obter mais entendimento entre a amplitude dos valores em seus dados e é, particularmente, útil quando você tem mais do que um valor se repetindo. Veja, no Quadro 3, os mesmos dados apresentados anteriormente, de maneira ordenada. Quadro 3 - Disposição de dados não empilhados em rol Custos de Refeições em Restaurantes no Centro da Cidade (em R$) 21 25 33 35 35 50 50 50 50 60 25 29 35 35 40 50 50 50 60 70 Custos de Refeições em Restaurantes em bairros da Cidade (em R$) 20 20 20 25 25 25 30 35 35 40 20 20 20 25 25 30 35 35 40 40 Fonte: o autor. 52 UNICESUMAR Analise, no Quadro 3, que fica bem mais fácil trabalhar com os dados seguindo uma ordem cres- cente, ou seja, do menor valor para o maior valor. Outro exemplo clássico de rol que, certamente, você já viu em sala de aula, é a lista de presença dos seus alunos. Os nomes estão em ordem alfa- bética, ou seja, em um rol, assim, fica mais fácil para localizar algum aluno, porque os dados estão organizados.Além disso, o rol é um passo importante para construção de tabelas de frequências. Mas o que são tabelas de frequências? Trata-se de uma distribuição, de modo tabular, os valores de uma variável numérica em um conjunto de classes (linhas) numericamente ordenadas. Podemos ter uma distribuição de frequências com intervalo de classes e sem intervalo de classes. Primeiro, você aprenderá a construir uma distribuição de frequências sem intervalo de classes, utilizando a contagem de uma variável qualitativa nominal. Vejamos a situação a seguir: em pro- fessor do curso de Enfermagem, aplicou um questionário para entender, qual(is) disciplina(s) os alunos tinham como preferência em uma turma. Para isso, selecionou uma turma com 40 alunos e fez a seguinte pergunta: “Qual disciplina você mais gosta neste ano?” Dentre as opções dadas aos alunos eles tiveram: • Anatomia Humana. • Biologia celular e molecular. • Parasitologia. • Bioestatística. Os votos dos 40 alunos podem ser verificados a seguir (Quadro 4). Quadro 4 - Votos dos 40 alunos de uma turma sobre a preferência de disciplinas (brutos) Dados Brutos Anatomia Humana Anatomia Humana Bioestatística Biologia Celular e Molecular Bioestatística Parasitologia Bioestatística Bioestatística Parasitologia Parasitologia Parasitologia Parasitologia Biologia celular e molecular Biologia celular e molecular Biologia celular e molecular Biologia Celular e Molecular Anatomia Humana Parasitologia Anatomia Humana Biologia Celular e Molecular Anatomia Humana Anatomia Humana Anatomia Humana Biologia Celular e Molecular Bioestatística Parasitologia Bioestatística Biologia Celular e Molecular Parasitologia Parasitologia Parasitologia Biologia Celular e Molecular Parasitologia Parasitologia Parasitologia Parasitologia Parasitologia Parasitologia Parasitologia Parasitologia Fonte: o autor. 53 UNIDADE 2 Para facilitar a construção da nossa tabela, faremos um rol, utilizando as disciplinas com ordem alfa- bética (Quadro 5). Quadro 5 - Votos dos 40 alunos de uma turma sobre a preferência de disciplinas (em rol) Dados em rol Anatomia Humana Bioestatística Biologia celular e molecular Parasitologia Anatomia Humana Bioestatística Biologia celular e molecular Parasitologia Anatomia Humana Bioestatística Parasitologia Parasitologia Anatomia Humana Biologia celular e molecular Parasitologia Parasitologia Anatomia Humana Biologia celular e molecular Parasitologia Parasitologia Anatomia Humana Biologia celular e molecular Parasitologia Parasitologia Anatomia Humana Biologia celular e molecular Parasitologia Parasitologia Bioestatística Biologia celular e molecular Parasitologia Parasitologia Bioestatística Biologia celular e molecular Parasitologia Parasitologia Bioestatística Biologia celular e molecular Parasitologia Parasitologia Fonte: o autor. Agora que temos os dados em rol, construiremos a tabela de frequências (Fi), que se trata de agrupar os dados em uma tabela, contando quantas vezes cada variável (nesse caso, cada disciplina) se repetiu, isso é o que chamamos de frequência. Para isso, organizamos a tabela (utilizando a ordem alfabética), contendo todos os elementos (título, cabeçalho, linhas, entre outros). Utilizando os dados em rol, construiremos uma tabela de frequências com a preferência de 40 alunos de uma turma do curso de Enfermagem (Tabela 6). Tabela 6 - Distribuição de frequências referentes à preferência de 40 alunos de uma turma do curso de Enfermagem Disciplina Contagem Frequência (Fi) Anatomia Humana III III I 7 Bioestatística III III 6 Biologia Celular e Molecular III III III 9 Parasitologia III III III III III III 18 Total 40 Fonte: o autor. 54 UNICESUMAR Como você pode observar, inserimos a coluna contagem somente para você entender como funciona a distribuição de frequência, geralmente, ela não aparece, mas como é a primeira vez que você está construindo essa tabela, elaboramos essa coluna para melhor entendimento. Observe que, na disciplina Anatomia Humana, a repetição, ou seja, a contagem foi de sete alunos, portanto, a frequência desta classe (desta linha) é igual a sete. Já na segunda classe, ou seja, segunda linha, temos a disciplina Bioestatística, com votos de seis alunos, portanto, a frequência para esta disciplina é igual a seis. Enquanto na terceira classe, a contagem para disciplina de Biologia Celular e Molecular é igual a nove, sendo assim, na coluna frequência, inserimos a informação que é igual a nove. Por fim, na última classe, com a disciplina Parasitologia, teve a preferência de 18 alunos. Uma classe em uma distribuição de frequência corresponde ao número de linhas desta tabela, exceto cabeçalho e total. Podemos, entretanto, reconstruir esta tabela, inserindo algumas colunas complementares que são importantes em uma distribuição de frequência, tais como: a) Frequência Relativa (FR %): corresponde à proporção entre a frequência da classe pelo total de números observados, e a equação a seguir apresenta-nos como calcular a frequência relativa. Fr Fi n (%) .� � � � � � � 100 Em que: Fr (%) = Frequência relativa (em percentual) Fi = Frequência da classe n = número total de elementos (ou somatória das frequências, correspondente ao total). b) Frequência Acumulada (Fac): referente à frequência de todos os valores inferiores ao limite superior da classe, ou seja, repete-se a primeira frequência, em seguida, vamos somando com as posteriores. c) Frequência Relativa Acumulada (FRAC %): trata-se de uma classe em que a frequência acu- mulada da classe, dividindo pelo total da distribuição, ou seja, pelo total. A equação referente à frequência acumulada pode ser observada a seguir: Frac Fac n (%) .� � � � � � � 100 55 UNIDADE 2 Em que: Frac (%) = Frequência relativa acumulada (em percentual) Fi = Frequência acumulada da classe n = número total de elementos (ou somatória das frequências, correspondente ao total). Agora, você aprenderá a construir a tabela de distribuição de frequências com estas colunas comple- mentares (Tabela 7). Vamos lá! Tabela 7 - Distribuição de frequências referentes a preferência de 40 alunos de uma turma do curso de Enfermagem Disciplina Frequência (Fi) FR (%) Fac FRAC (%) Anatomia Humana 7 7 40 100 17 5� � � � � � �. , 7 7 40 100 17 5� � � � � � �. , Bioestatística 6 6 40 100 15� � � � � � �. 7 6 13� � 13 40 100 32 5� � � � � � �. , Biologia Celular e Molecular 9 9 40 100 22 5� � � � � � �. , 13 9 22� � 22 40 100 55� � � � � � �. Parasitologia 18 18 40 100 45� � � � � � �. 22 18 40� � 40 40 100 100� � � � � � �. Total 40 100 Fonte: o autor. Como você pode observar, apresentamos as colunas FR (%), Fac e FRAC (%) com todas as fórmulas e resoluções. Na coluna FR (%), utilizamos a equação a seguir: Fr Fi n (%) .� � � � � � � 100 Em seguida, substituímos cada valor da frequência, dividimos pelo total (que neste caso é igual a 40), e temos que a proporção de alunos que preferem a disciplina Anatomia Humana é de 17,5%. Essa coluna também serve para situações em que queremos saber a proporção em percentual, por exemplo: qual o percentual de alunos que preferem a disciplina de Biologia Celular e Molecular? Simplesmente, basta olhar na coluna FR (%) e responder que: 22,5% dos alunos preferem a disciplina Biologia Ce- lular e Molecular. Neste momento, você pode estar se questionando, quando construirá tabelas de frequências e se é preciso apresentar todos os cálculos nesta tabela. A resposta é: não, necessariamente. No exemplo apresentado, fizemos a resolução completa apresentando os cálculos em cada uma das classes para que você possa visualizar a equação correspondente bem como a substituição dos valores para compor a tabela. 56 UNICESUMAR Na maioria das vezes, quando elaboramos estas tabelas, normalmente, não apresentamos os cálculos. Agora, você verá a mesma tabela, sem apresentar os cálculos (Tabela 8). Tabela 8 - Distribuição de frequênciasreferentes a preferência de 40 alunos de uma turma do curso de Enfermagem (sem os cálculos) Disciplina Frequência (Fi) FR (%) Fac FRAC (%) Anatomia Humana 7 7 7 17,5 Bioestatística 6 15 13 32,5 Biologia Celular e Molecular 9 22,5 22 55 Parasitologia 18 45 40 100 Total 40 100 Fonte: o autor. Além disso, temos como ir tirando prova real para verificar se os cálculos apresentados estão corretos. Observe a seguir: a) Na linha Total, observe que a somatória das frequências deve ser igual ao número de elemen- tos coletados, ou seja, para este caso, foram entrevistados 40 alunos do curso de Enfermagem, então, a somatória deve ser igual a 40. b) Na coluna FR %, analise que a somatória das frequências relativas em percentual, a somatória deve ser igual a 100, correspondente a 100 por cento. Caso sua somatória dê, por exemplo, 98%, é necessário conferir os cálculos anteriores. c) Na coluna Frequência Acumulada (Fac): aqui, somamos as frequências das classes com as frequências posteriores, certo? Mas a prova real, trata-se do último valor encontrado na colu- na FAC ser igual ao total de elementos analisados, ou seja, o valor dever ser igual ao total da somatória da coluna frequência. d) Na coluna Frequência Relativa Acumulada (FRAC %): o último valor correspondente à variável analisada deve ser igual a 100. Como você pode perceber, não precisamos apresentar todos os cál- culos nas colunas complementares da tabela de distribuição de fre- quências. Neste vídeo, apresentarei o passo a passo da construção das colunas complementares bem como reescreverei essa tabela sem cálculos. Acesse o vídeo e fique por dentro desse conteúdo. https://apigame.unicesumar.edu.br/qrcode/8464 57 UNIDADE 2 Não se esqueça: o coração da sua tabela é a coluna frequência, por isso, é importante estes valores serem distribuídos de maneira correta. Coletar dados.1º passo 2º passo Colocar os dados em rol (ordem crescente). 3º passo Construir a tabela e contar as frequências (repetições). 4º passo Construir as colunas Fr (%), FAC e FRAC (%). 5º passo Como garantia con�ra seus dados, principalmente a coluna frequência. Figura 1 - Passo a passo para construção de uma tabela de frequências simples, sem intervalo de classes / Fonte: o autor. Em uma tabela de distribuição de frequências, você sabia que po- demos tirar a prova real dos cálculos nas colunas complementares? Sim, isso é possível e, para entender como fazer essa prova real, con- vido você a acessar este vídeo e fazer comigo o passo a passo. Você verá que não terá erro. Fique por dentro deste plus aqui em nossa disciplina. Descrição da Imagem: na figura, temos a sequência dos passos para a construção de uma distribuição de frequências sem intervalo de classes, temos: 1º passo – coletar os dados; 2º passo – colocar os dados em rol; 3º passo – construir a tabela e contar as repetições; 4º passo – fazer as colunas frequência relativa (FR %), frequência acumulada (FAC) e frequência relativa acumulada FRAC (%), e o passo 5 – conferir os dados. https://apigame.unicesumar.edu.br/qrcode/8465 58 UNICESUMAR Até agora, vimos como trabalhar com uma distribuição de frequências, sem intervalo de classes, mas com uma variável quantitativa discreta. Vejamos um exemplo: supondo que um diretor de uma escola anotou durante 30 dias o número de atendimento aos pais e obteve o seguinte resultado: Dados Brutos 3 3 2 4 5 2 2 2 4 4 2 3 3 5 2 4 2 3 2 3 1 2 3 2 2 3 4 2 3 2 1º passo: colocaremos os dados em rol. Dados em Rol 2 2 2 3 4 2 2 2 3 4 2 2 3 3 4 2 2 3 3 4 2 2 3 3 5 2 2 3 4 5 2º passo: Construir a tabela, distribuir as frequências. Tabela 9 - Distribuição de frequências referentes ao atendimento do diretor de uma escola durante 30 dias consecutivos Atendimentos Número de dias (Fi) FR(%) FAC FRAC(%) 2 14 14 30 100 46 7� � � � � � �. , 14 14 30 100 46 7� � � � � � �. , 3 9 9 30 100 30� � � � � � �. 14 9 23� � 23 30 100 76 7� � � � � � �. , 4 5 5 30 100 16 7� � � � � � �. , 23 5 28� � 28 30 100 93 3� � � � � � �. , 5 2 2 30 100 6 6� � � � � � �. , 28 2 30� � 30 30 100 100� � � � � � �. Total 30 100 Fonte: o autor. 59 UNIDADE 2 3º passo: construir as colunas complementares (já realizado na própria tabela). Agora é só conferir mais uma vez a tabela e verificar se está tudo de acordo. As tabelas têm a função de condensar infor- mações, em alguns casos, o número de dados é tão grande, que dificulta a análise, para estes casos, são utilizadas tabelas com dados agrupados em inter- valos de classes. Imagine a seguinte a situação: você já atuando como professor de cursos de Saúde, aplica uma pro- va a seus alunos. Para entender o desempenho dos seus alunos nesta avaliação, você pode fazer uma lista com as notas dos seus alunose colocá-las or- denadas. A seguir temos as notas dos alunos desta turma (dados brutos). 3,0 3,0 6,0 9,0 10,0 3,0 9,5 8,5 6,5 6,5 3,0 5,0 7,0 7,0 7,0 4,0 7,0 6,0 6,5 8,0 9,0 4,5 9,5 8,0 8,5 6,0 7,0 10,0 7,5 8,5 Agora, colocaremos os dados em rol, observe a seguir: 3,0 5,0 6,5 7,5 9,0 3,0 6,0 7,0 8,0 9,0 3,0 6,0 7,0 8,0 9,5 3,0 6,0 7,0 8,5 9,5 4,0 6,5 7,0 8,5 10,0 4,5 6,5 7,0 8,5 10,0 Agora, construiremos a tabela de distribuição de frequências sem intervalo de classes (Tabela 10). Tabela 10 - Distribuição de frequências referente às notas de seus alunos (sem intervalo de classes) Notas Número de alunos 3,0 4 4,0 1 4,5 1 5,0 1 6,0 3 6,5 3 7,0 5 7,5 1 8,0 2 8,5 3 9,0 2 9,5 2 10,0 2 Total 30 Fonte: o autor. Você pode observar que temos uma tabela com mais de dez classes, ou seja, mais do que dez linhas (exceto cabeçalho e total). Agora, imagina, quando formos inserir as colunas complementares, quan- tos números terá nossa tabela? Para melhorar essa tabela, podemos cons- truir uma distribuição de frequências com intervalo de classes para condensar melhor as informações da tabela. Ao elaborar uma distri- buição de frequências com intervalo de classes, precisamos seguir os passos: 1º passo: colocar os dados em rol. 2º passo: determinar a amplitude total, que se trata da diferença entre o maior valor do conjunto de dados pelo menor valor do conjunto de dados, resolvido pela equação: 60 UNICESUMAR AT Xmáx Xmín� � Em que: AT = Amplitude Total Xmáx = Maior valor do conjunto de dados Xmín = menor valor do conjunto de dados 3º passo: determinar o número de classes. Para uma distribuição de frequências com intervalo de classes, os números de linhas são definidos pela equação a seguir: k n= Em que: K = número de classes n = número total de elementos Obs.: é muito importante que o número de classes seja arredondado. 4º passo: determinar a amplitude do intervalo, ou seja, a distância entre o limite inferior da classe e o limite superior da classe, dado pela equação: h AT k = Em que: h = Amplitude do intervalo AT = Amplitude total k = número de classes O arredondamento de dados é importante em uma distribuição de frequências com intervalo de classes, principalmente no item número de classes. Para relembrar como se faz o arredondamento de dados, assista ao vídeo a seguir. Para acessar, use seu leitor de QR Code. https://apigame.unicesumar.edu.br/qrcode/8449 61 UNIDADE 2 5º passo: construa a tabela, faça as colunas complementares, distribuindo, corretamente, as frequências. A seguir, temos um resumo dos passos que devem ser seguidos para construir uma distribuição de frequências com intervalo de classes (Figura 2). Colocar os dados em Rol.1º passo 2º passo Calcular Amplitude Total: AT = Xmáx-Xmín. 3º passo Calcular nº de classes = raiz (n). 4º passo Calcular amplitude do intervalo: h = AT/k. 5º passo Construir a tabela de frequências, respeitando o intervalo encontrado respeitando os limites inferior e superior. Figura 2 - Passo a passo para construção de uma tabela de frequências com intervalo de classes / Fonte: o autor. Descrição da Imagem: na figura, temos uma sequência dos passos para a construção de uma distribuição de fre- quênciascom intervalo de classes: 1º passo – rol; 2º passo – cálculo da AT; 3º passo – cálculo do número de classes (linhas); 4º passo – cálculo da amplitude do intervalo, e o passo 5 – construção da tabela respeitando o intervalo de classes entre os limites. Para entender melhor a construção de uma distribuição de frequências com intervalo de classes, observe os dados a seguir, que são referentes às notas de alunos do curso de Ciências Biológicas: 62 UNICESUMAR 1º passo: colocar os dados em rol ordenado (crescente). 3,0 5,0 6,5 7,5 9,0 3,0 6,0 7,0 8,0 9,0 3,0 6,0 7,0 8,0 9,5 3,0 6,0 7,0 8,5 9,5 4,0 6,5 7,0 8,5 10,0 4,5 6,5 7,0 8,5 10,0 2º passo: agora, determinaremos a Amplitude do Intervalo: AT Xmáx Xmín� � AT � � �10 0 3 0 7 0, , , 3,0 5,0 6,5 7,5 9,0 3,0 6,0 7,0 8,0 9,0 3,0 6,0 7,0 8,0 9,5 3,0 6,0 7,0 8,5 9,5 4,0 6,5 7,0 8,5 10,0 4,5 6,5 7,0 8,5 10,0 3º passo: em seguida, determinaremos o número de classes (k). k n= k k arredondando = = = 30 5 47 5, 4º passo: agora, resolveremos a amplitude do intervalo, utilizando a equação a seguir: h AT k = h h = = 7 5 1 4, Sabemos, até o momento, que nossa tabela terá: 5 linhas (classes) Intervalo será de 1,4 em 1,4 (entre limites) 63 UNIDADE 2 Antes de construir nossa tabela de frequências, precisamos entender o que são limites inferiores e superiores. Temos quatro maneiras de utilizar os limites inferiores e superiores: 1. |------- Nesta primeira notação, incluímos o limite inferior e excluímos o limite superior. 2. -------| Nesta notação, excluímos o limite inferior e incluímos o limite superior. 3. ------- Nesta notação, excluímos ambos os limites. 4. |------| Nesta notação, incluímos ambos os limites. Qual delas usar? Utilizaremos a primeira notação, que inclui limite inferior e exclui limite superior, mas, em alguns casos, somente na última classe, teremos que usar a quarta notação, que inclui ambos os limites, isso pode ocorrer para que o maior valor do conjunto de dados seja contado. Como já temos todas as informações, construiremos nossa tabela (Tabela 11): Tabela 11 - Distribuição de frequências referente às notas de seus alunos (com intervalo de classes) Notas Número de alunos (Fi) FR(%) FAC FRAC (%) Ponto médio (xi) 3,0 |----- 4,4 5 5 30 100 16 7� � � � � � �. , 5 5 30 100 16 7� � � � � � �. , 3 0 4 4 2 3 7, , ,�� � � � 4,4 |----- 5,8 2 2 30 100 6 6� � � � � � �. , 5+2=7 7 30 100 23 3� � � � � � �. , 4 4 5 8 2 5 1, , ,�� � � � 5,8 |----- 7,2 11 11 30 100 36 7� � � � � � �. , 7+11=18 11 30 100 36 7� � � � � � �. , 5 8 7 2 2 6 5, , ,�� � � � 7,2 |----- 8,6 6 6 30 100 20� � � � � � �. 18+6=24 24 30 100 80� � � � � � �. 7 2 8 6 2 7 9, , ,�� � � � 8,6 |-----| 10,0 6 6 30 100 20� � � � � � �. 24+6=30 30 30 100 100� � � � � � �. 8 6 10 0 2 9 3, , ,�� � � � Total 30 100 Fonte: o autor. Agora, temos a tabela resolvida, observe que, na última classe, tivemos que utilizar a notação que inclui limite inferior e inclui limite superior |-----|, isso foi feito para que a nota 10,0 fosse incluída na contagem. Observe, nesta tabela, que há uma coluna complementar a mais, a coluna ponto médio, que é de- terminado pela equação: Xi Li Ls� � �( ) 2 64 UNICESUMAR Em que: Xi = Ponto médio Li = Limite inferir do intervalo de classe (independentemente da notação) Ls = Limite superior do intervalo de classe (independentemente da notação) É importante ficar atento porque só existe ponto médio em uma distribuição de frequências com intervalo de classes. O ponto médio será importante, em nossa próxima unidade, no cálculo da média. Você sabia que um professor pode trabalhar dados da Educação Bá- sica e do Ensino Superior, fazendo consulta no próprio INEP? E que estes dados podem ser utilizados para entender o comportamento dos alunos do país? E que você pode trabalhar isso em sala de aula utilizando esses dados? Nossa roda de conversa traz uma explicação do trabalho de coleta dos dados do INEP e da organização em tabe- las, planilhas e gráficos. Assista e replique em sala de aula, vamos lá? Outra maneira de apresentar os dados provenientes de uma pesquisa são os gráficos (Figura 3). Um gráfico tem por objetivo apresentar uma ideia visual do comportamento de um conjunto de valores, tem a vantagem de facilitar a compreensão de determinada situação que queira ser descrita, permitindo a interpretação rápida de suas principais características (ARANGO, 2011). https://apigame.unicesumar.edu.br/qrcode/8459 65 UNIDADE 2 É importante frisar que um gráfico não traz tantas informações quanto a uma tabela. E você vai se perguntar: usarei gráfico ou tabelas em minhas pesquisas? A resposta é: fica a critério do pesquisador, ou seja, a pessoa que está fazendo a pesquisa pode utilizar gráficos ou tabelas, ou fazer uma mesclagem entre eles. Os gráficos estão sempre presentes em trabalhos científicos, artigos, congressos, seminários, simpósios, em que é preciso comunicar um grande volume de informações com tempo limitado, de forma compreensível e agradável. Temos vários modelos de gráficos, que veremos a seguir: a) Gráfico de colunas: quando temos as categorias apresentadas no eixo horizontal e a frequên- cia no eixo vertical (BARBETTA, 2014). Para construção do gráfico de colunas, utilizaremos os dados referentes às matrículas na Educação Infantil, retirados do INEP (2019). A Figura 3, apresenta um gráfico de colunas: Figura 3 - Gráfico de Colunas / Fonte: adaptada de Inep (2020). Descrição da Imagem: a figura traz um gráfico de colunas em que as barras estão na direção vertical, primeiro com a região Norte em que temos 690.631 alunos, seguida da região Nordeste com 2.349.305 alunos, seguida da região Sudeste com 3.919.235, após, com a região Sul, 1.347.509 alunos e, por fim, a região Centro-Oeste com 666.098 alunos. Como você pode observar, na horizontal, temos as regiões do país e, na vertical temos o número de matrículas na Educação Básica. Caso você queira saber o número de matriculados na região Norte, por exemplo, basta olhar na região Norte e verificar que há pouco mais do que 500.000 matrículas, no ano de 2019. 66 UNICESUMAR b) Gráfico de barras: em que cada variável é representada por uma barra de comprimento proporcional à sua ocorrência (BARBETTA, 2014). Temos as barras na vertical, na Figura 4. Figura 4 - Gráfico de Barras / Fonte: adaptada de Inep (2020). Descrição da Imagem: a figura traz um gráfico de colunas em que as barras estão na direção horizontal: de baixo para cima aparece primeiro a região Norte em que temos 690.631 alunos, seguida da região Nordeste com 2.349.305 alunos, seguida da região Sudeste com 3.919.235, após, a região Sul com 1.347.509 alunos e, por fim, a região Centro- -Oeste com 666.098 alunos. Descrição da Imagem: a figura traz um gráfico de linhas com os meses de janeiro a dezembro, apresentando a evo- lução do índice pluviométrico no período. c) Gráfico de linhas: são gráficos bem interessantes no uso de séries temporais, ou seja, a variável predominante é o fator tempo (cronológico), esse tipo de gráfico mostra informações da série estudada em pontos e que são marcados por segmentos de linha reta. A Figura 5 apresenta-nos um gráfico de linhas. Figura 5 - Gráfico de linhas / Fonte: o autor. 67 UNIDADE 2 Na Figura 5, com o gráfico de linhas, você pode observar que o aumento no índice pluviométrico é apresentado mês a mês (tempo), e, para interpretar esse gráfico, basta visualizar que podemos concluir que o mês de julho foi que apresentou maior quantidade de chuvas. d) Gráfico de setores: também conhecido como gráfico de pizza, é um gráfico circular, em que os valores são representados proporcionais às respectivas frequências. Para a construção deste gráfico, utilizaremos os dados referentes às preferências de alunos de uma turma do curso de Ciências Biológicas (Figura 6). Figura 6 - Gráfico de setores / Fonte: o autor. Neste tipo de gráfico, podemos verificar a proporção dentre as disciplinasque os alunos escolheram como preferidas. Fica nítida a preferência pela disciplina Zoologia I, seguida da disciplina Biologia Celular e Molecular, sendo a menos preferida a disciplina Anatomia Humana, para esta turma men- cionada no exemplo. e) Histograma: é a representação gráfica de uma distribuição de frequências, pode ser construído a partir de uma distribuição de frequências sem intervalo de classes ou com intervalo de classes. Aqui cada retângulo justaposto representa uma classe (Figura 7). Descrição da Imagem: a figura traz um gráfico em formato de pizza, circular, sendo que a proporção maior está com 45% na disciplina Zoologia I, seguida de 23% na disciplina Biologia Celular e Molecular, seguida da disciplina Bioesta- tística com 15% e, por fim, a disciplina Anatomia com 7%. 68 UNICESUMAR Figura 7 - Histograma / Fonte: o autor. Na Figura 7, que representa um histograma, para interpretação, você deve olhar as notas bem como a quantidade de alunos, observe que, no primeiro retângulo, temos cinco alunos com notas maiores ou iguais a 3,0 e menores do que 4,4, e assim sucessivamente. Você pode, também, construir todos os seus gráficos em suas pesquisas com o auxílio do Microsoft Excel®, basta inserir todos os dados, selecionar e escolher o modelo que melhor represente os dados com que está trabalhando. Dessa maneira, fica a critério do pesquisador a utilização de tabelas e gráficos para apresentar os resultados de uma pesquisa, podendo seu uso ser intercalado. Você percebeu o quanto a construção de tabelas e gráficos pode ser significativa e aplicada na sua profissão? Existem muitas possibilidades. Você pode trabalhar com pesquisa e apresentar os resultados em tabelas e gráficos, com dados disponíveis no próprio INEP sobre a Educação Básica ou, até mesmo, coletar dados de seus alunos, construir tabelas e gráficos para entender o comportamento de sua turma em alguns quesitos (dê preferência por disciplinas, notas, frequências, evasões, entre outros) Veja que tudo isso está relacionado e que a Bioestatística está presente em sua na vida diária. Descrição da Imagem: a figura representa um histograma, em que temos gráficos na vertical, juntos, ou seja, sem espaço entre as barras, iniciando com cinco alunos com notas maiores ou iguais a 3,0 e menores do que 4,4; dois alunos com notas maiores ou iguais a 4,4 e menores do que 5,8; onze alunos com notas maiores ou iguais a 5,8 e menores que 7,2; seis alunos com notas maiores ou iguais a 7,2 e menores do que 8,6 e seis alunos com notas maiores ou iguais a 8,6 e menores ou iguais a 10,0. 69 UNIDADE 2 Vimos, em nossos estudos, como as técnicas de estatística são fundamentais para tomada de decisões e que, para organizar uma tabela, precisamos seguir algumas normas específicas que foram apresentadas no decorrer dessa unidade. Além disso, os gráficos também podem ser utilizados para visualizar o resultado de uma pesquisa. Assim, ao tabular os resultados da pesquisa propostos no início de nosso estudo, mais especificamente na experimentação, em que colocamos uma situação hipotética, que rea- lizará um experimento para saber se as pessoas de um bairro (ou membros da família tiveram dengue). Aqui, na ação, após toda coleta de dados a partir de um formulário elaborado por você, certamente, terá resultados a serem tabulados. É isso mesmo, com todas as técnicas estudadas, você poderá criar tabelas de frequências, colunas complementares para melhorar os resultados obtidos e, a partir de então, tomar decisões. Supondo que suas respostas sejam que, dentro de um grupo de dez pessoas, oito responderam que já tiveram dengue, ou seja, 80% dos entrevistados, como profissional da área de Ciências Biológicas e Saúde, o que você pode propor? Com base nesse estudo, pode propor palestras para sensibilização da população, um dia D de combate ao foco de dengue, orientar, disseminar informações acerca dos cuidados que devemos ter com a dengue. Aqui, você pode perceber, que usamos uma técnica estatística, e a partir de então, foram feitas ações de melhoria no combate a dengue. Você sabia que, como futuro da saúde e, possivelmente, um profissio- nal da Educação, faz parte do exercício de cidadania e profissional a consulta de dados básicos para articulação, conscientização e tomada de decisão? Para tanto, uma sugestão seria iniciarmos consultando a sinopse Estatística da Educação Básica. Esta sinopse trata-se de dados relacionados à matrícula de acadêmicos, ao estabelecimento, às regiões, ao rendimento escolar para as diferentes modalidades de ensino brasileiras: Ensino Regular (Educação Infantil e Ensino Fundamental e Médio), Educação Especial e Educação de Jovens e Adultos. Você pode consultar os dados dessa sinopse que serão apresentados, detalhadamente, por cidade, estado e região, e trabalhar com eles os apresentando em tabelas mais reduzidas. Tudo isso pode variar de acordo com a sua necessidade como futuro professor. Esses dados podem ser consultados no qrcode a seguir. Para acessar, use seu leitor de QR Code. https://apigame.unicesumar.edu.br/qrcode/8451 70 M A P A M EN TA L Caro(a) estudante, a utilização de tabelas e gráficos são a forma de apresentar resultados oriundos de uma pesquisa, como vimos em nossa unidade, existem normas específicas para sua elaboração e confecção. A partir desta conceitualização, desenvolva um Mapa Mental que aborde os con- ceitos com que trabalhamos nesta unidade: Tabelas e Gráficos. Procure colocar as informações pertinentes sobre cada uma das relações apresentadas na área de Biológicas e da Saúde. 3 Olá, aluno(a), esta unidade será fundamental para sua aprendiza- gem e para sua futura profissão. Por meio dela, você terá oportuni- dade de entender como ocorre a análise dos dados oriundos de uma pesquisa para que possa analisar situações quanto à frequência, à incidência, às ocorrências, entre outras variáveis imprescindíveis para futura atuação profissional. Você aprenderá, nesta unidade, a trabalhar com as medidas de posição, separatrizes e variabilidade. Medidas de Posição e Dispersão Me. Renata Cristina Souza Chatalov 72 UNICESUMAR Para que possamos continuar nossas reflexões, vamos nos apropriar dos conceitos e resgataremos os exemplos e a trajetória das unidades anteriores. Neste momen- to de sua leitura, você, provavelmente, deve estar se perguntando: “agora que já coletei os dados, organizei em tabelas, qual a próxima etapa? O que posso fazer com eles? Por que estou aprendendo tudo isso? Em que será útil no meu dia a dia? Para que possamos problematizar e refletir, compartilharei outra história que foi muito relevante em minha trajetória. Vou nos transportar para a primeira vez em que entrei em uma escola como professora da disciplina Estatística. Naquele momento, eu tinha várias expectativas quanto à minha atuação como docente. Aquele ambiente inspirava o conhecimento e o meu desejo de ensinar. No entanto, já em sala de aula, quando fiz a primeira explicação/apresentação a respeito do que se tratava a disciplina de cálculo, explicitei que, também, trabalharíamos com a interpretação de dados e informações e notei que isso foi uma surpresa para os estudantes daquela turma. Na aula seguinte, fiz uma revisão de conteúdos de Matemática Básica, como fração, multiplicação e expressão numérica, quando percebi a necessidade de mais aulas relembrando este conteúdo com meus alunos. Então, para ter um parâmetro de como estava a turma, fiz um teste, sem valer nota, mas para ter um diagnóstico real de como poderia trabalhar. Depois que fiz as correções dos testes, calculei a média, a variância e o desvio padrão daquela turma e entendi que havia muita dispersão, ou seja, parte da turma necessitava de uma atenção especial em cálculos básicos de matemática, outra parte era inter- mediária, e outra parte tinha gabaritado o teste. Com essa turma heterogênea, era preciso cuidado e atenção, e isso me desafiava nesta primeira experiência comoprofessora. Com este relato de minha história, desejo que, nesta unidade, você se atente aos conteúdos que desbravaremos e compreender juntos, que tratam de formas de se calcular as medidas de posição e dispersão e sobre como perceber o quanto estas são importantes em nossa tomada de decisões. Você percebeu que, como professora da disciplina Estatística, utilizei medidas de dispersão para mensurar o conhecimento prévio da turma em Matemática Básica e, com base nos resultados, fui traçando um planejamento pedagógico pensando na melhor maneira do aprendizado da minha turma. Agora que en- tendemos que a estatística pode nos ajudar a construir elementos para tomada de decisões, você, também, pode se apropriar destes preceitos para a tomada de decisão em sua trajetória profissional e verá que essas medidas ajudarão você a interpretar os resultados de que precisa em um conjunto de dados. 73 UNIDADE 3 Portanto, peço que faça a leitura do artigo intitulado Medidas de dispersão: os valores estão próximos entre si ou variam muito? Nesse artigo, você terá uma explicação das medidas de dispersão e o que os resultados apresentam entre si. Acesse o qrcode: Depois da leitura do artigo anterior, vamos pôr a mão na massa? Trabalharemos, agora, com dados coletados em uma turma. Sugiro que levante as notas dos seus colegas de turma, no primeiro, no segundo, no terceiro e no quarto módulo. Em seguida, determine a média para cada aluno(a), e analise o desempenho de sua turma. Construa esta organização e faça esta análise, e você já estará utilizando mais uma técnica apresentada pela Bioestatística. Caso prefira, pode extrapolar este contexto de nosso exemplo para outras áreas da sua vida, como com as contas de luz, água ou internet, ao longo do último ano. Sendo assim, provoco você a fazer uma autoanálise sobre a sua aprendizagem de tudo que foi explicado até agora, pois este processo mostrará que estas medidas o aju- darão a interpretar os resultados de que precisa em um conjunto de dados. O que você encontrou até aqui? Todas estas informações auxiliarão você? Diante disso, convido você, acadêmico, a fazer suas anotações em um Diário de Bordo. Construa uma tabela à mão com esses dados, a fim de anotar suas primeiras impressões até o momento. DIÁRIO DE BORDO https://apigame.unicesumar.edu.br/qrcode/8455 74 UNICESUMAR Neste momento, caro(a) estu- dante, estudaremos as medi- das de posição, as separatrizes e a dispersão. As medidas de tendência central possibilitam representar um conjunto de dados com apenas um número (MARTINEZ, 2015). As medi- das de posição mais utilizadas e as que estudaremos são: a mé- dia, a moda e a mediana. Média Mediana Moda Figura 1 - Medidas de tendência central (ou medidas de posição) Fonte: o autor. Descrição da Imagem: a figura apresenta as três medidas de tendência central, ou podemos dizer, as medidas de posição mais utilizadas: média, mediana e moda. Figura 1 - Lorem ipsum dolor sit amet, consectetur adipiscing elit / Fonte: ipsum sit amet (p. 00). 75 UNIDADE 3 A medida de posição média é a medida de tendência central mais conhecida e mais importante para um conjunto de valores. Tenho certeza de que você já a utilizou no seu dia a dia, pois é bem simples de ser calculada. Para o cálculo da média, basta somar todos os valores e, em seguida, dividir pelo total de elementos. A média amostral é representada por um x com uma barra em cima ( X ), e a média populacional pela letra grega µ (lê-se mi). Mesmo sendo representadas de maneira diferente, a forma de calcular é a mesma. Para calcularmos a média, quando temos dados desagrupados, ou seja, sem estarem em tabelas, podendo ser brutos ou em rol, é dada por: f) Média Populacional: µ X N i Em que: µ = Média Populacional ∑ = Somatória Xi = Valor de cada elemento N = Total da População g) Média Amostral: X X n i� � Em que: X = Média Amostral ∑ = Somatória Xi = Valor de cada elemento n = Total da Amostra Cada uma dessas medidas envolve fórmulas e aplicações diferentes, tornando a Bioestatística ainda mais fascinante. “As medidas de tendência central só podem ser calculadas para variáveis quantitativas” (PARENTI; SILVA; SILVEIRA, 2017, p. 116). 76 UNICESUMAR Como você pode observar, o cálculo da média é o mesmo tanto para a população quanto para a amos- tra. Aposto que, neste momento, você está se questionando: mas como funciona na prática? Sempre que não for mencionado que os dados são populacionais, você pode considerar uma amostra, e isso acontece porque, geralmente, o trabalho com amostras tem um custo e um tempo menor do que o trabalho com população. Você pode observar que, na área das Ciências Biológicas e da Saúde, o uso de amostras é recorrente. Para compreender melhor o que eu desejo explicar para você aqui, o cálculo da média, vejamos um exemplo. As idades (em anos) de oito pessoas que estão apresentadas, a seguir: 38, 40, 49, 67, 33, 57, 54 e 64 A média amostral, denotada por x (lê-se “xis barra”), é dada por: X X n i� � X X n x x x xn n i� � � �� 1 2 3....... Assim: X X � � � � � � � � � � 38 40 49 67 33 57 54 64 8 402 8 50 25, Você pode observar que a média é apresentada na mesma unidade de medida da variável analisada. E como interpretamos uma média de 50, 25 anos? Em primeiro lugar, tendo a média como uma medida de tendência central, podemos afirmar que as idades das oito pessoas de nossa amostra estão em torno de 50, 25 anos. A Figura 2 ajuda-nos a visualizar a média e os dados apresentados. Figura 2 - Apresentação dos dados e da média / Fonte: o autor. Descrição da Imagem: a imagem apresenta uma reta com os valores de dois em dois, iniciando em 30, 32, 34, 36 e terminando em 68; a média está representada, na reta, no valor de 50, 25 anos, os valores estão apresentados na dispersão e marcados pontos em: 33,38, 40, 49, 54, 57, 64 e 67. 77 UNIDADE 3 Dessa forma, lembre-se de que a média é uma medida-resumo, isto é, ela visa sintetizar em um único valor todas as nossas observações amostrais. Em outras palavras, afirmarmos que a idade de 50, 25 anos é um valor que tem por intuito representar as idades de todas as oito pessoas analisadas. No entanto você pode observar que a média é um resumo incompleto de nosso conjunto de dados uma vez que ela não informa o tamanho da dispersão de nossos dados a seu redor. Observe que, com a média de 50, 25 anos, temos pessoas com 33 anos, com 48 e com 67. Para explicar toda esta dispersão, existe o desvio padrão, que discutiremos um pouco mais à frente. Supondo que, agora, temos uma amostra composta por oito mulheres, e a variável que nos interessa é o número de filhos, para isso, temos: 1, 1, 1, 2, 2, 3, 3, e 4 A variável analisada é de natureza quantitativa discreta. A média amostral é: X X n i� � X X X � � � � � � � � � � 1 1 1 2 2 3 3 4 8 17 8 2 125, Se o número de filhos é uma variável discreta, e não temos casas decimais, seria possível ter uma média de 2,125 filhos? Ainda que a variável estudada não admita casas decimais, a sua média pode sim ter casas decimais. Entretanto, neste exemplo apresentado, basta uma casa decimal para a média, aí po- demos utilizar a regra de arredondamento e dizer que as famílias têm, em média, 2,1 filhos. Também podemos ter interesse em calcular a média, em dados qualitativos apresentados em tabelas. Vejamos o exemplo, na Tabela 1, a seguir: Tabela 1 - Média das estaturas (em cm) de 30 adolescentes, conforme a classificação de seus pesos Grupo Frequência (Fi) Média da Estatura (cm) Portadores de sobrepeso 6 145,5 Portadores de obesidade 14 148,8 Portadores de peso adequado 10 149,3 Fonte: o autor. Para calcular a média neste caso, trabalharemos com a média ponderada, dada pela equação: X X fi n i� � . 78 UNICESUMAR Em que: X = média Xi = cada um dos valores (ou ponto médio) n = número total de elementos (ou somatória das frequências) Temos: X X fi n i� � . X X X � � � � � � ( . ,) ( . , ) ( . , ) . , . 6 145 5 14 148 8 10 149 3 30 873 2 083 32 1 493 30 �� � 4 449 32 30 148 31 . , ,X Em vez de calcular dessa maneira, para facilitar, você pode, dentro da sua tabela, criar uma coluna complementar e chamá-la de xi.fi, colocar os resultados em cada classe da multiplicação da frequência pelo valor da variável e, depois, somar com o total na Tabela 2. Vejamos a seguir: Tabela 2 - Média das estaturas (em cm) de 30 adolescentes, conforme a classificação de seus pesos com coluna complementar Grupo Frequência (Fi) Média da Estatura (cm) Fi.Xi Portadores de sobrepeso 6 145,5 ( . , )6 145 5 873= Portadores de obesidade 14 148,8 ( . , ) . ,14 148 5 2 083 2= Portadores de peso adequado 10 149,3 ( . , ) .10 149 3 1 493= Total 30 4.449,2 Fonte: o autor. Agora, com o resultado da somatória das frequências pela variável, utilizamos a mesma equação. Veja como fica: X X fi n i� � . X X = = 4 449 32 30 148 31 . , , 79 UNIDADE 3 Você, também, poderá encontrar situações, no seu cotidiano, já atuando como profissional, em que você precisará calcular a média de idade de seus pacientes, ou, ainda, calcular médias de seus alunos utilizando os dados quantitativos. Vejamos um exemplo hipotético em que analisaremos as notas de uma turma do curso de Biomedicina, na Tabela 3 a seguir: Tabela 3 - Notas de 30 alunos do Curso de Biomedicina Nota Número de alunos 7,0 8 8,0 12 9,0 6 10,0 4 Total 30 Fonte: o autor. Para que o professor saiba a média em questão, ele realizará uma análise simples, multiplicará a nota (variável que está sendo estudada) pelo número de alunos, em seguida dividirá pelo total da turma, que, neste caso, é de 30 alunos. Utilizando a equação da média, temos: X X fi n i� � . X X X X � � � � � � � � � � ( . ) ( . ) ( . ) ( . ) , 7 8 8 12 9 6 10 4 30 56 96 54 40 30 246 30 8 2 Outra opção para calcular, como vimos anteriormente, é criar a coluna complementar, ficando, desta forma, na Tabela 4: Tabela 4 - Notas de 30 alunos do Curso de Biomedicina Nota Número de alunos xi.fi 7,0 8 56 8,0 12 96 9,0 6 54 10,0 4 40 Total 30 246 Fonte: o autor. 80 UNICESUMAR Resolvendo a média, temos: X X fi n i� � . X X = = 246 30 8 2, E se tivermos uma tabela de frequências com intervalo de classes, como calculamos a média? Utilizaremos a mesma equação, mas precisaremos calcular o ponto médio. Vejamos um exemplo: as notas dos alunos do curso de Biomedicina estão apresen- tadas na Tabela 5 a seguir. Tabela 5 - Distribuição de frequências referente às notas de alunos do Curso de Biomedicina (com intervalo de classes) Notas Número de alunos (Fi) 3,0 |----- 4,4 5 4,4 |----- 5,8 2 5,8 |----- 7,2 11 7,2 |----- 8,6 6 8,6 |-----| 10,0 6 Total 30 Fonte: o autor. Na Tabela 6, temos as notas dos alunos do curso para calcularmos a média. A fim de facilitar, inseriremos uma coluna complementar, determinaremos o ponto médio primeiro, utilizando a equação a seguir: Xi Li Ls� � �( ) 2 Em que: Xi = Ponto médio Li = Limite inferior do intervalo de classe (independente da notação) Ls = Limite superior do intervalo de classe (independente da notação) Agora, com a coluna complementar na tabela, determinaremos o ponto médio de cada classe, na Tabela 6. 81 UNIDADE 3 Tabela 6 - Distribuição de frequências referente às notas de alunos do Curso de Biomedicina (com intervalo de classes) Notas Número de alunos (Fi) Ponto médio (xi) 3,0 |----- 4,4 5 3 0 4 4 2 3 7, , ,�� � � � 4,4 |----- 5,8 2 4 4 5 8 2 5 1, , ,�� � � � 5,8 |----- 7,2 11 5 8 7 2 2 6 5, , ,�� � � � 7,2 |----- 8,6 6 7 2 8 6 2 7 9, , ,�� � � � 8,6 |-----| 10,0 6 8 6 10 0 2 9 3, , ,�� � � � Total 30 Fonte: o autor. Agora que temos o ponto médio, basta inserir uma coluna complementar “xi.fi” e utilizar a equação da média, que já trabalhamos, anteriormente. Reescrevendo, na Tabela 7, temos: Tabela 7 - Distribuição de frequências referente às notas de alunos do Curso de Biomedicina (com intervalo de classes) Notas Número de alunos (Fi) Ponto médio (xi) xi.fi 3,0 |----- 4,4 5 3 0 4 4 2 3 7, , ,�� � � � ( . , ) ,5 3 7 18 5= 4,4 |----- 5,8 2 4 4 5 8 2 5 1, , ,�� � � � ( . , ) ,2 5 1 10 2= 5,8 |----- 7,2 11 5 8 7 2 2 6 5, , ,�� � � � ( . , ) ,11 6 5 71 5= 7,2 |----- 8,6 6 7 2 8 6 2 7 9, , ,�� � � � ( . , ) ,6 7 9 47 4= 8,6 |-----| 10,0 6 8 6 10 0 2 9 3, , ,�� � � � ( . , ) ,6 9 3 55 8= Total 30 203,4 Fonte: o autor. Determinando a média, temos: X X fi n i� � . X X = = 203 4 30 6 78 , , A média da turma é 6,78, arredondando temos que a média da turma de Biomedicina é de 6,8. 82 UNICESUMAR A medida de tendência central mais conhecida e mais utilizada é a média, mas não é sempre que ela é a mais apropriada para representar os dados, às vezes, a mediana é mais adequada para representar um conjunto de dados. Isso ocorre sempre que a variabilidade dos dados for alta, pois a média é afetada por valores extremos, e a mediana não, ela apenas leva em consideração os valores centrais. Fonte: Parenti, Silva e Silveira (2017, p. 120). É importante não confundir moda com maioria. A moda é a observação mais frequente, mas isso não implica, necessariamente, que a moda corresponde à maioria das observações. (E. Z. Martines). 83 UNIDADE 3 Outra medida de posição importante é a moda. Você deve ter ouvido falar da expressão: “música que está na moda”, “roupa que está na moda”, isso significa que tem muita frequência, muitas pessoas ouvindo a mesma música, muitas pessoas usando mesmo estilo de roupa. Aqui na Bioestatística, esse conceito é bem válido. Assim, para Martinez (2015), a moda é a observação que ocorre com maior frequência no conjunto de dados, ou seja, o valor que mais se repete. Imagine que em uma loja de calçados femininos foram vendidos 20 pares de sapatos em um único dia. Os pares tinham estas numerações: 34 37 34 36 36 35 36 37 33 36 36 36 36 36 39 36 35 34 36 36 A numeração que aparece com mais frequência é o número 36. Significa que é uma informação muito importante ao gerente da loja, pois indica que ele não pode deixar de ter calçados 36 em seu estoque, porque vendem com mais frequência. Em outro exemplo, suponha que, em uma turma de 1º ano de Nutrição, as idades dos 20 alunos (em anos completos) são: 30 25 19 18 18 18 18 18 18 18 19 20 23 25 27 24 22 22 18 18 Podemos descrever, adequadamente, as idades destes alunos dizendo que a idade mais frequente, ou moda, é 18 anos. No entanto, em alguns casos, a moda pode não ser a medida mais apropriada para caracterizar os dados. Como os valores a seguir são os níveis séricos de triglicérides (em mg/dl) em uma amostra de sete pacientes: 189, 72, 109, 140, 140, 140, 135 84 UNICESUMAR A moda, neste exemplo, seria 140 mg/dl, sendo o valor mais frequente. Mas será que a moda é a medida de posição que melhor caracteriza esses dados? Talvez a média ou a mediana (que veremos a seguir) sejam mais úteis para esta finalidade. Em algumas situações, a moda pode não ser única. Por exemplo, o tempo de aleitamento materno (em meses) de 8 crianças usuárias de um serviço de saúde: 1, 2, 3, 3, 4, 6, 6 Neste exemplo, temos dois valores mais frequentes, 3 e 6 meses. Podemos dizer que se trata de uma série bimodal, ou seja, dois valores de moda. Novamente, a média ou a mediana podem ser mais úteis para descrever os dados desse exemplo. Podemos não ter moda em um conjunto de dados, caso nenhum número se repita mais vezes do que outro. Quando isso acontece, chamamos a distribuição de amodal. Se tivermos mais do que duas modas, teremos uma distribuição multimodal (PARENTI; SILVA; SILVEIRA, 2017). Em alguns casos podemos ter interesse em saber a moda, mas os dados estão apresentados em tabela, como fazer? Bem simples, basta olharmos os dados e a coluna frequência, assim, vamos encontrar a classe modal, para então sabermos a moda. Observe os dados a seguir, na Tabela 8. Tabela 8 - Notas de alunos do Curso de Nutrição Nota Número dealunos 7,0 8 8,0 12 9,0 6 10,0 4 Total 30 Fonte: o autor. Para determinar a moda em tabelas, primeiramente, procuraremos a classe modal. Para isso, basta observar na coluna que tem a maior frequência. Em nosso exemplo, a segunda classe tem doze alunos, que corresponde ao valor que aparece com mais frequência, portanto, esta é a classe modal. Em tabelas de frequências, também, podemos ter mais do que uma moda. Analise a seguir, na Tabela 9. Tabela 9 - Notas de alunos do Curso de Nutrição Nota Número de alunos 7,0 4 8,0 10 9,0 6 10,0 10 Total 30 Fonte: o autor. Classe modal Classe modal Classe modal 85 UNIDADE 3 Neste caso, as notas que aparecem com maior frequência são 8 e 10, temos uma série bimodal, ou seja, com duas modas. E quando temos dados em tabelas de frequências com intervalo de classes, como fica? Primeiro passo é localizar a classe modal, ou seja, a classe que tem a maior frequência e, em seguida, utilizar a equação a seguir: Mo Li h Fi Fi Fi Fi Fi Fi � � � � � � � � � .( ) ( ) ( ) 1 1 1 Em que: Mo = Moda Li = Limite da classe inferior (na classe modal) h = Amplitude do intervalo (distância entre Li e Ls) Fi = Frequência da classe Fi−1 = Frequência da classe anterior Fi+1 = Frequência da classe posterior Para entender melhor, vejamos o exemplo na Tabela 10. Tabela 10 - Distribuição de frequências referente às notas de alunos do Curso de Nutrição (com intervalo de classes) Notas Número de alunos (Fi) 3,0 |----- 4,4 5 4,4 |----- 5,8 2 5,8 |----- 7,2 11 7,2 |----- 8,6 6 8,6 |-----| 10,0 6 Total 30 Fonte: o autor. Determine a moda. Para calcular a moda, procuraremos, na tabela, na coluna frequências, a maior frequência para indicar a classe modal. Podemos observar que a moda está na terceira classe da tabela, mas qual a moda? Determinaremos a seguir: Mo Li h Fi Fi Fi Fi Fi Fi � � � � � � � � � .( ) ( ) ( ) 1 1 1 Mo Mo Mo � � � � � � � � � � � 5 8 1 4 11 2 11 2 11 6 5 8 1 4 9 9 5 5 8 , , .( ) ( ) ( ) , , .( ) ( ) ( ) , 112 6 14 5 8 0 9 6 7 , , , , Mo Mo � � � 86 UNICESUMAR Encontramos que a nota que representa a moda é igual a 6,7; mas os dados não foram dados em rol, com esta equação, encontramos o valor mais aproximado, observem que este valor está dentro dos valores estabelecidos nos limites inferiores e superiores. Para Parenti, Silva e Silveira (2017), a mediana é definida como sendo o valor central da distribuição dos dados ordenados, e este divide a distribuição ao meio, sendo que metade dos valores será menor ou igual à mediana, e a outra metade será maior ou igual à mediana. Até o momento, quando calculávamos a média e a moda, fazíamos, diretamente, sem ter que colocar os dados em rol, mas, para calcular a mediana, obrigatoriamente, devemos colocar os dados em rol. Supondo que temos as idades de cinco alunos do curso de Nutrição, que são dadas a seguir: 25 22 18 23 24 Encontre a mediana entre as idades dos alunos. Sabemos que a mediana divide o conjunto de dados em duas partes iguais, não seria correto fazer simplesmente assim: 25 22 18 23 24 Dessa forma está errada, pois a idade de 18 anos não é o que divide o conjunto de dados em rol, pois, na mediana, estes dados devem ser ordenados, portanto: 18 22 23 24 25 Agora, temos a mediana, que é igual à idade de 23 anos. Vejamos outro exemplo: idades (em anos) de sete pessoas estão apresentadas a seguir: 38, 40, 49, 67, 33, 57, 54 Primeiro passo: colocar os dados em rol: 33, 38, 40, 49, 54, 57, 67 Encontrando a mediana, temos: 33, 38, 40, 49, 54, 57, 67 Mediana igual a 49. Agora, representaremos, na Figura 3, para que você consiga analisar os valores antes e depois da mediana. Mediana Mediana 87 UNIDADE 3 Figura 3 - Representação na mediana / Fonte: o autor. Descrição da Imagem: a figura apresenta uma representação da mediana onde se encontra uma reta com os valo- res de dois em dois, iniciando em 30, 32, 34, 36 e terminando em 68, a mediana está representada no valor de 49, os valores estão apresentados na dispersão e marcados pontos em: 33, 38, 40, 49, 54, 57, 64 e 67. Se substituirmos a maior idade de 67 para 75 anos, o que aconteceria com a mediana? Seu valor se modificaria? O número do meio continuaria sendo 49 anos. Esta é uma característica importante da mediana: ela não é sensível a valores atípicos de nosso conjunto de dados, e entendemos por valor atípico um número bastante grande ou pequeno em relação aos demais. No cálculo da mediana, temos duas situações quando temos o conjunto de dados com números pares e ímpares. Quando tivermos um número ímpar de elementos, a mediana será exatamente o valor central. Também pode ser calculado pela equação a seguir: p n� �( )1 2 Em que: P = posição do elemento que está à mediana n = número de elementos Por exemplo: Notas de sete alunos do curso de Nutrição: 7,0 6,0 5,0 5,5 9,0 8,0 9,0 Colocando os dados em rol: 5,0 5,5 6,0 7,0 8,0 9,0 9,0 88 UNICESUMAR Utilizando a equação, temos: p n� �( )1 2 p p p � � � � ( )7 1 2 8 2 4 O ‘p’ encontrado igual a 4, não é a mediana, mas sim o valor que ocupa a posição mediana, ou seja, com os dados em rol, a mediana ocupa a 4ª posição: 5,0 5,5 6,0 7,0 8,0 9,0 9,0 1ª 2ª 3ª 4ª 5ª 6ª 7ª Podemos visualizar que a mediana é a nota 7,0, que ocupa a 4ª posição. Quando tivermos um número par de elementos, a mediana será uma média simples entre os ele- mentos que ocupam a posição central o valor central. Pode ser calculado por: p n p n 1 2 2 2 1 � � � Em que: P = posição do elemento que está à mediana n = número de elementos Por exemplo: Notas de oito alunos do curso de Nutrição: 7,0 6,0 5,0 5,5 9,0 8,0 9,0 7,5 Colocando os dados em rol: 5,0 5,5 6,0 7,0 7,5 8,0 9,0 9,0 89 UNIDADE 3 Utilizando a equação, temos: p n p n 1 2 2 2 1 � � � p posição p posição 1 2 8 2 4 8 2 1 5 � � � � � ª ª Temos: 5,0 5,5 6,0 7,0 7,5 8,0 9,0 9,0 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª Agora, tiraremos uma média simples entre o elemento que está na quarta e na quinta posição: Md Md Md � � � � ( , , ) , , 7 0 7 5 2 14 5 2 7 25 Muitas vezes, podemos ter o interesse em calcular a mediana em dados agrupados em tabelas, para isso, precisaremos que nossa Tabela 11 tenha a coluna frequência acumulada (FAC). Tabela 11 - Notas de 30 alunos do Curso de Nutrição Nota Número de alunos FAC 7,0 8 8 8,0 12 20 9,0 6 26 10,0 4 30 Total 30 Fonte: o autor. Para encontrar a mediana, como os dados já se encontram agrupados em uma tabela de frequências, por meio da coluna frequência acumulada, vamos localizar o elemento que ocupa a posição mediana, como nosso conjunto de dados é par, temos: 90 UNICESUMAR p n p n 1 2 2 2 1 � � � p posição p posição 1 2 30 2 15 30 2 1 16 � � � � � ª ª Agora com na coluna FAC, vamos localizar os elementos que ocupam a 15ª e a 16ª posição. Veja na tabela 12, a seguir: Tabela 12 - Notas de 30 alunos do Curso de Nutrição Nota Número de alunos FAC 7,0 8 8 (ocupa até a 8ª posição) 8,0 12 20 (da 9ª até 20ª) 9,0 6 26 (da 21ª até 26ª) 10,0 4 30 (da 27ª até 30ª) Total 30 Fonte: o autor. Para este caso, o elemento que ocupa a 15ª e 16ª posição está na segunda classe é a nota 8,0, portanto, a nota mediana desta turma é 8,0. E se tivesse uma nota em uma classe, e outra na classe posterior? Simples, bastaria tirar a média simples entre as duas notas. Também podemos ter interesse em calcular a mediana em uma distribuição de frequências com intervalo de classes. Para determinar a mediana, utilizamos a seguinte equação: Md Li h n Fac Fi � � � �.( )2 1 Em que: Md = Mediana Li = Limite da classe inferior (na classe mediana) h = Amplitude do intervalo (distância entre Li e Ls) n = número de elementos Fi = Frequência da classe Fac−1= Frequência acumulada da classe anterior Agora, entenderá como calcular a mediana em dados agrupados em uma distribuição de frequências comintervalo de classes. Observe na Tabela 13 a seguir. Classe mediana 91 UNIDADE 3 Tabela 13 - Distribuição de frequências referente às notas de alunos do Curso de Nutrição (com intervalo de classes) Notas Número de alunos (Fi) FAC 3,0 |----- 4,4 5 5 4,4 |----- 5,8 2 7 5,8 |----- 7,2 11 18 7,2 |----- 8,6 6 24 8,6 |-----| 10,0 6 30 Total 30 Fonte: o autor. Para resolvermos, temos primeiro que encontrar a posição mediana na coluna FAC. Como nosso conjunto de dados é par, temos: p n p n 1 2 2 2 1 � � � p posição p posição 1 2 30 2 15 30 2 1 16 � � � � � ª ª Podemos observar, na tabela, que os dados estão na 3ª classe. Trabalharemos com estes dados e subs- tituiremos na equação da mediana. Md Li h n Fac Fi � � � �.( )2 1 Md Md Md Md � � � � � � � � � 5 8 1 4 30 2 7 2 5 8 1 4 15 7 11 5 8 1 4 8 11 5 , , .( ) , , .( ) , , .( ) ,, , , , , 8 11 2 11 5 8 1 02 6 82 � � � � Md Md 92 UNICESUMAR Temos que a nota mediana da turma é igual a 6,8. Compilaremos tudo que aprendemos em uma aplicação: Em uma maternidade, a enfermeira está anotando os pesos dos recém-nascidos na manhã de um domingo, quando cinco bebês nasceram. Os dados são (em kg): 3,850 4,210 3,950 4,300 3,850 Vamos calcular as medidas de tendência central para estes dados: a) Média: X X n i� � X X X � � � � � � � 3 850 4 210 3 950 4 300 3 850 20 16 5 4 032 , , , , , , , Em média, os bebês daquela manhã de domingo pesavam 4,032 kg. b) Moda: valor que mais se repete, portanto é 3,850 kg. Assim: O valor mais frequente para o peso dos recém-nascidos naquela maternidade é de 3,850 kg. c) Mediana: colocar os dados em rol: 3,850 3,850 3,950 4,210 4,300 p n� �( )1 2 p p p � � � � ( )5 1 2 6 2 3 A mediana será o terceiro elemento do conjunto de dados ordenados. Portanto, 3,950. Assim: metade das crianças nascidas na maternidade pesava menos de 3,950kg, e a outra metade pesava mais do que 3,950 kg. 93 UNIDADE 3 Outras medidas que você pode utilizar são as separatrizes que dividirão as séries em partes iguais, e as principais são: mediana (que já estudamos), quartis, decis e percentis. Os quartis dividem uma série de dados em quatro partes iguais, assim, temos: 1º quartil, 2º quartil e 3º quartil (CRESPO, 2009). Esta representação encontra-se na Figura 4, a seguir. 25%25% 25% 25% Q1 Q2 (mediana) Q3 Figura 4 - Representação dos quartis / Fonte: o autor. A medida de tendência central mais conhecida e mais utilizada é a média, mas não é sempre que ela é a mais apropriada para representar os dados, às vezes, a mediana é mais adequada para representar um conjunto de dados. Isso ocorre sempre que a variabilidade dos dados for alta, pois a média é afetada por valores extremos, e a mediana não, ela, apenas, leva em consideração os valores centrais. Fonte: Parenti, Silva e Silveira (2017). Descrição da Imagem: a figura traz a representação dos quartis, onde se encontram Três Quartis. De cima para bai- xo, vem o primeiro Quartil (Q1), que apresenta 25% dos dados menores e 75% maiores; logo abaixo, vem o segundo Quartil (Q2), onde temos 50% dos dados menores e 50% maiores, é a medida que coincide com a mediana, e no último e terceiro Quartil (Q3) temos 75% dos dados menores e 25% maiores. 94 UNICESUMAR Assim, como pode observar na Figura 5, segundo Crespo (2009) temos os três quartis: Primeiro Quartil (Q1): temos 25% dos dados menores e 75% maiores. Segundo Quartil (Q2): temos 50% dos dados menores e 50% maiores, é a medida que coincide com a mediana. Terceiro Quartil (Q3): temos 75% dos dados menores e 25% maiores. Figura 5 - Três Quartis / Fonte: Crespo (2009). Descrição da Imagem: a figura apresenta os Três Quartis. De cima para baixo, vem o primeiro Quartil (Q1), que apre- senta 25% dos dados menores e 75% maiores; logo abaixo, vem o segundo Quartil (Q2), onde temos 50% dos dados menores e 50% maiores, é a medida que coincide com a mediana, e no último e terceiro Quartil (Q3), temos 75% dos dados menores e 25% maiores. Para calcular, é bem simples, basta organizar a série de dados em rol, e utilizar as equações a seguir: 1º Quartil (Q1): P n� �0 25 1, .( ) 2º Quartil (Q2): P n� �0 50 1, .( ) 3º Quartil (Q3): P n� �0 75 1, .( ) Por exemplo, calcularemos Q1, Q2 e Q3 para um grupo que tem idades de oito pessoas: 38, 40, 49, 67, 33, 57, 54 e 64 Primeiro passo: colocar os dados em rol. 95 UNIDADE 3 33, 38, 40, 49, 54, 57, 64, 67 a) 1º Quartil (Q1): P n� �0 25 1, .( ) P P P � � � � 0 25 8 1 0 25 9 2 25 , .( ) , . , Neste caso, o Q1, será uma média simples entre 2º e 3º elemento: Q Q Q 1 38 40 2 1 78 2 1 39 � � � � ( ) b) 2º Quartil (Q2): P n� �0 50 1, .( ) P P P � � � � 0 50 8 1 0 50 9 4 5 , .( ) , . , Neste caso, o Q2, será uma média simples entre 4º e 5º elemento: Q Q Q 2 49 54 2 1 103 2 1 51 5 � � � � ( ) , c) 3º Quartil (Q3): P n� �0 75 1, .( ) P P P � � � � 0 75 8 1 0 75 9 6 75 , .( ) , . , 96 UNICESUMAR Neste caso, o Q3 será uma média simples entre 6º e 7º elemento: Q Q Q 3 57 64 2 1 121 2 1 60 5 � � � � ( ) , Outra medida separatriz é o decil. Este divide uma série em dez partes iguais (CRESPO, 2009). As equações para calcular estão apresentadas a seguir: 1º Decil (D1): P n� �0 10 1, .( ) 2º Decil (Q2): P n� �0 20 1, .( ) 3º Decil (Q3): P n� �0 30 1, .( ) 4º Decil (Q4): P n� �0 40 1, .( ) 5º Decil (Q5): P n� �0 50 1, .( ) 6º Decil (Q6): P n� �0 60 1, .( ) 7º Decil (Q7): P n� �0 70 1, .( ) 8º Decil (Q8): P n� �0 80 1, .( ) 9º Decil (Q9): P n� �0 90 1, .( ) Por exemplo: calcular D3 e D4 e para um grupo que tem idades de oito pessoas: 38, 40, 49, 67, 33, 57, 54 e 64 Primeiro passo: colocar os dados em rol. 33, 38, 40, 49, 54, 57, 64, 67 3º Decil (D3): P n� �0 30 1, .( ) P P P � � � � 0 30 8 1 0 30 9 2 7 , .( ) , .( ) , O 3º decil será o elemento que ocupa a posição 2,7, arredondando para 3º, assim, nosso terceiro decil é igual a 40. 97 UNIDADE 3 4º Quartil (Q4): P n� �0 40 1, .( ) P P P � � � � 0 40 8 1 0 40 9 3 6 , .( ) , .( ) , O 4º decil será o elemento que ocupa a posição 3,6, arredondando para 4º, assim, nosso quarto decil é igual a 49. Como percentil, temos como definição: os noventa e nove valores que separarão uma série de dados em cem partes iguais (CRESPO, 2009). Pode ser calculado por meio das equações a seguir: 5º Percentil (P5): P n� �0 05 1, .( ) 25º Percentil (P25): P n� �0 25 1, .( ) 50º Percentil (P50): P n� �0 50 1, .( ) 75º Percentil (P75): P n� �0 75 1, .( ) 90º Percentil (P90): P n� �0 90 1, .( ) Por exemplo: calcular P50 e P75 e para um grupo que tem idades de oito pessoas: 38, 40, 49, 67, 33, 57, 54 e 64 Primeiro passo: colocar os dados em rol. 33, 38, 40, 49, 54, 57, 64, 67 50º Percentil (P50): P n� �0 50 1, .( ) P n� �0 50 1, .( ) P n P P P � � � � � � 0 50 1 0 50 8 1 0 50 9 4 5 , .( ) , .( ) , .( ) , Portanto, o P50 é igual ao elemento que está na 4,5ª posição, portanto uma média simples entre 49 e 54: ( ) , 49 54 2 103 2 51 5� � � 98 UNICESUMAR 75º Percentil (P75): P n� �0 75 1, .( ) P n P P P � � � � � � 0 75 1 0 75 8 1 0 75 9 6 75 , .( ) , .( ) , .( ) , Portanto, o P75 é igual ao elemento que está na 6,75ª posição, portanto uma média simples entre 57 e 64: ( ) , 57 64 2 121 2 60 5� � � Além das medidas separatrizes, temos as medidas de dispersão, que são importantes no processo decisório. Com as medidas de dispersão e variabilidade, é possível entender a homogeneidade ou a heterogeneidade dos dados (PARENTI; SILVA; SILVEIRA, 2017). As medidas de dispersão são avaliadas em conjunto com as medidas de tendência central. Com as medidas de dispersão, podemos analisar como os dados estão se comportando em torno da média, da moda e da mediana. É importante salientar que, apesar de dois conjuntos de dados terem a mesma média, eles podem não ter o mesmo compor- tamento e a mesma variabilidade, para isso, é importante analisaros dados e fazer estas comparações para entender o comportamento dos dados. Não podemos interpretar as medidas de tendência central isoladamente. Para verificar se as medidas de variabilidade representam bem os dados, precisamos calcular e analisar as medi- das de variabilidade. (E. Z. Martinez) Vejamos outro exemplo. Seja a estatura (em cm) observada em duas amostras de adolescentes saudáveis, denotaremos essas amostras por A e B. As estaturas dos adolescentes da amostra A são: 149 156 157 158 159 160 161 164 As estaturas dos adolescentes da amostra B são: 132 138 152 157 160 171 176 178 99 UNIDADE 3 Ao calcular a média da amostra A e B, ambas são 158 cm. As medianas de ambas as amostras (A e B) são iguais a 158,5. Assim, as amostras A e B possuem médias e medianas idênticas. Mas o fato de as amostras A e B possuírem medidas de posição iguais (média e mediana) permite-nos afirmar que adolescentes das amostras A e B são semelhantes em relação à estatura? Vejamos a Figura 6 que apresenta o grupo A e B. Figura 6 - Grupo A e B / Fonte: o autor. Descrição da Imagem: a figura faz a representação do Grupo A e B. Nestas duas imagens, apresenta-se o grupo A com valores distribuídos na reta em: 149 156 157 158 159 160 161 164, e a média representando 158; no grupo A, a figura apresenta os pontos (dados) mais próximos da média; já o grupo B com valores distribuídos na reta em: 132 138 152 157 160 171 176 178, no grupo B, a figura traz os pontos mais distantes, ou seja, mais dispersos da média, que é igual a 158. Na Figura 6, podemos observar as dispersões destas observações. Percebemos que, embora as medidas de locação sejam iguais, as amostras têm diferença quanto à dispersão dos dados. Na amostra A, as observações possuem uma dispersão menor em relação à média de 158 cm, já na amostra B, as obser- vações encontram-se mais dispersas em relação a mesma média amostral. Se dissermos somente que a média das estaturas é de 158 cm, estaremos dizendo que nossas observações amostrais flutuam em torno de 158 cm, mas não temos informação do tamanho da dispersão dos dados em relação a essa média. Com isso, podemos evidenciar que as medidas de posição (média, moda e mediana), muitas vezes, dão um resumo incompleto do comportamento de nossos dados uma vez que elas não nos dizem nada a respeito da dispersão dos dados. Assim, torna-se tão importante a apresentação de medidas de variabilidade dos dados. 100 UNICESUMAR Vamos conhecer estas medidas de dispersão? Iniciamos pela Amplitude total, de acordo com Mar- tinez (2015), a amplitude é dada pela distância entre o maior valor do conjunto de dados pelo menor valor do conjunto de dados. Assim, a amplitude total só leva em consideração os extremos, não chega a comparar os valores da distribuição com a média destes dados. É calculada pela equação a seguir: AT Xmáx Xmín� � Em que: AT = Amplitude total Xmáx = Maior valor do conjunto de dados Xmín = Menor valor do conjunto de dados Por exemplo, temos oito pessoas cujas idades são apresentadas a seguir: 38, 40, 49, 67, 33, 57, 54 e 64 A pessoa mais velha tem 64 anos, e a mais nova, 33 anos. A amplitude amostral é, portanto: AT Xmáx Xmín� � AT AT � � � 64 33 31 Podemos interpretar a AT como sendo a maior diferença que é possível encontrar entre duas quaisquer observações de nossa amostra (MARTINEZ, 2015). Assim, a AT deve ser utilizada com certa cautela para descrever a amplitude de nossos dados, dado que ela é, fortemente, influenciada por valores atí- picos, sendo não recomendado seu uso sozinha para interpretação de variabilidade dos dados. Outra medida de dispersão é a variância, calculada com todos os dados da série e comparada cada um deles com a média. A variância mede a distância de cada um dos valores em relação à média (MARTINEZ, 2015). Por uma questão matemática, precisamos elevar ao quadrado cada uma dessas distâncias para podermos eliminar o sinal. Depois disso, fazemos a média dos quadrados destas dife- renças. Lembre-se de que não teremos variância negativa, certo? Caso a variância esteja sendo calculada para os dados de uma população, representaremos este valor pela letra grega sigma ao quadrado σ2. Em vez de dividirmos por n-1, dividimos o somatório por N, sendo que n é o número de elementos da amostra, e N é o número de elementos da população. A variância populacional e amostral é calculada por: a) Variância Populacional σ µ2 2 � �� ( )X N i 101 UNIDADE 3 Em que: s2 = Variância Populacional Xi = Cada valor/elemento µ = média populacional N = Número de elementos Σ = Somatória b) Variância Amostral S X X n i2 2 1 � � � � ( ) Em que: S2 = Variância Amostral Xi = Cada valor/elemento X = média amostral n −1= Número de elementos (menos 1) Σ = Somatória Como você pode observar, a única diferença na prática do cálculo da variância populacional e amostral é que, na variância amostral, tiraremos um elemento na hora de fazer a divisão. É válido lembrar que, na maioria das situações, utilizamos amostras, por questão de custo, da forma de coletar, entre outros. Entenderá na prática. Temos oito pessoas cujas idades são apresentadas a seguir: 38, 40, 49, 67, 33, 57, 54 e 64 Determinaremos a variância amostral. Lembrando que precisaremos da média para calcular a variância. a) A média amostral X X n i� � X X � � � � � � � � � � 38 40 49 67 33 57 54 64 8 402 8 50 25, 102 UNICESUMAR Agora que relembramos a média, calcularemos a variância amostral, substituindo os valores na equação: S X X n i2 2 1 � � � � ( ) S2 2 2 2 238 50 25 40 50 25 49 50 25 67 50 25 33 50 � � � � � � � � � �( , ) ( , ) ( , ) ( , ) ( ,225 57 50 25 54 50 25 64 50 25 8 1 12 25 2 2 2 2 2 2 ) ( , ) ( , ) ( , ) ( , ) ( � � � � � � � � � �S �� � � � � � � � �10 25 1 25 16 75 17 25 6 75 3 75 13 2 2 2 2 2 2, ) ( , ) ( , ) ( , ) ( , ) ( , ) ( ,775 7 150 06 105 06 1 56 280 56 297 56 45 56 2 2 ) ( , ) ( , ) ( , ) ( , ) ( , ) ( ,S � � � � � � )) ( , ) ( , ) . , , � � � � 14 06 189 06 7 1 083 48 7 154 78 2 2 S S Como você pode observar, a variância calcula a soma dos quadrados das distâncias em relação à média. Como elevamos todos os termos ao quadrado, a nossa unidade de medida também fica alterada. Se, por exemplo, estivermos calculando a variância da altura de alunos do curso de Ciências Biológicas, e a medida está em cm, todos os elementos determinados estarão em cm2. Sendo assim, nós não podemos comparar a variância, diretamente, com a média ou com outras medidas, pois precisaremos extrair a raiz da variância, e a isso denominamos desvio padrão. Como desvio padrão é a raiz quadrada da variância, calculamos pela equação a seguir: a) Desvio padrão populacional: s s= 2 Em que: s = desvio padrão Populacional s2 = variância populacional b) Desvio padrão amostral: S S= 2 Em que: S = desvio padrão amostral S2= variância amostral Determinando o desvio padrão, do exercício anterior, temos: 103 UNIDADE 3 S S= 2 S S = = 154 78 12 44 , , A variabilidade entre as idades do grupo analisado é de 12,44 anos. Se quisermos comparar a variabilidade de duas ou mais amostras (ou populações), para Parenti, Silva e Silveira (2017), podemos fazer esta comparação somente com o uso do desvio padrão. Mas podemos comparar utilizando o coeficiente de variação, que nos dará em percentual a variabilidade dos dados, determinado por: a) Coeficiente de variação (populacional): CV (%) .� � � � � � � σ µ 100 Em que: CV% = Coeficiente de variação σ = desvio padrão populacional µ = média populacional b) Coeficiente de variação (amostral): CV S X (%) .� � � � � � � 100 CV% = Coeficiente de variação S = desvio padrão amostral X = média amostral Determinando o CV% amostral do exercício anterior, temos: CV S X (%) .� � � � � � � 100 CV CV CV (%) , , . (%) , . (%) , % � � � � � � � � � � � 12 44 50 25 100 0 2475 100 24 75 104 UNICESUMAR Quandoutilizado o coeficiente de variação, sempre que quisermos descobrir qual grupo de dados é mais homogêneo, ou seja, que tem menor variabilidade em torno da média, optaremos pelo grupo que tiver o menor percentual do coeficiente de variação, pois, se o CV(%) for muito elevado, pode ser que a média não seja melhor medida para representar os dados, devido à variabilidade em torno dela (MARTINEZ, 2015). Supondo que, no curso de Ciências Biológicas, a média da turma A, na disciplina de Bioestatística, é 6,5, e o desvio padrão 1,2, e, na turma B, a média é de 6,8, e o desvio padrão é de 2,0, qual das duas turmas tem menor variabilidade dos dados? Determine, por meio do Coeficiente de variação. Para resolução, basta observar que já temos a média calculada e o desvio padrão também, é, simplesmen- te, calcularmos o CV (%). Para turma A, temos: CV S X (%) .� � � � � � � 100 CV CV CV (%) , , . (%) , . (%) , % � � � � � � � � � 1 2 6 5 100 0 1846 100 18 46 Já para turma B, temos: CV S X (%) .� � � � � � � 100 CV CV CV (%) , , . (%) , . (%) , % � � � � � � � � � 2 0 6 8 100 0 2941 100 29 41 Portanto, a turma que tem uma variabilidade menor é a turma A, em que o CV foi de 18,46%. 105 UNIDADE 3 Observe um resumo dos cinco passos para o Cálculo do Coefi- ciente de Variação. Seguindo este passo a passo, temos o exemplo na Figura 7. 1. Calcular a média 2. Calcular a média 3. Calcular desvio padrão 4. Calcular coe�ciente de variação 5. Interpretar: conjunto de dados homogêneos ou heterogêneos. Figura 7 - Passos para cálculo do coeficiente de variação / Fonte: o autor. Descrição da Imagem: na figura, apresentam-se os cinco passos para cálculo do coeficiente de variação. Apresentamos uma sequência desses passos. No primeiro passo, temos o cálculo da média, no segundo passo, a determinação do cálculo da variância; o terceiro passo, o cálculo do desvio padrão; no quarto passo, temos o cálculo do coeficiente de variação, e no quinto passo, interpretamos o resultado: conjunto de dados homogêneos ou heterogêneos. 106 UNICESUMAR Também podemos ter interesse em calcular: variância, desvio padrão, em dados que aparecem em tabelas de frequências. Vejamos a seguir: a) Cálculo das medidas de variabilidade em tabelas de frequências sem intervalo de classes: as notas de 30 alunos do curso de Ciências Biológicas estão apresentadas na distribuição de frequências a seguir: Tabela 14 - Notas de 30 alunos do Curso de Ciências Biológicas Nota Número de alunos 7,0 8 8,0 12 9,0 6 10,0 4 Total 30 Fonte: o autor. O primeiro passo é sabermos a média, antes de calcular a variância amostral, para isso, temos: X X fi n i� � . X X X X � � � � � � � � � � ( . ) ( . ) ( . ) ( . ) , 7 8 8 12 9 6 10 4 30 56 96 54 40 30 246 30 8 2 Agora que já sabemos a média, utilizaremos a equação a seguir: S X X fi n i2 2 1 � � � � ( ) . Em que: S2 = Variância Amostral Xi = Cada valor/elemento X = média amostral n −1= Número de elementos (menos 1) Σ = Somatória Fi = frequência 107 UNIDADE 3 Para facilitar nosso cálculo, abriremos uma coluna a mais em nossa distribuição de frequência e inse- riremos o numerador da equação da variância, conforme Tabela 15. Tabela 15 - Notas de 30 alunos do Curso de Ciências Biológicas Nota Número de alunos ( ) .X X fii � 2 7,0 8 ( , , ) . ,7 0 8 2 8 11 522� � 8,0 12 ( , , ) . ,8 0 8 2 12 0 482� � 9,0 6 ( , , ) . ,9 0 8 2 6 3 842� � 10,0 4 ( , , ) . ,10 0 8 2 4 12 962� � Total 30 28,3 Fonte: o autor. Com os dados da somatória de ( ) .X X fii − 2 , substituiremos na equação: S X X fi n i2 2 1 � � � � ( ) . Agora que temos o resultado e substituindo o valor “28,3” encontrado na tabela, por meio da coluna ( ) .X X fii − 2 , temos: S S S 2 2 2 28 3 30 1 28 3 29 0 9759 � � � � , , , Com o resultado da variância, conseguimos calcular o desvio padrão: S S= 2 S S = = 0 9759 0 9878 , , Podemos calcular o coeficiente de variação: CV S X (%) .� � � � � � � 100 108 UNICESUMAR CV CV CV (%) , , . (%) , . (%) , % � � � � � � � � � 0 9878 8 2 100 0 1205 100 12 05 b) Cálculo das medidas de variabilidade em tabelas de frequências com intervalo de classes: As notas dos alunos de uma turma de Ciências Biológicas estão apresentadas na tabela a seguir. Determine o CV. Tabela 16 - Distribuição de frequências referente às notas de alunos do Curso de Ciências Biológicas (com intervalo de classes) Notas Número de alunos (Fi) Ponto médio (xi) 3,0 |----- 4,4 5 3 0 4 4 2 3 7, , ,�� � � � 4,4 |----- 5,8 2 4 4 5 8 2 5 1, , ,�� � � � 5,8 |----- 7,2 11 5 8 7 2 2 6 5, , ,�� � � � 7,2 |----- 8,6 6 7 2 8 6 2 7 9, , ,�� � � � 8,6 |-----| 10,0 6 8 6 10 0 2 9 3, , ,�� � � � Total 30 Fonte: o autor. Para isso, calcularemos na sequência: 1. Média amostral. 2. Variância amostral. 3. Desvio padrão amoral. 4. Coeficiente de variação. Iniciaremos calculando a variância amostral. Assim, para o seu cálculo, a equação utilizada para tabelas sem ou com intervalo de classes, é a mesma que acabamos de ver. A única diferença na prática é que: em uma distribuição de frequências com intervalo de classes, nosso “Xi” será o ponto médio, e não simplesmente a variável estudada. Lembre-se de que o ponto médio é fundamental para se calcular a média desse tipo de distribuição de frequência. Calculando a média amostral, temos: 109 UNIDADE 3 Tabela 17 - Distribuição de frequências referente às notas de alunos do Curso de Ciências Biológicas (com intervalo de classes) Notas Número de alunos (Fi) Ponto médio (xi) xi.fi 3,0 |----- 4,4 5 3 0 4 4 2 3 7, , ,�� � � � ( . , ) ,5 3 7 18 5= 4,4 |----- 5,8 2 4 4 5 8 2 5 1, , ,�� � � � ( . , ) ,2 5 1 10 2= 5,8 |----- 7,2 11 5 8 7 2 2 6 5, , ,�� � � � ( . , ) ,11 6 5 71 5= 7,2 |----- 8,6 6 7 2 8 6 2 7 9, , ,�� � � � ( . , ) ,6 7 9 47 4= 8,6 |-----| 10,0 6 8 6 10 0 2 9 3, , ,�� � � � ( . , ) ,6 9 3 55 8= Total 30 203,4 Fonte: o autor. Determinando a média, temos: X X fi n i� � . X X = = 203 4 30 6 78 , , Arredondando, temos que a média da turma de Ciências Biológicas é de 6,8. Com o resultado da mé- dia, vamos reescrever a tabela, para determinar a variância amostral, para utilizar a equação a seguir: S X X fi n i2 2 1 � � � � ( ) . Com a tabela ajustada, temos: Tabela 18 - Distribuição de frequências referente às notas de alunos do curso de Ciências Biológicas (com intervalo de classes) Notas Número de alunos (Fi) Ponto médio (xi) ( ) .X X fii � 2 3,0 |----- 4,4 5 3 7, ( , , ) . ,3 7 6 8 5 48 052� � 4,4 |----- 5,8 2 5 1, ( , , ) . ,5 1 6 8 2 5 782� � 5,8 |----- 7,2 11 6 5, ( , , ) . ,6 5 6 8 11 0 992� � 7,2 |----- 8,6 6 7 9, ( , , ) . ,7 9 6 8 6 7 262� � 8,6 |-----| 10,0 6 9 3, ( , , ) . ,9 3 6 8 6 37 52� � Total 30 99,58 Fonte: o autor. 110 UNICESUMAR Agora que calculamos a variância na tabela, é só substituir na equação: S X X fi n i2 2 1 � � � � ( ) . Substituindo, na equação, pelos valores encontrados na Tabela 18, temos: S S S 2 2 2 99 58 30 1 99 58 29 34 34 � � � � , , , Logo após, determinaremos o desvio padrão: S S= 2 S S = = 34 34 5 86 , , Agora, com o desvio padrão, podemos calcular o CV(%): CV S X (%) .� � � � � � � 100 CV CV CV (%) , , . (%) , . (%) , % � � � � � � � � � 5 86 6 8 100 0 8671 100 86 71 No caso desta turma, com um coeficiente de variação de 86,71%, podemos concluir que há uma dis- persão muito grande das notas, e que a média pode não ser a medida ideal para interpretar estes dados. Mas quando olhamos para os dados com mais cautela, temos alunos que tiraram 3,0; 4,0; 5,0; 10. E o que isso quer dizer? Como conclusão, temos que essa turma apresenta uma grande dispersão no quesito nota, porque o resultado encontrado de 86,71% é superior a 50%. Isso quer dizer que existem alunos que estão indo bem na disciplina, mas também existem alunos que não estão aprendendo. Assim, podemos refletir: com tanta dispersão, o que posso melhorar para que todostenham um aprendizado? As medidas de dispersão podem ajudar neste caminho. Agora que temos os dados em mãos, podemos trabalhar para melhorar a maneira de ensinar nesta turma. 111 UNIDADE 3 Caro(a) estudante, finalizamos esta unidade compreendendo o processo pelo qual as medidas de posi- ção, as separatrizes e a dispersão podem ajudar a trabalhar melhor com os dados e auxiliar no processo decisório. Como educadores e profissionais da saúde, temos que ter a consciência da importância da Bioestatística, pois, como vimos, ela traz a preocupação de entender como os dados podem trazer indicativos para um professor em sala de aula. A partir das medidas de posição, você conseguirá trabalhar com seus dados, entendendo o com- portamento dos mesmos, e com as medidas de dispersão, como você percebeu, conseguimos entender se a média é representativa, ou não, para o conjunto de dados. Dentro da Bioestatística, você poderá observar os resultados de sua pesquisa sendo uma ferramenta, essencial para a tomada de decisões, e que estará presente no seu futuro profissional. Você sabia que um profissional da área de Biológicas ou da Saúde, também, pode ser um pesquisador? Pode pesquisar na área de meio ambiente, saúde, laboratorial, e é vasto o campo para esse profis- sional. Nossa Roda de Conversa trará como as medidas de posição e dispersão podem ajudar na interpretação de resultados em uma pesquisa. Assista e replique em sala de aula. Vamos lá? Você sabia que a área da Biologia, além das questões ambientais, educacionais, engloba a área da saúde? Assim, você pode consultar periódicos com aplicação da Bioestatística, e convido a fazer as lei- turas dos artigos, a seguir: Para acessar, use seu leitor de QR Code. Artigo 1 Artigo 2 https://apigame.unicesumar.edu.br/qrcode/8460 https://apigame.unicesumar.edu.br/qrcode/8454 https://apigame.unicesumar.edu.br/qrcode/8453 112 A G O R A É C O M V O C Ê 1. Um profissional de Ciências Biológicas que atua em um laboratório fará uma compra de um componente específico de para uma análise laboratorial, para isso, fez uma pesquisa com dois fornecedores diferentes. Para comparar o nível de impurezas presentes nas compras feitas aos dois fornecedores, o biólogo solicitou a medição de porcentagem de impurezas presentes em cada um dos grupos, obtendo o que segue resultado: Fornecedor A: 1,8 2,5 1,5 1,2 1,0 Fornecedor B: 1,6 2,5 1,2 2,3 1,5 Para saber qual dos fornecedores traz mais impurezas, o biólogo utilizou uma medida que estudou na disciplina de Bioestatística, o coeficiente de variação. Os resultados do C.V. (%) foram: 37% para o fornecedor A, e 30% para o fornecedor B. Mediante os resultados obtidos, analise as afirmativas a seguir. I) O fornecedor A apresenta uma maior dispersão, por isso, terá a preferência de compra pelo biólogo. II) O fornecedor B apresenta uma menor dispersão de impureza, por isso, é mais uni- forme às impurezas. III) Por meio do coeficiente de variação, conseguimos medir qual dos fornecedores traz uma menor impureza, e isso pode influenciar na aquisição do material. É correto o que se afirma em: a) I, apenas. b) I e II, apenas. c) I e III, apenas. d) II e III, apenas. e) I, II e III. 2. A tabela a seguir apresenta o tempo de duração (em dias) para se realizar análises de água. Os laboratórios estão credenciados em uma cidade no estado do Paraná. Tabela 1 - Duração de análises de água Tempo (dias) Nº de análises (Fi) Fac 4 |---- 6 20 20 6 |---- 8 3 23 8 |---- 10 7 30 Total 30 Fonte: o autor. 113 A G O R A É C O M V O C Ê Considerando esta informação, a mediana é igual a: a) 1,2. b) 3,2. c) 4,9. d) 5,5. e) 6,7 3. Um Biólogo fez pesquisa em site de uma revista e perguntou sobre as áreas da biologia de que os profissionais mais gostavam. Os participantes eram internautas e responde- ram, voluntariamente, a pergunta. As respostas estão apresentadas na Tabela a seguir. Tabela 2 - Áreas da Biologia Áreas Número de respostas Educação Ambiental 24 Anatomia 23 Botânica 10 Fisiologia 7 Bioquímica 36 Total 100 Fonte: o autor. Com base nesta pesquisa, a área da Biologia que representa a moda é: a) Educação Ambiental. b) Anatomia. c) Botânica. d) Fisiologia. e) Bioquímica. 4. As notas obtidas por 20 alunos do curso de Ciências Biológicas, na disciplina de Bioes- tatística, estão apresentadas na Tabela a seguir: Tabela 3 - Nota dos 20 estudantes na disciplina de Estatística Notas Frequência (Fi) 4 1 5 1 6 3 8 12 9 3 Total 20 Fonte: o autor. 114 A G O R A É C O M V O C Ê Diante destas informações, a média dessa turma foi igual a: a) 5,9. b) 6,7. c) 7,5. d) 7,9. e) 8,3. 5. Um professor de Ciências Biológicas está realizando um trabalho de Educação Ambien- tal voltado à prevenção da dengue. Depois de realizar as coletas de dados, as ações preventivas foram feitas e, para finalizar seu relatório, o professor fez uma pesquisa com 400 moradores de um bairro com o objetivo de saber o grau de satisfação dos moradores com o resultado do trabalho dele e de seus alunos. Os resultados estão apresentados na tabela a seguir. Tabela 4 - Satisfação dos moradores junto ao Projeto de Educação Ambiental Grau de satisfação dos moradores Frequência (Fi) Muito insatisfeito 12 Insatisfeito 45 Satisfeito 173 Bastante Satisfeito 170 Total 400 Fonte: o autor. A classe modal da pesquisa de moradores consiste na: a) Primeira classe. b) Segunda classe. c) Terceira classe. d) Quarta classe. e) O conjunto de dados é amodal. 115 M EU E SP A Ç O 116 M EU E SP A Ç O 4 Olá, aluno(a), nesta unidade, trabalharemos com a correlação e a regressão linear, em que duas variáveis são analisadas (X e Y), assim, poderemos verificar se existe uma relação entre elas (correlação) e faremos o ajuste da reta (regressão), estimando valores. Além disso, trabalharemos com um assunto muito importante para sua forma- ção: a inferência estatística, que visa, por meio de testes, analisar uma amostra e fazer projeções para a população. Correlação Regressão Linear e Inferência Estatística Me. Renata Cristina Souza Chatalov 118 UNICESUMAR Ao iniciar a leitura deste material, você pode já se perguntar: porque estudar correlação e regressão linear? Terei que fazer estimações de y a partir de x conhecido? Para que fazer um teste de hipóteses? Quando você estuda um comportamento conhecido e pode fazer estimações ou testar uma amostra, estará, certamente, utilizando uma técnica importante que será trabalhada aqui em Bioestatística. A correlação e a regressão linear ajudarão você a mensurar a força da relação entre X e Y, e a reta de regressão linear, você poderá fazer estimativas para Y a partir de X conhecido e, com isso, poderá trabalhar dentro de um modelo matemático conhecido, que ajudará em sua pesquisa. Já a inferência estatística trata-se de um conjunto de técnicas que tem por objetivo principal analisar uma população, por meio de evidências de uma amostra, para isso, temos: teste de hipóteses e intervalo de con- fiança, que estudaremos. Convido a fazer a leitura do artigo, acessando o qrcode: Assim, convido você a fazer um levantamento de artigos, reportagens, que tragam situações envolvendo correlação linear, regressão linear e inferência estatística. Faça um compilado e comece a identificar que os testes de hipóteses poderão ajudá-lo na tomada de decisões. E aí, conseguiu fazer o experimento sugerido? Anote todas suas primeiras impressões até o momento, escreva os resultados de sua pesquisa aqui no Diário de Bordo. Este espaço é seu! DIÁRIO DE BORDO https://apigame.unicesumar.edu.br/qrcode/8498 119 UNIDADE 4 Agora, partindo para a conceitualização da última unidade, avaliaremos se há uma associação entre duas variáveis com características quantitativas, que é objetivo de inúmeros estudos em ciências bio- lógicas e/ou da saúde. Por exemplo: um biomédico pode ter interesse se há relação entre a quantidadede chumbo em medida na água e no volume de efluentes despejados em certo rio; um profissional da área da saúde pode querer saber se existe relação entre a pressão arterial e idade das pessoas; um professor pode querer saber a relação entre peso e altura, e assim por diante. Quando existe a necessidade de analisar a relação entre essas duas variáveis, chamamos de correlação. Vejamos um exemplo: um professor de enfermagem deseja saber se existe correlação entre o tempo dedicado ao estudo e o desempenho dos alunos na disciplina Bioestatística. Assim, ele selecionou oito alunos, assim, podemos observar o número de horas (x) e nota obtida na prova de Bioestatística (y) para cada aluno(a). Tabela 1 - Relação entre as horas de estudo e nota na disciplina de Bioestatística Acadêmico Horas de Estudo (x) Nota em Bioestatística (y) A 8 10 B 8 8 C 6 4 D 5 8 E 4 6 F 7 9 G 5 7 H 1 2 Fonte: o autor. Descrição da Imagem: a figura mostra um gráfico de dispersão em que o eixo (X) está na horizontal, representando as horas de estudo dos alunos; no eixo Y, que está na vertical, temos as notas distribuídas dos oitos alunos. 120 UNICESUMAR Se fosse perguntado a você, neste momento: existe uma relação entre as horas de estudo e nota da prova? Ao observar a Tabela 1, você conseguiria responder com facilidade? Provavelmente, não. Por quê? Fica difícil concluir algo somente observando a tabela, pois temos grande variação nos dados. Por isso, o primeiro passo é tentar organizar esses dados em um gráfico para visualizar melhor a relação entre as variáveis X e Y. Para analisarmos se há correlação entre as variáveis X e Y, inicialmente, os dados são representados em um gráfico cartesiano de pontos, que chamamos de diagrama de dispersão. Cada ponto do gráfico corresponde a um aluno e é marcado segundo seu valor para X e para Y (Figura 1). Figura 1 - Gráfico de dispersão sobre a relação entre horas de estudo (X) e nota na disciplina de bioestatística (y) / Fonte: o autor. Analisando a Figura 1, podemos observar que os alunos que se dedicaram estudando por mais horas tiveram um desempenho melhor, e os que dedicaram menos horas ao estudo, a ter um desempenho pior na prova. Entretanto podemos observar que temos algumas exceções, como o aluno “C” que se dedicou horas de estudo e sua nota foi 4. Isso significa que, embora pareça existir uma correlação entre estas duas variáveis, ela não é perfeita. Para sabermos com mais precisão, existe outra maneira, que é avaliar a correlação e usar um coe- ficiente, que tem a vantagem de ser um valor numérico. Descrição da Imagem: na figura, temos um gráfico de dispersão em que o eixo (X) está na horizontal, e o eixo Y está na vertical, ao observar a dispersão, pode-se visualizar uma reta no sentido crescente, porque r = +1. 121 UNIDADE 4 “ O coeficiente de correlação produto-momento (r) é uma medida da intensidade de associação existente entre duas variáveis quantitativas, e sua fórmula de cálculo foi proposta por Karl Pearson em 1896. Por essa razão, é também denominado coeficiente de correlação de Pearson. Por ter sido o primeiro a ser proposto (vários outros foram criados depois), muitas vezes r recebe simplesmente nome de coeficiente de correlação (MARTINEZ, 2015, p. 85). O coeficiente de correlação pode variar entre -1 e +1. Quando temos valores negativos de r, temos cor- relação do tipo inversa, ou seja, à medida que X aumenta Y diminui. Já quando temos valores positivos para r ocorrem quando a correlação é direta, ou seja, X e Y variam no mesmo sentido. Por exemplo, temos que as taxas sanguíneas de insulina e glicose apresentam correlação negativa; enquanto a taxa do hormônio glucagônio tem correlação positiva com a glicemia (MARTINEZ, 2015). É importante salientar que, quando temos uma correlação linear negativa, não significa que é uma correlação ruim, apenas o sentido do gráfico será decrescente. O valor máximo (tanto r = +1 como r = -1) é obtido quando todos os pontos do diagrama estão em uma linha reta inclinada. Quando temos uma correlação linear igual a r +1, significa que temos uma correlação linear perfeita e positiva, como você pode observar na Figura 2. Figura 2 - Correlação quando r = +1 / Fonte: o autor. Descrição da Imagem: na figura, temos um gráfico de dispersão em que o eixo (X) está na horizontal e o eixo Y está na vertical, ao observar a dispersão, pode-se visualizar uma reta no sentido decrescente, à medida que x cresce y decresce, pois r = -1. Descrição da Imagem: na figura, há um gráfico de dispersão em que o eixo (X) está na horizontal, e o eixo Y está na vertical; ao observar a dispersão, podemos observar que a figura não tem uma reta crescente nem decrescente, pois o r é igual a 0,09. 122 UNICESUMAR Quando temos uma correlação linear igual r -1, significa que temos uma correlação linear perfeita e negativa, como você pode observar na Figura 3. Figura 3 - Correlação quando r = -1 / Fonte: o autor. Por outro lado, quando não existe correlação entre X e Y, os pontos se distribuem de maneira que não temos uma relação, podendo ser em formato de nuvens circulares ou formatos não definidos, não tendo uma tendência crescente ou decrescente (Figura 4). Figura 4 - Correlação quando r = 0,09 / Fonte: o autor. Descrição da Imagem: na figura, há um gráfico de dispersão em que o eixo (X) está na horizontal e o eixo Y está na vertical, ao observar a dispersão, temos que os dados estão dispersos, mas tem uma tendência crescente, pois o r é igual a 0,65. Descrição da Imagem: a figura apresenta um gráfico de dispersão em que o eixo (X) está na horizontal, e o eixo Y está na vertical; ao observar a dispersão, temos que os dados estão dispersos, mas tem uma leve tendência crescente, pois o r é igual a 0,55. 123 UNIDADE 4 As associações (X e Y) de grau intermediário (r entre 0 e |1|) apresentam-se como nuvens inclinadas, de forma elíptica, como podemos observar na Figura 5. Figura 5 - Correlação quando r = 0,65 / Fonte: o autor. O que significa, então, esses valores de r? Observe a Figura 6 a seguir, que traz uma correlação igual a r = 0,56. Figura 6 - Correlação quando r = 0,55 / Fonte: o autor. Descrição da Imagem: a figura apresenta uma reta que tem nove barras (na vertical), iniciando o traço em -1, -8, -0,5, -,02, 0, 0,2, 0,5 0,8 e +1. 124 UNICESUMAR O que significa, então, o valor 0,55 encontrado? Assim, o coeficiente de correlação nunca será maior que 1 nem menor que –1. Dessa maneira, os valores de r iguais a zero evidenciam que não há asso- ciação entre as variáveis X e Y. Enquanto valores próximos a zero (sejam eles negativos ou positivos) indicam uma correlação muito fraca entre as variáveis, os valores de r próximos a –1 ou a 1 indicam associações fortes entre X e Y. Portanto, o valor r = 0,588 indica uma correlação fraca ou forte? Apesar de uma boa resposta a esta pergunta subjetiva, para nos embasar, temos autores, livros, textos, artigos científicos para nos ajudar a interpretar a magnitude de um coeficiente de correlação. Segundo Zou et al. (2003) a proposta para interpretação do coeficiente de correlação linear (r) pode ser observada no Quadro 1. Quadro 1 - Interpretação do coeficiente de correlação linear Valor do coeficiente de correlação linear (r) Direção e força da associação -1,0 Perfeita e negativa -0,8 Forte e negativa -0,5 Moderada e negativa -0,2 Fraca e negativa 0 Ausência de associativa 0,2 Fraca e positiva 0,5 Moderada e positiva 0,8 Forte e positiva 1,0 Perfeita e positiva Fonte: adaptado de Zou et al. (2003). Zou et al. (2003) interpretam o sinal do coeficiente de correlação como a direção da associação. Os coeficientes de correlação linear que são maiores do que zero apresentam correlações positivas (quanto maior X, maior Y), e coeficientes menores que zero indicam correlações negativas (quanto maior X, menor Y). Já a correlação igual a zero indica que não existe uma correlação linear. É importante salientar que a interpretaçãode r pode variar de acordo com a experiência de au- tores, principalmente as intermediárias (-0,8, 0,5, -0,2, -0,3 e outros), o que não muda é que +1 e -1 são correlações perfeitas e zero não há correlação linear. Para facilitar nosso entendimento, analise na Figura 7 que quanto mais próximo aos extremos (-1 e +1) mais forte é a correlação, e, à medida que se aproxima de zero, a correlação vai ficando mais fraca. Figura 7 - Correlação quando r = 0,55 / Fonte: o autor. 125 UNIDADE 4 Então, podemos concluir que uma correlação igual a -0,90 é mais forte do que uma correlação igual a 0,40? Sim, porque -0,90 está mais próximo de -1, e 0,40 está mais próximo de zero. Mas como encontramos o coeficiente de correlação de Pearson? É representada pela letra “r” e determinado pela seguinte equação: r x y x y n x x n y y n � � � � � � � � � � � � � � � � � � � � ��� �� �� . ( ).( ) ( ) . ( )2 2 2 2 Em que: r = Coeficiente de correlação de Pearson (a ser encontrado) ∑x = valores da somatória da variável x ∑y = valores da somatória da variável y ∑x.y = valores da somatória da variável x multiplicado pela variável y ∑x2 = valores da somatória da variável x ao quadrado ∑y2 = valores da somatória da variável y ao quadrado Agora que temos a equação que determina o coeficiente de Pearson, vimos que se trata de uma equação bem complexa, mas fique tranquilo(a), querido(a) aluno(a), resolveremos juntos o passo a passo. Vejamos um exemplo: um professor de ciências biológicas deseja saber se existe correlação entre o tempo dedicado ao estudo e o desempenho dos alunos na disciplina de Bioestatística. Assim, ele selecionou oito alunos, assim, podemos observar o número de horas (X) e a nota obtida na prova de Bioestatística (Y) para cada aluno. A existência de uma correlação baixa, entretanto, não deve conduzir ao descarte das variáveis de estudo. Um coeficiente de correlação linear bai- xo indica apenas que não há uma grande semelhança de comportamento linear entre as variáveis do estudo. Assim, devem-se estudar outros tipos de relações entre elas. (E. Z. Martinez) 126 UNICESUMAR Tabela 2 - Relação entre as horas de estudo e nota na disciplina de Bioestatística Acadêmico Horas de Estudo (x) Nota em Bioestatística (y) A 8 10 B 8 8 C 6 4 D 5 8 E 4 6 F 7 9 G 5 7 H 1 2 Fonte: o autor. Para facilitar nosso cálculo, você deve ter percebido que vamos precisar elevar todos os valores de X ao quadrado, todos os valores de Y ao quadrado e somar tudo isso, então, vamos reescrever a tabela, com essas colunas. Observe a seguir (Tabela 3): Tabela 3 - Relação entre as horas de estudo e nota na disciplina de Bioestatística Acadêmico Horas de Estudo (x) Nota em Bioestatística (y) x2 y2 x.y A 8 10 64 100 80 B 8 8 64 64 64 C 6 4 36 16 24 D 5 8 25 64 40 E 4 6 16 36 24 F 7 9 49 81 63 G 5 7 25 49 35 H 1 2 1 4 2 TOTAL 44 54 280 414 332 Fonte: o autor. Agora que temos o total e já determinamos os valores que precisamos, faremos a substituição na equa- ção para determinar o coeficiente de Pearson. r x y x y n x x n y y n � � � � � � � � � � � � � � � � � � � � ��� �� �� . ( ).( ) ( ) . ( )2 2 2 2 Substituindo os valores na equação, temos: 127 UNIDADE 4 r r � � � � � � � � � � � � � � � � � � � � � � �332 44 548 280 44 8 414 54 8 332 2 2 ( . ) ( ) . ( ) (( . ) . . . 2 376 8 280 1 936 8 414 2 916 8 332 297 280 24 � �� �� � �� �� �� � �� � � � r 22 414 364 5 35 38 49 5 35 1 881 35 43 37 0 81 � � �� � � � � � � � � � . , . , . , , r r r r Portanto, existe uma correlação linear e forte entre as horas de estudo (x) e a nota na prova de B0ioes- tatística (y) uma vez que o valor encontrado de r é igual a 0,81. Você achou complicado utilizar esta equação? Ajudaremos com uma maneira simples, em que você consegue tirar a prova real utilizando o Microsoft Excel®, mas lembre-se, agora você está em processo de aprendizagem e, ao fazer cálculos passo a passo da forma algébrica, você estará exercitando seu raciocínio lógico, isso ajudará você na tomada de decisões. Utilizando o Microsoft Excel®, basta reescrever a tabela na planilha, vá em inserir função – Estatística – Correl, onde abrirá para você a função = correl, em seguida, no item matriz um, selecione todas as notas da variável X (sem cabeçalho e total), clique em matriz 2 e selecione todas as notas da variável Y (sem cabeçalho e total). Descrição da Imagem: a figura apresenta um gráfico de dispersão em que o eixo (X) está na horizontal representando as horas de estudo dos alunos; no eixo Y, que está na vertical, temos as notas distribuídas dos oitos alunos. 128 UNICESUMAR Quando falamos em relações lineares entre as variáveis X e Y, significa que, ao utilizarmos o coeficien- te de correlação de Pearson, estamos nos referindo a uma situação em que uma variável é, direta ou inversamente, proporcional a outra (CRESPO, 2009). Vimos em nosso exemplo, que quanto às horas dedicadas a estudos tem uma relação forte com a nota da disciplina de Bioestatística. Portanto, é de fundamental importância construir um gráfico de dispersão entre as variáveis antes de calcularmos o coeficiente de correlação (que já fizemos anteriormente, na Figura 7), e, então, observarmos se é realmente adequado utilizarmos essa medida de associação. Figura 8 - Gráfico de dispersão sobre a relação entre horas de estudo (X) e nota na disciplina de Bioestatística (Y) / Fonte: o autor. Se a dispersão que é apresentada no gráfico permite visualizar uma reta imaginária passando pelos pontos, entendemos que há a sugestão de uma relação linear (ainda que essa reta tenha uma inclina- ção pequena). Um erro comum entre as pessoas que estão aprendendo bioestatística é pensar que o coeficiente de correlação serve para testar se há uma relação linear entre as variáveis X e Y. Quando usamos o coeficiente de correlação, já partimos do princípio de que a possível relação entre as variáveis se dá de forma linear, por isso, a importância do gráfico de dispersão, assim, o coeficiente de Pearson serve para medir o tamanho dessa associação linear, e não para verificar se há linearidade na relação entre X e Y. 129 UNIDADE 4 Depois que calculamos a correlação linear, podemos ter o interesse em determinar a Regressão Linear. A análise de regressão explicita em uma equação matemática a forma da relação entre uma variável chamada dependente e uma ou mais variáveis chamadas independentes, ou seja, quando temos o interesse, estudo da regressão aplica-se àquelas situações em que há razões para supor uma relação de causa-efeito entre duas variáveis quantitativas e se deseja expressar, matematicamente, essa relação. “ O termo regressão deve-se a Francis Galton, que publicou, em 1886, um artigo no qual tentou explicar por que pais de alta estatura tinham filhos com estatura em média mais baixa do que a deles e pais de baixa estatura tinham filhos em média mais altos. Esse fenômeno foi chamado de regressão à média, termo que, apesar de inadequado para expressar a dependência entre duas variáveis quantitativas, acabou sendo incorporado pelo uso à linguagem estatística (MARTINEZ, 2015, p. 103). Para entender melhor, em nosso estudo, o professor de Enfermagem quis saber se há relação entre o tempo de estudo e nota na prova da disciplina Bioestatística. A variável dependente é a nota da prova, pois, supostamente, recebe o efeito do tempo dedicado aos estudos. Por sua vez, o tempo de estudo (X) é a variável independente, dado que, supostamente, ela exerce algum efeito sobre a variável dependente. Sendo assim, os objetivos da regressão linear são, segundo Martinez (2015): 1. Avaliar uma possível dependência de y em relação a x. 2. Expressar matematicamente está relação por meio de uma equação. Também podemos ter situações em que temos valores atípicos, ou seja, em que podemos chamar de fora da linearidade. O que fazemos com esses valores? Podemos excluir, ajustar? A resposta aesta pergunta não é simples. Em nenhuma situação podemos eliminar observa- ções de nosso banco de dados com o propósito de deixar os resultados mais interessantes ou de destacar possíveis associações entre as variáveis que valorizariam nosso estudo, prin- cipalmente nas áreas biológica e da saúde, que podem trazer dados que podem orientar o direcionamento de uma pesquisa, além de não ser uma conduta ética por parte do pesquisador. Para isso, é importante que você vá novamente aos dados coletados, faça comparação com os dados da pesquisa de campo, verifique os questionários, os prontuários, a fonte original dos dados para, então, verificar a possibilidade de erros de digitação ou anotação. Ainda que não fosse esse o erro encontrado, não é correto eliminá-lo, arbitrariamente. É de suma importância buscar outras informações sobre aquele dado para possa entender se realmente ele pertence àquela população de interesse do estudo. 130 UNICESUMAR Vamos considerar que a variável independente Y de interesse é quantitativa contínua. O modelo de regressão simples envolve uma única variável independente X. A equação para determinar a regressão linear é dada por: y a b x� � . Em que: ŷ = valor predito da variável resposta a = constante de regressão que representa o intercepto entre a linha de regressão e o eixo y b = coeficiente linear de regressão da variável resposta y em função da variável explicativa x incli- nação da reta; taxa de mudança na variável y por unidade de mudança na variável x x = valor da variável explicativa (variável independente) O coeficiente de regressão “b” fornece uma estimativa da variação esperada de y a partir da variação de uma unidade em x (BARBETTA et al., 2014). A partir desta equação, é possível encontrar os valores preditos para y e a reta de regressão. Vimos, anteriormente, que a relação entre x e y pode ser mostrada por um diagrama de dispersão. Para calcular a regressão linear, vamos determinar “a” e “b”. Assim, utilizaremos as equações: b x y x y n x x n � � � � � � � � � � � ��� �� . ( ).( ) ( )2 2 Em que: ∑x = valores da somatória da variável x ∑y = valores da somatória da variável y ∑x.y = valores da somatória da variável x multiplicado pela variável y Para determinar “a”, utilizaremos a equação a seguir: a Y b X� � . Em que: Y = média de Y X = média de X b = valor que é determinado por equação e encontrado valor de “b”. Para encontrarmos as médias de Y e X , basta: Y y n � � 131 UNIDADE 4 Em que: y = somatória de todos os valores de y n = número total de elementos X x n � � Em que: x = somatória de todos os valores de x n = número total de elementos Agora que já sabemos como determinar a correlação linear, relembraremos nosso exemplo: um professor de Enfermagem deseja saber se existe correlação entre o tempo dedicado ao estudo e o desempenho dos alunos na disciplina Bioestatística. Assim, ele selecionou oito alunos, assim, podemos observar o número de horas (X) e a nota obtida na prova de Bioestatística (Y) para cada aluno (apresentaremos a tabela a seguir, com as colunas necessárias para calcular a regressão linear). Tabela 4 - Relação entre as horas de estudo e nota na disciplina de Bioestatística Acadêmico Horas de Estudo (x) Nota em Bioestatística (y) x2 x.y A 8 10 64 80 B 8 8 64 64 C 6 4 36 24 D 5 8 25 40 E 4 6 16 24 F 7 9 49 63 G 5 7 25 35 H 1 2 1 2 TOTAL 44 54 280 332 Fonte: o autor. Com os resultados, podemos calcular o valor de “b”, utilizando a equação: b x y x y n x x n � � � � � � � � � � � ��� �� . ( ).( ) ( )2 2 Substituindo os valores na equação: 132 UNICESUMAR b b � � � � � � � � � � � � � � � � 332 44 54 8 280 44 8 332 2 376 8 280 1 936 8 2 ( ).( ) ( ) . .�� �� � �� � � �� � � � b b b 332 297 280 242 35 38 0 92, Agora, determinaremos “a”, utilizando a equação a seguir: a Y b X� � . Primeiro, teremos que encontrar a média de X e Y: Y y n � � Y Y = = 54 8 6 75, X x n � � X X = = 44 8 5 5, Agora que temos o valor de b = 0,92; Y = 6 75, e X = 5 5, , determinaremos “a”: a Y b X� � . a a a � � � � � 6 75 0 92 5 5 6 75 5 06 1 69 , , . , , , , Descrição da Imagem: a figura apresenta um gráfico de dispersão em que o eixo (X) está na horizontal representando as horas de estudo dos alunos; no eixo Y, que está na vertical; temos as notas distribuídas dos oitos alunos, na qual temos a reta em sentido crescente representando a regressão linear. 133 UNIDADE 4 Agora, com todos os valores necessários, determinaremos a equação de regressão linear: Substituindo, temos: y x� �1 69 0 92, , . Com a equação da reta, podemos substituir dois pontos quaisquer por X para traçar a reta. A Figura 9 apresenta-nos o gráfico de dispersão com a reta de regressão linear. Figura 9 - Gráfico de dispersão e reta de regressão linear sobre a relação entre horas de estudo (x) e nota na disciplina de bioestatística / Fonte: o autor. Podemos observar como o valor de r encontrado, anteriormente, foi igual a 0,80, e o valor de “bx” é positivo, nossa reta ajustada tem sentido crescente. Caso nosso valor de r fosse negativo, nossa reta ajustada teria o sentido decrescente. Outro ponto importante em uma análise utilizando ferramentas estatísticas é a inferência. Imagine que um profissional da saúde trabalha em um laboratório e está conduzindo um estudo cujo objetivo é analisar se um novo medicamento pode ser capaz de trazer bons resultados ao tratamento de determinada doença. Para realizar essa pesquisa, este profissional selecionou uma amostra de 80 pessoas portadoras da doença, e estas foram divididas em dois grupos com 40 pessoas cada. As pessoas do grupo A foram submetidas ao medicamento que está sendo avaliado, as pessoas do grupo B, receberam um placebo. Os resultados estão apresentados na Tabela a seguir: Descrição da Imagem: a figura apresenta um círculo grande com bolinhas dentro dele e com a letra N (maiúscula) representando a população. Dentro desse círculo grande, temos um círculo menor, que representa a parte que será analisada (amostra), seguida de uma seta, e essa bolinha menor é evidenciada com a letra n (minúscula). 134 UNICESUMAR Tabela 5 - Resultados do estudo Grupo Tamanho amostral Responderam ao tratamento A 40 20 40 50�� � � % B 40 10 40 25�� � � % Fonte: o autor. Podemos observar que: 20 40 50�� � � % das pessoas que estão no grupo A, responderam ao trata- mento que está sendo avaliado, já 10 40 25�� � � % das pessoas alocadas no grupo B responderam ao tratamento com o medicamento sem o princípio ativo (placebo). Dessa maneira, a razão entre essas porcentagens é 50 25 2%( ) / %( )grupoA grupoB = , isto é, podemos concluir que entre as 80 pessoas que tem a doença e estão participando do estudo, se utilizarem o medicamento (da pesquisa) tem o dobro de chances de responder à doença quando comparados ao grupo B. Agora, temos a contribuição da Bioestatística neste estudo: este resultado encontrado é válido para portadoras da doença ou somente para as 80 pessoas que participaram do estudo? Inicialmente, o resultado obtido descreve apenas as 80 pessoas que compuseram esta amostra. No entanto nosso intuito é que os nossos resultados tragam valor para todas as pessoas que fazem parte da população e que tenham essa doença, não importando se foram selecionados, ou não, para compor a amostra da pesquisa. Para obtermos isso, fazemos uso da inferência estatística, ferramenta usada para extrapolar os achados de nossa amostra para todos os indivíduos que fazem parte da população (MARTINEZ, 2015). A Figura 10 apresenta-nos o processo pelo qual obtemos conclusões sobre uma população (N) a partir de dados obtidos, por meio de uma amostra (n). Figura 10 - Representação de uma inferência estatística / Fonte: o autor. 135 UNIDADE 4 Para estudarmos a inferência estatística, relembraremos alguns conceitos já estudados anteriormente (CRESPO, 2009): a) População (N): conjunto de elementos que tem,pelo menos, uma característica em comum. b) Amostra (n): subconjunto da população, parte da população. c) Amostragem aleatória: é representativa da população, sendo válidos os resultados obtidos, por meio do uso da inferência estatística. Outro conceito importante que precisamos estudar aqui na inferência estatística é o Parâmetro, essen- cial para entendermos a inferência estatística. Trata-se de valor calculado a partir de uma população, ou seja, usando todos os elementos (MARTINEZ, 2015). Por exemplo: um professor de Farmácia quer estudar a altura (em cm) das crianças que estão cursando a 1ª série em determinado município. A população inclui todas as crianças deste município. A média da altura encontrada (em cm), que é calculada a partir da análise do peso de todas as crianças da população é um parâmetro. Pedimos que tome cuidado para não confundir Parâmetro com Variável. O parâmetro, como já vimos, é uma característica numérica de uma população, já uma variável é uma característica dos in- divíduos que estamos pesquisamos. Segundo Parenti, Silva e Silveira (2017), o parâmetro é um número fixo, já os valores de uma variável são passíveis de variação de um indivíduo a outro. Por exemplo: entre os alunos estudados, a idade e o prato preferido são variáveis, já a média da altura de todos os alunos de determinada cidade é um parâmetro. Nem sempre, na prática, conseguiremos trabalhar com parâmetros, trabalharemos com amostra. Assim, a média amostral, que é resultante de uma amostra de tamanho n, é uma estimativa da média populacional. Dessa maneira, as estimativas são quantidades calculadas da amostra com a finalidade de representar um parâmetro de interesse (MARTINEZ, 2015). A diferença entre uma média populacional (parâmetro) da média amostral (estimativa) é denotada por: a) média populacional: representado pela letra grega µ. b) média amostral: representado por “xis barra” X . “ Quando conduzimos uma pesquisa com base em uma amostra de n indivíduos, po- demos calcular o valor de x com base nas observações amostrais. Mas, obviamente, não podemos calcular o valor de n, dado que não temos à nossa disposição todos os elementos da população. Assim, entendemos que o parâmetro é um número fixo, mas geralmente não conhecemos seu valor (MARTINEZ, 2015, p. 166). Assim, as principais ferramentas da inferência estatística são os intervalos de confiança e os testes de hipóteses. Podemos utilizar da seguinte forma: a) Intervalos de confiança: utilizamos quando o objetivo do estudo é voltado à estimação de um parâmetro. b) Testes de hipóteses: utilizados quando o objetivo do estudo envolve hipóteses sobre um parâ- metro de interesse. 136 UNICESUMAR O intervalo de confiança para a média (µ) de uma população é construído em torno da estimativa pontual X . Para construir este intervalo, fixamos uma probabilidade “ 1 – α” de que o intervalo construído contenha o parâmetro populacional. Desta forma α será a probabilidade de que o intervalo obtido não contenha o valor do parâmetro, isto é, α será a probabilidade de erro. Sabendo-se que a média da amostra apresenta uma distribuição normal (média µ e desvio padrão σ/ ) se a população de onde for extraída a amostra for normal (ou se a amostra for superior a 30 e retirada de qualquer população) de média µ e de desvio padrão σ, podemos então utilizar a curva normal para estabelecer os limites para o intervalo de confiança (BARBETTA, 2014). Para entendermos melhor o intervalo de confiança, temos que entender que a margem de erro é a sua peça chave, ou seja, no meio do intervalo de confiança é que fica a média amostral. Observe na equação a seguir: Limite inferior do intervalo de con�anç X ME X Limite superior do intervalo de con�anç X ME A distância que temos entre a média e o limite do intervalo de confiança é exatamente igual à margem de erro. É importante salientar que o nível de confiança deve ser selecionado, previamente, pelo pesquisador, e que a média populacional fica dentro do intervalo de confiança. Para calcular o limite superior XLS e inferior XLI do intervalo de confiança para nível de confiança igual a (1 – α) usa-se a seguinte expressão oriunda da discussão sobre as áreas embaixo da curva normal e a distribuição normal padronizada: X X ME X Zc S n X X ME X Z S n LS LI c � � � � � � � � Em que: X = média Zc= Z crítico - valor a ser encontrado na Tabela de Curva Normal (Tabela Z) S = desvio padrão n = número de elementos da amostra α = intervalo de confiança (ex.: 90%, 95%, 98%). Você verá que é bem simples este cálculo, e temos duas situações: 1º caso: para σ conhecido ou amostra grande (n ≥ 30): para determinar, utilizaremos a equação a seguir: X Zc n ± . s Descrição da Imagem: a figura apresenta, em forma de sino, na qual essa curva não toca o eixo, sendo dividida em sua metade com pontilhados que indicam a média cuja área destacada é 0,4750. 137 UNIDADE 4 Em que: X = média Zc = “Z” crítico (encontrado na Tabela Z) σ = desvio padrão n = número de elementos da amostra. Vejamos um exemplo: um professor fez uma pesquisa com 100 alunos, e a média de idade deste grupo de alunos é de 24 anos. Sabendo-se que o desvio padrão é igual a quatro anos, determine o intervalo de 95% de confiança para a média. Para a resolução, devemos entender que o que calcularemos nessa equação é apenas: Zc n . s , pois a média que já é dada, nós somaremos e diminuiremos pelo intervalo encontrado. 1º passo: encontrar o Zcrítico: com a tabela de distribuição normal reduzida (vista no nosso capítulo 4) é que encontraremos Zcrítico. Temos 95% para encontrar o valor na curva, vamos: ( ) ,95 100 0 95� � Só que esta tabela é reduzida, então, não encontraremos o valor de 0,95, para isso, vamos: 0 95 2 0 475, ,� � Vamos construir o intervalo na curva: Figura 11 - Curva de Gauss / Fonte: o autor. 2º passo: agora, vamos até a Tabela Z para encontrar o valor referente a 0,4750, mas, desta vez, nós procuraremos os valores e acharemos Z. Veja a seguir: 138 UNICESUMAR Tabela 6 - Tabela de distribuição Normal Reduzida Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4454 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4764 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 Fonte: Crespo (2009, p. 218). Encontramos o valor de 1,96. Você poderá encontrar qualquer valor utilizando somente a tabela Z. Uma dica muito importante, valores de Zcrítico para o grau de confiança: a. 90% = 1,645; b. 95% = 1,96; c. 99% = 2,575. Esses valores já foram retirados da Tabela Z, e sãoos mais utilizados. Fica a dica! Agora que temos o Zcrítico, desvio padrão (dado no exercício) e número de elementos (também dado no exercício), vamos resolver. 3º passo: resolver a equação (margem de erro): 139 UNIDADE 4 Zc n . s 1 96 4 100 1 96 4 10 1 96 0 4 0 784 , . , . , . , ,= 4º passo: agora que temos a margem de erro, determinamos o intervalo de confiança, somaremos com a média o valor da margem de erro e diminuiremos a média pela margem de erro, utilizando: X Zc n � � � � � . , , , , s 24 0 784 24 784 24 0 784 23 216 ou 24 0 784± , Também pode ser escrito desta maneira: 23,218≤ µ ≤ 24,784. 2º caso: Intervalo de confiança para a média (σ desconhecido): quando desejamos estimar a média de uma população normal com variância desconhecida, temos duas situações: a) Se n >30: utilizamos a distribuição normal com estimador s2 de σ2 (visto anteriormente). b) Se n ≤ 30: utilizamos a distribuição t de Student. Vejamos um exemplo: uma amostra de dez pessoas com as idades: 9, 8, 12, 7, 9, 6, 11, 6, 10 e 9, tem, em média, 8,7, um desvio padrão 2 e foi extraída de uma população Normal. Construa um intervalo de confiança para média ao nível de 95%. Utilizando a equação do intervalo de confiança para t de Student, temos: IC X tc s n � � . Em que: X = média tcritíco= valor a ser encontrado na Tabela t de Student S = desvio padrão n = número de elementos da amostra Descrição da Imagem: a figura apresenta uma curva em formato de sino, dividida em duas partes iguais, e as pontas do eixo estão pintadas destacando-se pela cor cinza, com duas setas destacando esses eixos. Descrição da Imagem: a figura apresenta uma curva em formato de sino, divididas em duas partes iguais, e as pontas do eixo estão pintadas destacando-se pela cor cinza, com duas setas destacando esses eixos, representando 2,5% em cada eixo. O eixo do meio é igual a 95%. 140 UNICESUMAR Utilizaremos a Tabela t de Student em um teste bicaudal que podemos observar na Figura 12. Figura 12 - Representação do teste bicaudal para Tabela t student / Fonte: o autor. Para resolver nosso exercício, temos que encontrar nosso tcrítico, assim, temos: • 95% é nosso intervalo de confiança. • Como nossa área interessada para trabalhar com essa tabela são as caudas, devemos encontrar esse valor. • Se a área é 95%, para termos os 100%, faltam 5%, certo. São esses 5% que são divididos nas caudas. Veja a Figura 13. Figura 13 - Representação do teste bicaudal para Tabela t student / Fonte: o autor. Como você pode perceber, os 95% é o que temos em nosso exercício, e os 5% foram divididos nas duas áreas do gráfico, representando 2,5% em cada cauda. Mas, para utilizar a tabela t Student, consideraremos que 5% teste são bicaudal, e procuraremos esse valor na tabela. Apenas mais um detalhe, antes de ir à tabela, é importante que você entenda que o grau de liberdade é igual a n – 1, portanto, temos 10 elementos, para o grau de liberdade teremos: 10-1 = 9. Assim, buscaremos “9” quanto ao grau de liberdade. Vamos procurar a linha 9 e a coluna 5% em nossa tabela T Student apresentada a seguir: 141 UNIDADE 4 Ta be la 7 - T ab el a t de S tu de nt - P ro ba bi lid ad e pa ra u m te st e bi ca ud al G . lib er - da de 0, 95 0, 90 0, 80 0, 70 0, 60 0, 50 0, 40 0, 30 0, 20 0, 10 0, 05 0, 02 0, 01 0, 00 1 1 0, 07 87 0, 15 84 0, 32 49 0, 50 95 0, 72 65 1, 00 00 1, 37 64 1, 96 26 3, 07 77 6, 31 38 12 ,7 06 2 31 ,8 20 5 63 ,6 57 63 6, 61 9 2 0, 07 08 0, 14 21 0, 28 87 0, 44 47 0, 61 72 0, 81 65 1, 06 07 1, 38 62 1, 88 56 2, 92 00 4, 30 27 6, 96 46 9, 92 48 31 ,5 99 1 3 0, 06 81 0, 13 66 0, 27 67 0, 42 42 0, 58 44 0, 76 49 0, 97 85 1, 24 98 1, 63 77 2, 35 34 3, 18 24 4, 54 07 5, 84 09 12 ,9 24 0 4 0, 06 67 0, 13 38 0, 27 07 0, 41 42 0, 56 86 0, 74 07 0, 94 10 1, 18 96 1, 53 32 2, 13 18 2, 77 64 3, 74 69 4, 60 41 8, 61 03 5 0, 06 59 0, 13 22 0, 26 72 0, 40 82 0, 55 94 0, 72 67 0, 91 95 1, 15 58 1, 47 59 2, 01 50 2, 57 06 3, 36 49 4, 03 21 6, 86 88 6 0, 06 54 0, 13 11 0, 26 48 0, 40 43 0, 55 34 0, 71 76 0, 90 57 1, 13 42 1, 43 98 1, 94 32 2, 44 69 3, 14 27 3, 70 74 5, 95 88 7 0, 06 50 0, 13 03 0, 26 32 0, 40 15 0, 54 91 0, 71 11 0, 89 60 1, 11 92 1, 41 49 1, 89 46 2, 36 46 2, 99 80 3, 49 95 5, 40 79 8 0, 06 47 0, 12 97 0, 26 19 0, 39 95 0, 54 59 0, 70 64 0, 88 89 1, 10 81 1, 39 68 1, 85 95 2, 30 60 2, 89 65 3, 35 54 5, 04 13 9 0, 06 45 0, 12 93 0, 26 10 0, 39 79 0, 54 35 0, 70 27 0, 88 34 1, 09 97 1, 38 30 1, 83 31 2, 26 22 2, 82 14 3, 24 98 4, 78 09 10 0, 06 43 0, 12 89 0, 26 02 0, 39 66 0, 54 15 0, 69 98 0, 87 91 1, 09 31 1, 37 22 1, 81 25 2, 22 81 2, 76 38 3, 16 93 4, 58 69 11 0, 06 42 0, 12 86 0, 25 96 0, 39 56 0, 53 99 0, 69 74 0, 87 55 1, 08 77 1, 36 34 1, 79 59 2, 20 10 2, 71 81 3, 10 58 4, 43 70 12 0, 06 40 0, 12 83 0, 25 90 0, 39 47 0, 53 86 0, 69 55 0, 87 26 1, 08 32 1, 35 62 1, 78 23 2, 17 88 2, 68 10 3, 05 45 4, 31 78 13 0, 06 39 0, 12 81 0, 25 86 0, 39 40 0, 53 75 0, 69 38 0, 87 02 1, 07 95 1, 35 02 1, 77 09 2, 16 04 2, 65 03 3, 01 23 4, 22 08 14 0, 06 38 0, 12 80 0, 25 82 0, 39 33 0, 53 66 0, 69 24 0, 86 81 1, 07 63 1, 34 50 1, 76 13 2, 14 48 2, 62 45 2, 97 68 4, 14 05 15 0, 06 38 0, 12 78 0, 25 79 0, 39 28 0, 53 57 0, 69 12 0, 86 62 1, 07 35 1, 34 06 1, 75 31 2, 13 14 2, 60 25 2, 94 67 4, 07 28 16 0, 06 37 0, 12 77 0, 25 76 0, 39 23 0, 53 50 0, 69 01 0, 86 47 1, 07 11 1, 33 68 1, 74 59 2, 11 99 2, 58 35 2, 92 08 4, 01 50 17 0, 06 36 0, 12 76 0, 25 73 0, 39 19 0, 53 44 0, 68 92 0, 86 33 1, 06 90 1, 33 34 1, 73 96 2, 10 98 2, 56 69 2, 89 82 3, 96 51 18 0, 06 36 0, 12 74 0, 25 71 0, 39 15 0, 53 38 0, 68 84 0, 86 20 1, 06 72 1, 33 04 1, 73 41 2, 10 09 2, 55 24 2, 87 84 3, 92 16 19 0, 06 35 0, 12 74 0, 25 69 0, 39 12 0, 53 33 0, 68 76 0, 86 10 1, 06 55 1, 32 77 1, 72 91 2, 09 30 2, 53 95 2, 86 09 3, 88 34 20 0, 06 35 0, 12 73 0, 25 67 0, 39 09 0, 53 29 0, 68 70 0, 86 00 1, 06 40 1, 32 53 1, 72 47 2, 08 60 2, 52 80 2, 84 53 3, 84 95 21 0, 06 35 0, 12 72 0, 25 66 0, 39 06 0, 53 25 0, 68 64 0, 85 91 1, 06 27 1, 32 32 1, 72 07 2, 07 96 2, 51 76 2, 83 14 3, 81 93 22 0, 06 34 0, 12 71 0, 25 64 0, 39 04 0, 53 21 0, 68 58 0, 85 83 1, 06 14 1, 32 12 1, 71 71 2, 07 39 2, 50 83 2, 81 88 3, 79 21 23 0, 06 34 0, 12 71 0, 25 63 0, 39 02 0, 53 17 0, 68 53 0, 85 75 1, 06 03 1, 31 95 1, 71 39 2, 06 87 2, 49 99 2, 80 73 3, 76 76 142 UNICESUMAR G . lib er - da de 0, 95 0, 90 0, 80 0, 70 0, 60 0, 50 0, 40 0, 30 0, 20 0, 10 0, 05 0, 02 0, 01 0, 00 1 24 0, 06 34 0, 12 70 0, 25 62 0, 39 00 0, 53 14 0, 68 48 0, 85 69 1, 05 93 1, 31 78 1, 71 09 2, 06 39 2, 49 22 2, 79 69 3, 74 54 25 0, 06 33 0, 12 69 0, 25 61 0, 38 98 0, 53 12 0, 68 44 0, 85 62 1, 05 84 1, 31 63 1, 70 81 2, 05 95 2, 48 51 2, 78 74 3, 72 51 26 0, 06 33 0, 12 69 0, 25 60 0, 38 96 0, 53 09 0, 68 40 0, 85 57 1, 05 75 1, 31 50 1, 70 56 2, 05 55 2, 47 86 2, 77 87 3, 70 66 27 0, 06 33 0, 12 68 0, 25 59 0, 38 94 0, 53 06 0, 68 37 0, 85 51 1, 05 67 1, 31 37 1, 70 33 2, 05 18 2, 47 27 2, 77 07 3, 68 96 28 0, 06 33 0, 12 68 0, 25 58 0, 38 93 0, 53 04 0, 68 34 0, 85 46 1, 05 60 1, 31 25 1, 70 11 2, 04 84 2, 46 71 2, 76 33 3, 67 39 29 0, 06 33 0, 12 68 0, 25 57 0, 38 92 0, 53 02 0, 68 30 0, 85 42 1, 05 53 1, 31 14 1, 69 91 2, 04 52 2, 46 20 2, 75 64 3, 65 94 30 0, 06 32 0, 12 67 0, 25 56 0, 38 90 0, 53 00 0, 68 28 0, 85 38 1, 05 47 1, 31 04 1, 69 73 2, 04 23 2, 45 732, 75 00 3, 64 60 60 0, 06 30 0, 12 62 0, 25 45 0, 38 72 0, 52 72 0, 67 86 0, 84 77 1, 04 55 1, 29 58 1, 67 06 2, 00 03 2, 39 01 2, 66 03 3, 46 02 90 0, 06 29 0, 12 60 0, 25 41 0, 38 66 0, 52 63 0, 67 72 0, 84 56 1, 04 24 1, 29 10 1, 66 20 1, 98 67 2, 36 85 2, 63 16 3, 40 19 12 0 0, 06 28 0, 12 59 0, 25 39 0, 38 62 0, 52 58 0, 67 65 0, 84 46 1, 04 09 1, 28 86 1, 65 77 1, 97 99 2, 35 78 2, 61 74 3, 37 35 15 0 0, 06 28 0, 12 59 0, 25 38 0, 38 61 0, 52 55 0, 67 61 0, 84 40 1, 04 00 1, 28 72 1, 65 51 1, 97 59 2, 35 15 2, 60 90 3, 35 66 18 0 0, 06 28 0, 12 58 0, 25 37 0, 38 59 0, 52 53 0, 67 59 0, 84 36 1, 03 94 1, 28 63 1, 65 34 1, 97 32 2, 34 72 2, 60 34 3, 34 54 21 0 0, 06 28 0, 12 58 0, 25 37 0, 38 58 0, 52 52 0, 67 57 0, 84 33 1, 03 90 1, 28 56 1, 65 21 1, 97 13 2, 34 42 2, 59 94 3, 33 75 24 0 0, 06 28 0, 12 58 0, 25 36 0, 38 58 0, 52 51 0, 67 55 0, 84 31 1, 03 87 1, 28 51 1, 65 12 1, 96 99 2, 34 20 2, 59 65 3, 33 15 27 0 0, 06 28 0, 12 58 0, 25 36 0, 38 57 0, 52 50 0, 67 54 0, 84 30 1, 03 84 1, 28 47 1, 65 05 1, 96 88 2, 34 02 2, 59 42 3, 32 69 30 0 0, 06 28 0, 12 58 0, 25 36 0, 38 57 0, 52 50 0, 67 53 0, 84 28 1, 03 82 1, 28 44 1, 64 99 1, 96 79 2, 33 88 2, 59 23 3, 32 33 40 0 0, 06 27 0, 12 57 0, 25 35 0, 38 56 0, 52 48 0, 67 51 0, 84 25 1, 03 78 1, 28 37 1, 64 87 1, 96 59 2, 33 57 2, 58 82 3, 31 50 50 0 0, 06 27 0, 12 57 0, 25 35 0, 38 55 0, 52 47 0, 67 50 0, 84 23 1, 03 75 1, 28 32 1, 64 79 1, 96 47 2, 33 38 2, 58 57 3, 31 01 80 0 0, 06 27 0, 12 57 0, 25 34 0, 38 55 0, 52 46 0, 67 48 0, 84 21 1, 03 71 1, 28 26 1, 64 68 1, 96 29 2, 33 10 2, 58 20 3, 30 27 10 00 0, 06 27 0, 12 57 0, 25 34 0, 38 54 0, 52 46 0, 67 47 0, 84 20 1, 03 70 1, 28 24 1, 64 64 1, 96 23 2, 33 01 2, 58 08 3, 30 03 Fo nt e: B ar be ta e t al . ( 20 14 , p . 3 0 0) . O bs .: D is tr ib ui çã o de t- St ud en t se gu nd o os g ra us d e lib er da de e u m a da da pr ob ab ili da de e m u m t es te b ic au da l ( pr im ei ra li nh a) . P ar a um t es te m on oc au da l, co ns id er e m e- ta de d o va lo r de p ro ba bi lid ad e ap on ta do . 143 UNIDADE 4 Assim o valor encontrado é igual a 2,2622, agora, resolveremos nosso exercício. Resolvendo nosso exercício, voltando a equação, temos: IC X tc s n � � . IC IC IC IC � � � � � � � 8 7 2 2622 2 10 8 7 2 2622 2 3 16 8 7 2 2622 0 63 8 , , . , , . , , , . , ,, , , , , , , , 7 1 43 8 7 1 43 10 13 8 7 1 43 7 27 � � � � � � � IC IC Portanto: IC = [7,27; 10,13]. Assim, a probabilidade de este intervalo 7,27 a 10,13 conter a média populacional (verdadeira idade) das pessoas é igual a 95%. Também temos um método para fazer inferências sobre as populações: os testes de hipóteses. Ao admitirmos um valor hipotético para um parâmetro populacional e, baseados nas informações cole- tadas em uma amostra, podemos realizar o teste de hipóteses, na qual nossa decisão poderá: aceitar ou rejeitar a hipótese. É importante frisar que esta decisão está sujeita a erros, baseado em resultados de uma amostra, muitas vezes, não é possível tomar decisões que estejam totalmente corretas. No entanto, podemos dimensionar a chance, a probabilidade, o risco em aceitar ou rejeitar uma hipótese (MARTINEZ, 2015). Uma hipótese estatística refere-se à suposição do parâmetro populacional, como: a) A altura média da população brasileira é de 1,65 m, isto é: H: μ = 1,65 m. b) A variância populacional dos salários vale R$1.000,00, isto é: H: σ2 = 1.000,00. c) A proporção de paulistas com a doença X é de 40%, ou seja: H: p = 0,40. d) A distribuição de probabilidades dos pesos dos alunos de uma instituição de ensino é normal. e) A chegada de navios ao porto de Santos é descrita por uma distribuição de Poisson. Isso significa que as hipóteses estatísticas são estabelecidas pelos critérios do pesquisador, baseado no que ele está buscando, ou seja, com informações teóricas, muitas vezes. Já o teste de hipótese em si, trata-se de uma regra de decisão para aceitar ou rejeitar uma hipótese estatística com base nos ele- mentos amostrais. São dois os tipos de hipóteses: designa-se H0, denominada hipótese nula, a hipótese estatística a ser testada, e H1, a hipótese alternativa. A hipótese nula expressa uma igualdade, enquanto a hipótese alternativa é dada por uma desigualdade. 144 UNICESUMAR São exemplos de hipóteses para um teste estatístico: a) H0: μ = 1,65 m H1: μ ≠ 1,65 m ou H0: μ = 1,65 m H1: μ > 1,65 m ou H0: μ = 1,65 m H1: μ < 1,65 m b) H0: σ2 = 1.000,00 H1: σ2 ≠ 1.000,00 ou H0: σ2 = 1.000,00 H1: σ2 > 1.000,00 ou H0: σ2 = 1.000,00 H1: σ2 < 1.000,00 c) H0: p = 0,40 H1: p ≠ 0,40 ou H0: p = 0,40 H1: p > 0,40 ou H0: p = 0,40 H1: p < 0,40 Existem dois tipos possíveis de erros quando fazemos um teste estatístico para acei- tar ou rejeitar H0. Nós podemos rejeitar a hipótese H0, quando ela é verdadeira, ou aceitar H0, quando ela é falsa (MARTINEZ, 2015). O erro de rejeitar H0, sendo H0 ver- dadeira, é denominado Erro tipo I, e a probabilidade de se cometer o Erro tipo I é designada α. Por outro lado, o erro de aceitar H0, sendo H0 falsa, é denominado Erro tipo II, e a probabilidade de cometer o Erro tipo II é designada β. Os possíveis erros e acertos de uma decisão com base em um teste de hipótese estatístico estão apresentados a seguir: • Erro do tipo 1: trata-se do erro que se comete ao rejeitar a hipótese H0 quando ela é verdadeira. O nível de significância do teste é designado por α, que é a probabilidade de se cometer o erro do tipo 1. • Erro do Tipo 2: é o erro que se comete ao aceitar a hipótese H0 quando ela é falsa. Rejeitar H0 implica a aceitação de H1 e vice-versa. A probabilidade de cometer um erro do tipo 2 é dada por 1 – α. Dentro do teste de hipóteses, temos as regiões de aceitação e rejeição, a saber: • Região de Aceitação (R. A.): é a região na qual se aceita a hipótese nula (H0). • Região de Rejeição (R. R.): é a região de rejeição da hipótese nula (H0), sendo complementar à região de aceitação. É também chamada de Região Crítica (R. C.). Como tipos de testes de hipóteses temos: Bilateral, Unilateral à Esquerda, Unilateral à Direita, sendo a região crítica (ou região de rejeição) que corresponde aos valores da estatística de teste que nos levam a rejeitar a hipótese nula. Dependendo da afirmativa em teste, a região crítica poderia estar nas duas caudas extremas, poderia estar na cauda esquerda, ou poderia estar na cauda direita. 145 UNIDADE 4 Teste bilateral A região crítica está nas duas regiões extremas (caudas) sob a curva (Figura 14). Figura 14 - Teste bilateral / Fonte: o autor. Teste unilateral à direita A região crítica está na região extrema (cauda) direita sob a curva (Figura 15). Figura 15 - Teste unilateral à direita / Fonte: o autor. Descrição da Imagem: a figura apresenta uma curva em formato de sino (Gauss), divididas em duas partes iguais, sendo a R. A. (Região de Acei- tação), e, nas pontas do eixo, temos duas extremi- dades como R. R. (Região de Rejeição). Descrição da Imagem: a figura apresenta uma curva em formato de sino (Gauss), divididas em duas partes iguais, sendo a R. A. (Região de Acei- tação) na região direita, dividida com um traço e, na sua extremidade direita, temos a R. R. (Região de Rejeição). 146 UNICESUMAR Teste unilateral à esquerda A região crítica está na região extrema (cauda) esquerda sob a curva (Figura 16). Figura 16 - Teste unilateral à esquerda / Fonte: o autor. Depois de apresentarmos os conceitos fundamentais dentro de um teste de hipótese, você verá que não é um teste complicado. A seguir, apresentaremos o roteiro para realização de um teste de hipóteses. 1º passo:estabelecer a hipótese nula H0. 2º passo: estabelecer a hipótese alternativa H1. 3º passo: fixar o nível de significância α: em que definimos o nível de confiança para um intervalo de confiança, como a probabilidade 1 – α. Escolhas comuns para α são 0,05; 0,01 e 0,10, com 0,05 sendo a mais comum. Os valores críticos de z relativos aos níveis de significância usados com maior frequência podem ser observados a seguir (valores já retirados da Tabela Z de distribuição normal reduzida): Nível de significância α 0,10 0,05 0,01 Valores críticos de z para testes unilaterais ± 1,28 ± 1,64 ±2,33 Valores críticos de z para testes bilaterais ± 1,64 ± 1,96 ± 2,58 4º passo: determinar a região de rejeição da hipótese nula. 5º passo: extrair a amostra e calcular o valor da estatística correspondente. 6º passo: rejeitar ou aceitar H0, conforme o valor da estatística amostral cair em R. R. ou R. A. Para entendermos este passo a passo, vejamos um exemplo: supondo que um professor de ciências biológicas deseja testar H0: μ = 20 contra H1: μ > 20, sabendo que o desvio padrão da população é igual a 4 e a amostra testada foi de 16 elementos: Descrição da Imagem: a figura apresenta uma curva em formato de sino (Gauss), dividida em duas partes iguais, sendo a R. A. (Região de Acei- tação) na região direita, dividida com um traço e, em sua extremidade esquerda, temos a R. R. (Região de Rejeição). 147 UNIDADE 4 1º passo: estabelecer a hipótese nula H0: H0: μ = 20 2º passo: estabelecer a hipótese alternativa H1: H1: μ > 20 3º passo: fixar o nível de significância α: Para esse exercício vamos admitir que α = 0,05 = 5%. 4º passo: determinar a região de rejeição da hipótese nula: Como H1: μ > 20, vamos utilizar o teste unilateral à direita, que podemos observar na Figura 17. Figura 17 - Teste unilateral à direita / Fonte: o autor. 5º passo: extrair a amostra e calcular o valor da estatística correspondente: temos a amostra de 16 elementos, desvio padrão igual a 4, e determinar o Zcalculado. Obs.: não temos a média amostral para este exercício. Como estabelecemos 0,05 como nível de significância, o z será igual a 1,64. zcalculado X n µ � � 0 s Em que: Zcalculado = valores da tabela Z X = média da amostra µ0 = é a média da população (hipótese a ser testada) σ = desvio padrão da população n = número de elementos da amostra Substituindo os valores na equação, temos: Descrição da Imagem: a figura apresenta uma curva em formato de sino (Gauss), dividida em duas partes iguais, sendo a R.A. (Região de Acei- tação) na região direita, dividida com um traço e, na sua extremidade direita, temos a R. R. (Re- gião de Rejeição). 148 UNICESUMAR zcalculado X n µ � � 0 s 1 64 4 16 1 64 4 4 1 64 1 1 64 20 21 64 20 20 20 , , , , , � � � � � � � � � X X X X X 6º passo: rejeitar ou aceitar H0, conforme o valor da estatística amostral cair em R. R. ou R. A. Nesse exercício, temos: Rejeitar H0 quando > 21,64 Não Rejeitar H0 quando ≤ 21,64 Vamos a outro exemplo para sua melhor compreensão? Um professor de Biomedicina fez uma pesquisa com um componente que será utilizado em labo- ratório, tem uma vida média de 50 meses e um desvio padrão de 50 meses. Ao retirar uma amostra de 36 componentes, que foram obtidas a partir desta população, percebeu que o componente tem em média 48 meses de vida. Assim, utilizando o teste de hipóteses, podemos afirmar que a média desta população é diferente de 50? Considere o nível de 5% para resolução. Nesse caso, queremos obter o teste de hipóteses com uma média diferente de 50, certo? Então, utilizaremos o teste bilateral. Resolvendo o exercício passo a passo, temos: 1º passo: estabelecer a hipótese nula H0: H0: µ = 50 (µ0) 2º passo: estabelecer a hipótese alternativa H1: H1: µ ≠ 50 (µ0) 3º passo: fixar o nível de significância α: 0,05. 149 UNIDADE 4 4º passo: determinar a região de rejeição da hipótese nula: como H1: μ > 20, utilizaremos o teste unilateral à direita, que podemos observar na Figura 18. Figura 18 - Teste bilateral / Fonte: o autor. 5º passo: extrair a amostra e calcular o valor da estatística correspondente: temos a amostra de 36 componentes, com uma população de 50 componentes, o tempo de vida médio amostral é de 48 me- ses. Como estabelecemos 0,05 como nível de significância (para teste bilateral), o z será igual a 1,96. zcalculado X n µ � � 0 s zcalculado zcalculado zcalculado zcalcu � � � � � � 48 4 36 2 4 6 2 0 666 50 , llado � �3 6º passo: rejeitar ou aceitar H0, conforme o valor da estatística amostral cair em R. R. ou R. A.. Nesse exercício, temos: Rejeita-se H0 pois, o resultado amostral afirma que a média é diferente de 50 meses, ao nível de 95% de confiança. Descrição da Imagem: a figura apresenta uma curva em formato de sino (Gauss), dividida em duas partes iguais, sendo a R. A. (Região de Aceitação), e, nas pontas do eixo, temos duas extremidades como R. R. (Região de Rejeição). 150 UNICESUMAR Você percebeu, caro(a) estudante, que a correlação e a regressão linear poderão ajudá-lo(a) como professor(a). Você pode ter uma turma, analisar duas disciplinas e fazer projeções sobre as possíveis notas de seus alunos, desde que tenham uma correlação linear forte. Você, também, identificou como as técnicas estudadas em Bioestatística sobre a inferência poderão, por meio de testes, construir um modelo de aceitação ou rejeição de uma hipótese. Você sabia que o ajuste de retas em uma análise de regressão é im- portante para a área de ciências biológicas e da saúde? Muitos fenô- menos biológicos podem ser expressos por equações matemáticas, que podem facilitar o entendimento das relações entre grandezas conhecidas e aquelas que queremos estimar, como o ajustamento de curvas, que é um instrumento imprescindível quando sabemos que a medida cefálica de um animal arisco (ave, morcego, peixe etc.) apre- senta uma afinada relação com outras medidas, entre outras aplica- ções. Nossa roda de conversa abordará um pouco desta aplicação. Você sabia que um professor pode, também, analisar (utilizando técnicas estatísticas) a compreensão dos seus alunos quanto aos conteúdos trabalhados? Para isso, recomendamos a leitura do artigo a seguir, em que foi avaliada a compreensão em testes de hipóteses de alunos que cursaram a disciplina Bioestatística em uma Universidade pública no estado de Minas Gerais. Para tal, 23 alunos responderam a um teste sobre o tema, do qual foram analisadas neste texto duas questões que versam sobre o estabelecimento/ formulação de hipóteses. Para acessar, use seu leitor de QR Code. https://apigame.unicesumar.edu.br/qrcode/8513 151 A G O R A É C O M V O C Ê 1. Um professor de Ciências Biológicas fez uma análise com 20 alunos, com o objetivo de saber se existe relação entre as disciplinas Anatomia Humana e Fisiologia Humana. Com isso, calculou a regressão linear, e o valor encontrado foi igual a r = 0,85. Assim, o professor pode concluir que: a) Existe uma correlação linear forte e positiva entre as disciplinas de Anatomia Humana e Fisiologia Humana. b) Existe uma correlação linear forte e negativa entre as disciplinas de Anatomia Humana e Fisiologia Humana. c) Existe uma correlação linear fraca e positiva entre as disciplinas de Anatomia Humana e Fisiologia Humana. d) Existe uma correlação linear fraca e negativa entre as disciplinas de Anatomia Humana e Fisiologia Humana. e) Não existe uma correlação linear fraca e positiva entre as disciplinas de Anatomia Humana e Fisiologia Humana. 2. Um professor de Biomedicina fez a correlação de uma de suas turmas entre as disci- plinas de Ecologia (x) e Educação Ambiental (y), obteve um r = 0,83 e uma equação de regressão linear igual a: y = 0,74x + 2,38. Se a nota de um aluno na disciplina Ecologia for 6,0, a nota estimada da disciplina de Educação Ambiental será igual a: a) 5,0. b) 6,0. c) 6,4. d) 6,8. e) 7,2. 152 A G O R A É C O M V O C Ê 3. O diagramade dispersão pode ajudar na interpretação e, também, a verificar se existe alguma correlação entre as variáveis X e Y. Diante disso, analise o gráfico (Figura 19) de dispersão a seguir: Fonte: o autor. Descrição da Imagem: a figura apresenta um gráfico de dispersão, no qual temos pontos x, y apre- sentados na ordem a seguir (sempre lendo primeiro eixo x seguida de vírgula eixo y, para separar o próximo ponto separamos por traço) 10,11- 12,11- 13,2 - 14,1- 15,1- 10,1- 9,1 - 8,1. Ao analisar o gráfico de dispersão, podemos dizer que: a) Existe uma correlação linear forte. b) Existe uma correlação linear positiva. c) Existe uma correlação linear negativa. d) Existe uma correlação linear fraca. e) Não existe uma correlação linear. 153 C O N FI R A S U A S R ES P O ST A S 4. Um professor fez um experimento com uma amostra de 100 peças, com um tempo médio de vida de 501,2 minutos e desvio padrão igual a 4. O intervalo de confiança para média populacional com 95% de confiança é igual a: a) IC � �501 2 0 998, , b) IC � �501 2 1 775, , c) IC � �501 2 3 75, , d) IC � �501 2 4 99, , e) IC � �501 2 0 784, , 5. Sabemos que um intervalo de confiança é um parâmetro de interesse em uma popu- lação, na qual podemos determinar a partir de amostras conhecidas. Se temos uma amostra igual a 12, determinaremos o intervalo de confiança utilizando: a) Distribuição Normal. b) Distribuição Binomial. c) Distribuição t de Student. d) Correlação Linear. e) Regressão Linear. 154 M EU E SP A Ç O 5 Iniciaremos uma visão geral da Epidemiologia e compreender os seus conceitos, elementos fundamentais e temas básicos. Vamos abordar a perspectiva histórica da Epidemiologia, destacando a evolução, utilização atual até a Epidemiologia moderna. Apresen- taremos as principais aplicações da Epidemiologia; além de com- preender a história natural da doença integrando os conceitos de saúde e doença. Entender a Etiologia nas fases pré-patológicas e patológicas. E por fim compreender a correlação entre preditor e desfecho para explicar o processo de saúde-doença e classificar a prevenção em saúde. Epidemiologia: Definição, Objetivos e Perspectivas Históricas Dra. Izabel Galhardo Demarchi 156 UNICESUMAR Aluno (a), você compreenderá que a Epidemiologia é uma discipli- na básica e fundamental para os cursos da área de saúde, uma vez que a aplicação de seus conceitos e métodos permitem estabelecer ou hipotetizar a situação de saúde de uma população, assim como define os preditores (fatores de risco ou de proteção) associados aos mais diversos desfechos encontrados em saúde. Nesta unidade, serão apresentados os principais conceitos, objetivos e perspectivas históricas da Epidemiologia, fornecen- do informações conceituais essenciais para a compreensão das próximas unidades. Aqui, conceituamos a Epidemiologia e outras terminologias, e descrevemos os seus objetivos e aplicações para a saúde. Em perspectivas históricas, contamos a base do surgimento desta disciplina até a Epidemiologia Moderna, destacando a sua importância para a descoberta dos agentes causadores de doen- ças, óbitos ou outras consequências. A Epidemiologia não só está relacionada às doenças ou outros desfechos desfavoráveis, mas também com a descoberta de vacinas ou medidas preventivas que promovem a saúde do indivíduo ou do coletivo, assim como explora a pesquisa de medicamentos, novos métodos de diagnós- tico e de recuperação da saúde. Considerando que a Epidemiologia estuda a distribuição das doenças e outros desfechos em saúde em uma população, é impor- tante que todo o processo em que o indivíduo saudável se torna um doente seja compreendido desde a raiz. Portanto, aqui nesta unidade o aluno poderá compreender o processo saúde-doença, também descrito como História Natural das Doenças. A base das doenças ou outros desfechos, como o óbito, sequelas ou até a cura, está na investigação dos fatores etiológicos (preditores de risco ou de proteção) e na causalidade, que são definidos e in- terpretados na Unidade I. Aqui, você também poderá compreender como se dá a aplicação das medidas preventivas para a promoção, proteção e recuperação à saúde. Tenha uma boa leitura e um bom aproveitamento da nossa disciplina. 157 UNIDADE 5 CONCEITOS EPIDEMIOLÓGICOS Bem-vindo (a) ao primeiro tópico de Epidemiologia! Caro (a) aluno (a), neste tópico você aprenderá alguns conceitos teóricos da nossa disciplina para podermos dar continuidade aos próximos conteúdos. Nesta Unidade, nós estudaremos a definição de Epidemiologia e outros temas importantes para padro- nizarmos a nossa linguagem. Espero que você adquira a base teórica da Epidemiologia para avançarmos para os conteúdos mais complexos. O que é Epidemiologia? Primeiramente, você deve estar se perguntando, mas o que é Epidemiologia? Atualmente, Epidemio- logia é a principal ciência da informação em saúde, base da medicina, da saúde coletiva e das outras formações profissionais de saúde (ALMEIDA FILHO; BARRETO, 2011). Pode ser considerada o eixo da saúde pública e uma disciplina essencial para todas as disciplinas clínicas (ROUQUAYROL; ALMEIDA FILHO, 1999). Em termos etimológicos (origem da palavra), “Epidemiologia” significa o estudo do que afeta a população ou estudo sobre populações (epi=sobre; demo=população; logos=estudo) Atualmen- te, considerando que a Epidemiologia tem uma complexidade crescente e que sua abrangência partiu do individual para um conceito de coletividade, existem muitas definições para este termo (PEREIRA, 2002). 158 UNICESUMAR O conceito original se restringia ao estudo de epidemias de doenças transmis- síveis, o que prevaleceu por um longo período (PEREIRA, 2002). No dicionário Oxford (English Dictionary), Epidemiologia se trata de um ramo da ciência médica que trata das epidemias. E o que é epidemia? A epidemia ocorre quando o número de casos de uma doença ou óbito (ou ainda outro desfecho) excede o número de casos esperados para aquele período e localidade (GORDIS, 2009). No entanto, esse conceito é muito básico e atualmente não contempla a magnitude dessa disciplina, de modo que o conceito evoluiu para abranger todos os eventos relacionados com a saúde das populações (PEREIRA, 2002). A Epidemiologia tem sido definida tradicionalmente como a ciência que estuda a distribuição das doenças e suas causas em populações humanas (ALMEIDA FILHO; BARRETO, 2011). Leon Gordis (2009) define Epidemiologia como a ciência que estuda a distribuição das doenças nas populações e os fatores que determinam ou influenciam esta distribuição. A Associação Internacional de Epidemiologia (IEA, International Epidemiological Association), em 1973, definiu essa disciplina em seu Guia de Métodos de Ensino como o estudo dos fatores determinantes para a frequência (número e porcentagem) e a distribuição das doenças nas coletividades humanas . A ciência clínica tem como foco o estudo da enfermidade no indivíduo, observando caso a caso, enquanto que a Epidemiologia estuda os problemas de saúde de um grupo de pessoas (ROUQUAYROL; ALMEIDA FILHO, 1999). O conceito mais completo de Epidemiologia pode ser encontrado na referência de Almeida Filho e Rouquayrol (2006, p. 15), na qual ela é conceituada como: “ ciência que estuda o processo saúde-enfermidade na sociedade, ana- lisando a distribuição populacional e fatores determinantes do risco de doenças, agravos e eventos associados à saúde, propondo medidas específicas de prevenção, controle ou erradicação de enfermidades, danos ou problemas de saúde e de proteção, promoção ou recuperação da saúde individual ou coletiva, produzindo informação e conheci- mento para apoiar a tomada de decisão no planejamento, adminis- tração e avaliação de sistemas, programas, serviços e ações de saúde. A Epidemiologia questiona Qual, Onde, Quando e Porquê alguma doença ou outro evento em saúde acomete um indivíduo ou uma população? Portanto, a doença, a moléstia, o agravo, oóbito e ausência de saúde não são distribuídas ao acaso em uma população (GORDIS, 2009). Atualmente, sabe-se que a Epidemiologia não estuda somente as epidemias e que as áreas temáticas se concentram no estudo de doenças infecciosas (por exemplo: sarampo, malária, infecção pelo vírus da imunodeficiência adquirida/HIV, entre 159 UNIDADE 5 outras), doenças não infecciosas (diabetes, hipertensão arterial, depressão e outras), e agravos à integridade física (acidentes, homicídios, suicídios, óbito) (ROUQUAYROL; ALMEIDA FILHO, 1999). Pode ainda ser definida como a ciência que estuda os fatores etiológicos na gênese das enfermidades (JÉNICEK, 1995), que quantifica os fenômenos de saúde e doença, usando cálculos matemáticos e técnicas estatísticas (GORDIS, 2009). Podemos inferir que a Epidemiologia é uma ciência aplicada e diri- gida para a solução de problemas de saúde, e se trata de uma ferramenta poderosa e de grande utilidade para a área da saúde. Atualmente, ela ocupa cada vez mais um lugar privilegiado como fonte de desenvolvimento metodológico para todas as ciências da saúde e subsidiando as práticas de saúde (ALMEIDA FILHO; BARRETO, 2011). Resumindo, a Epidemiologia é a disciplina que analisa a situação de saúde das populações a partir do levantamento da frequência e distribuição dos fenômenos associados à saúde humana, animal e ambiental; identifica os fatores determinantes (preditores) das doenças, agravos ou óbito; e auxilia no planejamento e gestão em saúde a partir de seus resultados e interpretações. Agora que você já entendeu o conceito da Epidemiologia, vamos compreender melhor os seus objetivos para a saúde coletiva e individual. Objetivos da Epidemiologia Como pudemos ver anteriormente, o alvo da Epidemiologia, no passado, era voltado para a detecção de epidemias, como as de cólera, pestes, varíola e febre amarela, que afetam a população. Com o passar do tempo, observou-se que a epidemia era apenas uma fase aguda de uma fase do processo de morbidade (doença). Os estudiosos passaram a observar continuamente a ocorrência e a distribuição das doenças agudas e a buscar agentes etiológicos específicos para as doenças. A par- tir disso, o estudo de doenças infecciosas crônicas também se tornaram alvo das pesquisas (PEREIRA, 2002). Ao longo dos anos, os pesquisadores e epidemiologistas observaram que houve uma redução do número de óbitos e doentes por doenças infecciosas, enquanto aumentaram os casos de doenças crônicas (como o câncer, diabetes e hipertensão arterial). O estudo de doenças crônicas dirigiu as pesquisas para investigações de condições etiológicas pré-existentes (presentes antes do aparecimento das alterações clínicas ou anatomopatológicas), como os fatores de risco e os estados fisiológicos. Assim, a Epidemiologia passou a estudar qualquer evento relacionado a saúde das populações, não só a doença, mas também os fatores de risco e de proteção aos quais os indivíduos se expõem, e outros fatores que afetam os índices de morbidade e mortalidade (PEREIRA, 2002). 160 UNICESUMAR A partir da assistência aos doentes e da prática de medidas preventivas, destacou-se o papel dos serviços de saúde para a detecção da distribuição e ocorrência das doenças, e esses serviços passaram a ser utilizados como referência para obtenção de dados e informações para a Epidemiologia, assim como a disciplina Epidemiologia passou a ser utilizada pelos serviços como um método de avaliação dos serviços prestados, como por exemplo, a auxiliar as instituições de saúde a verificar a cobertura populacional dos serviços, a qualidade do atendimento e outros (PEREIRA, 2002). Os objetivos básicos da Epidemiologia são: • descrever as condições de saúde da população, como a distribuição e a magnitude dos eventos, de forma a determinar a extensão da doença na comunidade; • investigar os fatores determinantes (preditores) da situação de saúde, ou seja, iden- tificar os fatores etiológicos na gênese das enfermidades em um contexto coletivo.; • estudar a história natural e o prognóstico da doença, a fim de desenvolver novos modelos de intervenção a partir de tratamentos ou medidas preventivas e, assim, comparar com os modelos de referência para verificar se foram efetivos; • reduzir ou eliminar a exposição aos fatores de risco a partir do desenvolvimento de uma base para programas preventivos; • reduzir os problemas de saúde a partir do conhecimento de sua distribuição e das medidas de intervenção; • proporcionar dados essenciais para o planejamento, execução e avaliação das ações de prevenção, controle e tratamento das doenças, assim como estabelecer prioridades; • proporcionar bases para desenvolver as políticas públicas de saúde relacionadas aos problemas genéticos, ambientais ou de outra natureza; • avaliar o impacto das ações dos serviços de saúde, assim como, tecnologias e pro- cessos no campo da saúde. (ROUQUAYROL; ALMEIDA FILHO, 1999; PEREIRA, 2002; GORDIS, 2009; ALMEIDA FILHO; BARRETO, 2011) Hoje, a Epidemiologia é fundamental e a base para todas as ciências básicas, clínicas e sociais da saúde (ALMEIDA FILHO; BARRETO, 2011). Mas qual é a sua história? Como surgiu tão importante disciplina? Quais são os princípios éticos, políticos e filosóficos que tornam inegável a Epidemiologia para nossas vidas? Todas essas respostas você encontrará no próximo tópico. PERSPECTIVA HISTÓRICA Neste tópico, você entenderá o surgimento da Epidemiologia como disciplina e base para as demais áreas da saúde, e compreenderá o seu desenvolvimento até a Epide- miologia Moderna. 161 UNIDADE 5 Raízes Históricas da Epidemiologia As raízes da Epidemiologia estão dentro da História da Medicina e da evolução das causas das doenças, e podemos traçá-las desde a antiguidade clássica (PEREIRA, 2002). Segundo Almeida Filho e Barreto (2011), a Epidemiologia é uma ciência que busca respostas para questões transcendentes sobre a vida, a saúde, o sofrimento e a morte, e que se modifica sem cessar. No campo científico, a Epidemiologia emergiu no final do século XIX e se consolidou como ciência em meados do século XX. Inicialmente, abordaremos os principais elementos da Epidemiologia, com base na cultura ocidental moderna, e as circunstâncias que que fizeram emergir os três pilares fundamentais da Epidemiologia: a clínica, a medicina social e a estatística (ALMEIDA FILHO; BARRETO, 2011). Hipócrates de Cós - Grécia antiga (400 anos a.C.) Os primeiros relatos associados à Epidemiologia são encontrados na História Antiga, em que exis- tia uma tensão entre a medicina curativa e preventiva, e entre a medicina individual e coletiva. Esse pensamento ocidental era encontrado na Grécia antiga em 420 a.C. Na mitologia grega, cultuava-se o deus da saúde, Asclépios (também chamado de Esculápio), concomitantemente conhecido como deus da medicina (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; BUSATO, 2016; ROU- QUAYROL; ALMEIDA FILHO, 1999). 162 UNICESUMAR Esse antagonismo entre a medicina curativa e a medicina preventiva é encontrado na figura das filhas e herdeiras de Asclépios, Panacéia e Higéia. Este paradoxo entre a medicina individual/curativa e coletiva/preventiva é ainda um pensamento predominante até os dias de hoje. Panacéia era conside- rada a “padroeira” da medicina individual curativa, a qual representava a prática terapêutica baseada em intervenções por manobras físicas, encantamentos, preces e uso de medicamentos (pharmakon= fármacos) em indivíduos doentes (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; BUSATO, 2016). A irmã, Higéia (que deu origem ao termo higiene), era venerada por aqueles que consideravam a saúde resultante da harmonia entre os homens e o ambiente. Os chamados higeus buscavam promo- ver a saúde e evitar as doenças por meio de ações preventivas, a partir da manutenção do equilíbrio entre os elementos fundamentais: terra, fogo, ar e água. A sobrevivência dessas crenças e práticas levou à derivação da palavra higiene e aoseu conceito no sentido de promoção da saúde, principalmente em âmbito coletivo (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; ROUQUAYROL; ALMEIDA FILHO, 1999). O precursor da Epidemiologia, também con- siderado por muitos o pai da Epidemiologia, foi Hipócrates de Cós. O raciocínio epidemiológico foi antecipado por Hipócrates a partir de seus es- tudos sobre as epidemias (termo criado por ele) e a distribuição das enfermidades nos ambientes. No seu escrito Corpus Hippocraticus, fica clara a visão racional da medicina, afastando as teorias sobrena- turais, bem diferente da concepção mágico-religio- sa predominante na antiguidade (PEREIRA, 2002; ALMEIDA FILHO; BARRETO, 2011). Hipócrates definiu que a saúde do homem de- penderia da harmonia entre os fluidos (bile amarela e negra, fleugma ou linfa, e sangue) e do equilíbrio destes elementos naturais, ou seja, as doenças eram produto da relação complexa entre a constituição do indivíduo e do ambiente que o cerca. Em seu texto, ele orientava ao médico sempre considerar os fatores ambientais como o clima, a maneira de viver, os hábitos de comer e de beber, durante a avaliação clínica do indivíduo. Ele também defen- dia o exame clínico minucioso e sistemático do pacientes, que consiste em base para o diagnóstico e descrição da História Natural das Doenças. Além de ser considerado o pai da medicina, muitos o consideram o pai da Epidemiologia, ou ainda o primeiro epidemiologista (PEREIRA, 2002). Figura 1 - Hipócrates de Cós, o iniciador da Epidemiologia, que estudou as causas das doenças seguindo um raciocínio lógico e não miasmático. 163 UNIDADE 5 Um dos seus trabalhos clássicos, denominado como Ares, águas, lugares, buscou apresentar ex- plicações no racional, e não no sobrenatural, a respeito das doenças nas populações, ligando-as aos fatores ambientais, defendendo o conceito ecológico da saúde-enfermidade, utilizado até os dias de hoje. Suas observações não se limitavam apenas ao paciente em si, mas sim à coletividade. A partir daí, surgiu a ideia do miasma (emanação), em que a doença era originada de situações insalubres, como a má qualidade do ar. Essas emanações insalubres seriam capazes de causar doenças como malária, que vem do latim maus ares (junção de mal e ar), que se relaciona com a crença sobre o modo de transmissão da doença. As emanações passariam do doente para os indivíduos suscetíveis, o que explicava a origem das epidemias de doenças contagiosas da época (PEREIRA, 2002; ALMEI- DA FILHO; BARRETO, 2011). A preservação dos ensinamentos de Hipócrates foi mantida principalmente por Galeno (138-201 a.C) na Roma antiga, por árabes na Idade Média e retomada por clínicos na Europa Ocidental, no período da Renascença e, posteriormente, por toda parte. Um dos médicos mais famosos naquele período, foi Claudius Galeno, natural de Bergama (Turquia). Galeno sustentou a teoria humoral de Hipócrates e a ampliou (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; BUSATO, 2016; ROUQUAYROL; ALMEIDA FILHO, 1999). Além de Galeno, a era romana nos deixou mais um legado para a Epidemiologia, pelas mãos do im- perador Marco Aurélio, que solicitava a realização de censos periódicos e de um registro compulsório de nascimentos e óbitos, o que mais tarde seria conhecido como “estatísticas vitais”. O império romano tinha o que podemos chamar de infraestrutura sanitária, formada por aquedutos que levavam água de melhor qualidade para Roma, e de esgotos, que até hoje são preservados (ALMEIDA FILHO; BARRETO, 2011; BUSATO, 2016; ROUQUAYROL; ALMEIDA FILHO, 1999). Idade Média até o Século XIX No início da idade média, no Ocidente, predominaram o cristianismo e as práticas de caráter mági- co-religioso, com o propósito da salvação da alma. A prática clínica para os pobres era exercida por religiosos, principalmente como caridade, ou por leigos, barbeiros, boticários e outros. Nesse contexto, não havia espaço para as ações de cunho coletivo, alastrando-se as epidemias e as pragas, e nestas situações de maior risco, tornava-se a se tomar as medidas coletivas (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). Enquanto no mundo ocidental priorizavam-se as medidas de cunho individual e práticas baseadas em magia, no mundo árabe destacavam-se o avanço tecnológico e o caráter coletivo da medicina. O apogeu desta era deu-se no século X, nos califados de Bagdá e Córdoba. Os médicos muçulmanos, ainda preservando os princípios hipocráticos, realizavam a prática da higiene, precursora da saúde pública, pois foram estabelecidos os registros de informações demográficas e sanitárias e até sistemas de vigilância epidemiológica. 164 UNICESUMAR Neste período, destacamos o médico persa Avicena (989-1037), autor da obra Cânon da Medicina, que trata dos princípios gerais da medicina, adotando os termos Etiologia, sintomas, diagnose, prognose e terapêutica. Nessa obra, foi preconizado o uso sistemático do registro da ocorrência de doenças, antecipando a Epidemiologia (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; BUSATO, 2016; ROUQUAYROL; ALMEIDA FILHO, 1999). O avanço no campo cultural, filosófico e social, articulado à emergência de um novo modo de produção, resultou na constituição das ciências modernas. O novo entendimento do mundo superou a metafísica religiosa medieval e, entre os séculos XVI e XVIII, houve um enorme e complexo esforço para a produção de dados, informações e conhecimento em todos os níveis do saber e localidades em que se expandia a civilização ocidental (ALMEIDA FILHO; BARRETO, 2011). No século XVI, o médico espanhol Angelério descreveu um estudo sobre as pestes, denominado Epidemiologia, tendo então criado o termo. No final do século XVIII e início do século XIX, iniciando com a Revolução Francesa, as epidemias como cólera, febre tifóide e febre amarela eram graves problemas de saúde nas cidades, aumentando as preocupações com higiene, o aprimoramento da legislação sanitária e a criação de estruturas administrativas para controle e prevenção das doenças (PEREIRA, 2002). Todos esses avanços e o impacto dos movimentos renascentistas na formação da Epidemiologia permitem dizer que ela surgiu da consolidação de um tripé de elementos conceituais (saberes sobre a doença), metodológicos (diretrizes quantitativas) e ideoló- gicos (práticas de transformação da sociedade): Clínica, estatística e Medicina Social, respectivamente (ALMEIDA FILHO; BARRETO, 2011; BUSATO, 2016). A seguir, você aprenderá sobre as raízes epidemiológicas em cada um dos três eixos. Epidemiologia na Clínica O fundador da clínica médica foi Thomas Sydenham (1624-1689), segundo os anglo-sa- xões. Sydenham era um médico de Londres e um precursor da ciência epidemiológica que estabeleceu uma teoria sobre epidemias e elaborou o conceito “História Natural das Enfermidades” (MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011; ROU- QUAYROL; ALMEIDA FILHO, 1999). Para os franceses, o precursor da medicina científica moderna foi Michel Focault (1926- 1984). Foucault conta que a Sociedade de Medicina de Paris fundou a clínica moderna no século XVIII, e organizou-se a partir da Ordem Real para que os médicos investigassem uma epizootia que dizimou rebanhos e que gerou grandes perdas para a indústria têxtil francesa. Nessa investigação estava incluída a contagem do número de casos, mesmo que não humanos, o que contribuiu grandemente para a Epidemiologia metodológica (ALMEIDA FILHO E BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999; MEDRONHO, 2009). 165 UNIDADE 5 Com a teoria microbiana e a fisiopatologia, a medicina científica passou a desem- penhar um papel importante na institucionalização da prática médica contemporânea. No século XVII, o microscópio já era conhecido nos Países Baixos e, inicialmente, não era utilizado por médicos ou outro profissional das ciências biológicas, mas sim por comerciantes para examinar a qualidade dos tecidos que compravam e vendiam. A curiosidade do homem foi além, e passou avisualizar tudo que estivesse à sua volta (ALMEIDA FILHO; BARRETO, 2011). Com os aperfeiçoamentos técnicos e a vidraria, foi possível a confecção de instrumentos óticos de razoável potência, por- tanto foi possível reconhecer os microrganismos e relacionar o seu papel na gênese das doenças (PEREIRA, 2002; ALMEIDA FILHO; BARRETO, 2011). A partir daí, um dos clínicos mais conhecidos por explorar problemas de maior relevância clínica e de saúde pública na época foi Ignaz Semmelweis (1818-1865). Semmelweis comandava a maternidade do hospital geral de Viena (Áustria), que na época tinha duas clínicas obstétricas. A clínica, constituída por médicos e estudantes de medicina, registrou 16% de taxa de óbito de parturientes, quase dez vezes maior que no setor das parteiras (7%). Após um aluno de Semmelweis ferir-se acidental- mente durante uma necropsia e morrer de infecção maciça, detectaram lesões e pus que se assemelhavam aos encontrados nas parturientes mortas por febre puerperal. Observou-se que os médicos e estudantes, que todos os dias realizam as necropsias nas pacientes falecidas e depois iam fazer os partos, poderiam transmitir as tais partículas a partir das mãos. A partir disso, Semmel- weis determinou que antes dos partos os profissionais deveriam lavar as mãos com uma solução de soro e escovar as unhas após as autópsias e antes de entrar em contato com qualquer paciente. No ano seguinte, a mortalidade da clínica médica foi semelhante a das parteiras, reduzindo de 12,2% para 2,4% (GORDIS, 2009; ALMEIDA FILHO E BARRETO, 2011). Outras contribuições foram surgindo a partir da emergência da fisiologia moderna e da microbiolo- gia, principalmente com Louis Pasteur (1822-1895). A pedido da indústrias de vinho, Pasteur, químico e não médico ou biólogo, estudou a fermentação alcoólica evidenciando a presença de leveduras como causa do processo. Ele também iniciou a teoria da pasteuriza- ção, na qual alguns microrganismos eram destruídos pelo aquecimento (GORDIS, 2009; ALMEIDA FILHO; BARRETO, 2011; PEREIRA, 2002). Figura 2 - Louis Pasteur, famoso pelos estudos de fer- mentação alcoólica e pasteurização. Fonte: Wikimedia (2016, on-line)¹. 166 UNICESUMAR Um outro exemplo importante da clínica médica é Robert Koch (1843-1910), que em 1882 descobriu o agente causador da tuberculose e escreveu os postulados da teoria microbiana da doença (“teoria do germe”). Koch postulou que o microrganismo deveria ser isolado em cultura de cada caso da doença. Uma vez isolado, deveria ser inoculado em um animal para reproduzir a doença experimentalmente. Aplicando-se os métodos de Koch, em 1880 e 1989 foram descobertos os agentes da febre tifóide, hanseníase, malária, cólera, erisipela, difteria, brucelose, pneumonia e outros (ALMEIDA FILHO, BARRETO, 2011). Como podemos ver, na segunda metade do sé- culo XIX e na primeira do século XX ocorreu uma reorientação do pensamento médico e uma altera- ção dos conceitos de doença e contágio. A partir da comprovação de seres microscópicos e seu papel na gênese da enfermidades, a clínica e a patologia tornaram-se subordinadas aos laboratórios, que também ditavam as normas de higiene e legislação sanitária. As escolas de saúde pública passaram as formas aos sanitaristas, e os ensinos passaram a se concentrar em laboratórios. Foram fundados diversos institutos de pesquisas aplicadas à prática clínica, como o Instituto Pasteur e, consequente- mente, aumentou-se o número de produções cien- tíficas com progresso da ciência e tecnologia. Não somente os avanços da bacteriologia; houve uma significativa consolidação dos métodos de preven- ção de doenças, como as imunizações e a promoção da saúde ambiental (PEREIRA, 2002). Em relação às imunizações, destaca-se Edward Jenner (1749), que teve um grande interesse na varíola, considerada um problema de saúde universal para a época. Sabia-se que os sobreviventes à doença estariam imunes, e tornou-se uma prática comum infectar indivíduos saudáveis administrando um material retirado de pacientes com varíola. Esse procedimento ficou conhecido como variolização, e tornou-se um método preventivo muito comum na prática médica. No entanto, muitos indivíduos foram a óbito, ou alguns desenvolveram a doença ou ainda outras infecções (GORDIS, 2009). Com o objetivo de encontrar uma prática mais segura para prevenir a varíola, Jenner passou a estudar a varíola bovina, e observou que as mulheres ordenhadoras de vacas desenvolviam a varíola mais bran- da e que após surtos da doença essas mulheres não desenvolviam a infecção. Então, Jenner decidiu testar a hipótese de que a varíola bovina poderia prevenir a doença nos homens. Somente em 1967 a Organização Mundial da Saúde (OMS) realizou uma intensa campanha internacional para erradicar a varíola, usando vacinas contendo o vírus da varíola bovina. Em 1980, a OMS emitiu um certificado de erradicação da doença (GORDIS, 2009). Figura 3 - Robert Koch, o descobridor do agente etiológico da tuberculose. / Fonte: Wikimedia (2016, on-line)². 167 UNIDADE 5 Na saúde ambiental, destacou- -se o meio ambiente como propa- gador de doenças, relacionando o seu papel na transmissão das en- fermidades, como a presença de vetores e reservatórios de agentes. Com a saúde ambiental, foi pos- sível estabelecer ciclo de vida de parasitos e o papel de mosquitos na transmissão de doenças in- fecciosas. A partir destes conhe- cimentos de transmissibilidade, abandonou-se a teoria centrada nos germes e passaram a aplicar a teoria da multicausalidade para a ocorrência de doenças, ou seja, as doenças são resultantes da in- teração entre o agente, o homem e o meio ambiente. A doença re- sultaria em qualquer perturbação dessa complexa interação de múl- tiplos fatores, e não só de um fator unificado (PEREIRA, 2002). A partir de todos os resultados clínicos, a quantificação da doença passou a ser um elemento metodológico importante para avaliar a distribuição das doenças e a efetividade das medidas preventivas. A quantificação das enfermidades passou a ser uma nova ciência da saúde, surgindo a estatística (PEREIRA, 2002; ALMEIDA FILHO; BARRETO, 2011, MEDRONHO, 2009). Desta maneira, a clínica contribui para a descrição das doenças, diagnóstico e tratamento de doenças, agravos e outros eventos de saúde que acometem pessoas ou populações, sendo importante para o avanço das pesquisas e desenvolvimento da tecnologia médica (BUSATO, 2016). Epidemiologia na Estatística Segundo Busato (2016, p. 24), “a articulação entre a clínica, medicina social e a estatística, resulta na evolução da Epidemiologia, ressaltando a sua vocação de ciência aplicada no diagnóstico e na solução de problemas de saúde”. A estatística é um método capaz de analisar os riscos, os fatores de risco e os desfechos em saúde, promovendo maior confiabilidade nos resultados obtidos pelas pesquisas. Além disso, com a computadorização, a avaliação de causa e efeito tiveram maior precisão na análise estatística. Figura 4 - Edward Jenner (1749-1823), pioneiro da vacinação. Nesta figura, está o menino James Phipps de 8 anos de idade sendo imunizado contra varíola, 1796. 168 UNICESUMAR Os métodos numéricos já eram utilizados para o estudo da situação de saúde já no século XVII. As pesquisas e os registros populacionais de John Graunt (1620-1674) são mencionados como precursores da demografia, da estatística e da Epidemiologia. Graunt foi um membro da Royal Society (Londres) que realizou os primeiros estudos analíticos de estatística vital utilizando dados de obituários (mortalidade por sexo e região). Graunt foi o pioneiro em utilizar os coeficientes (óbito em relação à população) e é considerado o pai das estatísticas vitais ou o pai da demografia (ALMEIDA FILHO; BARRETO, 2011, MEDRONHO, 2009; PEREIRA, 2002; ROUQUAYROL; ALMEIDA FILHO, 1999). Em 1747, James Lind (1716-1794), um médico escocês e pioneiro da higiene naval, realizou o primeiro estudo de ensaio clínico (experimen-tação em seres humanos). Lind observou que marinheiros possuíam sintomas como dentes soltos, sangramento de gengivas e hemorragias. Assim, ele selecionou 12 homens do navio que sofriam de escorbuto e dividiu os dois grupos, com seis indivíduos cada. Os grupos receberam adições diferentes à sua dieta básica: alguns receberam sidra (fermen- tado alcoólico de suco de maçã), e outros água do mar, uma mistura de alho, mostarda e rabanete. O outro grupo recebeu vinagre, laranjas e limões. Os indivíduos alimentados com cítricos tiveram uma recupera- ção notável. Lind estabeleceu definitivamente a superioridade das frutas cítricas sobre todos os outros tratamentos (BBC, 2017; PEREIRA, 2002). O estudo de Pierre-Charles Alexandre Louis (1787-1872) inaugurou a Epidemiologia. Louis foi um médico e matemático precursor da avaliação da eficácia de tratamentos clínicos utilizando métodos estatísticos, que realizou estudos para investigar a mortalidade por diversas doenças. Um desses estudos avaliou a letalidade da pneumonia após o tratamento com a sangria, e revelou também seu poder prejudicial para o tratamento da doença (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; PEREIRA, 2002; ROUQUAYROL; ALMEIDA FILHO, 1999). William Farr (1807-1883) criou o registro anual de mortalidade e morbidade para a Inglaterra e o País de Gales. Essa criação foi o marco da institucionalização dos sistemas de informação em saúde. Farr foi influenciado pelo enfoque social, e analisou os dados de mortalidade com dados específicos (ocupações, sexo, estação e outros fatores). Jun- tamente dos dados disponibilizados pelo escritório, foi possível o acesso a um manancial de informações sobre saúde, até então não disponível (MEDRONHO, 2009, ALMEIDA FILHO; BARRETO, 2011; PEREIRA, 2002; ROUQUAYROL; ALMEIDA FILHO, 1999). 169 UNIDADE 5 O método de aritmética médica de Louis e a estatística de Farr permitiram a integração entre a clínica e a estatística, faltando ape- nas o campo político para o surgimento de uma nova ciência da saúde de caráter coletivo. Para isso, também foi preciso atribuir a saúde aos aspectos sociais e políticos e aliar este princípio à preo- cupação e ao compromisso com o processo de transformação da situação de saúde na sociedade . No final do século XVIII, com a burguesia já consolidada, ocorreram muitas intervenções do Estado na saúde das populações (MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). Na França, esse processo ficou conhecido como Medicina urbana, com o objetivo de sanear as cidades e os seus espaços, ventilar as ruas e as construções e isolar áreas consideradas miasmáticas. Na Inglaterra e na Alemanha também houve intervenção do Estado para o controle e vigilância das enfermidades, e havia o movimento hospitalário e o assistencialismo. Com a urbanização e a formação de um proletaria- do, abriu-se um processo de luta política por uma medicina coletiva, ou medicina social, dando início a um movimento de politização da saúde (MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). Medicina Social Também conhecida como medicina urbana ou ainda medicina social (termo cunhado por Jules Guérin em 1838). A medicina social designa modos de abordar a questão da saúde de modo co- letivo (MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011). Muitos relatórios de discípulos de Louis Pasteur, tanto na França como na Inglaterra, demonstraram que as condições inadequadas de vida da classe trabalhadora resultaram na deterioração dos níveis de saúde. Em 1842, na Alemanha, Edwin Chadwick (1800-1890) escreveu o relatório As condições sanitárias da população traba- lhadora da Grã-Bretanha, voltado para a medicina dos pobres. Essa publicação impressionou o Parlamento, que ficou encarregado de propor medidas de saúde pública e de recrutamento de médi- cos sanitaristas para solucionar os principais problemas de saúde coletiva (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). 170 UNICESUMAR Em meados do século XIX, o médico sanitarista Rudolf Ludwing Karl Virchow (1821-1902) destacou-se como um dos principais personagens da medicina social. O legislativo de Berlim enviou Virchow para a Alta Silésia, onde vivia uma população de origem polonesa (da mesma origem da família de Virchow), para estudar um surto de tifo. O seu relatório constatou que as pessoas viviam em condições deploráveis e denunciou o capitalismo, pois descreveu que a prevenção das epidemias não dependia somente de remédios ou medidas de higiene, mas dependia de uma ampla reforma das condições sócio-econômicas (MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). Em 1850, os jovens idealistas médico-sociais, oficiais de saúde pública e membros da Royal Me- dical Society organizaram na Inglaterra a London Epidemiological Society. Dentre os membros mais importantes destacou-se John Snow (1813-1858), considerado o fundador (pai) da Epidemiologia. Snow desenvolveu numerosos estudos para esclarecer a origem das epidemias de cólera ocorridas em Londres (MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011; GORDIS, 2009; PEREIRA, 2002; BUSATO, 2016; ROUQUAYROL; ALMEIDA FILHO, 1999). Naquele período, Londres era uma megalópole de 2,5 milhões de habitantes, e que tinha uma precária condição de higiene e de saneamento. Os dejetos eram acumulados por toda parte da cidade e jogados no rio Tâmisa, cuja água era uti- lizada para abastecimento por duas companhias de distribuição. Para Snow, a teoria do miasma não explicava a transmissão de cólera. Em 1849, no segundo ano da epidemia, Snow publicou o panfleto intitulado ‘Sobre a Maneira de Trans- missão da Cólera’ (On the Mode of Communi- cation of Cholera), defendendo a ideia de que a doença era transmitida pela água (contaminação hídrica) (ALMEIDA FILHO; BARRETO, 2011; BUSATO, 2016). Snow observou que os casos mais frequentes estavam entre as pessoas que usavam água forne- cida por empresas que a recolhiam de um poço na Broad Street. A captação da água era realizada em pontos muito poluídos do rio pelas companhias Lambeth Company e Southwark and Vauxhall Company. Naquela época, por motivos técnicos e não de saúde, a companhia Lambeth transferiu o lugar de captação da água para um local menos poluído do rio Tâmisa, mas a outra companhia não moveu o local de captação da água. Snow racio- cinou que a transferência do lugar de captação da água deveria reduzir a taxa de mortalidade por cólera Figura 5 - John Snow, o pai da Epidemiologia, realizou estudos sobre o cólera em Londres durante o período de 1849-1856. Fonte: Wikimedia (2015, on-line)³. 171 UNIDADE 5 naqueles que recebiam água pela companhia Lambeth em relação aos que recebiam água pela outra empresa. Snow encontrou uma taxa de mortalidade de 315 casas por 10.000 casas quando a água era distribuída pela Southwark and Vauxhall Company. Naquelas abastecidas pela Lambeth Company, a taxa era de apenas 38 casos de óbito a cada 10.000 casas (GORDIS, 2009; PEREIRA, 2002; BUSATO, 2016). O número de casos de cólera era quase 14 vezes maior na área que recebia água da companhia Southwark and Vauxhall em relação à região abastecida pela Lambeth Company. Então, ele propôs ao conselho administrativo que fosse removida a bomba do poço de Broad Street, e os casos de cólera começaram a diminuir. A partir disso, ele publicou a segunda edição de On the Mode of Communi- cation of cholera, acrescentando esses resultados. Em 1884, Robert Kock isolou e cultivou a bactéria (ALMEIDA FILHO; BARRETO, 2011). Na Inglaterra, na França e na Alemanha, surgiu o movimento conhecido como sanitarismo, no qual a maioria dos funcionários era de agências oficiais que realizavam o controle de doenças. Os sanitaristas faziam discursos e praticavam as questões de saúde baseados na aplicação de tecnologia e em atividades profiláticas, como a imunização, o saneamento e o controle de vetores. As ações eram destinadasprin- cipalmente aos pobres e a setores excluídos da sociedade. Além do sanitarismo, a estatística, a patologia e as pesquisas microbianas aplicadas no campo social da saúde (Saúde Pública) contextualizaram a constituição da Epidemiologia como campo científico (ALMEIDA FILHO; BARRETO, 2011). Epidemiologia Atual Dando continuidade abordaremos a consolidação da Epidemiologia como disciplina, as atualidades e o seu desenvolvimento no Brasil. No Mundo Em 1918, a escola pioneira de saúde pública foi inaugurada em Baltimore (EUA), Johns Hopkins School of Hygiene and Public Health, a qual serviu de modelo de “escola de saúde pública” e foi difundida pelo mundo todo, com o apoio da Fundação Rockefeller. Wade Hampton Frost (1880-1938), sanitarista do National Public Health Service, assumiu a nova cátedra de Epidemiologia na escola John Hopkins e foi o primeiro professor da disciplina no mundo. Frost utilizou novas técnicas estatísticas para es- tudar a prevalência e a incidência de doenças transmissíveis (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; ROUQUAYROL; ALMEIDA FILHO, 1999). Em 1928, a fusão da antiga Escola da Medicina Tropical com o Departamento de Higiene da University College formou a London School of Hygiene and Tropical Medicine. O primeiro pro- fessor de Epidemiologia e Estatística Vital foi Major Greenwood (1880-1949), conhecido também como o fundador da estatística moderna. Ele foi o principal responsável em introduzir a estatística na pesquisa epidemiológica (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; ROU- QUAYROL; ALMEIDA FILHO, 1999). 172 UNICESUMAR Em 1929, com a crise econômica mundial e social, o avanço tecnológico e a especialização da prática médica levaram à elevação dos custos e da elitização da assistência à saúde, reduzindo o seu alcance social. Nesse período, o caráter social das doenças foi resgatado a partir da Epidemiologia. Em 1936, o clínico britânico John Ryle (1889-1950), o primeiro diretor do Instituto de Medicina Social da Universidade de Oxford, propôs a sistematização do modelo de História Natural das Doenças, essencial para a crescente medicina preventiva. Nesse modelo, a saúde poderia ser alcançada pelas ações intervencionistas reali- zadas antes do aparecimento da doença. Posteriormente, a noção de prevenção se estendeu em muitos países que internacionalizaram o movimento ideológico da Medicina Preventiva como prática médica (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; ROUQUAYROL; ALMEIDA FILHO, 1999). Nas décadas de 1930 e 40, muitos países passaram a incorporar os aspectos de prevenção nos con- teúdos de formação de profissionais de saúde. Foram criados departamentos de medicina preventiva que abordavam os conteúdos de Epidemiologia, administração em saúde e ciências da conduta, que eram ministrados pelas escolas de saúde pública somente. O conceito de prevenção foi ampliado para prevenção primária, secundária e terciária (descritos ainda nesta unidade), incorporando toda a prática médica (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009). Com a Segunda Guerra Mundial, houve uma necessidade de desenvolver métodos eficientes para medir a saúde física e mental dos exércitos, abrindo a possibilidade de aplicação dos métodos epi- demiológicos à população civil. No período pós-guerra, grandes inquéritos epidemiológicos foram realizados, principalmente de doenças não-infecciosas, como pretendia a nova ciência (MEDRONHO, 2009; ROUQUAYROL; ALMEIDA FILHO, 1999). Em 1954, a institucionalização da disciplina levou à fundação da International Epidemiological Association (IEA), à transformação do tradicional American Journal of Hygiene em American Journal of Epidemiology em 1964. Na década de 1950, novos desenhos de investigação começaram a ser desenvolvidos por programas de investigação e departamentos de Epidemiologia (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; PEREIRA, 2002; ROTHMAN; GREENLAND; LASH, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). Na teoria, foram definidos os indicadores básicos da saúde, prevalência e incidência, e formalizado o conceito de risco. Também foi introduzida a Bioestatística como ferramenta de análise dos estudos para a identificação das causas das enfermidades. Neste campo, destacou-se Jerome Cornfield (1912- 1979), que desenvolveu os estimadores do risco relativo (risco de desenvolver uma determinada doença quando exposto a um fator de risco) e introduziu as técnicas de regressão logística (análise estatística) na Epidemiologia (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009). Na década de 1960, houve um grande avanço tecnológico e científico com o desenvolvimento e difusão da computação eletrônica. Isso levou à matematização cada vez maior da disciplina. Com a computação, foi possível criar e utilizar os bancos de dados, que aliados às ferramentas e softwares (programas) de estatística, expandiram a investigação epidemiológica. Na década de 1970, a matemática passou a validar as investigações científicas dos riscos, fatores e efeitos, ou seja, ela passou a ser indis- pensável para a confrontação da experiência clínica ou da demonstração experimental (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; ROUQUAYROL; ALMEIDA FILHO, 1999). 173 UNIDADE 5 Na década de 80, foi consolidada a Epidemiologia clínica, aquela fora do contexto coletivo, com ênfase em procedimentos de identificação de caso e na avaliação da eficácia terapêutica, conforme o que recentemente é conhecido como medicina baseada em evidência. Nos anos de 1990, houve uma ampliação do objetivo de conhecimento da disciplina, surgindo novos horizontes de pesquisa, destacando-se a Epidemiologia Molecular, a Epidemiologia Genética, a Farmacoepidemiologia e a Epidemiologia de Serviços de Saúde (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009). No Brasil No Brasil, o início da Epidemio- logia deu-se com a Medicina Tropical e os naturalistas, que des- creveram a ocorrência de muitas doenças infecciosas, seus agentes e vetores. Em 1903, o médico Os- waldo Cruz (1872-1917), egres- so do Instituto Pasteur de Paris, ocupou o cargo de diretor Geral de Saúde Pública. Oswaldo Cruz tinha como tarefa, sanear a capital (Rio de Janeiro, naquela época), e combater as principais endemias da cidade, como a febre amarela, varíola e peste bubônica. Oswaldo Cruz impôs a notificação compulsória e medidas rigorosas para controle das doenças, como a aplicação de multas e vacinação nos moldes militares. Em 1904, a capital sofreu uma grave epidemia de varíola, e obrigou a vacinação contra a doença a partir de um projeto de lei do Congresso, a qual previa sanções para quem a desobedecesse. O autoritarismo da vacina levou à insatisfação popular que deu origem à Revolta das Vacinas. No início do século XX, em Manguinhos, no Rio de Janeiro, Oswaldo Cruz fundou um Instituto de pesquisa, que hoje leva o seu nome e se tornou um dos laboratórios mais importantes do país (PEREIRA, 2002; ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009). Após Oswaldo Cruz, destacou-se Carlos Chagas (1879-1934), médico sanitarista e campanhista. Em 1909, em Lassance (Minas Gerais), enquanto combatia o surto de malária, Chagas descobriu o agente da tripanossomíase americana (mundialmente conhecida como Doença de Chagas), o protozoário Trypanosoma cruzi, nome dado em homenagem ao Oswaldo Cruz (MEDRONHO, 2009; PEREIRA, 2002; ALMEIDA FILHO; BARRETO, 2011). Do Instituto Manguinhos, também merece destaque o protozoologista Adolfo Lutz (1855-1940), que trabalhou com febre amarela e outras endemias. Lutz ocupou o cargo de diretor do Instituto Bacteriológico em São Paulo, e descobriu a relação do vetor Aedes aegypti como transmissor da febre amarela (PEREIRA, 2002; ALMEIDA FILHO; BARRETO, 2011). Figura 7: Revolta das Vacinas, ocorrida em 1904 no Rio de Janeiro, contra o autori- tarismo da vacinação comandado por Oswaldo Cruz e seu exército Fonte: Wikimedia (2017, on-line)4. 174 UNICESUMAR Em meados de 1950, foram criados os departamentos de Medicina Preventiva(ou Social) em fa- culdades de Medicina, e a disciplina de Epidemiologia foi inserida nos cursos de medicina. Em 1960, foram realizadas campanhas de vacinação para a erradicação da varíola, e em 1970, contra a poliomielite. Juntamente com a epidemia de doença meningocócica, as campanhas e a epidemia contribuíram para a consolidação do Sistema Nacional de Vigilância Epidemiológica do Brasil. Ainda em 1970, foram criados núcleos de saúde coletiva, e em 1979 criou-se a Associação Brasileira de Pós-graduação em Saúde Co- letiva (ABRASCO), atuando também nos serviços de saúde (MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011). O ápice do movimento de reforma sanitária deu-se na VIII Conferência Nacional de Saúde, considerada o marco da criação do Sistema Único de Saúde (SUS). Em 1898, durante o Seminário Estratégias para o Desenvolvimento da Epidemiologia no Brasil, foi elaborado o I Plano Diretor, que abordava questões sobre o desenvolvimento da disciplina no Brasil para a graduação, pós-gra- duação, pesquisas e serviços de saúde (MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011). Em 1990, foi realizado o I Congresso Brasileiro de Epidemiologia (Campinas, SP) e criado o Centro Nacional de Epidemiologia, órgão vinculado ao Ministério da Saúde (criado em 1953). Esse órgão era responsável por promover e disseminar o uso de Epidemiologia para todos os níveis de atenção na saúde do SUS. Posteriormente, foram realizados outros congressos de Epidemiologia, com cada vez mais trabalhos científico apresentados e maior número de participantes, e também atualizado o Plano Diretor (MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011). Desde 2005, a Comissão de Epidemiologia da ABRASCO lançou o IV Plano Diretor de Desenvol- vimento da Epidemiologia no Brasil, que afirma o uso da Epidemiologia na saúde pública, refletindo um grande aumento das pesquisas epidemiológicas com impacto social e as relações com os diversos determinantes de saúde (social, econômico, político e cultural) (MEDRONHO, 2009; ALMEIDA FILHO E BARRETO, 2011). APLICAÇÕES DA EPIDEMIOLOGIA Tradicionalmente, a Epidemiologia é utilizada como método de verificação da situação de saúde de uma população, estudando a distribuição das doenças e outros problemas de saúde e as razões para que esta distribuição ocorra. Além disso, com essa base racional, a Epidemiologia pode ser utilizada para a deci- são das intervenções em saúde e empregada para avaliar o sucesso das tomadas de decisão para o bem individual e da coletividade (PEREIRA, 2002; FRANCO; PASSOS, 2011). Bem como a Epidemiologia é um campo de ação tecnológica que pode ser utilizada no planejamento e gestão em saúde, também é um campo de prática social que promove a saúde (ALMEIDA FILHO; BARRETO, 2011). A seguir, as aplicações da Epidemiologia serão melhor descritas complementando o tópico I desta unidade. 175 UNIDADE 5 Diagnóstico da situação de saúde O diagnóstico da situação de saúde de uma população é baseada na iden- tificação dos problemas de saúde que afetam um ou mais indivíduos, e é uma das principais aplicações da disciplina, se- não a mais importante. Essa investigação gera dados quantitativos que são obtidos diariamente, como em laboratórios de análises clínicas (diagnóstico e notifica- ção de casos de dengue, por exemplo), ou em situações especiais, como em in- quéritos realizados por graduandos ou pós-graduandos. Todos os dados coleta- dos podem ser analisados em conjunto e fornecer um diagnóstico da população (ROTHMAN et al., 2011; PEREIRA, 2002; GORDIS, 2009). Os dados coletados podem ser a ocorrência de uma condição única, como um agravo à saúde (uma doença, uma sequela pós-traumática, um efeito adverso e outros); um fator de risco (por exemplo, exposição ao fumo ou álcool); uma característica populacional, como raça e condições econômicas, ou outro evento de interesse; grupo de condições, como doenças infecciosas ou cardiovasculares, por exemplo (PEREIRA, 2002). Com a geração de informações em saúde, é possível: f) direcionar as ações em saúde; por exemplo, focar as ações saneantes para áreas com maior taxa de infecções gastrointestinais. A distribuição de casos apontará as camadas da população em que o dano é dano mais frequente ou onde é raramente encontrado. Com esses dados é possível acompanhar as intervenções e observar se os processos de desigualdade persistem ou foram sanados. Desta forma, uma das ações da Epidemiologia, além de identificar os problemas de saúde, é de propor medidas preventivas dos riscos e os danos a fim de evitar a ocorrência das doenças, agravos, ou compli- cações, como a vacinação do exemplo acima (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999; GORDIS, 2009). g) formular explicações ou gerar hipóteses do porque esses eventos são mais frequentes em de- terminados grupos. 176 UNICESUMAR A distribuição de eventos em uma população nos leva a questionar: quais são os fatores que influen- ciaram ou que causaram essa distribuição? Uma variável de exposição constitui um fator de risco ou não para uma determinada patologia? A resposta para esta questão se torna muito importante do ponto de vista da saúde coletiva, para que se possa tomar decisões para a resolução de problemas de saúde (ALMEIDA FILHO; BARRETO, 2011; PEREIRA, 2002; ROUQUAYROL; ALMEIDA FILHO, 1999; GORDIS, 2009). No entanto, o maior desafio da Epidemiologia consiste na correta produção de hipóteses e no processo de validação destas para a busca de soluções para os problemas identificados (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999; GORDIS, 2009; ROTHMAN et al. 2011). Você já pensou como a Epidemiologia está relacionada com a sua rotina e suas relações indi- viduais e coletivas? Avalie a importância da Epidemiologia no seu cotidiano. Identificação etiológica dos problemas de saúde A identificação etiológica significa identificar a causa de uma doença, de um agravo ou de qualquer outro problema de saúde, o que constitui um grande desafio científico. Como podemos ver na história da Epidemiologia, a investigação das causas das doenças tiveram início no sobrenatural. Posteriormente, atribuiu-se aos fatores físicos e miasmas, depois aos germes ou contágio e, então, à múltipla causalidade (multifatorial, a teoria utilizada até os dias de hoje). Nesta fase da causalidade múltipla, os eventos de saúde dependem da interação dos fatores físicos, biológicos, sociais e outros na coletividade (PEREIRA, 2002; ROUQUAYROL; ALMEIDA FILHO, 1999; GORDIS, 2009; ROTHMAN et al., 2011). No caso das investigações epidemiológicas, podemos ter abordagens unicausais ou multicausais (PEREIRA, 2002): • unicausal: relaciona-se uma causa a um efeito. Por exemplo, a incidência e mortalidade por câncer de pulmão é reduzida significativamente com a diminuição do hábito de fumar. Porém, esse princípio da unicausalidade não se aplica a muitas doenças, como as crônico-degenerativas (diabetes, por exemplo); 177 UNIDADE 5 • ulticausal: múltiplas causas estão envolvidas com um evento ou uma única causa está envol- vida com muitos danos à saúde. Exemplo: as doenças coronarianas estão associadas a múl- tiplos fatores, como a obesidade, nível sérico (sanguíneo) de coleste- rol aumentado (acima do considerado nor- mal), ao sedentarismo, tabagismo, estresse e outros. Múltiplos fato- res também requerem múltiplos esforços para controle e prevenção do evento. Pulmão Saudável Pulmão de Fumante EFEITOS DO TABACO SOBRE A SAÚDE Figura 8. O hábito de fumar pode levar ao câncer de pulmão. Consequentemente, reduzir o consumo de cigarros diários ou adotar a medida de parar de fumar pode reduzir o risco de se ter câncer de pulmão. Para se confirmar um caso (uma doença, ou qualquer outro evento em saúde) é necessário evidenciar os fatos, como um diagnóstico clínico e laboratorial que confirmem o caso. Até uma nova intervenção deve ter seu efeito comprovado. Esse tipo de ciência é denominada medicina baseada em evidência.Essas evidências podem ser obtidas de diferentes fontes, como as experiências em animais, observações clínicas adquiridas com os anos, achados laboratoriais, análises comparativas de estatísticas e inquéritos populacionais (PEREIRA, 2002; FRANCO; PASSOS, 2011; BENSEÑOR; LOTUFO, 2005). Caso as evidências apontem uma relação causal, gera-se uma hipótese, e procura-se confirmar essa causa ou descartá-la por uma simples coincidência (PEREIRA, 2002; ROUQUAYROL; ALMEIDA FILHO, 1999; GORDIS, 2009). Não são todos os métodos epidemiológicos que permitem diferen- ciar uma coincidência de uma verdadeira relação causal, e os estudos mais adequados que inferem causalidade são os ensaios clínicos randomizados e controlados (PEREIRA, 2002; GORDIS, 2009; BENSEÑOR; LOTUFO, 2005). 178 UNICESUMAR Aprimoramento de um diagnóstico e prognóstico A Epidemiologia, ao descrever a distribuição da doença na população, contribui para o diagnóstico clínico realizado pelos médicos. A descrição de quadro clínico inicia-se a partir da observação de um caso, ou de poucos casos. O clínico reconhece os principais aspectos daquela afecção (PEREIRA, 2002), acompanhado das evidências laboratoriais, e é confirmado baseado na literatura especializada e pelos estudiosos da matéria (PEREIRA, 2002; FRANCO; PASSOS, 2011). Além disso, a Epidemiologia contribui para a identificação de síndromes e a classificação de doenças ao reunir pessoas com os mesmos sinais e sintomas, reconhecendo-se padrões clínicos em grupos que tenham as mesmas características (PEREIRA, 2002; FRANCO; PASSOS, 2011), como ocorre na Classificação Internacional de Doenças (CID) (PEREIRA, 2002). Os valores de referência de exames laboratoriais também estão subordinados aos estudos epidemioló- gicos, uma vez que a precisão do valor está associada à soma dos valores individuais que geram resultados coletivos (PEREIRA, 2002). Para isso, podem ser calculados os valores de sensibilidade e especificidade, abordadas nos livros de análises clínicas. Além disso, pode-se selecionar o melhor teste de diagnóstico para uma região com alta ou baixa prevalência a partir dos cálculos e da interpretação do valor preditivo positivo e negativo (GORDIS, 2009; BENSEÑOR; LOTUFO, 2005). Ao mesmo tempo em que a Epidemiologia contribui para a avaliação do curso clínico da doença, des- crevendo melhor suas características, ela fornece elementos para quantificar o prognóstico. Este, por sua vez, representa se o indivíduo afetado pela enfermidade terá maior probabilidade ou não de apresentar uma complicação ou um menor tempo de sobrevida. Os desfechos resultantes da patologia como o tempo de sobrevida, surgimento de complicações, sequelas, óbito, e até a cura ou melhora clínica são considerados fatores de prognóstico (PEREIRA, 2002; MEDRONHO, 2009; GORDIS, 2009; BENSEÑOR; LOTUFO, 2005). Alguns coeficientes podem ser utilizados para se calcular o prognóstico , como a taxa de letalidade, as taxa de mortalidade e de sobrevivência e a mediana do tempo de sobrevivência (GORDIS, 2009). Planejamento e organização de serviços de saúde Uma vez que a Epidemiologia dispõe de instrumentos adequados para determinar o impacto das medidas e intervenções em saúde, as informações epidemiológicas deveriam ser utilizadas para as tomadas de decisão na fase de planejamento e de organização dos serviços de saúde (MEDRO- NHO, 2009). Algumas informações epidemiológicas podem ser utilizadas para subsidiar as decisões relativas à prioridade e ao melhor destino dos recursos. Dentre essas informações, encontram-se a magnitude e a distribuição dos problemas de saúde, que são os fatores de risco e os agravos à saúde, e das características da população; as relações causais entre as características populacionais e os recursos humanos, financeiros e materiais (PEREIRA, 2002). Para a adequação da oferta de serviços, da orientação e da reorganização, é preciso analisar a necessidade de saúde, a demanda, a oferta, o acesso, o uso e a equidade. O conceito de necessidade de saúde pode ser visto do aspecto clínico (necessidade individual, clínica, voltada para a opinião médica) e a necessidade 179 UNIDADE 5 percebida pelo indivíduo. Não basta o problema ser identificado como necessidade, para a saúde coletiva é importante que esse problema também tenha demanda. As informações de morbidade e mortalidade são os indicadores que mais refletem a necessidade populacional. Ainda, a Epidemiologia pode colaborar para a elaboração de novos indicadores e parâmetros de avaliação da qualidade dos serviços (MEDRONHO, 2009) Os serviços devem estar disponíveis (acessíveis) em quantidade e qualidade suficientes para atender todos aqueles que dele necessitem. No entanto, é comum observarmos discrepâncias na oferta de serviços de acordo com a região ou localidade, muitas vezes uma prioridade da lei do mercado e não da necessida- de de atenção à saúde. A organização e a distribuição dos serviços dependem da forma de financiamento (público, privado) e da demanda de necessidade tecnológica (MEDRONHO, 2009). A oferta do serviço é medida pelas quantidades de recursos físicos (número de consultórios e leitos), humanos (médicos, dentistas, enfermeiros e etc.), de equipamentos ou ainda de horas semanais de dispo- nibilidade e o volume de produção que se é capaz de oferecer. O acesso aos serviços depende, em todos os níveis de atenção à saúde, não só da disponibilidade dos recursos, mas também da distância, das barreiras geográficas, culturais, econômicas, e até funcionais. Também depende do tempo, do transporte, e até mesmo das filas, salas de espera, horários e outras condições que viabilizam o uso do serviço por diferentes grupos populacionais (MEDRONHO, 2009). Assim, a Epidemiologia faz o levantamento desses dados, quantifi- cando a frequência e a distribuição da demanda, da oferta e do acesso, facilitando ao gestor e à população decidirem onde os recursos devem ser mais bem aplicados. Avaliação de serviços e programas assim como políticas públicas de saúde A preocupação em avaliar a assistência à saúde é mais antiga quanto a medicina, mas somente no início deste século a avaliação de qualidade na área da saúde como um conjunto de conhecimentos organi- zados passou a ser praticada. O conceito de qualidade deve abranger os aspectos de acesso, adequação, efetividade, equidade, custos e a satisfação do paciente. Inclui também o desempenho do profissional de saúde, a qualidade e a utilização de insumos (vacinas, diagnósticos, medicamentos e outros), e o adequado abastecimento e desenvolvimento dos sistemas de informação (MEDRONHO, 2009). Os mesmos princípios utilizados para a identificação etiológica também podem ser aplicados para a avaliação epidemiológica dos serviços e programas (PEREIRA, 2002; FRANCO; PASSOS, 2011). Observa-se se um recurso (material, humano ou financeiro) ou um processo foi bem empregado na saúde (PEREIRA, 2002). Os resultados observados geralmente são os indicadores de saúde (veja a Uni- dade II). Por exemplo: observa-se se os índices de morbimortalidade de uma população melhoraram após o investimento financeiro destinado ao treinamento de pessoal (PEREIRA, 2002). A partir da obtenção dos resultados dos indicadores, deve-se comparar aos padrões, os quais são especificações numéricas precisas consideradas como grau aceitável de qualidade. Essas especificações podem ser obtidas em revisões de literatura, opinião de especialistas, consensos e resultados de ensaios clínicos, principalmente os randomizados (MEDRONHO, 2009). 180 UNICESUMAR Os hospitais têm utilizado crescentemente os indicadores e padrões para suas bases administrati- vas, principalmente o indicador de mortalidade, o tempo de permanência e a taxa de readmissão. Em relação à taxa de mortalidade, a identificação das mortes evitáveis deve ser um objetivo fundamental, pois pode representar o uso inadequado de tecnologias, falhas nas supervisões, altas inapropriadas, infecção hospitalar, erroscirúrgicos e procedimentos invasivos (MEDRONHO, 2009; GORDIS, 2009). Nesse sentido, podem ser avaliados os parâmetros de eficácia, efetividade e eficiência. A eficácia investiga o impacto das tecnologias em condições ideais de observação (em ambiente laboratorial), como uma experiência epidemiológica ou uma avaliação de produtos (vacinas, medicamentos, pro- dutos de diagnóstico e outros) e procedimentos (cirurgias, técnicas de educação em saúde, etc.). A efetividade é utilizada para avaliar o impacto que os serviços e programas geram em condições normais (reais), como efeitos vacinais, a implantação de programas (como de farmacovigilância), a avaliação da toxicidade de um produto recém-lançado no mercado. A eficiência leva em consideração não só o impacto, mas também os recursos empregados em um programa e serviço. Assim, a eficiência pode comparar o resultado de diversas tecnologias para avaliar qual confere maior benefício e menor custo (MEDRONHO, 2009; PEREIRA, 2002; GORDIS, 2009). A Epidemiologia também é utilizada para verificar os benefícios de políticas de rastreamento de doenças, como o rastreamento para detecção precoce de câncer (mama, colo do útero, próstata e ou- tros). Por exemplo: podemos utilizar estudos em seres humanos para verificar se o rastreamento de câncer de mama tem reduzido os índices de mortalidade (GORDIS, 2009). Avaliação de qualidade no Brasil A avaliação da qualidade dos serviços de saúde praticados no Brasil ainda é muito limitada, restrin- gindo-se à análise da estrutura física e aos aspectos quantitativos da produção de serviços. Visuali- za-se uma avaliação precária do indicador de morbimortalidade ou o uso de padrões, parâmetros e indicadores inadequados ou obsoletos. É indiscutível a necessidade de avaliar o sistema e os serviços de saúde utilizando indicadores e outras ferramentas com alta qualidade e precisão, para que que se tomem medidas e intervenções confiáveis e seguras, assim como a utilização desses resultados para o planejamento e organização dos serviços (MEDRONHO, 2009). A produção hospitalar dos serviços financiados pelo sistema público de saúde é coberta por uma base de dados nacional. Atualmente, esse sistema é uma fonte de informação que pode ser utilizada para avaliar a assistência hospitalar. O sistema de informação mais importante para os hospitais é o Sistema de Informações Hospitalares (SIH) pertencente ao Sistema Único de Saúde (SUS). O SIH é um banco de dados administrativo que fornece informações sobre morbidade, consumo de recursos, uso de procedi- mentos de diagnóstico, perfil sociodemográfico e geográfico e outros. Desta maneira, o SIH é um valioso instrumento para o planejamento e a avaliação da qualidade dos serviços prestados (MEDRONHO, 2009). 181 UNIDADE 5 Qual é o papel dos hospitais públicos e particulares para a compreensão da distribuição e frequência das doenças em uma população? O papel dos gestores na Epidemiologia O bom gestor (planejador) é aquele que considera as informações epidemiológicas para o planejamento, a execução e a avaliação das ações de saúde. Ele deve considerar os indicadores de saúde, como a mortalidade, a morbidade, os fatores de risco, as características da população e outros fatores que se tornam necessários ou são demandados por aquela comunidade. Aplicar corretamente o conhecimento epidemiológico de acordo com a situação de saúde detectada é um grande desafio para o gestor nos tempos atuais. Tudo isso porque o gestor é aquele que decide ou sugere em que aplicar os recursos. Portanto, a Epidemiologia fornece dados e interpretações que dão suporte para as decisões a serem tomadas sobre a alocação de recursos e a organização dos serviços. As decisões a serem tomadas podem ser baseadas nas prioridades levantadas pelos estu- dos epidemiológicos, adequando-se às necessidades e aos recursos disponíveis (PEREIRA, 2002). Um outro objetivo da Epidemiologia é a busca de evidências em saúde na literatura científica disponível em bancos de dados online. As evidências a partir de bases online podem auxiliar o médico a tomar decisões clínicas que não puderam ser baseadas em sua intuição ou experiên- cia. A base de dados mais utilizada é o MEDLINE ou PubMed, pertencente à Biblioteca Nacional de Medicina (National Library of Medicine) dos Estados Unidos da América (disponível no link https://www.ncbi.nlm.nih.gov/pubmed/). Os artigos científicos mais encorajados para a tomada de decisão são os de revisão sistemática e metanálise. Os estudos podem ser selecionados por palavras (em inglês) citadas no título, no corpo do texto, no nome de autores e revistas, no ano de publicação, no tipo de estudo e outros filtros. (BENSEÑOR; LOTUFO, 2005) 182 UNICESUMAR HISTÓRIA NATURAL DA DOENÇA Seguimos estudando o processo saúde-doença ou História Natural das Doenças, como também abor- daremos os conceitos de causalidade e fatores etiológicos. A História Natural das Doenças (HND) compreende o conjunto de processos que interagem levando a algum dano na saúde do indivíduo. Esses processos interativos compreendem as relações entre o agente, o suscetível e o meio ambiente. A HND vai desde os primeiros estímulos patológicos até os efeitos de doença, como a invalidez, as sequelas, a recuperação ou a morte (LEAVELL; CLARK apud ROUQUAYROL; ALMEIDA FILHO, 1999). A utilidade da HND é descrever as múltiplas causas e as diferentes enfermidades que acometem o indivíduo, servindo de base para a compreensão de condições reais e específicas e, principalmente, apontando as diversas medidas de prevenção e controle (ROUQUAYROL; ALMEIDA FILHO, 1999). A HND pode ser dividida em dois estágios ou fases (ROUQUAYROL; ALMEIDA FILHO, 1999; PE- REIRA, 2002; FRANCO; PASSOS, 2011): • Período pré-patogênico: aquele em que o suscetível (focaremos aqui o homem) é exposto aos fatores biopsicossociais. Refere-se ao período anterior à doença, à interação preliminar dos fatores potencialmente causadores da doença; • Período patogênico: seria aquele em que ocorre a manifestação da doença propriamente dita. É o período em que o indivíduo acometido pela doença manifesta sinais e sintomas. O indivíduo iniciou a interação estímulo-hospedeiro e possui alterações fisiopatológicas. Nesse período, a enfermidade pode progredir para a cura, a recuperação, a cronicidade, as sequelas, a invalidez e até a morte. Para compreendermos melhor esses processos, faremos uma breve revisão dos conceitos de saúde e doença. Conceitos de saúde e doença O termo saúde, no mais simples que se possa descrever, seria a ausência de doença, e por isso esse 183 UNIDADE 5 conceito não é mais usado. “A saúde já foi considerada uma espécie de silêncio orgânico”, na qual existe um estado de harmonia e equilíbrio funcional em que os diferentes sistemas e aparelhos não sinalizam irregularidades (FRANCO; PASSOS, 2011, p. 2). Rotineiramente, na prática clínica, os indivíduos são rotulados como sadios ou doentes a partir de exames clínicos e laboratoriais que indicam a presença ou ausência de anormalidades (PEREIRA, 2002), e é claro que não podemos considerar como uma pessoa saudável aquela que contém uma infecção ou qualquer outra doença (FRANCO; PASSOS, 2011). Em 1948, em sua constituição, a OMS adotou a definição de que “saúde é um completo estado de bem-estar físico, mental e social, e não meramente a ausência de doença”. O Brasil incorporou o direito à saúde na Constituição Federal do Brasil de 1988, e ampliou o seu conceito na Lei Orgânica da Saúde 8.080 (de 19 de setembro de 1990) e na Lei 12.864 de 24 de setembro de 2013 (BRASIL, 1990; 2013): “é direito de todos e dever do estado, garantido mediante políticas sociais e econômicas que visem à redução do risco de doença e de outros agravos e ao acesso universal e igualitário às ações e serviços, para sua promoção, proteção e recuperação” (Art. 196 da Constituição Federal do Brasil) (BRASIL, 1988). A partir das leis mencionadas acima, definiram-se os determinantese condicionantes de saúde: alimentação, moradia, o saneamento básico, meio ambiente, transporte, trabalho, renda, educação, atividade físicas, lazer e acesso aos bens e serviços essenciais (BUSATO, 2016). Em contrapartida, a doença seria a falta ou perturbação da saúde (PEREIRA, 2002), ou ainda um “desajustamento ou uma falha nos mecanismos de adaptação do organismo ou uma ausência de rea- ção aos estímulos, cuja ação está exposto” (JENICEK; CLÉROUX, apud HERZLICH, 2004). Ainda, a portaria n° 204 de 17 de fevereiro de 2016 (BUSATO, 2016, p. 27) descreve o agravo como: “ “qualquer dano à integridade física ou mental do indivíduo, provocado por circuns- tâncias nocivas, tais como acidentes, intoxicações por substâncias químicas, abuso de drogas ou lesões decorrentes de violências interpessoais […]”; e a doença como: “enfermidade ou estado clínico, independente de origem ou fonte, que represente ou possa representar um dano significativo para os seres humanos; [...]”. O processo saúde-doença implica múltiplas e complexas interações. O processo é definido por Jenicek e Cleroux (apud HERZLICH, 2004) como uma perturbação da estrutura, função de um órgão, sistema ou de todo um organismo, podendo, ainda, alterar suas funções vitais. De um modo geral, o processo saúde-doença na coletividade humana é o processo biológico de desgaste e reprodução, resultando em um funcionamento biológico diferente com consequência para o desenvolvimento regular das atividades do cotidiano. Seria o surgimento da doença (ROUQUAYROL; ALMEIDA FILHO, 1999). A divisão do processo saúde-doença é útil para identificação dos riscos e dos danos à saúde, mas também para pontuar as ações preventivas e curativas nos diversos momentos, também preocupando-se com o momento em que a doença afeta o indivíduo ou o coletivo (PEREIRA, 2002). A Epidemiologia não se preocupa, portanto, somente com o conhecimento dos problemas de saúde, incapacidade, doença ou morte, mas também com a melhoria dos indicadores de saúde e de elevação da qualidade de vida das populações (FONSECA; CORBO, 2007; BUSATO, 2016). 184 UNICESUMAR A História Natural das Doenças é dividida em período pré-patogênico e patogênico. Para cada período, há medidas de prevenção específicas e gerais para promover o controle ou a intervenção do processo saúde-doença, conforme apresentado no Quadro 1. Período pré-patogênico Essa fase inicial ou de suscetibilidade é aquela em que o indivíduo ainda não manifesta a doença, mas existem condições para o seu aparecimento. As condições de vida, características pessoais (como sexo, idade e outros) e os hábitos podem facilitar ou dificultar os danos à saúde e são considerados fatores de risco ou de proteção (PEREIRA, 2002; GORDIS, 2009). Quando o indivíduo é exposto aos fatores de risco, tem maior probabilidade de desenvolver uma determinada enfermidade. Por exemplo: a exposição ao fumo predispõe ao câncer de pulmão. Ao passo que os fatores de proteção indicam que quando o indivíduo é exposto ao fator, ele tem uma menor chance de desenvolver aquele problema de saúde. Por exemplo, pessoas que praticam atividade físi- ca regularmente estão mais protegidas contra doenças coronarianas (PEREIRA, 2002). A partir da multicausalidade, constrói-se o modelo sistêmico, que é constituído de várias causas que podem estar em diferentes níveis de organização (veja a figura abaixo). O círculo externo representa a sociedade, que engloba os demais, como as famílias, que compreen- dem o indivíduo, que é composto por órgãos e células. Poderíamos ir mais adiante, com as moléculas e os átomos. A partir deste círculo, podemos procurar uma explicação ao dano à saúde. Essa explicação incorpora o aspecto so- cial à visão biomédica individualista, levando a uma visão social e holística e, assim, cons- truindo a Epidemiologia Social. As soluções para o problema se darão de acordo com o nível afetado, variando desde uma intervenção individual a uma coletiva (PEREIRA, 2002; FRANCO; PASSOS, 2011). Na lógica multicausal, a tríade ecológica é a mais utilizada em Epidemiologia para identificar fatores de risco, e é representada por três aspectos: o hospedeiro, o agente e o meio ambiente (Pereira, 2002; Busato, 2016; Gordis, 2009; Rouquayrol e Almeida Filho, 1999; Almeida Filho e Barreto, 2011; Franco e Passos, 2011). Figura 8: Modelo sistêmico da pesquisa epidemiológica Fonte: a autora, adaptado de Pereira (2002). 185 UNIDADE 5 Figura 9 - Tríade ecológica como modelo multicausal no processo saúde-doença. Fonte: a autora, adaptado de Fonseca e Corbo (2007). Este modelo representa a multicausalidade dos problemas de saúde e mostra a igual importância de cada elemento que compõe a tríade. Sendo assim, todas as características devem ter a mesma relevân- cia para o estudo de qualquer agravo à saúde. A partir da identificação das características da tríade é possível analisar o processo saúde-doença e localizar racionalmente as intervenções (PEREIRA, 2002; BUSATO, 2016; GORDIS, 2009; ROUQUAYROL; ALMEIDA FILHO, 1999; ALMEIDA FILHO; BARRETO, 2011; FRANCO; PASSOS, 2011). Nos fatores do hospedeiro, devemos levar em consideração a herança genética, a anatomia, a fi- siologia do organismo e os hábitos e costumes, por exemplo. Nos fatores ambientais, temos o ambiente físico, químico, biológico e social (PEREIRA, 2002; BUSATO, 2016; FRANCO; PASSOS, 2011; ROU- QUAYROL; ALMEIDA FILHO, 1999). A pesquisa genética tem se fortalecido nas últimas décadas, uma vez que muitos genes têm sido atribuídos à diferentes patologias. A essa investigação podemos dar o nome de Epidemiologia Genética (PEREIRA, 2002; FRANCO; PASSOS, 2011). Em relação à anatomia e à fisiologia do hospedeiro, é claro e evidente que, por exemplo, o sexo influen- cia nas patologias encontradas, como é o caso de câncer colo do útero em mulheres e do de próstata nos homens. Assim, temos as características como idade, raça, sexo (FRANCO; PASSOS, 2011) e os aspectos imunológicos do hospedeiro, incluindo as imunizações naturais e artificiais (vacinação) (GORDIS, 2009). Em relação ao estilo de vida, os hábitos e as condutas podem favorecer ou prevenir a ocorrência de danos à saúde. Muitas doenças estão relacionadas com os hábitos diários; por exemplo: as doenças coronarianas estão relacionadas ao sedentarismo, ao tabagismo, à obesidade, ao consumo elevado de gorduras e outros. Assim como, nas doenças infecciosas, o hábito da prática sexual sem uso de preservativos pode predispor às infecções sexualmente transmissíveis (PEREIRA, 2002; BUSATO, 2016). Em relação aos fatores ambientais, que são designados como intrínsecos e extrínsecos ao hos- pedeiro, podemos classificá-los como físico, biológico e social. No ambiente físico, temos os aspectos do ar, água e lugares, assim como a constituição da flora e da fauna de um dado local. Por exemplo: as altitudes, a umidade relativa do ar, a geografia, o clima, os recursos hídricos e a temperatura podem influenciar a multiplicação de vetores e a sobrevivência de parasitas. Ainda temos os terremotos, as inundações, a poluição e outras características que podem afetar a saúde ou a vida do indivíduo e da sociedade (PEREIRA, 2002; ROUQUAYROL; ALMEIDA FILHO, 1999). 186 UNICESUMAR No ambiente biológico, encontramos os seres vivos: agentes, vetores e reservatórios das doenças. As condições ecológicas determinam a concentração de doentes em uma dada região, assim como, a distribuição dos agentes biológicos, vetores, reservatórios e seres humanos infectados e os suscetíveis (PEREIRA, 2002). O ambiente social está relacionado com os aspectos sociais, econômicos, políticos e culturais. É a parte humana do meio ambiente organizada em sociedade. Aqui temos exemplos de fatores que afetam a saúde do indivíduo: renda, nível de escolaridade, ocupação, transporte, emprego e outros. A partir da quantificação dos aspectos sociais, podemos encontrar desigualdades, por exemplo, de cobertura dos sistemas de saneamento e deserviços de saúde. Essas identificações das desigualdades determinam os tipos e as intensidades das medidas preventivas e curativas utilizadas na intervenção do processo de doença (PEREIRA, 2002; BUSATO, 2016; ROUQUAYROL; ALMEIDA FILHO, 1999). Podemos concluir que o estado de saúde-doença depende da interação e do equilíbrio desses fatores ecológicos da tríade. A saúde reflete o resultado homeostase e a doença é resultante do desequilíbrio desses fatores (FRANCO; PASSOS, 2011). O período pré-patológico pode evoluir ou não para a fase patológica, e isso depende das ações e medidas tomadas neste período de exposição aos fatores de risco. A prevenção da exposição aos fatores de risco e aos de proteção conduzirá a uma promoção da saúde do indivíduo, evitando que este seja afetado por problemas de saúde. Período patogênico Na fase patológica ocorrem os processos de exteriorização da afecção. É o período em que ocorrem os processos no interior do corpo humano e se sucedem as respostas orgânicas (PEREIRA, 2002). O período de patogênese é caracterizado pelas primeiras ações do agente patogênico, com perturbações bioquímicas em nível celular, nas formas e nas funções do organismo, evoluindo para efeitos perma- nentes, cronicidade, morte ou cura (ROUQUAYROL; ALMEIDA FILHO, 1999). O conhecimento desses mecanismos permite a adoção de critérios de diagnóstico e tratamentos vol- tados para detectar e interromper o processo já instalado no organismo. Por exemplo, a manifestação de dores articulares pode indicar a artrite reumatoide, que é confirmada por exames laboratoriais e clínicos. A partir dessa identificação, pode-se prescrever o uso de antiinflamatórios para o tratamento da doença. As medidas intervencionistas podem ou não regredir ou solucionar o problema (PEREIRA, 2002). O período patológico compreende as fases pré-clínica, clínica e residual. A fase pré-clínica, em que a doença ainda não é clinicamente aparente, pode evoluir para a fase clínica ou não. Essa fase seria o que chamamos da base de um iceberg, ou seja, a ponta do iceberg, aquela que emerge, é a fase clínica, a aparente, a que se vê pelas manifestações clínicas e pode ser observada facilmente; a base do iceberg é aquilo que não se vê, mas se sabe que existe. Na fase pré-clínica, as medidas de rastreamento e triagem, também chamadas de screening, são as ferramentas mais importantes para o diagnóstico deste perío- do. Essas técnicas são utilizadas para a procura de indivíduos suspeitos de estarem enfermos o sob o risco de adoecer. Isto pode ser realizado a partir de exames laboratoriais aplicados à população geral, por exemplo (PEREIRA, 2002; GORDIS, 2009; FRANCO; PASSOS, 2011). O período pré-clínico é a 187 UNIDADE 5 interação entre o estímulo e o suscetível (ROUQUAYROL; ALMEIDA FILHO, 1999). Na fase clínica, observa-se a doença propriamente dita, é a manifestação do problema de saúde. A percepção do limiar clínico é a ponta do iceberg da doença, acima do mar, é a doença exteriorizada. Geralmente, apenas os casos aparentes são notificados e utilizados para verificar a distribuição de uma doença na comunidade, ficando de fora os casos subclínicos (PEREIRA, 2002; GORDIS, 2009; FRANCO; PASSOS, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). Portanto, neste período, as medidas protetoras são as curativas, as quais irão levar à proteção do indivíduo e evitar sequelas ou o óbito. Como exemplo temos o infarto agudo do miocárdio, que pode requerer procedimento cirúrgico, ou que para evitar de ocorrer novamente irá requerer uma dieta, abstenção de fumo, controle da pressão arterial e outras medidas (PEREIRA, 2002; GORDIS, 2009; FRANCO E PASSOS, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). Proporção de casos clinicamente discerníveis Proporção de casos não discerníveis clinicamente Infecção inaparente Óbitos Manifestações clínicas Casos graves Linha do horizonte clínico Figura 10: Horizonte clínico da doença representado pelo ‘iceberg’ / Fonte: autoria própria, adaptado de Saúde & Cidadania (2017). O iceberg representa o horizonte clínico, em que acima do mar encontram-se os casos clinicamente aparentes, e abaixo, os inaparentes. No nível clínico, podemos ter vários desfechos, como o óbito, a cronicidade do caso, que pode evoluir ou não para o óbito, a gravidade e a agudização, invalidez, os casos fatais, as sequelas ou ainda a cura (GORDIS, 2009; FRANCO; PASSOS, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). A fase residual é aquela em que doença não progrediu para o óbito ou não houve cura completa, observando-se alterações anatômicas e funcionais que se estabilizam. Podemos até dizer que é a pro- gressão para a cronicidade. Esta estabilização é alcançada por tratamentos ou pelo próprio curso natural da doença, que muitas vezes deixa sequelas. Neste caso, tomam-se medidas de recuperação à saúde com o objetivo de reabilitar o indivíduo diante o aspecto físico, psicológico ou social. Por exemplo: a reabilitação de indivíduos que sofreram acidentes a partir da fisioterapia (Pereira, 2002; Franco; Passos, 2011; Rouquayrol; Almeida Filho, 1999). 188 UNICESUMAR Quadro 1 - Modelo de História Natural das Doenças: do horizonte clínico às medidas de prevenção. Susceptibilidade Fase clínica Fase pré clínica Doença precoce discernível Doença avançada (complicações) Morte Invalidez Pré patogênese Diagnóstico precoce Limitação do ano Prevenção secundária Cura Convalescença Reabilitação Prevenção terciária Horizonte clínico Recuperação Patogênese precoce Patogênese Fase de incapacidade residual Atenção primária Promoção Da saúde Proteção Especí�ca Fonte: Wikimedia (2011, on-line)5. MEDIDAS PREVENTIVAS Com todo conhecimento que você já adquiriu, podemos con- cluir que o conhecimento dos fatores de risco e de proteção e a identificação dos grupos de risco e do processo saúde-doen- ça são fundamentais para a escolha das tomadas de decisão, como as ações intervencionistas e de prevenção. Portanto, nós abordaremos os níveis de prevenção na atenção à saúde como ferramenta para a saúde individual e coletiva. As medidas preventivas são todas as ações direcionadas para evitar as doenças ou suas consequências. Essas medidas podem ser periódicas (esporádicas) ou aplicadas e de forma endêmica ou epidêmica. A saúde pública constantemente promove ações destinadas a evitar o início de doenças. Por exemplo, nas doenças infecciosas e parasitárias é tradição a cloração da água de abas- tecimento público, o controle de vetores, a imunização e outras medidas. Têm-se também medidas específicas (restritas), como no caso do uso de antiretrovirais para a infecção pelo HIV, e as inespecíficas (gerais), como o saneamento básico, que promove a melhora da qualidade de vida da população (PEREIRA, 2002). 189 UNIDADE 5 O objetivo principal da saúde pública é evitar as doenças, prolongar a vida e desenvolver a saúde física e mental na sociedade. Esses objetivos se sobrepõe aos da Epidemiologia, a qual tem sido um instrumento fundamental para a orientação das ações de saúde pública. As práticas de saúde podem se basear no conhecimento epidemiológico para o planejamento, a execução e a avaliação de medidas preventivas (ROUQUAYROL; ALMEIDA FILHO, 1999). Atualmente, a prevenção de danos à saúde é classificada em (PEREIRA, 2002; ROUQUAYROL; ALMEIDA FILHO, 1999): • prevenção primária: medidas aplicadas na fase anterior do início da doença, ou seja, no período pré-patogênico; • prevenção secundária: ações que interferem no curso da doença, no período patogênico; • prevenção terciária: aplicada no estágio mais avançado da doença, com o objetivo de prevenir a piora do quadro clínico, também aplicada no período patogênico. A medidas de prevenção não são apenas responsabilidade dos profissionais de saúde, mas também dos gestores e, principalmente, da sociedade. Prevenção primária As ações de prevenção primária são dirigidas para a manutenção da saúde, evitando a ocorrência da fase patológica e denovos casos de agravos à saúde. É o que refere à promoção da saúde, não focando apenas o individual, mas sim a melhoria da qualidade de vida da coletividade humana. Por exemplo: práticas de educação para a saúde e saneamento ambiental, prática de esportes (PEREIRA, 2002; FRANCO; PASSOS, 2011). A prevenção primária também engloba as ações de proteção específica, como a imunização, a saúde ocupacional, a higiene pessoal e do lar; a proteção contra acidentes; o aconselhamento genético; e o controle de vetores (ROUQUAYROL; ALMEIDA FILHO, 1999) Na prevenção primária, a resposta às ações depende dos custos envolvidos, da magnitude da evi- dência (unicausal; multicausal), da facilidade em reduzir ou eliminar a exposição ao fator específico (GORDIS, 2009). Prevenção secundária As medidas de prevenção secundária são voltadas para o período patológico, seja em fase subclínica ou clínica. Essas ações previnem a evolução do processo patológico no organismo, no sentido de fazê-lo regredir ou cessar, como no caso do uso de antibióticos para doenças bacterianas. Nesse caso, há o uso da medida preventiva com o intuito de prevenir um agravo maior, e não com função curativa. Por exemplo: a utilização de aspirina por indivíduos que já tiveram infarto do miocárdio pode prevenir um segundo infarto. Portanto, as ações secundárias visam a prevenir reincidências, complicações, sequelas e óbitos (PEREIRA, 2002; FRANCO E PASSOS, 2011). 190 UNICESUMAR A prevenção secundária também aborda o diagnóstico precoce a partir de inquéritos para a des- coberta de casos na comunidade, os exames periódicos individuais, o isolamento do indivíduo para evitar propagação das doenças e o tratamento da doença (ROUQUAYROL; ALMEIDA FILHO, 1999). Na prevenção secundária, devemos considerar a gravidade da doença, se há possibilidade de de- tecção precoce por métodos de diagnóstico, o quão onerosa e invasiva será a detecção, se o indivíduo terá benefícios (como o tratamento, ausência ou mínimos efeitos colaterais) (GORDIS, 2009). Prevenção terciária Neste caso, as medidas preventivas se destinam à fase residual da doença, visando a desenvolver a capacidade funcional do indivíduo, que foi reduzida pela doença. Exemplo: recuperar o indivíduo que sofreu de poliomielite na infância; reabilitar aquele que sofreu um acidente (PEREIRA, 2002; FRANCO; PASSOS, 2011). Nesses casos, englobam-se as medidas de reabilitação, a fisioterapia, a terapia ocupacional e o emprego ao reabilitado (ROUQUAYROL; ALMEIDA FILHO, 1999). Níveis de atenção em saúde Na saúde pública do Brasil, desdobram-se três níveis de atenção à saúde (PEREIRA, 2002; FRANCO; PASSOS, 2011; GORDIS, 2009): 1. Atenção primária: aquela voltada para a promoção da saúde, ou seja, aquela em que as medidas são destinadas à manutenção do bem-estar coletivo, sem uma doença específica. Por exemplo: aquela que promove uma boa qualidade nutricional, de moradia, de emprego e até da imuni- zação. As atividades são comumente realizadas pelas Unidades Básicas de Saúde (UBS); 2. Atenção secundária: engloba medidas que impedem o aparecimento de um determinado dano à saúde, voltadas para a proteção da saúde. Inclui também a identificação e o tratamento de processos patológicos, e a limitação do dano. As medidas são geralmente realizadas nas clínicas, laboratórios e hospitais; 3. Atenção terciária: envolve medidas que desenvolvem o potencial funcional do organismo afe- tado. Seria a reabilitação promovida, geralmente, por uma equipe multiprofissional que fornece ações integradas para dar suporte físico, mental e social. Geralmente, as ações são realizadas nas clínicas e hospitais. 191 UNIDADE 5 No Brasil, os três níveis de atenção à saúde são articulados a partir das Redes de Atenção em Saú- de (RAS), garantindo a integralidade do cuidado. As diretrizes para a organização das RAS no âmbito do Sistema Único de Saúde foi oficializado por meio da Portaria GM/MS nº 4.279, publi- cada no Diário Oficial de 31/12/2010. As RAS possuem como eixo norteador e porta de entra- da a atenção primária, que se articula e integra com a secundária e terciária. (MENDES, 2011). Chegamos ao final de mais uma Unidade; agora você conheceu os conceitos básicos e a história da nossa disciplina, que apesar de muito antiga, é atualizada e aplicada em todos os ciclos da vida. Agora você já possui a base conceitual da Epidemiologia e podemos prosseguir para os próximos conteúdos e aprofundar as práticas e os conceitos epidemiológicos. CONSIDERAÇÕES FINAIS Nesta unidade, estudamos os conceitos de Epidemiologia, saúde, doença, processo saúde-doença, fa- tores etiológicos e prevenção. Todos esses conceitos são base para que você compreenda as próximas unidades. Observamos que a saúde é o bem-estar físico, mental e psicossocial, e que deve ser estudada pela Epidemiologia para identificar os desequilíbrios que acarretam os problemas de saúde. Concluí- mos que a Epidemiologia é fundamental para o planejamento e orientação dos serviços de saúde, uma vez que as necessidades da população são evidenciadas a partir dos estudos epidemiológicos. A identificação das prioridades coletivas permite que sejam propostas medidas para os problemas de saúde encontrados, como as medidas preventivas. Concluímos que o estudo epidemiológico deve ser realizado rotineiramente a partir da coleta de da- dos em clínicas, laboratórios, universidades, hospitais e outras instituições (como as de pesquisa), ou até mesmo pelo indivíduo da comunidade. Esses dados devem ser interpretados quali e quantitativamente para que se possa inferir a verdadeira situação de saúde da população. Uma das maneiras de transformar os dados em informações é aplicando os cálculos dos indicadores de saúde e as medidas de ocorrência. Vimos que são muitas as aplicações da Epidemiologia e que, desde a Grécia Antiga, os seus conceitos e práticas vêm sendo aplicados nos níveis individual e coletivo, com o objetivo de compreender o pro- cesso saúde-doença, identificar causas dos problemas de saúde e propor medidas de prevenção, a fim de melhorar a qualidade e a expectativa de vida humana e ambiental. Muitas experiências de grandes estudiosos, como John Snow, foram descritas aqui nesta unidade para que possamos compreender que os estudos epidemiológicos não cessam; ao contrário, eles estão em constante transformação e alcançam cada vez mais credibilidade na área científica. Os estudos mais importantes são aqueles com cunho social e que podem modificar toda a história de uma sociedade. 192 A G O R A É C O M V O C Ê 1. Conceitue a ciência Epidemiologia. 2. O objetivo principal da Epidemiologia é: I) Identificar fatores etiológicos dos problemas de saúde. II) Estudar a distribuição das doenças e outros danos à saúde. III) Propor medidas de prevenção em saúde e até de planejamento. IV) Reformar as políticas públicas de saúde e interferir nas ações dos gestores. Assinale a alternativa correta. a) Apenas I e II estão corretas. b) Apenas II e III estão corretas. c) Apenas I está correta. d) Apenas I, II e III estão corretas. e) Nenhuma das alternativas está correta. 3. Assinale a alternativa CORRETA quanto à história e os personagens da Epidemiologia. a) John Snow, médico inglês, dedicou seus estudos para a medicina social, destacando-se pelo estudo do cólera e a transmissão hídrica. b) John Snow foi um médico inglês que voltou seus estudos para a medicina clínica, dei- xando de fora o cunho social das doenças. c) James Lind realizou o primeiro ensaio clínico, e descobriu que o escorbuto era causado pela deficiência de vitamina D. d) Roberto Kock é considerado o Pai das Estatísticas Vitais e identificou causas de mor- talidade, como prematuridade e raquitismo. e) Oswaldo Cruz foi um médico sanitarista que descobriu o agente etiológico da Doença de Chagas, o Trypanosoma cruzi. 193 A G O R A É C O M V O C Ê 4. Assinale Verdadeiro (V) ou Falso (F) quanto à História Natural das Doenças (HND).) ( A HND é dividida em período pré-patogênico e patogênico. O primeiro refere-se à fase que antecede a doença, e o segundo, à doença propriamente dita. ) ( A HND estuda a tríade ecológica que envolve apenas os aspectos do hospedeiro, do agente e do ambiente, e não o social. ) ( Na fase patológica, além da doença, tem-se a preocupação com as suas sequelas, com a incapacidade e até com o óbito. Assinale a alternativa correta: a) V; V; F. b) F; F; V. c) V; F; V. d) F; F; F. e) V; V; V. 5. Assinale Verdadeiro (V) ou Falso (F) para as alternativas referentes às medidas preven- tivas utilizadas na Epidemiologia. ) ( A prevenção primária é voltada para ações que previnem o aparecimento da doença; são medidas que antecedem o período patogênico. Por exemplo: saneamento básico e imunizações. ) ( A prevenção secundária inclui medidas de proteção à saúde que interferem na fase patológica. Por exemplo: diagnóstico e tratamento de uma doença específica. ) ( A prevenção terciária engloba ações de reabilitação durante a fase patogênica, como a fisioterapia utilizada em casos de acidentes. Assinale a alternativa correta. a) V; V; F. b) F; F; V. c) V; F; V. d) F; F; F. e) V; V; V. 194 A G O R A É C O M V O C Ê Leia o texto sobre a imunização contra a varíola (variolização) e veja a importância do conhecimento da História Natural das Doenças, a aplicação da estatística e da medicina social para se obter a eficácia de medidas preventivas (como a vacinação), quando aplicadas sobre as reais necessidades da população (como a varíola): “A tentativa de imunização contra a varíola configura-se como uma prática milenar, an- terior à constituição e divulgação do método experimental em biomedicina, que marcou o final do século XIX, e à elaboração das teorias e conceitos que envolvem a elucidação do processo imunitário, e à fabricação de vacinas em escala industrial, que só ocorreram no século XX. Mesmo antes de se reconhecer a similaridade entre o cowpox (doença que acometia os bovinos) e a varíola e de ter sido criada a vacinação, já se tinha observado que a varíola podia ser evitada a partir do contato do homem sadio com o doente. Esta cons- tatação impulsionou a disseminação de práticas, inicialmente orientais, que alcançaram a Europa no início do século XVIII, conhecidas como ‘variolização’, ‘inoculação’ [...]. Apesar de se estabelecerem como diferenciadas tecnicamente entre si, consistiam em implantar no homem sadio o vírus variólico contido na secreção retirada das pústulas de pessoas doentes, na tentativa de provocar a instalação da varíola na sua forma mais branda com manifestação local, tentando evitar a doença na expressão mais grave. [...] A difusão da vacina antivariólica nos países europeus, a partir de fins do século XVIII, veio aumentar o questionamento acerca da prática da inoculação do vírus variólico, incor- porando-o a um processo de discussão que extrapolava a própria técnica, abrangendo as ações de saúde e higiene que já começavam a se estruturar em vários países, tomando a varíola um espaço importante, dada sua expressão epidemiológica e social de relevo. Destacavam-se questões referentes à varíola e à sua imunização na tentativa de se ex- plicar as diversas variáveis da doença e a imunidade específica a partir, principalmente, a constatação da perda da defesa contra a doença em pessoas vacinadas, detectada na primeira década após o início da disseminação da vacina no mundo. Como uma das soluções, na tentativa de não descartar o uso da vacinação como uma medida para o controle da varíola, propôs-se a revacinação, que também gerou discussões, angariando adeptos e críticos à sua indicação. A precária base científica da microbiologia e da fisiopatologia, além do desconhecimento do processo imunitário, naquele século, levou à realização, ao longo do período, de várias experiências empíricas, com base na medicina clínica e na estatística, envolvendo no de- bate corrente, além da vacinação e da revacinação, preocupações com a disseminação da doença e o uso da técnica da inoculação (aplicação do vírus variólico). LE IT U R A C O M P LE M EN TA R 195 A G O R A É C O M V O C Ê LE IT U R A C O M P LE M EN TA R [...] A Gazeta Médica da Bahia, por exemplo, divulgou um artigo, assinado pelo médico Pacífico Pereira, onde esse apoiava e elogiava a atuação de outro médico, Lucien Papillaud, que desde 1847, no Sul do Brasil, se dedicava à prática da inoculação do vírus variólico, tanto em indivíduos não vacinados como em alguns anteriormente vacinados. Baseado em experiências formuladas por ele, Papillaud defendia a inoculação pós-vacinal através da aplicação do vírus variólico, apontando-o como preservativo da varíola epidêmica, indicando o vírus vacinal para o controle da varíola esporádica (endêmica). A estatística elaborada por ele, em uma de suas experiências, mostra que entre 84 pessoas inoculadas com o vírus extraído de variolosos (vírus variólico), 63 apresentaram erupção, sendo que, entre estes, nove caracterizavam-se, segundo ele, como erupções variólicas. Dessa forma, nesta experiência, o risco de contrair a varíola através deste tipo de aplicação era de mais de 10%. [...]. Aparecem na prática deste médico três questões associadas: além do tipo de agente a ser inoculado (vacinal ou variólico) sugere, também, diferenciação do estado de distribuição da varíola epidêmica ou endêmica para escolha da aplicação a ser formulada, distinguindo a revacinação da prática que denominou de inoculação pós-vacinal. [...] Com a introdução da vacina animal e a incorporação, no Brasil, principalmente a partir da década de 1920, de novas técnicas de produção em escala industrial, gerou-se um novo perfil da questão, que, em termos do controle da doença, culminou com sua erradicação mundial, na década de 1970. Novas questões vêm surgindo, no início do presente século, em relação à varíola, voltando a transformá-la em problema mundial, diante da perspectiva do vírus ser utilizado como arma biológica. [...] Apesar de a vacinação se constituir como uma prática estatal, esta não respondia às expectativas de controle da doença, devido às extensas dimensões territoriais e à falta de serviços locais e nacionais articulados e adequados às necessidades e possibilidades das práticas sanitárias. A discussão em torno da vacinação envolvia também a capacidade profissional, a situação empregatícia dos vacinadores, principalmente nas províncias e nas localidades distantes da Corte, a qualidade da vacina empregada e da vacinação executada, assim como a liberdade de opção pelo uso ou não da vacina por parte da população.” Fonte: FERNANDES, T. M. Imunização antivariólica no século XIX no Brasil: inoculação, va- riolização, vacina e revacinação. História, Ciências, Saúde. Manguinhos, v. 10 (suplemento 2), p. 461-74, 2003. 196 A G O R A É C O M V O C Ê M A TE R IA L C O M P LE M EN TA R A História e Suas Epidemias - A Convivência do Homem com os Microorganismos Stefan Cunha Ujvari Editora: SENAC Rio Sinopse: este livro faz o resgate abrangente e minucioso da luta travada pela humanidade contra os germes ao longo dos séculos - desde a tenta- tiva de compreensão das primeiras epidemias da História, passando pela descoberta dos microorganismos como causadores de infecção e também dos antibióticos e vacinas que levaram ao controle ou extinção de alguns deles. Descreve com riqueza de detalhes a disputa aparentemente sem fim entre homens e micróbios; estes, a cada avanço científico para destruí-los, contra-atacam com mutações e tipos mais resistentes. Erin Brockovich Ano: 2000 Sinopse: Julia Roberts é a atriz principal e interpreta Erin, uma mulher divorciada, com três filhos e sem um tostão no bolso que, depois de so- frer um acidente, implora ao seu advogado para trabalhar com ele. Ela descobre uma história de cair o queixo e começa a investigar a ocultação de um incidenteenvolvendo casos de água contaminada que causava graves doenças nos moradores das redondezas. A história é baseada em fato verídico. O acordo a que os advogados chegaram foi a maior indenização já paga num litígio direto na história dos Estados Unidos, cerca de US$ 333 milhões’. No artigo Papel da Epidemiologia no desenvolvimento do Sistema Único de Saúde no Brasil: histórico, fundamentos e perspectivas, você aprenderá sobre o papel da Epidemiologia e seus praticantes no desenvolvimento do Sistema Único de Saúde (SUS). Para acessar, use seu leitor de QR Code. http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1415-790X2002000400003 197 M EU E SP A Ç O 198 M EU E SP A Ç O 6 Olá aluno (a) nesta unidade vamos conceituar os métodos da ciência epi- demiológica, ressaltando a questão das variáveis e indicadores de saúde, problematizando instrumentos e técnicas de medida de doença e saúde na pesquisa populacional e descrever o processo de coleta de dados para a geração de informações epidemiológicas para a caracterização dos eventos de saúde que ocorrem nas populações, nos grupos de indivíduos e na cole- tividade humana. Vamos também apresentar as formas de expressão dos resultados dos indicadores de saúde, conceituando a frequência absoluta e relativa; os indicadores de saúde, ressaltando a importância do indicador para a avaliação da situação de saúde das populações. E por fim, descre- ver a estrutura e as funções do sistema de vigilância epidemiológica para doenças transmissíveis e não transmissíveis. Identificar as fontes de dados em saúde e conhecer os sistemas de informação em saúde. Indicadores de Saúde e a Vigilância Epidemiológica Dra. Izabel Galhardo Demarchi 200 UNICESUMAR Olá, caro(a) aluno(a). Nesta unidade, você compreenderá como podemos aplicar algumas ferramentas epidemiológicas, como os indicadores de saúde e a vigilância epidemiológica nas ati- vidades rotineiras, assim como para o planejamento e a avaliação das políticas de saúde. Inicialmente, são abordados os métodos epidemiológicos, ou seja, referenciamos as estratégias, técnicas e procedimentos de pesquisa no campo da Epidemiolo- gia. Você terá subsídios conceituais para reconhecer e aplicar as variáveis epidemio- lógicas e os indicadores de saúde. Também abordaremos as técnicas para medir a doença e a saúde nas populações para, em seguida, apresentarmos as estratégias metodológicas para modificar os determinantes e os mecanismos do processo saú- de-doença. Na unidade anterior, você aprendeu sobre as aplicações da Epidemiologia, e a maioria delas, senão todas, depende de in- formações em saúde para qualquer tomada de decisão. Aborda- remos desde a coleta de dados à transformação em informação. A informação epidemiológica é produzida a partir de dados, que são a base para se formular os objetivos, as hipóteses e a metodologia dos estudos epidemiológicos. Você aprenderá como expressar os resultados epidemioló- gicos em frequências, absoluta e relativa. Serão abordados os principais indicadores de saúde, seus cálculos e interpretações. Os indicadores são utilizados para o planejamento de ações e serviços em saúde pelos gestores, e para a avaliação de progra- mas e serviços de saúde. Por fim, faremos uma breve síntese de como atua a vigilância epidemiológica, desde a sua estrutura e dos objetivos até as suas ações em saúde. Ainda nesse tópico, você será capaz de encon- trar as fontes de dados mais importantes em saúde e conhecer os principais sistemas de informação, que podem ser utilizados para o conhecimento da situação de saúde de uma população. 201 UNIDADE 6 MÉTODOS EPIDEMIOLÓGICOS: CONCEITOS Caro (a) aluno (a), você aprenderá a utilizar algumas das ferramentas epidemio- lógicas usadas para quantificar a situação de saúde de uma população, assim como compreenderá o papel da Vigilância Epidemiológica para a coleta de dados e a geração de informações em saúde que podem ser utilizadas pelos gestores, sanitaristas e pesquisadores para as tomadas de decisões e o planejamento das ações e dos serviços de saúde. Nesta Unidade, primeiramente, definiremos a noção de metodologia, desde o descobrimento do problema e da obtenção de soluções até a geração e a correção de hipóteses. Também abordaremos como as variáveis e indicadores epidemio- lógicos são utilizados no campo epidemiológico. Quando analisamos a situação de saúde de populações, nós nos deparamos com diversos problemas de saúde, que precisam ter a ocorrência confirmada e mecanismos para sua identificação e resolução e para a geração de novas ideias. Para se ter fatos reais relevantes, que mereçam prioridade e maior atenção pelos gestores e comunidade, a pesquisa do problema deve ser sistematizada e genera- lizada, ou seja, de ponta (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). Portanto, inicialmente, precisamos descobrir qual é o problema, a ‘’lacuna” em um conjunto de conhecimento. O problema pode estar evidente e claro, ou podemos sugerir um problema a partir de métodos quantitativos, ou ainda re- colocar um velho problema à luz dos novos conhecimentos (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). Por exemplo, pode- mos verificar que a AIDS tem sido um problema evidente no mundo; observa-se que as mortes por acidente de trânsito têm aumentado significativamente nos últimos anos; e que casos de sarampo voltaram a ser notificados em algumas regiões do país. Após a colocação do problema, devemos procurar conhecimentos e instrumen- tos para a solução deste problema. Por exemplo: encontrar técnicas que detectem precocemente indivíduos infectados pelo HIV para se evitar o desenvolvimento da AIDS propriamente dita, como a detecção precoce da infecção por métodos laboratoriais. Em seguida, deve-se solucionar o problema, o que é uma das etapas mais difíceis, pois podemos utilizar meios empíricos e teóricos já existentes ou identificados, ou ainda inventar novas ideias (hipóteses, teorias e técnicas) (AL- MEIDA FILHO; BARRETO, 2011; FRANCO; PASSOS, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). Por exemplo, investigar novos medicamentos para o tratamento do HIV, ou métodos de cura. 202 UNICESUMAR Ao obter uma solução, as suas consequências deverão ser investigadas. Utilizando o exemplo acima, pode-se investigar o prognóstico de um paciente infectado pelo HIV tratado com um novo medicamento. Devemos provar que a solução para o problema é pertinente, se o resultado é satisfatório e, se sim, dar a pesquisa como concluída. Caso contrário, devemos corrigir as hipóteses, procedimentos, teorias ou dados empregados na obtenção da solução incorreta. Seria o recomeço da investigação, um novo ciclo da pesquisa (ALMEIDA FILHO; BARRETO, 2011; FRANCO; PASSOS, 2011). Atualmente, com a modernização dos sistemas de saúde, nós temos uma crescente variedade e complexidade dos serviços prestados pelos profissionais de saúde à disposição da população, assim como muitos gastos. Diariamente, são muitos e complexos os dados registrados pelos sistemas de saúde, os quais podem ser transformados em informações que refletem, além da situação de saúde, a eficácia e o sucesso das ações prestadas e de programas de saúde pública, bem como constituir a base para a formulação de hipóte- ses e metodologias de estudo (PEREIRA, 2002; ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). Os dados coletados podem ser a ocorrência de uma condição única, como um agravo à saúde (uma doença, uma sequela pós-traumática, um efeito adverso e outros); um fator de risco (por exemplo, exposição ao fumo ou álcool); uma característica populacional, como raça e condições econômicas, ou outro evento de interesse; um grupo de condições, como doenças infecciosas ou cardiovasculares, por exemplo (PEREIRA, 2002). A coleta de informações é sistemática sobre eventos relacionados à saúde de uma po- pulação definida e na quantificação desses eventos (MEDRONHO, 2009). Um problemaepidemiológico pode ser muito evidente, podemos dizer que salta aos olhos, como uma grave epidemia. Outras vezes, o problema é latente e o tempo de aparecimento do pro- blema é longo. Esses fatos mais “escondidos” emergem quando se utilizam estratégias de investigação mais elaboradas e que requerem uma sensibilidade e percepção do investiga- dor (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). Um outro aspecto relevante para o diagnóstico de saúde é a abrangência populacional que esses dados representam, que é importante para a utilização de técnicas de amostra- gem populacional aleatória, para que toda a diversidade possa ser selecionada sem vieses do pesquisador (PEREIRA, 2002). Outro aspecto que deve ser minuciosamente observado é a seleção dos indicadores de saúde (Tópico 4 desta unidade), que devem ser selecionados adequadamente e retratar muito bem a população. Os principais indicadores utilizados no mundo são o de morbidade (coeficiente de pessoas doentes em uma população por uma determinada doença) e o de mortalidade (taxa de óbito em uma população, geral ou específica) (PEREIRA, 2002). 203 UNIDADE 6 Processo de seleção de amostras de elementos da população alvo para realizar um levantamento epidemiológico. A ferramenta epidemiológica utilizada para descrever o estado de saúde popu- lacional é o estudo epidemiológico descritivo, que organiza os dados e evidencia as frequências dos eventos de saúde em diversos grupos da população, permitindo comparar os resultados entre esses grupos. Neste tipo de estudo, o evento de saúde é descrito de acordo com características pessoais, do lugar e tempo (ALMEIDA FILHO; BARRETO, 2011; PEREIRA, 2002; ROUQUAYROL; ALMEIDA FI- LHO, 1999). Por exemplo: pode-se estudar o número de casos de AIDS segundo o gênero, município e ano de notificação. A Epidemiologia também auxilia na identificação de grupos de pessoas mais vulneráveis a uma doença (FRANCO; PASSOS, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999), por exemplo, os profissionais manicure e pedicure são mais vulneráveis à infecção por hepatite B e C (SÃO PAULO, 2017). A metodologia epidemiológica parte da pesquisa e da validação de uma hipótese epidemiológica, que surge a partir de enunciado que propõe uma ex- plicação para um fenômeno relacionado à distribuição ou à frequência de um desfecho em populações, utilizando para isso os fatores de risco e as medidas de risco. Ao ser formulada, a hipótese deve levar em consideração os dados da doença na população e das variações ambientais, associados à exposição aos fatores de risco (ALMEIDA FILHO; BARRETO, 2011). 204 UNICESUMAR DADOS EPIDEMIOLÓGICOS: DA COLETA À INFORMAÇÃO Todo esse processo de geração de conhecimento científico-técnico é iniciado pela observação, tomada como matéria-prima. As observações são transformadas em dados que podem produzir informa- ções no final do processo produtivo, emergindo como conhecimento científico e tecnológico. Na observação temos a identificação, a seleção, a coleta e o registro sistemático de características, pro- priedades ou atributos relevantes de objetos naturais, culturais, pessoais e sociais. Podem ser objetos de observação: o homem, o ambiente, as condições sócio-econômicas, uma célula, a massa corpórea, uma doença, etc. (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). Os dados podem ser expressos como indicadores, no sentido de que indicam parâmetros (valor ideal de uma dada dimensão) ou propriedades (quantificáveis) do objeto em observação. Os dados não refletem nenhuma informação quando analisados isoladamente, é necessário que haja um aglomerado de dados para que tenham algum valor científico ou para que sejam utilizados para tomadas de decisão. A transformação do dado em informação requer uma ferramenta analítica a partir da qual o dado é organizado, classificado, condensado e interpretado. Por exemplo: o peso de um feto em particular é um dado, compará-lo com um parâmetro estabelecido gera a informação de desnutrição ou de um bom estado nutricional (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). OBSERVADO *Observação DADO Codi�cação INFORMAÇÃO Análise CONHECIMENTO Interpretação Figura 1: O ciclo da produção de conhecimento./ Fonte: autoria própria, adaptado de Almeida Filho e Barreto (2011). 205 UNIDADE 6 A estrutura dos dados Quando transformamos os dados em informações, estas podem ser chamadas de variáveis, que quanto à sua natureza podem ser qualitativas (como sexo feminino e masculino, renda, ocupação, procedência, situação conjugal, presença ou ausência de uma enfermidade etc.) e quantitativas (número de casos, estatura, pressão arterial, temperatura corporal, níveis de colesterol e outros) (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). As variáveis qualitativas podem ser numeradas para facilitar a digitação em ban- cos de dados, ou seja, podemos codificá-las; por exemplo: se a doença for ausente, podemos atribuir a ela o número zero (0), enquanto para aqueles que possuem a doença, podemos a atribuir o número um (1). Ainda para as variáveis categorizadas, demos como exemplo o estado civil: solteiro=0, casado=1, divorciado=2, viúvo=3. As variáveis quantitativas podem ser contínuas ou descontínuas (discretas), classi- ficadas de acordo com os limites de variação. Estas referem dois valores consecutivos expressos por números inteiros, não sendo possível fracioná-los (exemplo, número de casos de uma doença, 10 casos de dengue). Já as contínuas são aquelas que admi- tem valores fracionados, independente do valor consecutivo (exemplo: temperatura corporal, 36,5°C) (ROUQUAYROL; ALMEIDA FILHO, 1999; ALMEIDA FILHO; BARRETO, 2011; FRANCO; PASSOS, 2011). As variáveis ainda podem ser classificadas como dependentes e independentes, em termos matemáticos. As variáveis independentes são aquelas representadas no eixo x das abscissas; e as ordenadas do eixo y são as dependentes. A variável independente será o fator causal, sendo o efeito final a variável dependente, aquela que depende do fator de risco para ser desencadeada. A independente antecipa a dependente (ROUQUAYROL; ALMEIDA FILHO, 1999; ALMEIDA FILHO; BARRETO, 2011). Em alguns manuais de Epidemiologia, a variável dependente também é deno- minada de “variável resposta” (em inglês: outcome), e seus valores dependem das variáveis independentes, denominados de ‘“variáveis preditoras”. Em uma perspectiva geral, as variáveis epidemiológicas são expressas como dados a partir de indicadores (ALMEIDA FILHO; BARRETO, 2011). Os indicadores epidemiológicos sintetizam a relação entre os doentes ou outros desfechos (óbito, doença, sujeitos portadores de uma doença e outros resultados) e o conjunto de membros de uma população. Os indicadores equivalem à probabilidade de adoecer, e constituem uma expressão geral e simplificada do que chamamos de risco. Ora, os indicadores podem ser calculados por taxas, razão ou proporção, e como coeficientes. Como já citamos anteriormente, os principais indicadores utilizados para avaliar o estado de saúde das comunidades são os de mortalidade e morbidade (ALMEIDA FILHO; BARRETO, 2011). 206 UNICESUMAR Fontes dos dados As fontes dos dados podem ser primárias ou secundárias, e ainda cole- tadas de forma contínua ou periódica. As fontes primárias são aquelas em que os dados são obtidos diretamente dos indivíduos participantes das pesquisas, a partir de exames ou entrevistas, como nos estudos observacio- nais utilizados em Epidemiologia. Os registros diários e sistemáticos das atividades profissionais de saúde nos serviços, suas ações e intervenções, constituem fontes especiais dos dados secundários, que alimentam os sistemas de informação. São incluídos também como fontes especiais os registros em cartório, os prontuários clínicos, os arquivos de laboratórios, entre outros. Os dados mais coletados são a Declaração de Óbito, a Decla- ração de Nascido Vivo e a Ficha de Notificaçãode casos de doenças e agra- vos à saúde (ALMEIDA FILHO; BARRETO, 2011; FRANCO; PASSOS, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999; MEDRONHO, 2009). Os dados secundários são muitas vezes obtidos por meio eletrônico a partir dos sistemas nacionais de informação e de inquéritos popula- cionais, que cobrem um amplo interesse sobre os perfis de morbimor- talidade, os fatores de exposição e os determinantes das condições de saúde. As fontes mais importantes para obtenção de dados de interesse em saúde no Brasil são pertencentes ao Ministério da Saúde (MS) e à Organização Pan-Americana (OPAS). Uma das fontes mais utilizadas é a Rede Interagencial de Informações para a Saúde (RIPSA), que viabiliza um conjunto de dados e informações com a publicação Indicadores e Dados Básicos para a Saúde no Brasil (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999; MEDRONHO, 2009). Em relação ao tempo de coleta dos dados, pode-se obtê-los de forma contínua ou episódica, ou ainda com periodicidade não definida. Os dados contínuos podem ser obtidos a partir do registro civil, de notificações e de registros de óbitos, doenças e agravos, como aqueles obtidos também pelo Instituto Brasileiro de Geografia e Estatística (IBGE). Também são contí- nuos os dados obtidos e que alimentam o Sistema Nacional da Vigilância Epidemiológica, o Sistema Nacional de Agravos de Notificação (SINAM), o Sistema de Informação de Mortalidade (SIM) e o Sistema de Nascido Vivos (SINASC), dentre muitos outros pertencentes ao MS (tópico 5 desta Unida- de). Nesses sistemas, podem ser coletados diversos dados, como os relativos a óbito, doença, sexo, idade, estatura, peso, raça, ocupação, estado civil, tipo de parto e outros (ALMEIDA FILHO; BARRETO, 2011; FRANCO; PASSOS, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999; MEDRONHO, 2009). 207 UNIDADE 6 Os dados periódicos geralmente são aqueles obtidos por inquéritos epidemiológicos realizados nos estudos observacionais, como os transversais, que analisam a situação de saúde de uma população em um período limitado, ou ainda, são obtidos por estudos longitudinais que acompanham um grupo de populacional para verificar fatores de risco e determinantes de doenças e agravos em saúde. Como exemplo de fonte de dados periódicos, temos o inquérito de maior abrangência geográfica e periódico, a Pesquisa Nacional por Amostra de Domicí- lios (PNAD). Uma outra base importante é o Instituto Nacional do Câncer (INCA). Destaca-se também o VIGITEL, do MS, que realiza inquéritos domiciliares a partir de entrevistas por telefone em todos os municípios das capitais. Neste inquérito, podemos obter dados como as características sócio-demográficas, de alimentação, de ati- vidade física, de tabagismo, de consumo de álcool e drogas, de saúde bucal, de violência e outros (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). É muito importante a transparência das ações e das aplicações de recursos em saúde para uma boa gestão, seja ela pública ou particular. É a partir da transparência que nós, cidadãos e profissionais de saúde, sabemos onde e como nossos recursos estão sendo aplicados A Lei n° 12.527 regulamenta o direito constitucional de acesso dos cidadãos às informações públi- cas. Assim nasceu o portal da transparência do Ministério da Saúde (MS), que pode ser acessado em <http:saude.gov.br>. O MS também conta com Sala de Apoio à Gestão Estratégica (SAGE), que disponibiliza as informações e análises de forma gráfica e em tabelas, de modo executivo e gerencial, para sub- sidiar as tomadas de decisões, a gestão, a prática profissional e a geração de conhecimento, e demonstrar a ação da gestão na saúde no âmbito do SUS. Embora seja público, a SAGE é uma ótima referência para as instituições de saúde demonstrarem seus indicadores de saúde de modo representativo. Para ver mais, acesse: <http:sage.saude.gov.br>. Fonte: a autora. 208 UNICESUMAR Os instrumentos de coleta devem ser tão simples quanto possível e fáceis de serem organizados e analisados posteriormente. Deve-se assegurar o correto preenchimento dos dados que tenham va- riáveis suficientes para a produção de informação, pois a insuficiência de dados poderá prejudicar a interpretação do estudo, assim como a coleta excessiva e complexa, que pode levar a erros e falhas de preenchimento. Torna-se, também, muito importante a capacitação e o treinamento dos pesquisadores ou dos indivíduos que alimentam os sistemas. Os instrumentos mais utilizados são os formulários, protocolos, questionários e roteiros, que podem ser aplicados diretamente e pessoalmente para o participante ou via internet, correspondência e outros (ALMEIDA FILHO; BARRETO, 2011; ROU- QUAYROL; ALMEIDA FILHO, 1999). RESULTADOS EPIDEMIOLÓGICOS A maioria dos resultados ou informações em saúde são expressos como indicadores, e a preparação destes envolve a contagem de unidades, como o número de doentes, de óbitos, etc. A forma mais sim- ples de representar um resultado é a partir do número absoluto, denominando de frequência absoluta. Essa forma de expressão de um resultado é a mais utilizada pela imprensa leiga rotineiramente. Por exemplo: foram detectados dez casos de dengue na semana. Esses resultados podem ser utilizados para comparar a situação de saúde entre regiões e em tempos diferentes (veja a Tabela 1) (PEREIRA, 2002; GORDIS, 2009; FRANCO; PASSOS, 2011). Outra forma de expressão é a frequência relativa, mais utilizada para facilitar a comparação e inter- pretação e na qual os valores absolutos são expressos em relação a outros valores absolutos, calculan- do-se a porcentagem (%) (veja Tabela 1) (PEREIRA, 2002; GORDIS, 2009; FRANCO; PASSOS, 2011). 209 UNIDADE 6 Para você entender melhor a frequência absoluta e relativa, vamos dar como exemplo os resultados de Pierre Louis (mencionado na Unidade I), que realizou estudos para investigar a mortalidade por pneumonia após tratamento com a sangria (Tabela 1). O estudo revelou, a partir da frequência absoluta e relativa do número de óbitos, que a sangria realizada logo no início dos sintomas era extremamente prejudicial para o tratamento da doença (PEREIRA, 2002). Tabela 1 – Letalidade da pneumonia em franceses submetidos à sangria, Paris, 1835. Início do tratamento/ sangria (dias) Número de pacientes Frequência absoluta (número de óbitos) Frequência relativa (letalidade) (%) 1-3a 24 12 50 4-6b 34 12 35 7-9c 19 3 16 Total 77 27 35 a A sangria foi iniciada entre o primeiro e terceiro dia da doença; b a sangria foi iniciada a partir do quarto dia da doença; c a sangria foi iniciada a partir do sétimo dia da doença. / Fonte: Pereira (2002). Os resultados relativos também podem ser expressos a partir do cálculos de coeficientes ou taxas, nos quais o número de casos é relacionado com o tamanho da população da qual eles procedem. O numerador é definido pelo nú- mero de casos detectados e o de- nominador é o número total da população sob o risco de adoe- cer. O numerador é o número de pessoas acometidas pela doença ou exposta ao fator de risco, e o denominador é o número total de pessoas sob o risco (PEREIRA, 2002; FRANCO; PASSOS, 2011). Veja como podemos estruturar um coeficiente: (número de casos/população sob risco no período do estudo) x constante. A constante pode ser qualquer múltiplo de 10 (10, 100, 1.000, 10.000 e etc.). Multiplica-se pela constante para facilitar a comunicação dos resultados e a comparação entre popu- lações com tamanhos diferentes de amostragem (PEREIRA, 2002; FRANCO; PASSOS, 2011). Demos como exemplo dados hipotéticos, na cidade X ocorreram 10 casos de dengue a cada 10.000 habitantes por semana epidemiológica, enquanto que na cidade Y foram apenas 3 casos a cada 10.000 habitantes. Quando utilizamos a constante 100, fazemos a relação de porcentagem, muito utilizada nos estudos observacionais e retrospectivos. Figura 3 – Tratamento com sanguessugas. Os estudos de Pierre Louis mostraram que a sangria utilizando sanguessugassobre a pele era prejudicial para o tratamento da pneumonia e não benéfico, como se acreditava naquela época. 210 UNICESUMAR Figura 4 – A utilização de computadores para digitação e armazenamento de bancos de dados também permite a construção de gráficos e tabelas, e a análise estatísticas dos dados. Os indicadores de saúde são parâmetros utilizados internacionalmente ou nacionalmente para verificar a situação de saúde de populações, sob o ponto de vista sanitário, permitindo a comparação com parâmetros estabelecidos, ou entre regiões e períodos, assim como com o intuito de mudar uma situação presente julgada insatisfatória. Também podem ser utilizados para subsidiar uma tomada de decisão de forma racional e bem fundamentada ou ainda como faceta diagnóstica, uma vez que tem caráter de prognóstico, pois podem presumir o que provavelmente ocorrerá no futuro tendo como base os indicadores do passado e do presente (PEREIRA, 2002; ROUQUAYROL; ALMEIDA FILHO, 1999; MEDRONHO, 2009). A escolha de um indicador de saúde para a interpretação de uma situação de saúde requer muitos aspectos metodológicos, éticos e operacionais. Um indicador deve medir e representar o fenômeno considerado, ou seja, ele deve quantificar o fenômeno e ser capaz de discriminar corretamente o even- to dos outros. Além deste aspecto, o indicador deve ter alta confiabilidade, também conhecida como reprodutibilidade, o que significa que deve permitir a obtenção de resultados semelhantes quando a mensuração é repetida (PEREIRA, 2002; FRANCO; PASSOS, 2011; MEDRONHO, 2009). PRINCIPAIS INDICADORES DE SAÚDE 211 UNIDADE 6 A representatividade se refere à cobertura populacional que esse indicador alcança. Geralmente, para que o indicador tenha esse alcance, utiliza-se a técnica de amostragem para se obter um processo adequado de seleção das unidades componentes da amostra. Deve-se considerar os aspectos éticos, uma vez que os indicadores devem manter o sigilo e não podem acarretar malefícios ou prejuízos às pessoas investigadas. Do ângulo técnico-administrativo, o indicador deve ser de fácil cálculo, interpretação e obtenção, baixo custo operacional, e ainda o cálculo deve ser simples e flexível (PEREIRA, 2002; FRANCO; PASSOS, 2011; MEDRONHO, 2009). Atualmente, a forma mais confiável para se obter informações válidas e de fácil transformação de dados é a utilização de computadores para a digitação de bancos de dados informatizados. Os dados são arma- zenados em computadores e, assim, são mais fáceis de serem manipulados, atualizados e comparados no tempo e espaço (PEREIRA, 2002). A escolha do coeficiente é determinada pelos dados disponíveis e pelo propósito da análise dos dados, e deve ser realizada de forma adequada para evitar vieses nas interpretações da situação de saúde (GORDIS, 2009; FRANCO; PASSOS, 2011; MEDRONHO, 2009). Morbidade Os indicadores de morbidade permitem inferir os riscos de o indivíduo adoecer, indicam os determinantes das doenças e a escolha das ações saneadoras adequadas. Em comparação com a mortalidade, a morbi- dade é mais sensível para expressar mudanças a curto prazo. Os registro de doença ou outros agravos são coletados rotineiramente pelos serviços de saúde e, devido à sua facilidade operacional de registro, este é o caminho mais simples para se verificar o estado de saúde das populações (PEREIRA, 2002; FRANCO; PASSOS, 2011; MEDRONHO, 2009). Os dados de doença podem ser obtidos por diagnósticos de altas hospitalares, atendimentos de consultas, arquivos como prontuários e laudos laboratoriais, atestados e notificações compulsórias. Os dados ainda podem ser obtidos por inquéritos epidemiológicos, uma vez que não existe um sistema rotineiro adequado para registro, ou usualmente isto não é requerido (PEREIRA, 2002; FRANCO; PASSOS, 2011; GORDIS, 2009; MEDRONHO, 2009). O cálculo de morbidade é dado pela fórmula= número de indivíduos acometidos pela doença, período, ano X constante número de pessoas na população Limitações: as pessoas muitas vezes não percebem as anormalidades ou ainda tardam a procurar os serviços de saúde, o que pode alterar as estatísticas e a variabilidade dos registros de morbidade (PEREIRA, 2002). 212 UNICESUMAR Mortalidade Historicamente, é o primeiro indicador utilizado em saúde coletiva. Até hoje, é o mais empregado. Isso se deve à sua facilidade operacio- nal, à objetividade do termo óbito e à obrigatoriedade da notificação do óbito e de sua causa. O seu registro compulsório permite que a base de dados seja mantida e atualizada constantemente pelos técnicos do governo e divulgada periodicamente (PEREIRA, 2002; FRANCO; PASSOS, 2011; GORDIS, 2009; MEDRONHO, 2009). Os indicadores de mortalidade ainda podem ser específicos, como: • Coeficiente de mortalidade por causas específicas= (número de óbitos por uma causa específica/número total de indiví- duos sob o risco) x múltiplo de 10, geralmente 100.000; • Coeficiente de mortalidade materna= (número de óbitos por causas ligadas à gestação, parto e puerpério, área, ano/ nascidos vivos no mesmo período) x múltiplo de 10; • Coeficiente de mortalidade infantil = (número de óbitos em menores de um ano, na área, ano/número de nascidos vivos, na área, ano) x 1000. Este indicador é sempre multipli- cado por mil nascidos vivos, é um parâmetro universal. Veja abaixo a ilustração da distribuição da taxa de mortalidade infantil no mundo (2008); • Coeficiente de mortalidade neonatal infantil precoce = (nú- mero de óbitos em recém-nascido do dia zero a 6 dias de nascimento, área, durante o ano/total de nascidos vivos, área, durante o ano) x 1000. Geralmente, as mortes são relacionadas com anormalidades congênitas e infecções intrauterinas; • Coeficiente de mortalidade neonatal, tardia = (número de óbitos em recém-nascidos com sete a 27 dias de nascimento, área, durante o ano/total de nascidos vivos, área, durante o ano) x 1000. Geralmente, o óbito está relacionado a gastroen- terites, infecções respiratórias e má nutrição; • Coeficiente de mortalidade neonatal, pós-neonatal = (nú- mero de óbitos em recém-nascido com 28 a 364 dias de nascimento, área, durante o ano/total de nascidos vivos, área, durante o ano) x 1000. Estes óbitos estão relacionados com infecções respiratórias, má nutrição, acidentes e outros. 213 UNIDADE 6 TAXAS MUNDIAIS DE MORTALIDADE INFANTIL Mortes/1000 nascidos vivos 175 100 50 25 10 1 Figura 5 – Taxa (ou coeficiente) de mortalidade infantil no mundo, ano de 2008. As áreas mais vermelhas são as com maior taxa de mortalidade em menores de um ano de idade. Legenda: óbitos/mil nascidos vivos; taxa de mortalidade infantil no mundo. / Fonte: Wikimedia (2014, on-line)¹. Um dos maiores desafios da mortalidade é a alta taxa de mortalidade por causas evitáveis, ou seja, óbitos que poderiam ser evitados quando tomada alguma medida preventiva. Essas mortes evitáveis geralmente estão relacionadas com os baixos níveis sanitários e sociais da popu- lação. Por exemplo: a mortalidade materna é quase cinco vezes maior em países do Terceiro Mundo, e é considerada como morte evitável. Os óbitos por acidente de trânsito e outros também são considerados evitáveis (PEREIRA, 2002). Apesar de ser o indicador mais utilizado, apresenta algumas limitações importantes que merecem destaque, pois podem dimi- nuir a sua qualidade. Um dos maiores problemas é a subcontagem do numerador, o que pode acontecer devido a mortes não infor- madas, registros de óbito inexistentes, cemitérios clandestinos e outras causas. Também ocorre a sobre-contagem do numerador por certidões duplicadas, por exemplo. O denominador exige uma estimativa correta da população. Ainda se perde qualidade quando o número de médico é baixo para cada mil habitantes, e quando se tem causas de óbito mal definidas (PEREIRA, 2002; GORDIS, 2009; MEDRONHO, 2009). 214 UNICESUMAR Outros indicadores Abaixo, citamos um dos indicadores utilizados para avaliar a situação de saúde, diagnósticoe prognóstico de populações (GORDIS, 2009): • Taxa de letalidade: número de pessoas que morrem por uma doença dividido pelo número de pessoas com a doença no ano; • Taxa de mortalidade: número de óbitos por uma doença dividido pelo número de pessoas naquela população (doen- tes e não doentes) por ano; • Taxa de sobrevivência em cinco anos: percentual de pes- soas vivas em cinco anos após o início do tratamento ou cinco anos após o diagnóstico da doença. Esse coeficiente é muito utilizado para avaliação de tratamentos para câncer; • Sobrevivência observada: sobrevivência observada ao lon- go do tempo, na qual se observa o número de indivíduos vivos a cada ano após o início do tratamento ou da doença; • Mediana do tempo de sobrevivência: extensão do tempo em que a metade da população estudada sobrevive; • Taxa relativa de sobrevivência: é a sobrevivência esperada em pessoas com a doença dividido pela sobrevivência espe- rada em pessoas sem a doença; • Índice de morbimortalidade: este índice é chamado de multidimensional, e incorpora tanto o impacto das doenças quanto o dos óbitos que incidem em uma população. Além desses indicadores, outros podem ser selecionados para ava- liar programas e serviços de saúde, como a taxa (%) de cobertura populacional, a taxa de imunização em menores de um ano, o acesso a água potável, o acesso a esgoto, o acesso aos serviços de saúde, entre outros (PEREIRA, 2002). Você conhece os indicadores de saúde do seu município e como eles têm sido aplicados para as tomadas de decisão? 215 UNIDADE 6 VIGILÂNCIA EPIDEMIOLÓGICA Explicar a ocorrência de doenças e a distribuição dos indicadores auxi- lia na identificação de causas e de seus determinantes (ME- DRONHO, 2009; GORDIS, 2009). Essas explicações fornecem subsídios para a investigação etiológica e para as tomadas de deci- sões (ALMEIDA FILHO; BARRETO, 2011; PEREI- RA, 2002; ROUQUAYROL; ALMEIDA FILHO, 1999). Assim nascem os núcleos de vigilância, uma vez que o seu ob- jetivo é monitorar a ocorrência de problemas de saúde e a documentação dos seus efeitos em uma população definida, e caracterizar as pessoas afetadas e com maior risco. Os dados da vigilância podem ser utilizados para informar e avaliar programas de saúde pública e identificar tendências futuras, auxiliando os planejadores de saúde (ROTHMAN et al., 2011) O termo vigilância significa o ato de vigiar, atenção, cuidado. A Vigilância em Saúde é o ato de observar e analisar permanentemente a situação de saúde da população, desenvolvendo um conjunto de ações destinadas a controlar determinantes, riscos e danos à saúde de populações que vivem em de- terminados territórios. Os componentes da vigilância são: vigilância e controle das doenças transmissíveis; vigilância das doenças e agravos não transmissíveis; vigilância da situação de saúde; vigilância da saúde do trabalhador; vigilância ambiental em saúde e vigilância sanitária. Todos com o objetivo de diminuir coe- ficientes de morbimortalidade; aumentar a qualidade de vida e garantir acesso da população aos serviços de saúde (MINISTÉRIO DA SAÚDE, 2009). No Brasil, o marco da institucionalização das ações de vigilância ocorreu em 1966-1973, com a Campa- nha de Erradicação da Varíola (CEV). Em 1969, o modelo da CEV inspirou a Fundação Serviços de Saúde Pública (FSESP) a organizar um sistema de notificação semanal de doenças selecionadas e a disseminar informações pertinentes em um boletim epidemiológico de circulação quinzenal. Em 1975, ocorreu a 5ª Conferência Nacional de Saúde, na qual foi instituído o Sistema Nacional de Vigilância Epidemiológica (SNVE), sob a Lei n° 6.259/75 e o Decreto n° 78.231/76. A partir desta lei, tornou-se obrigatória a notifica- ção de doenças transmissíveis. Em 1988, o SUS incorporou o SNVE e definiu a Vigilância Epidemiológica (VE), a partir da Lei Orgânica da Saúde 8.080 (MINISTÉRIO DA SAÚDE, 2009, on-line)²: 216 UNICESUMAR “ conjunto de ações que proporciona o conhecimento, a detecção ou prevenção de qual- quer mudança nos fatores determinantes e condicionantes de saúde individual ou coletiva, com a finalidade de recomendar e adotar as medidas de prevenção e controle das doenças ou agravos. Consequentemente, a vigilância deixou de ser um setor acessório e passou a integrar o nível decisório da gestão. As atividades principais da VE são a coleta e o processamento dos dados coletados; a aná- lise e a interpretação dos dados processados; a recomendação das medidas de controle apropriadas; a promoção das ações de controle indicadas; a avaliação da eficácia e efetividade das medidas adotadas; e a divulgação de informações pertinentes (MINISTÉRIO DA SAÚDE, 2009). A VE tem muitos desafios, como a profunda mudança no perfil epidemiológico das populações (mu- danças sociais e demográficas); o declínio das taxas de mortalidade por doenças infecciosas e parasitárias e do crescente aumento das mortes por causas externas e doenças crônicas degenerativas, o que implicou na incorporação de doenças e agravos não transmissíveis ao escopo de atividades da VE. Ainda, a VE tem o propósito de fornecer orientação técnica permanente para os profissionais de saúde, que têm a respon- sabilidade de decidir sobre a execução de ações de controle de doenças e agravos, tornando disponíveis, para esse fim, informações atualizadas sobre a ocorrência desses casos, bem como dos fatores que a con- dicionam, numa área geográfica ou população definida (MINISTÉRIO DA SAÚDE, 2009). Os dados coletados geralmente são os dados demográficos, socioeconômicos, ambientais, de mor- bidade e mortalidade e as notificações de surtos e epidemias. Esses dados são coletados a partir da observação de pessoas e de doenças e agravos em saúde. A partir da observação de pessoas, podem ser investigados os fatores de risco, os prognósticos para a doença, a eficácia de dada vacina/medicamento (MINISTÉRIO DA SAÚDE, 2009). A observação de doenças e agravos permite detectar as varia- ções de tendências e a frequência dos problemas de saúde, identifi- cando as doenças e agravos com valores altos e baixos. Também possibilita traçar o perfil das doenças, priorizar problemas e agir em função do diagnóstico da situação. Faz parte da VE o Centro de Controle de Zoonoses, que realiza atividades dirigidas aos vetores (Aedes sp., fleboto- míneos e outros), reservatórios e hospedeiros (MINISTÉRIO DA SAÚDE, 2009). Figura 6 – Centro de Controle de Zoonoses, pertencente à Vigilância Epidemiológica do município de Guaratinguetá (SP). Essa instituição tem a função de controle de vetores, e suas atividades são voltadas para os reservatórios e hospedeiros de doenças que acometem os animais / Fonte: (Wikimedia, 2015, on-line)³. 217 UNIDADE 6 Outro desafio da VE são as doenças emergentes e reemergentes. As doenças emergentes são aquelas cujos agentes, até então, são desconhecidos, ou as que se expandem ou ameaçam expandir-se para áreas consideradas indenes. A infecção pelo HIV é um exemplo. As doenças reemergentes são aquelas doenças bastante conhecidas, que estavam controladas, ou eliminadas de uma determinada região, e que vieram a ser reintroduzidas, como a cólera e a dengue (MINISTÉRIO DA SAÚDE, 2009). A VE alimenta muitos sistemas de informação do SUS. O mais impor- tante deles é o Sistema Nacional de Informação de Agravos de Notificação, o SINAN, que é uma base de dados que contém valiosas fontes de informação sobre a ocorrência de doenças e agravos sob vigilância epidemiológica, e que se utiliza do registro rotineiro de dados sobre saúde, derivado da produção de serviços ou de sistemas de informação específicos. As principais fontes são os laboratórios e hospitais que emitem resultados de exames laboratoriais e, na rotina da VE, complementam o diagnóstico de confirmação da investigação epidemiológica (MINISTÉRIO DA SAÚDE, 2009). Com a utilização das ferramentas epidemiológicas para a determinação da situação de saúde, podemos observar muitasconquistas ao longo dos anos: o Brasil interrompeu transmissão da doença de Chagas pelo vetor Triatoma infestans; o índice de tétano neonatal caiu abaixo do limite estabelecido; a síndrome da rubéola congênita tornou-se um evento raro no país; os casos de óbitos por coqueluche diminuíram (Corynebacterium diphtheriae); o número de internações de casos por complicações de influenza decresceu após a vacinação, dentre outras (MINISTÉRIO DA SAÚDE, 2009). O fortalecimento da VE se dá pela realização de cursos de longa duração, como o Programa de Capacitação e Formação de Recursos Humanos, os mestrados e as especializações profissionalizantes; o Programa de Atualização em Epidemiologia Aplicada à Gestão; os cursos de curta duração ministrados pela Funasa, pela OMS, pela Fiocruz, pela Universidade Federal do Rio de Janeiro e outros; por Cooperação internacional e pela faculdade de Saúde Pública da Universidade de São Paulo (MINISTÉRIO DA SAÚDE, 2009). Prezado aluno(a), chegamos ao final de mais uma unidade, em que abor- damos os indicadores de saúde e o papel da Vigilância Epidemiológica para o planejamento e a gestão em saúde. Podemos, a partir de agora, compreender melhor a situação das populações e como acompanhar o seu desenvolvimento a partir da saúde. Espero que você utilize os conhecimentos adquiridos nesta unidade para cumprir seu papel no controle social, monitorando a qualidade de saúde da sua população, e também cobrando dos órgãos responsáveis melhorias nos padrões de vida. Até a próxima Unidade! 218 UNICESUMAR CONSIDERAÇÕES FINAIS Caro(a) aluno(a), você aprendeu a aplicação de algumas ferramentas epidemiológicas, como os indicadores de saúde e a Vigilância Epidemiológica (VE). Pode entender que a construção dos indicadores e as ações de VE ocorrem diariamente ou de forma periódica. Conhecemos as estratégias metodológicas para realizar os estudos epidemiológicos, desde o sur- gimento da pergunta científica, passando pela detecção do problema e pela formulação de hipóteses até a solução do problema e a validação da hipótese. Descrevemos o conceito de dados, como realizar a coleta de dados e a importância da transformação dos dados em informação. Nós caracterizamos as variáveis epidemiológicas (qualitativas e quantitativas; contínuas e discretas; dependentes e independentes; resposta e preditora) e citamos as fontes para coleta dos dados (IBGE, SINAN, SIM e outras bases). Você também pode compreender o papel das informações para determinar a situação de saúde, planejamento e gestão em saúde. Descrevemos também como expressar os resultados epidemiológicos em frequências, absolu- ta e relativa (porcentagem, coeficientes e taxas). Abordamos o conceito de indicador de saúde e apresentamos os principais indicadores, morbidade e mortalidade, seus cálculos, interpretações e limitações. A partir disso, você pode compreender a importância desses parâmetros para o pla- nejamento de ações e serviços em saúde pelos gestores e para a avaliação de programas e serviços de saúde. Finalmente, fizemos uma síntese de como atua a Vigilância Epidemiológica e vimos que a observação das pessoas e das doenças e agravos em saúde, rotineiramente ou de forma periódica, é fundamental para se estabelecer a situação de saúde de uma população, identificar fatores determinantes e condi- cionantes de saúde, avaliar ações e programas e subsidiar as tomadas de decisão. Assim chegamos ao fim de mais uma unidade.. Espero que você tenha compreendido as funções e como utilizar a metodologia epidemiológica e os indicadores de saúde para o estudo da situação de saúde das populações, assim como que tenha entendido a importância da Vigilância Epidemiológica nas atividades diárias dos serviços de saúde e gestão. 219 A G O R A É C O M V O C Ê 1. Para que servem os indicadores de saúde? 2. Em relação à fase que vai da coleta de dados até a geração de informação em saúde, selecione a alternativa correta. a) Os dados epidemiológicos podem ser utilizados de forma bruta para se gerar conhe- cimento sobre a situação de saúde de uma população. b) Os dados podem ser coletados rotineiramente nas atividades e serviços de saúde, mas nunca ocasionalmente. c) A coleta de dados periódica, realizada por inquéritos epidemiológicos, não pode ser utilizada para a interpretação da situação de saúde, uma vez que não possui credibi- lidade científica. d) As variáveis qualitativas não possuem a mesma relevância epidemiológica que as variáveis quantitativas. e) Os dados devem ser trabalhados, matemática e estatisticamente, para gerar uma informação utilizável para interpretar a situação de saúde de uma população. 3. Os critérios empregados para a avaliar um indicador de saúde são: I) O seu cálculo deve ser simples, e os dados, acessíveis. II) Deve ter uma ampla cobertura populacional e deve ser reprodutível. III) Não precisa manter o sigilo das informações. IV) Deve ter baixo custo operacional. Assinale a alternativa correta. a) Apenas I e II estão corretas. b) Apenas I, II e IV estão corretas. c) Apenas I está correta. d) Apenas II e III estão corretas. e) Todas as alternativas estão corretas. 220 A G O R A É C O M V O C Ê 4. Em relação aos indicadores de saúde, assinale verdadeiro (V) ou falso (F). ) ( Os indicadores de saúde são utilizados para subsidiar a tomada de decisão de forma racional e bem fundamentada. ) ( Os indicadores podem ser expressos por frequência absoluta (a mais utilizada), relativa (porcentagem) e, em menor caso, por coeficientes ou taxas. ) ( O indicador de morbidade é calculado pelo número de pessoas doentes dividido pelo de número de pessoas na população. ) ( A morbidade pode ser obtida em base de dados de notificação compulsória e em inquéritos epidemiológicos, enquanto que na mortalidade os dados são retirados apenas de declaração de óbito. ) ( O indicador de mortalidade tem muitas limitações, como a subcontagem ou sobre- contagem do numerador e o preenchimento de declaração de óbito com causas mal definidas. 5. Em relação ao papel da Vigilância Epidemiológica (VE), assinale verdadeiro (V) ou falso (F). ) ( A VE é responsável pela vigilância das condições sanitárias de portos, restaurantes, escolas e outros estabelecimentos. ) ( A VE deve proporcionar o conhecimento, a detecção ou a prevenção de qualquer mudança nos fatores determinantes e condicionantes de saúde individual ou coletiva. ) ( Outra finalidade da VE é recomendar e adotar as medidas de prevenção e controle das doenças ou agravos. ) ( Os dados utilizados pela VE são os demográficos, sociais e econômicos, ambientais, de morbidade e mortalidade, e qualquer outro que se fizer necessário. ) ( Os Centros de Controle de Zoonoses e os laboratórios de análises clínicas não per- tencem à VE. 221 A G O R A É C O M V O C Ê Neste texto, você poderá construir uma visão crítica sobre os dados utilizados para os resultados dos indicadores de saúde de mortalidade e morbidade. Aqui são expostos os principais problemas enfrentados para a confiabilidade dos indicadores. “Ao avaliar a exatidão dos dados de mortalidade, muitos autores consideram “padrão ouro” os diagnósticos obtidos nas necropsias. Ainda que estes se constituam em excelente fonte de informação para o preenchimento de causas nas declarações de óbito, sabe-se que não é bem assim. De fato, mesmo que 100% das mortes fossem submetidas à necropsia, não se teria 100% de exatidão nas mesmas, visto que nem todos os patologistas preenchem adequadamente os atestados de óbito. [...] quando a evolução para o óbito é muito rápida, a proporção de erros de diagnóstico é grande, como o verificado com a hemorragia cerebral e a oclusão coronária. [...] Entre nós, há poucos estudos comparando as informações do atestado de óbito com dados de autópsia. [...] Por outro lado, apenas os dados da necropsia não são, muitas vezes, suficientes para elaboração de umasequência causal lógica e adequado preenchimento da declaração de óbito. Pensa-se, nesse caso, haver necessidade também de informações clínicas, razão pela qual acredita-se que a melhor forma de preencher a declaração de óbito é a originada da união das informações de uma necropsia e um prontuário, ambos bem elaborados. [...] O que foi aqui descrito quanto à fidedignidade dos dados de mortalidade diz respeito apenas à declaração da causa básica, a qual nem sempre é feita de maneira correta pelos médicos. Por outro lado, as estatísticas podem apresentar falhas, mesmo quando a causa da morte é declarada corretamente, porque existe a possibilidade de erros na codificação da causa, por conta de codificadores mal preparados. No Brasil, após a municipalização das ações de saúde, a codificação das causas de morte passou a ser feita nas secretarias municipais de saúde, o que fez com que a quantidade de codificadores crescesse assusta- doramente, sendo que o Brasil é, hoje, talvez, o país com maior número de codificadores de causas de morte. Esse fato fez com que se tornasse difícil o seu treinamento e, parti- cularmente, o acompanhamento e a supervisão necessários para o bom andamento dos trabalhos. Assim, corre-se o risco de ver deterioradas as estatísticas de mortalidade, caso não seja feita boa formação dos codificadores e supervisão, em nível municipal. A tentati- va de sanar essa questão e uniformizar o trabalho desenvolvido foi feita por meio de um programa para seleção eletrônica da causa básica da morte, o qual vem sendo utilizado regularmente através do programa Seletor da Causa Básica – SCB, desenvolvido pelo Centro Brasileiro de Classificação de Doenças em conjunto com o Datasus/Ministério da Saúde. Este, embora ainda com algumas falhas, representa a esperança de uma boa codificação LE IT U R A C O M P LE M EN TA R 222 A G O R A É C O M V O C Ê LE IT U R A C O M P LE M EN TA R da causa da morte, além de assegurar a comparabilidade dos seus dados, em todo o País. Outro fator que pode afetar as estatísticas de mortalidade por causas, somente para es- tudos de tendências, é a introdução de novas revisões da Classificação Internacional de Doenças. Com o objetivo de sanar esse viés, a OMS e a Rede de Centros Colaboradores da OMS para a Classificação de Doenças publicam uma equivalência dos códigos entre as revisões, a qual deve ser usada nesses estudos, sempre que o período estudado englobar mais do que uma revisão. Um cuidado também a ser tomado para evitar distorção dos dados, na análise epidemiológica, refere-se à necessidade de selecioná-los segundo local de residência do falecido ou, em caso específico, segundo local de ocorrência. Além de todos esses aspectos, é preciso introduzir no currículo das escolas médicas (nos últimos anos e mesmo na residência médica) temas relacionados às estatísticas de mortalidade, seus usos e a importância do preenchimento do atestado de óbito e a maneira correta de fazê-lo. A excessiva multiplicação dos cursos de medicina é bastante preocupante, visto que pode levar a uma situação em que, se os alunos estão correndo o risco de serem mal preparados nas artes de diagnosticar e tratar, certamente, não serão melhores quanto a declarar do que morreram seus pacientes.” Fonte: LAURENTI, R.; JORGE, M. H. P. de M.; GOTLIEB, S. L. A confiabilidade dos dados de mortalidade e morbidade por doenças crônicas não-transmissíveis. Ciência & Saúde Co- letiva, v. 9, n.4, p. 909-920, 2004. 223 A G O R A É C O M V O C Ê M A TE R IA L C O M P LE M EN TA R Epidemiologia. Indicadores de Saúde e Análises de Dados Tatiana Gabriela Brassea Galleguillos Editora: Saraiva Sinopse: o livro apresenta os conceitos de Epidemiologia e estatística, bem como sua utilização no decorrer do tempo. Discute as diferentes teorias que explicam o processo saúde-doença, inclusive a que contempla os Determinantes Sociais em Saúde. Mostra os indicadores mais utilizados para medir morbidade e mortalidade, associando-os às metas mundiais e nacionais, como os Objetivos do Milênio. Aponta as características de doenças transmissíveis e não transmissíveis e os impactos que causam nas diferentes regiões do país. Por fim, explica a transição epidemiológica ocorrida no Brasil e o planejamento em saúde, a partir do uso de indicadores epidemiológicos, como ferramenta de gestão do SUS. O conteúdo pode ser aplicado para os cursos técnicos em Agente Comunitário de Saúde, Enfermagem, Gerência em Saúde, Registros e Informações em Saúde, Vigilância em Saúde, entre outros. A Organização Pan-Americana de Saúde subsidia a Rede Interagencial de Informações em Saúde (RIPSA), que traz as bases de dados para os Indicadores e Dados Básicos para a Saúde no Brasil. Acesse o link abaixo e veja mais. Para acessar, use seu leitor de QR Code. http://www.ripsa.org.br/vhl/indicadores-e-dados-basicos-para-a-saude-no-brasil-idb/ 224 M EU E SP A Ç O 7 Para começarmos nossa disciplina aluno (a) você irá conhecer e introduzir os conceitos e aplicações de prevalência e incidência, e abordar a relação prevalência e incidência ,descrever os tipos de prevalência e sua interpretação, os tipos de incidência e sua interpretação. E por fim, conceituar e interpretar as medidas de associação utilizadas para identificação de fatores de risco ou de proteção dos estudos retrospectivos, além das medidas de associa- ção utilizadas para identificação de fatores de risco ou de proteção dos estudos prospectivos. Medidas de Frequência e de Associação Dra. Izabel Galhardo Demarchi 226 UNICESUMAR Caro(a) aluno(a), nesta unidade você aprenderá o que são e como utilizar as medidas de ocorrência dos fenômenos epidemiológicos, como a prevalência e a incidência. Nós também abordaremos como calcular e interpretar as medidas de associação (Odds ratio, ou razão das proporções, e risco relativo), as quais possibilitam identificar fatores de risco associados aos desfechos em saúde e calcular a probabilidade da ocorrência dos problemas de saúde quando um indivíduo é exposto a esses fatores. Faremos uma breve introdução dos conceitos básicos das medidas de ocorrência mais utilizadas em epidemiologia, também chamadas de me- didas de frequência. Também mostraremos para você como representar a ocorrência das doenças nas populações utilizando tabelas, mapas e gráficos. Descreveremos as medidas de prevalência e de incidência, seus cálculos e interpretações. Nesses dois tópicos, utilizaremos exemplos hipotéticos ou originais para que você compreenda a aplicação dessas medidas, para verificar a situação de saúde das populações e determinar quais são as doenças ou causas das enfermidades que nelas ocorrem com maior frequência. E conceituaremos as medidas de associação e suas aplicações para a identificação de fatores de risco, causas ou ainda fatores de proteção, que levam à ocorrência de doenças, óbitos ou outros desfechos em saúde. Para facilitar a compreensão das medidas de associação, destaca- remos as medidas de odds ratio (proporção dos pares) e risco relativo, utilizadas quando se realizam estudos retrospectivos e prospectivos, respectivamente. Por isso, para que você compreenda esse tema, tam- bém abordaremos brevemente esses tipos de estudos, os quais você aprenderá melhor na próxima unidade deste livro. 227 UNIDADE 7 MEDIDAS DE FREQUÊNCIA (OCORRÊNCIA) Figura 1 – Gráfico de ocorrência do vírus HIV / Fonte: Wikimedia (2014, on-line)¹. Nesta unidade, conceituaremos as medidas de frequência, também chamadas de ocorrência, e as medidas de associação. Você será capaz de compreender e até de calcular e interpretar as medidas de frequência e de associação a partir da obtenção dos conhecimentos teóricos e da prática de exercícios contidos nesta unidade. Primeiramente vamos conceituar as medidas de frequência das doenças. Para isso, precisamos voltar ao conceito de epidemiologia contido anteriormente, na qual o melhor conceito