Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 EPIDEMIOLOGIA INTRODUÇÃO Décadas atrás a epidemiologia era conhecida como o estudo das doenças transmissíveis. Hoje, no entanto, sabemos que ela é muito mais abrangente, uma vez que trata de qualquer evento relacionado à saúde das populações. A epidemiologia estuda o processo saúde-doença de grupos de pessoas, objetivando uma melhoria na saúde das populações, principalmente das menos favorecidas. Uma das características fundamentais da prática epidemiológica é a medida de saúde e de doença. Neste contexto, diversas são as medidas que auxiliam na caracterização da saúde das populações. Por muitos anos a teoria da unicausalidade era norteadora para o entendimento das doenças. Hoje, porém. A teoria da Multicausalidade tem seu papel reconhecido na epidemiologia. 2 Estes são alguns conceitos que vamos trabalhar. É importante lembrar que dominar bem os conceitos explorados neste capítulo servirão de subsídio para sua preparação acadêmica e profissional. Epidemiologia: conceitos e história O que é epidemiologia? A epidemiologia já foi entendida de diferentes maneiras. As definições, geralmente, estão vinculadas com a visão de mundo da época em que foi escrita. Em 1927, Frost definiu epidemiologia como o “estudo da história natural das doenças”. Sartwell, em 1973, entendia que a epidemiologia era o “uso de todos os métodos pertinentes que estão disponíveis para estudar a distribuição e dinâmica das doenças nas populações humanas”. Recentemente, em 2000, Pereira passou a entender a epidemiologia como o estudo do comportamento coletivo da saúde e da doença. Estes são alguns exemplos de definições de epidemiologia ao longo do tempo. Com o intuito de nortear este livro, adotaremos a definição que caracteriza epidemiologia como um conjunto de conceitos, teorias e métodos que permitem estudar, conhecer e transformar o processo saúde- 3 doença na dimensão coletiva. Ao utilizar essa definição, entendemos que a epidemiologia é uma ciência que estuda as doenças em grupos populacionais, enquanto a clínica estuda a enfermidade no indivíduo. Estas definições de epidemiologia, assim como tantas outras que existem na literatura, possuem em comum o estudo da doença na população. Sendo assim, todas elas se preocupam em descobrir como as doenças se distribuem e quais são as causas, visando identificar os fatores determinantes/causais no processo saúde-doença. É importante destacar que a epidemiologia faz uso de métodos matemáticos e de técnicas de estatística para quantificar os fenômenos saúde-doença. Isto fez com que ela se tornasse a principal fonte de informação em saúde, se destacando na produção de metodologias para todas as áreas da saúde. Um pouco da história da epidemiologia Alguns autores contam que a epidemiologia surgiu ainda na Antiguidade, com Hipócrates, uma vez que ele descrevia as epidemias e o ambiente, sugerindo certo raciocínio epidemiológico. No entanto, os sucessores de Hipócrates não mantiveram o entendimento de coletividade, concebendo a cura individual como referência na prática médica. 4 A dominação da Igreja católica, na Idade Média, e as invasões dos bárbaros estimularam a adoção de práticas de saúde baseadas em crenças religiosas. Os tratamentos mágico-religiosos propunham que, mesmo que o corpo fosse perdido, a alma poderia ser salva. Este movimento fez com que a “medicina” fosse realizada pelos religiosos, por caridade, ou pelos leigos, por profissão. Nesta época não era oferecido nenhuma prática para tratamento coletivo, a menos que surgisse alguma praga ou epidemia. Com a ascensão da burguesia, países como a França, Estados Unidos e Inglaterra começaram a exigir que o Estado interferisse na saúde da população. Sendo assim, no século XVIII, movimentos assistencialistas começaram a promover a medicina para os pobres. A Revolução Industrial e sua economia política deram origem à uma classe proletária, que tinha a força do trabalho como único meio de sobrevivência. No século XIX, com a prevalência de doenças infectocontagiosas, o avanço da bacteriologia, da patologia e da fisiologia fez com que a medicina colocasse o foco na assistência nos aspectos curativos das pessoas. A medicina estava, novamente, vinculada com aspectos individuais da doença. Fonte: https://ichef.bbci.co.uk/news/660/cpsprodpb/AFBF/production/_102519944_sificolores.jpg 5 No Brasil, no final da década de 1920, as condições precárias de trabalho associadas às condições de moradia dos trabalhadores, assim como a falta de saneamento nas cidades, foram os principais fatores que causaram diversas doenças e mortes (MEDRONHO et al., 2008). Na mesma época, problemas com a economia mundial anteciparam uma crise na medicina científica. O desenvolvimento da tecnologia e a especialização da área médica reduziu ainda mais o alcance social. Esta crise elevou os custos com cuidados médicos, dificultando o acesso da população mais carente à assistência à saúde. O enfoque em aspectos sociais relacionados à saúde retornou somente por meio da epidemiologia, mas de forma menos politizada que a medicina social. Nesta época a epidemiologia preocupava-se em manter o caráter médico-social com enfoque na coletividade e não apenas em um grupo de indivíduos. Na década de 1960, com o surgimento da computação, foi possível desenvolver a epidemiologia por meio da matemática. As novas técnicas de análise de dados tornaram-se mais efetivas, específicas e precisas. Atualmente, um dos principais problemas metodológicos da epidemiologia é a falta de modelos que possam explicar de que forma ocorre a relação entre condições de saúde de uma população e seus fatores de risco. Não existem modelos que possibilitam explicar claramente a associação entre um fator de risco e a ocorrência de uma doença. Resumindo, falta uma teoria que trate a saúde como um fato social. 6 Planejar e organizar os serviços de saúde definindo prioridades, subsidiando o planejamento de ações para a melhoria da atenção à saúde, alterando as condições de saúde da população. Avaliar programas e serviços disponíveis com o objetivo de identificar aqueles que apresentam os melhores resultados e tenham o maior impacto nas condições de saúde da população. Diagnosticar a saúde da população conhecendo o perfil epidemiológico e suas necessidades com o objetivo de desenvolver práticas de saúde adequadas para cada contexto, região ou realidade. Analisar criticamente os trabalhos científicos possibilitando selecionar produções de melhor qualidade. Aplicabilidades da epidemiologia Destacaremos a aplicabilidade da epidemiologia de forma breve e objetiva, mesmo sabendo que sua utilidade é bastante abrangente. Sendo assim, sintetizamos algumas de suas aplicabilidades: São profissões que utilizam a epidemiologia: sanitarista, planejador, gestor, epidemiologista, professor, clínico, etc. 7 Causalidade e processo saúde- doença A saúde e a doença são conceitos que foram interpretados de maneiras distintas ao longo do tempo. A saúde já foi definida como um estado em que os diversos sistemas do organismo estavam em silêncio e equilíbrio. Sendo assim, essa concepção não torna possível caracterizar como doença qualquer problema que estivesse relacionado com algum aspecto mental ou social. Considerar um indivíduo saudável quando suas funções orgânicas, físicas e mentais encontram-se em situação normal também pode gerar uma série de dúvidas, como sabemos o que é“normal” e “anormal”? Ficaria a critério de cada indivíduo determinar o que é uma pessoa saudável? Sendo assim, em 1948, a Organização Mundial da Saúde (OMS) sugeriu como definição de saúde o “completo estado de bem-estar físico, mental e social e não apenas a ausência de doenças”. Mas, novamente, esbarramos em conceitos difíceis de serem avaliados. O que é o “completo estado de bem-estar”? O que sabemos é que a doença sempre faz parte da vida humana. Existem indícios de doenças desde a Antiguidade. Os registros mais antigos são encontrados em fósseis e pinturas rupestres. No entanto, como são entendidas as causas dessas doenças? 8 Uma doença, uma única causa No final do século XVII a causalidade social das doenças aparece com força. Todas as diferentes teorias de causalidade fortalecem a ideia de que as definições de saúde e doença são determinadas pelos fatos históricos e aspectos sociais. Com o desenvolvimento da bacteriologia, no século XVIII, as teorias começaram a apresentar causas mais palpáveis, uma vez que agora era possível identificar vírus e bactérias. Ficou evidente que as doenças tinham uma causa específica e poderia ser combatida com agentes químicos ou vacinas. Tratava-se do início da concepção unicausal. Até o início do século XX essa concepção foi bem aplicada para doenças infecciosas, mas logo se percebeu que essa teoria possui limitações, uma vez que não explicava todos os tipos de doenças. Algumas enfermidades não conseguiam ser explicadas por apenas uma causa. Isso fez com que essa ideia fosse substituída por outras mais abrangentes. Uma doença, uma cadeia de causas Rothman, em 1986, propôs um modelo de causalidade. Este modelo dizia que certo fenômeno não seria explicado por um único fator, mas sim por uma cadeia de fatores (causas componentes). Essas causas, juntas, agiriam para a produção de determinado efeito. O autor chama de “causa suficiente” a cadeia mínima de causas componentes que, inevitavelmente, produzirá a doença. Este modelo parece o mais coerente para 9 correlacionar causa e efeito. Por considerar a multicausalidade, em que cada mecanismo causal envolve a ação conjunta de várias causas componentes. MacMahon entende que a epidemiologia tem como objetivo construir uma rede de eventos causas que podem determinar a ocorrência de uma doença em uma população. Ao construir essa rede de associações, é possível identificar e dar prioridade para as relações causais que podem promover a saúde da população, evitar enfermidades ou outras complicações. Medidas em saúde Na área da saúde existem diversas formas de medir o nível de vida e de saúde de uma população. Essas medidas são efetuadas utilizando coeficientes e índices. Para isso, é necessário seguirmos alguns critérios, por exemplo, é preciso que os dados de toda a população de uma determinada área estejam disponíveis, utilizar as mesmas definições e mesmos métodos para todos os países, com o objetivo de comparação. Incidência A incidência da doença é definida como o número de casos novos em um período de tempo, em uma população exposta ao risco de ficar doente. Devemos ficar atentos pois, o número de casos deve ser medido em relação à população e não em números absolutos. 10 É possível verificar a incidência de uma doença por meio de um coeficiente que pode ser calculado da seguinte forma É importante destacarmos que podemos escolher a base da equação de acordo com a frequência de casos. Em uma frequência alta podemos utilizar base 100 ou 1000. Já quando a frequência é baixa é mais comum utilizar 10 mil ou 100 mil. A medida de incidência permite verificar a ocorrência de casos novos em dada população exposta. Por isso, não podemos incluir no numerador do cálculo aquelas pessoas que já estavam doentes em um momento anterior ao determinado. Prevalência O coeficiente de prevalência é o número de casos de uma doença que existe em uma população em um período de tempo específico dividido pelo número total de pessoas nessa população no mesmo período. A prevalência nos informa quantos casos existem naquela determinada população. Somam-se os casos novos e os já existentes, sem diferenciá-los. Existem dois tipos de prevalência. A prevalência no ponto ou instantânea é quando escolhemos um determinado momento para fazer 11 o cálculo, como uma fotografia daquele momento. Já a prevalência no período é quando realizamos o cálculo utilizando um intervalo de tempo mais amplo, como uma série de fotografias sequenciais. Mortalidade Mortalidade refere-se ao conjunto de indivíduos que morreram em um dado intervalo de tempo. É a relação entre a frequência absoluta de óbitos e o número de expostos ao risco de morrer. Um exemplo disso é o cálculo de mortalidade infantil. Mortalidade infantil é o termo que é utilizado quando nos referimos ao óbito de crianças menores de 1 ano, ocorridos em uma determinada área, em um dado período de tempo. A taxa de mortalidade infantil (TMI) é dada pela seguinte equação Mortalidade infantil – óbitos de crianças menores de 1 ano, ocorridos em determinada área, em dado período de tempo. Mortalidade neonatal – óbitos de menores de 28 dias de idade, também chamada de mortalidade infantil precoce. Mortalidade pós-neonatal – óbitos ocorridos no período que vai do 28º dia de vida até o 12º mês, antes de a criança completar 1 ano de idade, também chamada de mortalidade tardia. 12 Vale salientar que a taxa de mortalidade infantil também pode ser separada em neonatal e pós-neonatal. Por fim, é comum observarmos que, à medida que ocorre o desenvolvimento social e econômico, a taxa de mortalidade infantil diminui. Letalidade A letalidade é entendida como o maior ou menor poder que uma doença tem de provocar a morte. Pode ser calculada pela relação entre os óbitos causados por um evento e o número de pessoas que foram acometidos pela doença. 13 Surto Surto é a ocorrência de dois ou mais casos epidemiologicamente relacionados. Alguns autores entendem o surto como a ocorrência de um fenômeno restrito a um espaço extremamente delimitado, como quartel, creche, festa. Epidemia Epidemia é a ocorrência, em uma comunidade ou região, de casos de natureza semelhante, claramente excessiva em relação ao esperado. O conceito usado na epidemiologia diz que a epidemia é uma alteração, espacial e cronologicamente delimitada, do estado de saúde-doença de uma população, caracterizada pela elevação inesperada e descontrolada dos coeficientes de incidência de uma determinada doença. Pandemia A pandemia é caracterizada como uma epidemia de larga distribuição geográfica, atingindo mais de um país ou continente. Endemia Uma doença é considerada endêmica quando acontece com muita frequência em um mesmo local. Tem duração contínua e restrita a uma determinada área. 14 EXEMPLOS DE APLICAÇÕES Questão 1. Numa determinada comunidade, a letalidade do sarampo foi de 10% no ano de 2014. Durante esse ano, ocorreram 50 óbitos da doença. A partir destas informações, qual o número de casos de sarampo nessa comunidade no ano de 2014? (a) 5 (b) 25 (c) 50 (d) 250 (e) 500 Questão 2. Em um determinado município com uma população de 1.200.000 de habitantes, foram notificados 600 casos de meningite, dos quais 120 mortes foram confirmadas, causadas pela doença. Qual foi o percentual de letalidade da doença neste caso? (a) 20% (b) 0,5% (c) 2% (d) 0,02% (e)5% Questão 3. Em um estado brasileiro, dois municípios vizinhos apresentam os seguintes dados populacionais: cidade A com 30.000 habitantes e a cidade B com 100.000habitantes. Em ambas as cidades foram registrados 252 casos de hepatite A, no mês de março. Ao avaliar esta situação, o coeficiente de morbidade dessas cidades em relação a hepatite A é: (a) Maior na cidade B (b) Igual nas duas cidades (c) Menor na cidade A (b) (d) Menor na cidade B (e) Não é possível determinar Questão 4. No município X, no ano de 2014, foram diagnosticados 30 casos novos de tuberculose. Além destes, 10 casos de tuberculose diagnosticados em 2013 ainda se encontravam em tratamento em 2014. Ao final de 2014, constatou-se que entre estes 40 casos de tuberculose ocorreram 2 óbitos. A população do município X em 2014 era de 100.000 habitantes. Qual foi a incidência de tuberculose no município X em 2014? (a) 4 por 10.000 hab. (b) 2 por 10.000 hab. (c) 1 por 10.000 hab. (d) 3 por 10.000 hab. 15 Qual foi a prevalência de tuberculose no município X em 2014? (a) 4 por 10.000 hab. (b) 2 por 10.000 hab. (c) 1 por 10.000 hab. (d) 3 por 10.000 hab. Qual foi o coeficiente de letalidade da tuberculose no município X em 2014? (a) 2. (b) 5% (c) 0,2 por 10.000 habitantes. (d) 6,7% RECAPITULANDO Neste capítulo tratamos sobre os principais conceitos e definições de epidemiologia, apontando para a definição aceita nos dias de hoje. Concebemos epidemiologia como uma ciência que estuda as doenças em grupos populacionais. Logo após contamos um pouco da história da epidemiologia, com o objetivo de entender como ocorreu a construção da definição que é aceita atualmente. Apontamos, também, para sua aplicabilidade. Destacamos o conceito de causalidade. Hoje, entendemos que as doenças e enfermidades possuem modelos multicausais, onde existe uma cadeia de causas que devem ser estudadas e entendidas para promover a saúde. Por fim, apresentamos as principais medidas em saúde, destacando a incidência e a prevalência, mortalidade e letalidade. Finalizamos o capítulo definindo surto, epidemia e pandemia. 16 REFERÊNCIAS BUSATO, I. M. S.; Epidemiologia e processo saúde-doença. Curitiba: InterSaberes, 2016. FRANCO, L. J.; PASSOS, A. D. C.; Fundamentos de Epidemiologia. Barueri: Manole, 2011. MEDRONHO, R.A.; BLOCH, K.V.; LUIZ, R.R.; WERNECK, G. L. Epidemiologia. São Paulo: Atheneu, 2008. TIETZMANN, D. Epidemiologia. São Paulo: Pearson Education do Brasil, 2014. 17 INTRODUÇÃO Neste nosso segundo capítulo, abordaremos os principais tipos de Estudos Epidemiológicos destacando as características de cada um, sua aplicabilidade e exemplos na área da saúde. Por que é importante para o profissional da área da saúde ter conhecimento a respeito dos estudos epidemiológicos? A evolução tecnológica, o avanço da ciência e as novas descobertas que diariamente ocorrem na área da saúde fazem com que seja indispensável ao profissional o domínio da linguagem relacionada às pesquisas da área. Um profissional atualizado necessita estar em contato com publicações específicas a sua atuação através da leitura de artigos, livros, laudos, relatórios de pesquisas, etc. Também destaca-se aqui o profissional que deseja realizar pesquisas em seu campo de atuação, neste 18 caso, a determinação da metodologia a ser utilizada deve estar alinhada aos objetivos do seu estudo. Neste contexto, uma das competências necessárias é o conhecimento dos tipos de estudos epidemiológicos mais importantes e suas características. Então convido a todos a conhecer um pouco mais sobre os ESTUDOS EPIDEMIOLÓGICOS! 19 ESTUDOS EPIDEMIOLÓGICOS O delineamento de um estudo é fundamental para o alcance dos objetivos a que este se propõe, por esta razão é muito importante que toda a pesquisa seja desenvolvida sob a luz de um projeto. Neste projeto o pesquisador deve traçar sua metodologia e considerar todos os aspectos teóricos importantes para a condução de um estudo científico e com validade acadêmica. Neste contexto, o tipo de estudo a ser conduzido deve ser criteriosamente selecionado de acordo com as hipóteses e/ou proposições que se deseja verificar, observando-se que todos os tipos possuem vantagens e desvantagens em sua escolha. Os principais estudos epidemiológicos podem ser classificados em dois grandes grupos: Observacionais e Experimentais. ESTUDOS OBSERVACIONAIS Os estudos observacionais caracterizam-se pela NÃO intervenção do pesquisador, é muito comum utilizar este tipo de estudo para descrever temas de pesquisa ainda pouco conhecidos, sem hipóteses de pesquisa pré-definidas e sem a presença de associações entre variáveis. Podem ser: descritivos, transversais, de coorte ou estudos de caso - DESCRITIVOS: como o nome já sugere, descrevem a ocorrência de uma doença/patologia específica em uma população de interesse. 20 Os estudos descritivos são indicados em situações em que se conhece muito pouco sobre a frequência, história natural ou determinantes de uma doença, podem utilizar dados secundários de grandes bases de pesquisa, dados rotineiros como prontuários, fichas de observação clínica, ou ainda dados coletados através de questionários. EXEMPLO - TRANSVERSAIS: também conhecidos por Estudos de Prevalência, uma vez que medem a prevalência de uma determinada doença de interesse, são importantes pois fornecem indicadores úteis para o entendimento de surtos epidêmicos. Neste tipo de pesquisa cada indivíduo é estudado em relação a ocorrência de uma determinada 21 doença em um determinado período de tempo pré-estabelecido. São estudos amplamente utilizados na área da saúde pois são de fácil condução e baixo custo. EXEMPLO - COORTE: Permite verificar a associação entre o fator de exposição e o desfecho, seguindo uma sequencia lógica temporal, sendo caracterizado por ser um estudo longitudinal. O estudo de coorte é um estudo de incidência, com isso, os indivíduos investigados não apresentam o desfecho de interesse no momento em que a investigação começa. 22 O estudo de coorte pode ser considerado o delineamento mais adequado para avaliar o risco de ocorrência de uma doença em função da exposição a um determinado fator. Estes tipos de estudo devem ser utilizados para casos em que se deseja: Os estudos de coorte podem ser de dois tipos: a) Coorte Prospectivo: neste estudo o investigador monta os grupos de estudo no tempo presente, coleta os dados iniciais de um período base deles e continua a coletar os dados com o passar do tempo. Suas características são: Identificar a incidência de determinada doença de interesse Verificar fatores relacionados à ocorrência desta doença Observar fatores que possuem associação em relação à evolução desta doença Acompanhar a sobrevida associada à doença 23 EXEMPLO: A investigação deve iniciar ANTES da ocorrência da doença Deve-se certificar que a exposição ocorre ANTES do efeito (desfexo) Configura-se como um estudo de longa duração, com isso pode ser oneroso e ter perdas de casos 24 b) Coorte Retrospectivo: neste estudo o investigador volta para trás na história para definir um grupo de risco (ex. aqueles que foram expostos à bomba atômica de Hiroshima, em agosto de 1945) e segue os membros do grupoaté o presente para ver o desfecho ocorrido. Suas características são: EXEMPLO: A investigação deve iniciar APÓS da ocorrência da doença É necessário o acesso a registros e informações sobre o indivíduo investigado (fichas, prontuários) Determina-se um grupo de interesse formado no passado com continuidade até o presente 25 - ESTUDOS CASO–CONTROLE: neste tipo de estudo os grupos de participantes são selecionados a partir de casos observados de uma doença de interesse e os controles são estabelecidos a partir de determinados critérios (são oriundos do mesmo universo estabelecido para o grupo de casos, porém não possuem/ não desenvolveram a doença/patologia de interesse). Os grupos são comparados quanto a frequência da exposição entre os casos (doentes) e controles (não doentes). “O aspecto central desse tipo de desenho é a comparação entre dois grupos com base na frequência da exposição ao(s) fator(es) de risco de interesse. A principal vantagem é a possibilidade de se investigar doenças mais raras, com longo período de indução ou de latência, sem a necessidade de acompanhamento de uma grande população, por um longo período para verificar a ocorrência da doença. Para algumas doenças que ocorrem mais raramente, seria inviável acompanhar os indivíduos por vários anos ou décadas, até que a doença ocorra.” (Rêgo, 2010) Por exemplo, uma determinada pesquisa verificou que o risco de desenvolver câncer de pulmão é duas vezes maior em indivíduos fumantes do que em não fumantes. Neste exemplo poderíamos determinar em uma pesquisa com fumantes que o Grupo caso são indivíduos com câncer de pulmão e o Grupo controle indivíduos que não desenvolveram câncer de pulmão. Aqui é importante que os grupos caso e controle sejam pareados de acordo com algumas variáveis como idade, sexo, raça e histórico familiar de câncer. 26 Genericamente poderíamos representar desta forma: Indivíduos investigados Grupo Caso: Com câncer de Pulmão Fumantes Não fumantes Grupo Controle: Sem câncer de pulmão Fumantes Não fumantes Indivíduos investigados Grupo Caso: Doentes Expostos Não expostos Grupo Controle: Sadios Expostos Não expostos 27 Estudos de Caso-controle viabilizam ao pesquisador a análise simultânea de vários fatores de exposição que possivelmente estariam associados a doença investigada, são indicados no estudo de doenças raras e considerados mais ágeis e menos onerosos do que estudos de Coorte. EXEMPLO: 28 ESTUDOS EXPERIMENTAIS Os estudos experimentais também são conhecidos por estudos de intervenção, uma vez que o pesquisador tem participação ativa na determinação de estratégias de ação com vistas a interferir no estudo de forma sistemática e controlada. Neste tipo de estudo epidemiológico é possível testar hipóteses pré-determinadas, isolar efeitos de interesse, exercer controle em relação a fatores externos e comparar a eficácia entre tratamentos, medicações, métodos em uma doença de interesse. Os resultados obtidos com estudos experimentais podem conduzir a conclusões como o estabelecimento de um novo tratamento para uma lesão na coluna, a diminuição do tempo de internação através de um novo protocolo de atendimento, a redução dos casos de violência doméstica através do estabelecimento de ações comunitárias de conscientização, etc. Questões éticas são de extrema importância na condução de pesquisas experimentais, uma vez que pacientes/indivíduos serão submetidos a algum tipo de intervenção, com isso, o consentimento informado por parte dos participantes é de suma importância. 29 Poderíamos apresentar um delineamento experimental através do seguinte esquema: Os estudos experimentais podem ser de dois tipos: Ensaio Clínico randomizado ou Ensaio Clínico não randomizado. - ENSAIO CLÍNICO RANDOMIZADO (ECR): Os participantes devem ter a mesma oportunidade de receber, ou não, a intervenção proposta e esses grupos devem ser os mais parecidos possíveis, de forma que a única diferença entre eles seja a intervenção em si, podendo-se, assim, avaliar o impacto na ocorrência do desfecho em um grupo sobre o outro. A seleção dos indivíduos participantes, bem como a divisão dos grupos Controle e Experimental deve ser feita de forma aleatória. É o padrão de excelência em estudos Pacientes/Indivíduos selecionados Método Convencional Placebo Evento ocorre Evento não ocorre Método Experimental Evento ocorre Evento não ocorre 30 EXEMPLO: -ENSAIO CLÍNICO NÃO RANDOMIZADO (ECNR): Neste tipo de estudo há um grupo experimental e um grupo controle, mas a designação dos participantes para cada grupo não se dá de forma aleatória, como no Ensaio Clínico não randomizado, mas conveniência do pesquisador. 31 OUTROS ESTUDOS: ECOLÓGICOS A unidade de análise é uma população ou um grupo de pessoas que geralmente pertencem a uma área geográfica definida (cidade, Estado, Região, etc.). São utilizados com o objetivo de avaliar como o contexto social e ambiental podem afetar a saúde em grupos populacionais, avaliando a ocorrência de uma determinada doença e a efetividade de intervenções, por exemplo, de políticas públicas de saúde na população de estudo. Possuem um baixo custo de execução, os resultados obtidos permitem uma análise macro, é inviável aqui termos resultados a nível individual de pacientes. EXEMPLO: 32 REFERÊNCIAS BIBLIOGRÁFICAS Ayres J.R.D.C.M. Sobre o risco: paara compreender a epidemiologia. São Paulo: HUCITEC - Humanismo, Ciência e Tecnologia; 1997. ROBERTO, A. M.. Medronho, RA et al. (eds). Epidemiologia. São Paulo: Atheneu, 2002 RÊGO, MAV. Estudos caso estudos caso-controle: uma breve revisão. Gaz Méd Bahia 2010. Rocha, H. A. L., Carvalho, E. R., & Correia, L. L. ([s.d.]). Conceitos Básicos em Epidemiologia e Bioestatística. Fortaleza: Faculdade de Medicina - Universidade Federal do Ceará. Consultado em 20 de janeiro de 2019 http://www.epidemio.ufc.br/files/ConceitosBasicosemEpidemiologiae Bioestatistica.pdf 33 NESTE CAPÍTULO VOCÊ IRÁ APRENDER: ● Pesquisar, conhecer, compreender, analisar e avaliar a realidade social, nos diferentes cenários do mundo do trabalho e em todos os níveis de atenção à saúde. • Conhecer, desenvolver e aplicar métodos e técnicas de investigação e elaboração de trabalhos acadêmicos e científicos que permitam a busca de novos conhecimentos e tecnologias, com o propósito de contínua atualização para o exercício profissional de excelência. 34 INTRODUÇÃO Existe um consenso por parte dos estudiosos de várias áreas que há uma grande demanda na sociedade atual por um cidadão que compreenda estatística, que seja capaz de consumir e pensar criticamente sobre as informações diárias que recebe, exercendo boas decisões baseadas nestas informações. Há uma concordância geral na concepção de que o estudo de estatística merece um extenso estudo devido à relevância para a sociedade contemporânea de atividades de coletar, representar e processar dados, este fato pode ser considerado como uma consequência do crescimento do uso de métodos estatísticos na realização de predições. A Estatística hoje se configura como uma das ciências que mais vem crescendo em termos de utilização e importância. Diariamente somos“soterrados” por informações estatísticas: são estatísticas da saúde, estatísticas da segurança, estatísticas da educação, etc., não há como qualquer cidadão fugir de tanta informação. A quantidade enorme de dados é o que caracteriza o mundo atual, cada vez mais necessitamos de informações, saber como obtê-las e como entendê-las é fundamental para qualquer indivíduo, pois este deve ser capaz de fazer uma análise crítica dos dados possibilitando uma tomada de decisões mais consciente. A relevância e as justificativas para o estudo da estatística são inúmeras, o que agora, neste momento, entra em debate são as questões referentes as quais habilidades e competências estatísticas que devem ser 35 trabalhadas com os alunos. Esta competência estatística se refere ao conhecimento básico do raciocínio e do propósito da estatística. Um cidadão "estatisticamente competente" seria aquele que possui a habilidade para interagir como uma pessoa "educada" na atual era da informação. Esta competência estatística pode também ser definida como a habilidade para compreender e avaliar criticamente resultados estatísticos que permeiam nossas vidas diárias – junto à habilidade para reconhecer a contribuição que o pensamento estatístico pode trazer para as decisões públicas e privadas, profissionais e pessoais. 36 Conceitos Básicos de Estatística Sempre que falamos em Estatística estamos inseridos no contexto de uma pesquisa. As pesquisas podem ser classificadas em duas grandes abordagens: qualitativa e quantitativa. Uma pesquisa é composta por quatro etapas distintas. Destas etapas nas três últimas (planejamento, execução e comunicação dos resultados) a estatística surge como uma importante ferramenta de suporte para o pesquisador. Na etapa Planejamento da pesquisa, a estatística tem importante participação na determinação do tamanho da amostra a ser estudada, na escolha do procedimento/processo de amostragem que deve ser utilizado para a coleta de dados, bem como na elaboração do instrumento de coleta e no estabelecimento do tipo de variáveis a serem pesquisadas. No momento da Execução da pesquisa, a estatística é imprescindível, pois fornece as ferramentas necessárias para a análise dos dados e para a obtenção de conclusões sobre o objeto de estudo. Na Comunicação dos resultados, a estatística auxilia a construção de tabelas e gráficos facilitando a apresentação dos principais resultados obtidos. Todas estas etapas são importantes de serem realizadas e fazem parte da elaboração de uma pesquisa científica que procure ser o mais fidedigna possível. O conhecimento destas etapas também é importante para o julgamento da adequação de pesquisas realizadas por terceiros, ou 37 seja, quando nos é apresentado oralmente ou através de artigos resultados de uma pesquisa precisamos ter um conhecimento mínimo do processo científico para que sejamos capazes de criticar e entender os resultados obtidos. O que é estatística? A palavra estatística surge da expressão em Latim statisticum collegium palestra sobre os assuntos do Estado, de onde surgiu a palavra em língua italiana statista, que significa "homem de estado", ou político, e a palavra alemã Statistik, designando a análise de dados sobre o Estado. A palavra adquiriu um significado de coleta e classificação de dados, no início do século 19. Atualmente a estatística é entendida como uma ciência que estuda e pesquisa sobre: o levantamento de dados com a máxima quantidade de informação possível para um dado custo; o processamento de dados para a quantificação de incertezas; tomada de decisões sob condições incertas, utilizando o menor risco possível. A estatística tem sido utilizada para a pesquisa científica, para otimização de recursos econômicos, para a melhoria na qualidade e na produtividade, para a otimização de tomada e análise de decisões, em questões judiciais e para previsões. Estatística Descritiva e Inferencial A Estatística, pode ser dividida em duas áreas: Descritiva e Inferencial. A área descritiva é mais simples, contemplando ferramentas de organização 38 de dados e síntese de informação. A área Inferencial, por sua vez, permite ao pesquisador projetar resultados amostrais para populações, bem como testar hipóteses concernentes a parâmetros populacionais. Inferência estatística é o processo pelo qual estatísticos tiram conclusões acerca da população usando informação de uma amostra. A Estatística Inferencial está baseada em dois pilares fundamentais: a Amostragem e a Probabilidade. População e Amostra Uma população é o conjunto de elementos de interesse em um determinado estudo, que podem ser pessoas ou resultados experimentais, com uma ou mais características comuns. Uma amostra é um subconjunto da população, usada para obter informação acerca do todo. Obtemos uma amostra para fazer inferências de uma população. No entanto, as inferências só são válidas quando a amostra representa a população. A Variável Uma variável é uma característica de uma população que difere de um indivíduo para o outro e do qual temos interesse em estudar. Cada unidade (membro) da população que é escolhido como parte de uma amostra fornece uma medida de uma ou mais variáveis, chamadas observações. As variáveis podem ser classificadas como quantitativas e qualitativas. 39 Variáveis Quantitativas São aquelas que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numéricos/quantidades. Podem ser contínuas ou discretas. Variáveis Qualitativas São aquelas que não possuem valores quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, representam uma classificação dos indivíduos. Podem ser nominais ou ordinais. 40 Estatística Descritiva Tabelas de Frequência Tabelas de frequência e gráficos estatísticos são encontrados em jornais, relatórios técnicos, monografias, dissertações, teses e revistas científicas. As tabelas de frequência simples apresentam de forma concisa o número de ocorrências (absoluta e relativa) dos valores de uma variável. A tabela de frequência é uma forma de representação de frequência de cada valor distinto da variável. Elas resumem a informação contida na amostra, ordenando os seus valores e agrupando-os em classes de valores repetidos ou valores distribuídos por intervalos. Exemplo: Tabela 1. Distribuição de frequências das raças de gatos atendidos na clínica em setembro/2018 Raça Frequência % Abissínio 15 18,3 Persa 25 30,5 Himalaio 10 12,2 Siamês 32 39,0 Total 82 100 41 Elementos que compõe a tabela: 1. Título – deve apresentar a informação contida na tabela Tabela 1. Distribuição de frequências das raças de gatos atendidos na clínica em setembro/2018 2. Cabeçalho – indica o que cada coluna da tabela representa Raça Frequência % 3. A tabela de frequência possui três colunas: A primeira corresponde à variável de pesquisa Raça Abissínio Persa Himalaio Siamês Total A segunda corresponde ao número de vezes que cada valor ou categoria da variável se repetiu Frequência 15 25 10 32 82 A terceira é o valor relativo da frequência, ou seja, o percentual % 18,3 30,5 12,2 39,0 100 42 Para calcular o percentual podemos utilizar o seguinte procedimento % = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑔𝑎𝑡𝑜𝑠 𝑑𝑎 𝑟𝑎ç𝑎 𝑒𝑠𝑝𝑒𝑐í𝑓𝑖𝑐𝑎 (𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎) 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑔𝑎𝑡𝑜𝑠 𝑖𝑛𝑣𝑒𝑠𝑡𝑖𝑔𝑎𝑑𝑜𝑠 (𝑎𝑚𝑜𝑠𝑡𝑟𝑎) ∗ 100Exemplo: Vamos calcular o percentual de gatos da raça Siamês %𝑆𝑖𝑎𝑚ê𝑠 = 32 82 ∗ 100 Portanto %𝑆𝑖𝑎𝑚ê𝑠 = 0,39 ∗ 100 Logo, %𝑆𝑖𝑎𝑚ê𝑠 = 39,0% Medidas Estatísticas A análise descritiva dos dados tem por objetivo a descrição dos resultados de uma pesquisa através de tabelas, gráficos e cálculos de algumas medidas estatísticas. Medidas de Tendência Central São indicadores que permitem que se tenha uma primeira ideia, um resumo, de como se distribuem os dados de um determinado experimento. Estas medidas são consideradas formas úteis de descrever um grupo como 43 um todo encontrando um único número que represente o conjunto de dados. As medidas de tendência central são: média, mediana e moda. Média A média aritmética é representada por �̅� na amostra ou por 𝜇 na população. É uma medida de localização do centro da amostra, e obtém-se a partir da soma de um conjunto de valores, dividida pelo número de valores considerados conforme a seguinte expressão: �̅� = ∑ 𝑥 𝑛 Exemplo: Assim como com os seres humanos, os animais precisam de toda uma preparação durante a gravidez. É necessário saber quanto tempo dura, como agir durante o processo e o que vai acontecer depois do nascimento. Neste contexto, uma pesquisa foi realizada com uma amostra de 10 gatos da raça Ragdoll com o objetivo de verificar o tempo de gestação (em dias). Os dados observados foram: 60 60 65 65 65 65 70 70 65 62 Amostra: 10 gatos da raça Ragdoll Variável: tempo de gestação (em dias) Média: �̅� = 60 + 60 + 65 + 65 + 65 + 65 + 70 + 70 + 65 + 62 10 44 �̅� = 647 10 �̅� = 64,7 O tempo médio de gestação foi de 64,7 dias Mediana (Md) Ordenados os elementos da amostra, a mediana é o valor que a divide ao meio, isto é, metade dos elementos da amostra são menores ou iguais a mediana e a outra metade é maior ou igual a mediana. Exemplo 1: Quando o tamanho da amostra é par Considere a quantidade de sódio (mg) em 9 marcas distintas de 1 litro de leite integral: 90 92 95 90 95 94 90 90 91 1º passo: Ordenar os dados em ordem crescente 90 90 90 90 91 92 94 95 95 2º passo: Encontrar a posição da mediana Como o tamanho da amostra é ímpar, o valor central estará na posição 𝑛+1 2 , portanto, a posição da mediana será 9+1 2 = 5ª posição 3º passo: localizar a mediana 90 90 90 90 91 92 94 95 95 45 Interpretação: metade das marcas de 1 litro de leite integral possuem menos que 91mg de sódio e metade, mas que 91mg de sódio. Exemplo 2: Quando o tamanho da amostra é par Considere a quantidade de sódio (mg) em 10 marcas distintas de 1 litro de leite integral: 90 92 95 90 95 94 90 90 91 93 1º Passo: Ordenar os dados em ordem crescente 90 90 90 90 91 92 93 94 95 95 2º Passo: Encontrar a posição da mediana Como o tamanho da amostra é par, o valor central está na posição 𝑛 2 , portanto a posição da mediana será 10 2 = 5ª posição 3º Passo: Localizar a mediana: como “n” é par devemos localizar os dois valores centrais, ou seja, a 5ª e a 6ª posição: 90 90 90 90 91 92 93 94 95 95 Sendo assim, a mediana será 𝑀𝑑 = 91 + 92 2 𝑀𝑑 = 91,5 𝑚𝑔 46 Moda A moda é o valor que ocorre com maior frequência num conjunto de dados, ou seja, o valor mais comum. Exemplo: Considere as notas finais em Estatística de 10 alunos: 8 7 6 8 7 2 5 7 7 7 Interpretação: a nota em Estatística que ocorreu com maior frequência foi de 7 pontos. Medidas de Variabilidade ou Dispersão São medidas da variação de um conjunto de dados em torno da média, ou seja, da maior ou menor variabilidade dos resultados obtidos. Elas permitem se identificar até que ponto os resultados se concentram ou não ao redor da tendência central de um conjunto de observações. A média é extremamente útil como uma medida que objetiva representar/resumir um conjunto de dados, mas também é imprescindível ao pesquisador ter conhecimento da variação que ocorre em torno desta média. Para isso o cálculo das medidas de variabilidade contribui para uma melhor interpretação do comportamento de uma variável quantitativa (sua média e sua variação). 47 Variância A variância é representada na população pelo símbolo 𝜎2 e na amostra pelo símbolo 𝑠2. Quanto maior for a variação dos valores do conjunto de dados, maior será a variância. A variância de uma amostra é a média dos quadrados dos desvios dos valores em relação à média. 𝑠2 = ∑(𝑥 − �̅�)2 𝑛 − 1 No cálculo da variância pode-se observar que a unidade da variável estudada é levada ao quadrado, dificultando assim, a interpretação de seu resultado final. A solução para este problema é extrair a raiz quadrada da variância, permitindo assim que se volte à unidade original da variável. Essa nova medida (a raiz quadrada da variância) é chamada de desvio- padrão Desvio-padrão O desvio-padrão é a raiz quadrada da variância. Esta medida expressa a variação média do conjunto de dados em torno da média, para mais ou para menos. 𝑠 = √ ∑(𝑥 − �̅�)2 𝑛 − 1 Exemplo: os dados abaixo se referem à quantidade de pessoas que apresentaram uma determinada virose e foram diagnosticados em uma amostra de 5 dias em um hospital 48 8 10 5 8 8 Amostra: 5 dias Variável: quantidade de pessoas que apresentaram uma determinada virose Média: �̅� = 8+10+5+8+8 5 = 7,8 𝑝𝑒𝑠𝑠𝑜𝑎𝑠 Interpretação: em média são diagnosticados ao dia 7,8 pessoas com essa virose Desvio-padrão: 𝑠 = √ (8−7,8)2+(10−7,8)2+(5−7,8)2+(8−7,8)2+(8−7,8)2 5−1 sendo assim, 𝑠 = √ (0,2)2 + (2,2)2 + (−2,8)2 + (0,2)2 + (0,2)2 4 portanto, 𝑠 = √ 0,04 + 4,84 + 7,84 + 0,04 + 0,04 4 logo, 𝑠 = √ 12,8 4 = √3,2 = 1,8 𝑝𝑒𝑠𝑠𝑜𝑎𝑠 Interpretação: existe uma variação em torno da média de 1,8 pessoas 49 Coeficiente de Variação (CV) O CV é a razão entre o desvio-padrão e a média de um conjunto de dados. Ele expressa a variação relativa (%) presente no conjunto de dados em relação à média. 𝐶𝑉 = 𝑠 �̅� ∗ 100 Quanto maior o CV, mais heterogêneos são os dados. Exemplo: 𝐶𝑉 = 1,8 7,8 ∗ 100 = 23,1% RECAPITULANDO Neste capítulo aprendemos sobre os conceitos básicos de estatística, diferenciando a parte descritiva da inferencial. Apontamos, também, as diferenças entre variáveis quantitativas e qualitativas. Aprendemos a organizar os dados em tabelas de frequência, com o objetivo de proporcionar uma apresentação mais adequada dos mesmos. Estudamos as medidas de tendência central (média, mediana e moda) e as medidas de variabilidade (variância, desvio-padrão e coeficiente de variação). 50 REFERÊNCIAS CASSENOTE, A.J.F. Principais temas em Epidemiologia para residência médica. São Paulo: Medcel, 2012. FRANCO, L. J.; PASSOS, A. D. C.; Fundamentos de Epidemiologia. Barueri: Manole, 2011. MEDRONHO, R.A.; BLOCH, K.V.; LUIZ, R.R.; WERNECK, G. L. Epidemiologia. São Paulo: Atheneu, 2008. 51 NESTE CAPÍTULO VOCÊ IRÁ APRENDER: ● Conhecer os principais métodos de Amostragem. • Realizar Estimativas intervalares para uma proporção e para uma média. 52 INTRODUÇÃO Frequentemente precisamos obter conclusões para um conjunto de elementos (população) observando apenas uma parcela deste conjunto (amostra). Este processo é chamado de inferência estatística. É importante termos a consciênciade que a possibilidade de erro é inerente ao processo de inferência. A preocupação fundamental para minimizar o risco de errar ao tomar uma decisão é com a forma de seleção da amostra. O critério a ser utilizado na seleção de elementos deve ser muito cuidadoso, para que possamos tomar nossas decisões com níveis de segurança aceitáveis. Amostragem A seguir, algumas das principais técnicas de amostragem. Amostragem Probabilística É a designação dada a todos os métodos de amostragem que envolvem seleção aleatória dos elementos, atribuindo a cada elemento da população uma probabilidade de pertencer à amostra. Podemos destacar as seguintes técnicas de amostragem probabilística: 53 Amostra Aleatória Simples Equivale ao sorteio lotérico, em que todos os elementos da população têm iguais probabilidades de pertencer à amostra e todas as possíveis amostras têm iguais probabilidades de ocorrer. Amostra Aleatória Sistemática Consiste numa variação da amostra aleatória simples, que tem por objetivo facilitar a obtenção da amostra. Ela é feita, selecionando-se elementos em intervalos regulares (a cada dez ou vinte, por exemplo), partindo de um cadastro previamente organizado de acordo com um critério que não tenha relação com a variável de interesse. Amostra Aleatória Estratificada É indicada nos casos em que a população é muito heterogênea, ou seja, os elementos possuem características muito distintas entre si, e isto interfere no fenômeno que desejamos investigar. Consiste em dividir a população em grupos (estratos) de tal forma que, dentro de cada estrato, os elementos sejam semelhantes e as diferenças ocorram entre os grupos. Em cada um desses grupos, é selecionada uma amostra (aleatória simples ou sistemática). Através deste processo, garantimos que as diferentes características da população serão representadas na amostra. 54 Amostra Aleatória por Conglomerados Este tipo de amostragem também trabalha com grupos, mas, ao contrário da estratificada, aqui os grupos já estão naturalmente formados, não por afinidade, mas por proximidade física. Dentro de cada grupo (conglomerado), podemos encontrar as mesmas diferenças que encontraríamos na população como um todo. A técnica consiste em sortear alguns grupos e, dentro deles, sortear alguns elementos para participar da pesquisa ou até mesmo investigar todos os elementos do grupo. A amostra aleatória por Conglomerados é bastante comum em pesquisas domiciliares, quando o fenômeno a ser investigado não está relacionado com a classe social. Os conglomerados corresponderiam aos diferentes quarteirões de um município. Aí são sorteados alguns quarteirões e, dentro deles, é feito o estudo. O objetivo desta técnica é minimizar o custo e o tempo despendido na coleta de dados. Amostragem Não Probabilística É o termo utilizado para designar todas as técnicas de seleção amostral que não envolvem mecanismos aleatórios, ou sorteios. Estas amostragens são extremamente comuns em pesquisas de opinião. Podemos citar algumas técnicas não probabilísticas. 55 Amostra por Conveniência ou Acidental O pesquisador escolhe, de acordo com a sua conveniência, os elementos que serão investigados. Normalmente, a decisão do pesquisador fundamenta-se em um conhecimento profundo que ele tenha da população, de tal forma que ele possa definir quais elementos representam melhor esta população. Amostra por Cotas Tem como objetivo obter uma amostra que tenha características similares às da população. Para fazer isto, o pesquisador deve ter um bom conhecimento sobre a distribuição da população com relação a algumas características que podem interferir no seu estudo, por exemplo, qual o percentual da população com determinada faixa etária ou de determinada classe social. Então, ele vai selecionando elementos para compor sua amostra, até atingir aquele percentual. Este é o método não probabilístico que se aproxima da técnica probabilística de amostragem estratificada, tendo como diferença a inexistência de um sorteio prévio dos elementos a serem pesquisados. Amostra de Voluntários Os elementos da população são informados sobre a realização da pesquisa e decidem fazer parte ou não do estudo. Na área da saúde este tipo de amostragem é muito utilizado, principalmente para testes de 56 medicações ou de vacinas. Também vemos este tipo de amostragem nas pesquisas interativas, muito comuns em programas de debate, nos quais somos convidados a expressar nossa opinião sobre determinado assunto. As técnicas de Inferência Estatística que iremos estudar partem do pressuposto de que a amostra foi selecionada de forma aleatória simples. Se tiver sido utilizada alguma outra técnica de amostragem probabilística, não há problemas com relação a este pressuposto, pois as técnicas de amostragem sistemática ou por conglomerados produzem, sob condições gerais, resultados equivalentes a uma aleatória simples, enquanto que a amostragem estratificada produz melhores resultados. O problema ocorre quando a amostra for não probabilística, o que é bastante comum, na prática. Quando isto ocorre, teoricamente falando, não poderíamos aplicar técnicas de inferência estatística. Este procedimento acabaria inviabilizando o uso da Estatística em muitas áreas do conhecimento, pois muitas vezes é inviável ou mesmo impossível aplicar alguma técnica probabilística. Nestas situações, o que se recomenda é um extremo cuidado ao fazer generalizações, respeitando sempre as limitações do estudo, extrapolando os resultados apenas para elementos que tenham características semelhantes àqueles que foram estudados. 57 Estimação Primeiro precisamos entender dois conceitos: PARÂMETRO: Medida que caracteriza uma população (ex: média, desvio- padrão, proporção de elementos com uma característica, ...). ESTATÍSTICA OU ESTIMADOR: Medida que caracteriza uma amostra (ex: média, desvio-padrão, proporção de elementos com uma característica, ...). A partir destes conceitos, percebe-se que um parâmetro é uma constante, ou seja, possui um valor fixo (mesmo que ele seja desconhecido), enquanto que uma estatística é uma variável, pois depende de qual será a amostra selecionada. Estimar é fazer uma previsão ou uma projeção. É fornecer um valor para um parâmetro desconhecido. A estimação pode ser: Por ponto • Fornece um único valor como estimativa para o parâmetro Por intervalo • Fornece um intervalo de valores no qual se acredita que esteja contido o parâmetro. 58 Intervalo de Confiança Consiste em construir um intervalo em torno da estimativa por ponto, usando uma margem de erro. Conceitos Associados Nível de Confiança (1-α) É a probabilidade de que o intervalo realmente contenha o valor do parâmetro. Deve ser fixado pelo pesquisador. Os valores que são usados com maior frequência são 90%, 95% e 99%. Nível de Significância (α) É o complementar do nível de confiança, correspondendo a probabilidade de erro ao se fazer uma estimação. Erro Absoluto de Estimação (ε) É a margem de erro do intervalo. Corresponde à distância máxima que se admite, a um dado nível de confiança, entre o valor do parâmetro (desconhecido) e a estimativa obtida a partir da amostra. O erro de estimação pode ser fixado pelo pesquisador. Para tanto, ele deverá planejar cuidadosamente o seu estudo, determinando o tamanho de 59 amostra que será necessário para obter esta margem de erro. Quando isto não é feito, ele pode ser calculado a partir da amostra coletadae seu valor dependerá: do tamanho da amostra, do nível de confiança desejado e da variabilidade da população. Intervalo de Confiança para Proporção Para que este intervalo seja construído é necessário trabalharmos com uma amostra relativamente grande (n>30). O intervalo deve ser construído da forma: [𝑝 ± 𝜀] Onde: 𝜀 = 𝑧. √ 𝑝. (1 − 𝑝) 𝑛 Os valores de 𝑧 (normal padrão) mais utilizados são: Z 0,05 = 1,645 (para 90% de confiança) Z 0,025 = 1,96 (para 95% de confiança) Z 0,005 = 2,576 (para 99% de confiança Exemplo: 60 Uma pesquisa foi realizada com uma amostra de 400 crianças residentes em uma determinada região do município de Porto Alegre, destas 48 já tiveram catapora. Construa um Intervalo de Confiança 95% para o verdadeiro percentual de crianças com catapora. População: é formada por todas as crianças de uma determinada região de Porto Alegre. Amostra: é composta pelas 400 crianças que foram pesquisadas. Variável: presença ou ausência de catapora, que é uma variável qualitativa Parâmetro a ser estimado: incidência de catapora na população, ou seja, o percentual de crianças da população que tiveram catapora. Calculando a respectiva incidência na amostra, obtemos 𝑝 = 48 400 = 0,12 = 12%. Portanto, estimamos que 12% das crianças desta região já tiveram catapora. Esta é a estimativa por ponto. 𝜀 = 1,96. √ 0,12(1 − 0,12) 400 Logo, 𝜀 = 1,96. √ 0,1056 400 Portanto, 61 𝜀 = 1,96. √0,0003 Sendo assim, 𝜀 = 1,96.0,0162 = 0,032 Ou seja, 𝜀 = 3,2% Esta é a margem de erro desta pesquisa. Agora sabemos que está próximo de 12%, no máximo 3,2% de distância desse valor. Desta forma temos [12 − 3,2 𝑎𝑡é 12 + 3,2] logo, [8,8% 𝑎𝑡é 15,2%] Interpretação: podemos afirmar, com 95% de confiança, que entre 8,8% e 15,2% das crianças desta região (população) já tiveram catapora. Neste exemplo, imaginamos que a pesquisa já havia sido realizada e estávamos apenas calculando a margem de erro resultante. O mais correto é fazer um planejamento prévio do estudo, determinando quantas pessoas deveriam ser pesquisadas, para que tivéssemos, a um determinado nível de confiança, uma margem de erro estabelecida. Nesta situação, precisamos calcular um tamanho de amostra que atenda a estas condições. Para fazer isto, necessitamos fixar um nível de confiança e uma margem de erro, além de ter uma estimativa da variabilidade populacional (por exemplo, através da proporção de uma amostra). 62 Vamos fazer isto no exemplo: Usaremos 99% de confiança, com uma margem de erro de 3,2 pontos percentuais, que foi aquela que encontramos quando trabalhamos com 95% de confiança. Imagine que já tenha sido feito um estudo inicial (estudo piloto), revelando que 12% das crianças pesquisados tiveram catapora. Para determinar o tamanho de amostra (n), trabalhamos algebricamente com as fórmulas da margem de erro, e chegamos à seguinte fórmula: 𝑛 = 𝑧2. 𝑝. (1 − 𝑝) 𝜀2 Portanto, 𝑛 = 2,582. 0,12. (1 − 0,12) 0,0322 Sendo assim, 𝑛 = 686,44 Isso significa que deveríamos pesquisar 687 crianças da comunidade. Intervalo de Confiança para uma Média Nos exemplos citados anteriormente estávamos trabalhando com variáveis qualitativas. Nestes casos, só podemos trabalhar com percentuais. Quando trabalhamos com variáveis quantitativas, no entanto, podemos fazer estimação de médias. 63 O intervalo de confiança para uma média populacional tem a forma: [�̅� ± 𝜀] Neste intervalo �̅� é a média amostral e ε a margem de erro da média amostral. Para calcularmos este erro é necessária a utilização da seguinte fórmula 𝜀 = 𝑡. 𝑠 √𝑛 Onde 𝑡 é o valor obtido em uma tabela de distribuição 𝑡, com 𝑛 − 1 graus de liberdade, associado ao nível de confiança desejado. Exemplo: Considere uma amostra de 25 pacientes com enxaqueca que foram tratados com determinado tipo de analgésico, observou-se que o tempo médio que o analgésico levou para começar a fazer efeito foi de 18 minutos, com desvio-padrão de 3,5 minutos. População: é formada por todas as pessoas que são tratadas com este analgésico. Amostra: é composta pelos 25 pacientes com enxaqueca que foram pesquisados. 64 Variável: tempo que o analgésico levou para começar a fazer efeito, que é uma variável quantitativa. Parâmetro a ser estimado: tempo médio que o analgésico leva para começar a fazer efeito, para todos os pacientes que recebem este tratamento. Estimativa: uma estimativa por ponto para o parâmetro consiste em dizer que o tempo médio deverá ser de 18 minutos (�̅�), aproximadamente. Para iniciarmos os cálculos devemos obter o valor de 𝑡 na tabela. Para isso, devemos considerar que estamos trabalhando com 95% de confiança e que 𝑛 = 25. Sendo assim, na tabela 𝑡 − 𝑠𝑡𝑢𝑑𝑒𝑛𝑡 65 Logo, 66 𝜀 = 2,064 . 3,5 √25 Sendo assim, 𝜀 = 2,064 . 0,7 Portanto, a margem de erro é de 𝜀 = 1,44 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 Com este valor é possível construir o intervalo de confiança para a média populacional [18 − 1,44 ; 18 + 1,44] Ou seja [16,56 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝑎𝑡é 19,44 𝑚𝑖𝑛𝑢𝑡𝑜𝑠] Interpretação: Podemos afirmar, com 95% de segurança, que o tempo médio que este analgésico leva para começar a fazer efeito nos pacientes a ele submetidos (população) deve estar entre 16,56 minutos e 19,44 minutos Exercícios Os exercícios a seguir são relacionados com os temas discutidos no capítulo 67 1- Uma amostra de famílias de uma comunidade foi investigada quanto ao número de filhos, resultando os dados a seguir: Número de filhos Número de famílias 0 6 1 12 2 23 3 10 4 8 5 2 a) Qual a variável apresentada nessa tabela? Como ela se classifica? b) Qual o percentual de famílias que possui menos de 3 filhos? c) Construa um intervalo, com 95% de confiança, para o percentual de famílias dessa comunidade que possuem menos de 3 filhos. 2- Amostras de trabalhadores dos gêneros masculino e feminino foram investigadas com relação ao salário bruto mensal, resultando os dados a seguir, em salários mínimos: Masculino: 6 7 5 8 3 4 5 6 Feminino: 4 3 5 7 5 2 5 7 a) Para cada um dos dois gêneros, determine as medidas de tendência central. b) Para cada um dos dois gêneros, determine o desvio-padrão. c) Determine o intervalo de confiança de 95% para a média de salário bruto mensal de cada gênero. 68 3- Uma amostra de 40 usuários de determinado serviço assistencial foi investigada quanto à idade, resultando uma média de 42,5 anos, com desvio-padrão de 7,6 anos. a) Estime, com 95% de confiança, a média populacional. b) Estime, com 98% de confiança, a média populacional 4- Foi feita uma pesquisa com 800 adultos de uma região metropolitana, verificando-se que 6% deles estão desempregados. a) Estime, com 95% de confiança, a verdadeira proporção de adultos desempregados nessa região. REFERÊNCIAS FRANCO, L. J.; PASSOS, A. D. C.; Fundamentos de Epidemiologia. Barueri: Manole, 2011. MEDRONHO, R.A.; BLOCH, K.V.; LUIZ, R.R.; WERNECK, G. L. Epidemiologia. São Paulo: Atheneu, 2008. 69 NESTE CAPÍTULO VOCÊ IRÁ APRENDER: - Realizar a tomada de decisão através de um teste de hipóteses; - Compreender a interpretação e aplicabilidade de cada tipo de teste de hipóteses 70 INTRODUÇÃO Em muitos casos de pesquisas há um interesse em realizarcomparações entre grupo de investigação. Estas comparações inicialmente são feitas de forma descritiva, por exemplo, através do cálculo de médias. Mas quando desejamos inferir um resultado obtido em uma amostra para toda a população de interesse é necessária a realização de uma análise inferencial através de um teste de hipóteses. [...] um teste de hipóteses é um processo que usa estatísticas amostrais para testar a afirmação sobre o valor de um parâmetro populacional. Pesquisas na área da saúde e negócios confiam nos testes de hipóteses para a tomada de decisões fundamentais sobre novos medicamentos e estratégias de mercado. (FARBER, 2010) Em que situações na área da saúde observamos a utilização desta ferramenta Estatística? - Boni et all (2005) utilizaram testes de hipóteses para a comparação dos comportamentos de risco para infecção por HIV entre amostras de usuários de cocaína injetável do Rio de Janeiro e de Porto Alegre. (veja aqui o artigo na íntegra) 71 - Silva et all (2009) analisaram através de um teste de hipóteses os efeitos da infecção causada pelo Toxoplasma gondii sobre a parede do duodeno de gatos. Os autores compararam gatos com cerca de três meses de vida, distribuídos aleatoriamente em um Grupo controle com gatos do Grupo infectado. (veja aqui o artigo na íntegra) - Bergman et all (2005) verificaram as alterações, após o período de um ano, no crescimento e na aptidão física relacionada à saúde de escolares dos sexos feminino e masculino. Para a comparação dos resultados entre meninos e meninas utilizaram o teste de hipóteses. (veja aqui o artigo na íntegra) - Aurichio et all (2010) comparou através de um teste de hipóteses o índice de massa corporal (IMC) de idosos entre duas faixas de idade: 60 a 74 anos e 75 anos ou mais. ( veja aqui o artigo na íntegra) Neste capítulo, abordaremos os testes de Hipóteses para comparação entre duas médias t-student, uma das ferramentas Estatísticas mais utilizadas na área da saúde. 72 TESTES DE HIPÓTESES PARA MÉDIAS – TESTE T-STUDENT lgumas vezes existe um particular interesse em decidir sobre a verdade ou não de uma hipótese específica (se dois grupos têm a mesma média ou não, ou se o parâmetro populacional tem um valor em particular ou não). O Teste de hipóteses fornece-nos a estrutura para que façamos isto, ele é útil quando desejamos verificar a alegação (afirmação) feita sobre uma média, configura-se numa importante ferramenta na toma de decisão porque é um método científico capaz de validar ou não uma afirmação sobre uma população de estudo. Neste capítulo veremos dois dos principais testes de Hipóteses: teste t-student para uma média e teste t-student para comparação entre duas médias. A utilização destes testes permite a análise e posterior tomada de decisão em situações onde são formuladas hipóteses a respeito de uma média. Exemplos: - O QI médio dos funcionários é de 110 pontos; - A taxa de colesterol média de mulheres é superior à dos homens; A 73 - O tempo de tratamento com o medicamento A é inferior ao tempo do medicamento B. COMPONENTES DE UM TESTE DE HIPÓTESES Um teste de hipóteses poderia ser descrito através de uma estratégia de análise com o seguinte raciocínio: 1º) Descreva o efeito em que está interessado em comprovar em termos de um parâmetro populacional como, por exemplo, uma média ( ) ou uma proporção ( ); 2º) A Hipótese Nula (H0) é a afirmação de que tal efeito não está presente na população; 3º) Com base nos dados obtidos na amostra verifique se os valores obtidos estão muito distantes do valor do parâmetro pela hipótese nula; caso afirmativo, os dados evidenciam que a hipótese nula é falsa e que o efeito que está procurando está realmente presente; 4º) O valor de “p” (p-value) representa o nível de significância de um teste e indica a probabilidade de se observar um valor igual ou mais extremo do que o observado, se a hipótese nula é verdadeira. Em geral, estipula-se um nível de 5%. O valor da probabilidade de se obter o efeito observado, dado que a hipótese nula é verdadeira, é chamado de p-valor. Se o valor do p-valor for menor que o nível de Podemos interpretar o valor de prova ou valor-p ou p-value como a medida do grau de concordância entre os dados e H0 Assim Quanto menor for o p-value, menor é a consistência entre os dados e a hipótese nula. 74 significância estipulado, assume-se o erro tipo I e rejeita-se a hipótese nula. Ao contrário, se o p-valor for maior, não é assumido o erro tipo I e se aceita a hipótese nula. Os testes podem rejeitar ou aceitar a hipótese nula. Há dois possíveis tipos de erros quando realizamos um teste estatístico para aceitar ou rejeitar H0 : Erro do tipo I : é o erro ao rejeitar H0 quando, na realidade, H0 é verdadeira. A probabilidade de cometer este erro do tipo I é designada por α (nível de significância). O erro do tipo I equivale a concluir que o tratamento é eficaz quando na verdade ele não é. Erro do tipo II : é o erro ao aceitar H0 quando, na realidade, H0 é falsa. A probabilidade de cometer este erro do tipo II é designada por β . Em um teste de hipóteses é obviamente desejável que se reduza ao mínimo as probabilidades α e β dos dois tipos de erros. Porém, a diminuição de se ter um erro implica no aumento de ter um outro erro. Em geral, escolhe-se pela diminuição do erro tipo I. A redução simultânea dos erros poderá ser alcançada pelo aumento do tamanho da amostra. 75 HIPÓTESES DE PESQUISA O primeiro passo consiste em formular hipóteses sobre a afirmação de estudo. As hipóteses estatísticas sempre comparam dois ou mais parâmetros e podem ser classificadas em dois tipos: • Hipótese Nula (H0) estabelece a ausência de diferença entre os parâmetros. É sempre representada por uma igualdade. • Hipótese Alternativa (H1) é a hipótese contrária à H0 geralmente é a hipótese que o pesquisador quer ver confirmada. É normalmente representada por uma desigualdade. ESTATÍSTICA DO TESTE A estatística do teste é um valor calculado com as informações provenientes da amostra e utilizado para se tomar a decisão sobre a aceitação ou rejeição da hipótese nula (H0). REGRA DE DECISÃO Se o valor da estatística do teste cai dentro da região crítica, rejeitamos a hipótese (nula) H0, pois existe uma forte evidência amostral 76 de sua falsidade. Ao contrário, se aceitamos H0, não existe evidência amostral significativa para sua rejeição. CONCLUSÃO EXPERIMENTAL Após a regra de decisão o teste deve ter uma conclusão experimental onde o pesquisador de acordo com o contexto do problema finalizará a sua análise. Figura 1. Etapas de um teste de Hipóteses TESTE DE HIPÓTESES PARA UMA MÉDIA Formulação das hipóteses de pesquisa H0 e H1 Calculo da Estatística do Teste Determinação da Regra de Decisão Conclusão 77 Utiliza-se este teste para comparar os valores obtidos em uma amostra com uma média estabelecida como referência. HIPÓTESES Obs.: Em nossa disciplina vamos trabalhar com os testes bilaterais. ESTATÍSTICA DO TESTE t = x̅ − μ s √n REGRA DE DECISÃO EXEMPLO 1 Em um debate sobre as estruturas familiares, um psicólogo afirma que há alguns anos atrás a idade média em que os filhos saem da casa de seus pais para irem morar sozinhos ou constituírem suas própriasfamílias é de 25 anos. Suspeitando = )(:1H )(:Ho o o referência referência x = média da amostra = valor de referência s = desvio-padrão da amostra n = tamanho da amostra 78 que esta realidade tenha nos últimos anos se alterado um pesquisador resolveu verificar a hipótese de que nos dias de hoje os filhos permanecem mais tempo na casa dos pais. Para isso ele fez uma pesquisa com 400 indivíduos questionando-os a Idade em que haviam saído da casa de seus pais e como resultado foi verificada uma idade média de 32 anos com um desvio-padrão de 5 anos. Analise os dados e conclua a um nível de significância de 5%. Passo 1. Dados do Problema x = Idade em que os filhos haviam saído da casa de seus pais (variável) µ = 25 anos (valor de referência) n = 400 indivíduos (tamanho da amostra) x̅ = 32 anos (média da amostra) s = 5 anos (desvio-padrão da amostra) p = 5% ou 0,05 (nível de significância) Passo 2. Formulação das Hipóteses { H0: μ = 25 anos H1: μ ≠ 25 anos Passo 3. Cálculo da Estatística do teste t = x̅ − μ s √n = 32 − 25 5 √400 = 7 0,25 = 28 Passo 4. Regra de Decisão 79 1º) Obter o valor de t tabelado, ou seja, o valor da tabela t-student que se encontra no final deste capítulo. Para esse exemplo as hipóteses caracterizam um teste bilateral (pois H1: μ ≠ 25 anos), então de acordo com a tabela para α = 0,05 (nível de significância do teste: p=5% então devemos observar a coluna t0,05). A linha da tabela (gl – graus de liberdade) é sempre para este teste: n-1. Então teremos: 400 -1 = 399 – devemos observar o valor na linha infinito (sempre que ultrapassar 200 olhamos a linha infinito) - O valor tabelado é t tabelado = 1,96. 2º) O valor tabelado será o valor que estabelecerá os limites de aceitação e rejeição na regra de decisão: 3º) O valor calculado da estatística do teste caiu FORA da Região de aceitação então a decisão será REJEITA H0!!! Ao REJEITAR H0, estamos REJEITANDO a hipótese de que µ = 25 anos – logo concluímos que µ ≠ 25 anos. Passo 5. Conclusão Região de Aceitação Aceita H0 Região crítica Rejeita H0 -1,96 0 1,96 Região crítica Rejeita H0 28 80 Rejeita-se H0, logo a idade média em que os filhos saem da casa de seus pais difere significativamente de 25 anos. Pelos dados observados na amostra (média amostral foi de 32 anos) observa-se que esta idade é superior a 25 anos, com isso os filhos estão saindo mais tarde da casa dos pais. EXEMPLO 2 De acordo com a OMS (Organização Mundial de Saúde) um bebê que acaba de nascer possui, em média, um tamanho de 50 cm. Uma amostra de 20 bebês recém-nascidos filhos de mães usuárias de crack foi investigada e uma das variáveis analisadas foi o tamanho do bebê ao nascer. Verificou-se neste estudo que os bebês nasceram, em média, com 48,3 cm com um desvio-padrão de 5 cm. Analise estes dados e conclua se podemos afirmar ao nível de significância de 5% que bebês filhos de usuárias de crack possuem o tamanho significativamente inferior ao estabelecido pela Organização mundial de saúde. Passo 1. Dados do Problema x = Tamanho de bebês recém-nascidos (variável) µ = 50 cm (valor de referência) 81 n = 20 bebês (tamanho da amostra) x̅ = 48,3 cm (média da amostra) s = 5 cm (desvio-padrão da amostra) p = 5% ou 0,05 (nível de significância) Passo 2. Formulação das Hipóteses { H0: μ = 50 cm H1: μ ≠ 50 cm Passo 3. Cálculo da Estatística do teste t = x̅ − μ s √n = 48,3 − 50 5 √20 = −1,7 1,11 = −1,53 Passo 4. Regra de Decisão 1º) Obter o valor de t tabelado, ou seja, o valor da tabela t-student que se encontra no final deste capítulo. Para esse exemplo as hipóteses caracterizam um teste bilateral (pois H1: μ ≠ 50 cm), então de acordo com a tabela para α = 0,05 (nível de significância do teste: p=5% então devemos observar a coluna t0,05). A linha da tabela (gl – graus de liberdade) é sempre para este teste: n-1. Então teremos: 20 -1 = 19 – devemos observar o valor na linha 19 - O valor tabelado é t tabelado = 2,093. 82 2º) O valor tabelado será o valor que estabelecerá os limites de aceitação e rejeição na regra de decisão: 3º) O valor calculado da estatística do teste caiu DENTRO da Região de aceitação então a decisão será ACEITA H0!!! Ao ACEITAR H0, estamos ACEITANDO a hipótese de que µ = 50 cm Passo 5. Conclusão Aceita-se H0, logo o tamanho médio de bebês recém-nascidos, filhos de usuárias de Crack NÃO difere significativamente de 50 cm. Com isso, não podemos afirmar que os bebês de usuárias de crack nascem menores do que os bebês normais. TESTE DE HIPÓTESES PARA COMPARAÇÃO ENTRE DUAS MÉDIAS Este teste tem por objetivo comparar as médias provenientes de duas amostras independentes. Região de Aceitação Aceita H0 Região crítica Rejeita H0 -2,093 0 2,093 Região crítica Rejeita H0 -1,53 83 Grupo 1 1 1 1 s x n Grupo 2 2 2 2 s x n HIPÓTESES: Obs.: Em nossa disciplina vamos trabalhar com os testes bilaterais. ESTATÍSTICA DO TESTE: 𝑡 = �̅�1 − �̅�2 √𝑠1 2 𝑛1 + 𝑠2 2 𝑛2 REGRA DE DECISÃO EXEMPLO 1 Os dados abaixo representam os escores do grau de Qualidade de vida (mensurado através do instrumento SF 36 que corresponde a uma escala de 0 a 100 pontos, quanto maior o escore maior é a Qualidade de vida) de dois grupos de = 21 21 :1H :Ho x 1 = média do grupo 1 x 2 = média do grupo 2 s12 = desvio-padrão ao quadrado do grupo 1 s22 = desvio-padrão ao quadrado do grupo 2 n1 = tamanho da amostra do grupo 1 n2 = tamanho da amostra do grupo 2 84 Idosos: Grupo 1: Idosos residentes em casas de repouso e Grupo 2: Idosos residentes com a família Idosos residentes n Escore Médio Desvio-padrão Grupo 1 - Casas de repouso 27 68 7 Grupo 2 - Com a família 39 75 10 Verifique se existe diferença significativa para o escore médio de qualidade de vida entre os grupos e conclua ao nível de significância de 5%. Passo 1. Dados do Problema x = Grau de Qualidade de vida (variável) n1 = 27 idosos n2 = 39 idosos x1̅ = 68 pontos x2̅̅ ̅ = 75 pontos s12 = 7 pontos s22 = 10 pontos p = 5% ou 0,05 (nível de significância) Passo 2. Formulação das Hipóteses Passo 3. Cálculo da Estatística do teste 𝑡 = �̅�1 − �̅�2 √ 𝑠1 2 𝑛1 + 𝑠2 2 𝑛2 = 68 − 75 √7 2 27 + 102 39 = −7 √1,81 + 2,56 = −7 2,09 = −3,3 Passo 4. Regra de Decisão 1º) Obter o valor de t tabelado, ou seja, o valor da tabela t-student que se encontra no final deste = 21 21 :1H :Ho 85 capítulo. Para esse exemplo as hipóteses caracterizam um teste bilateral (pois H1:µ1 ≠ µ2), então de acordo com a tabela para α = 0,05 (nível de significância do teste: p=5% então devemos observar a coluna t0,05). A linha da tabela (gl – graus de liberdade) é sempre para este teste: n1+n2 -2. Então teremos: 27+39 -2 = 64 – como não temos linha 64 na tabela, devemos observar
Compartilhar