Baixe o app para aproveitar ainda mais
Prévia do material em texto
A P O S T I L A L I S A B R E U B A R C E L O S BIOESTATÍSTICA 2 0 2 6 . 2 P A 1 F A C U L D A D E D E M E D I C I N A D E C A M P O S A P O S T I L A D E B I O E S T A T Í S T I C A A estatística é um ramo da matemática que possui métodos apropriados para a coleta, a apresentação, a análise e a interpretação de dados de observação. Podemos aplicar a estatística em diversas áreas do conhecimento. Uma delas é a área da saúde, onde a chamamos de bioestatística. Esta, está diretamente relacionada com a epidemiologia, que estuda os fatores que determinam a frequência e a distribuição das doenças em grupos de pessoas. A Bioestatística e a Epidemiologia atuam no estudo da frequência, da distribuição e dos determinantes dos estados ou eventos relacionados à saúde em específicas populações e a aplicação desse estudo no controle dos problemas de saúde. Aplicação da Bioestatística na Saúde e em Epidemiologia Introdução A B I O E S T A T Í S T I C A A Bioestatística é o estudo voltado para a compreensão do processo saúde/doença no âmbito de populações. Para a população rural as politicas se concentraram na distribuição de protetores solares. Por outro lado, para uma jovem da cidade, a distribuição será de anticoncepcional. Cada população terá uma demanda, e a Bioestatística nos auxilia a identificar essas populações e os seus agravos, para oferecer fundamentos técnicos para a elaboração de programas de saúde. Preocupa-se com o desenvolvimento de estratégias para as ações voltadas à proteção e promoção da saúde da comunidade. Inclui a vigilância, observação, elaboração e teste de hipóteses, estudos observacionais e experimentais. Identificação de perfis e fatores de risco A avaliação de serviços de saúde, geralmente, leva em consideração o acesso da população aos serviços e a cobertura oferecia. Identificação, quantificação e caracterização de danos à saúde da população; Identificação de fatores de risco e fatores prognósticos para determinado agravo; Ampliação da informação sobre a história natural de um agravo; Estimativa da validade e confiabilidade de procedimentos de diagnóstico e intervenção (o quanto determinado equipamento é confiável; o ideal é 95% de confiabilidade); Avaliação da eficácia/efetividade de um procedimento terapêutico; Testar a eficácia, a efetividade e o impacto de estratégias de intervenção, assim como qualidade, acesso e disponibilidade dos serviços de saúde para controlar, prevenir e tratar os agravos de saúde na comunidade. A doença não ocorre aleatoriamente na população; A doença humana tem fatores causais, prognóstico e preventivos que podem ser identificados por meio de investigações sistemáticas de diferentes populações ou subgrupos de populações em diferentes pontos no tempo e/ou no espaço. Vigilância em Saúde Pública A vigilância é a observação contínua da distribuição e tendências da incidência de doenças mediante a coleta sistemática, consolidação e avaliação de informes de morbidade e mortalidade. Em síntese, a Bioestatística na Saúde pode ser entendida como fundamentada em dois pressupostos: L I S A B R E U B A R C E L O S 2 0 2 6 . 2 Descrever a magnitude da doença na população; Examinar a distribuição da doença na população usando dados da estatística viral; Analisar o comportamento das doenças segundo características das pessoas, do tempo e lugar Os objetivos da Bioestatística na Saúde Descritiva são: Fenômeno Estatístico É qualquer evento que se pretenda analisar, cujo estudo seja passível da aplicação do método estatístico. São divididos em três grupos: De massa ou coletivo: são aqueles que não podem ser definidos por uma simples observação. Ex.: o preço da cerveja no Litoral do RJ, preciso buscar os valores de várias praias do litoral. Individuais: são aqueles que irão compor os fenômenos de massa. Ex.: Relato de caso; cada preço de cerveja. Multidão: quando as características observadas para a massa não se verificam para o particular. Quando percebemos que para um grupo étnico, por exemplo, não funcionou. Está, geralmente, associado à genética. Dado Estatístico: é um dado numérico e é considerado a matéria-prima a qual iremos aplicar os métodos estatísticos. População: é o conjunto total de elementos portadores de, pelo menos, uma característica comum. Ex.: População de Campos= Morar em Campos. Amostra: é uma parcela representativa da população que é examinada com o propósito de tirarmos conclusões sobre essa população. É mais rápido que usar todo mundo. Erro amostral: um paciente que morreu, ou que não foi mais para as consultas = temos uma conta para minimizar esse erro nos cálculos. Parâmetros: são valores singulares que existem na população e que servem para caracterizá-la. Para definirmos um parâmetro devemos examinar toda a população. Estimativa: é um valor aproximado do parâmetro e é calculado com o uso da amostra. Variável Qualitativa Nominais: sem nenhuma ordem (Ex.: cor dos olhos, sim ou não, presença ou ausência.) Ordinais: algum tipo de ordem ou grau (Ex.: 1º grau, 2º grau, 3º grau, pós-graduação; nenhuma melhora, alguma melhora, muita melhora; classe social= alta, média, baixa). Variável Quantitativa Discreta ou Descontínua: seus valores são expressos geralmente através de números inteiros não negativos. Resulta normalmente de contagens. (Ex.: nº de alunos presentes nas aulas de bioestatísticas no semestre). Contínua: resulta normalmente de uma mensuração, e a escala numérica de seus possíveis valores corresponde ao conjunto dos números reais, podendo assumir qualquer valor entre dois limites. Variável É o conjunto de resultados possíveis de um fenômeno. Característica a ser estudada. Quando seus valores são expressos por atributos (Ex.: sexo, cor da pele). podem ser: Quando os dados são de caráter quantitativo, e o conjunto dos resultados possui uma estrutura numérica. Podem ser: Atenção! Idade em ANOS: número inteiro e positivo = DESCONTÍNUA Idade em MESES: número fracionado e até negativo = CONTÍNUA Termômetro: nesse caso o zero não é absoluto, foi inventado, e por mais que o número da temperatura seja inteiro e positivo, é CONTÍNUO, pois ele passou por frações. Também serão contínuos: peso e altura. Variável Dependente: representa uma grandeza cujo valor depende de como a variável independente é manipulada. Ex.: a variável dependente é quanto você ganha, que dependerá da quantidade de tarefas que você realiza. Variável Independente: representa uma grandeza que está sendo manipulada pelo experimento, é aquela candidata a explicar a dependente. Ex.: Você realiza uma tarefa para receber uma mesada, a cada tarefa realizada você ganha R$ 3,00 Fator associado à forma de amostragem. Na seleção da amostra procura-se reproduzir as características observáveis da população - uso do critério de proporcionalidade. Em caso de desconhecimento da composição da população deve-se utilizar algum critério de aleatoriedade (sorteio). Amostra tendenciosa – conclusões sem consistência. Relacionada à precisão ou qualidade dos dados. Motivos da falta de precisão: Falhas nos instrumentos de aferição; Problemas nos questionários empregados na obtenção dos dados; Falha humana.; Modelo estatístico / desenho estatístico. Centro: Um valor representativo ou médio, que indica onde se localiza o meio do conjunto de dados. Variação: Uma medida de quanto os valores dos dados variam. Distribuição: A natureza ou forma da distribuição dos dados (ex. uniforme, sino, assimétrica). Problemas usuais - Representatividade Problemas usuais - Fidedignidade A importância da coleta de dados: fazer um bom questionário, o qual não haja influência do entrevistador, esse deve ser treinado anteriormente. Amostragem: Se os dados amostrais não forem coletados de maneira apropriada, eles podem ser de tal modo inúteis que nenhuma manipulação estatística poderá salvá-los. Características importantes dos dados Medidas de Tendência Central Frequência Estatística E T E N D Ê N C I A C E N T R AL Levantamento de Dados Média Moda Mediana Média Se o número de valores é ímpar, a mediana é o número localizado exatamente no meio da lista. Se o número de valores é par, a mediana é a média dos 2 valores do meio. Mediana: para calcular a mediana devemos primeiro colocar os valores em ordem crescente (ou decrescente) e, em seguida, aplicar um dos dois processos abaixo: Moda: é o valor que ocorre mais frequentemente. Uma distribuição pode ser unimodal, bimodal, multimodal ou amodal. Outliers ou valores discrepantes: valores amostrais que se localizam muito longe da grande maioria dos outros valores amostrais. Tempo: Características dos dados que mudam com o tempo. L I S A B R E U B A R C E L O S 2 0 2 6 . 2 Distribuição de Frequências Relacionam categorias ou classes de valores, juntamente com contagens (ou frequência) do número de valores que se enquadram em cada categoria. Considere o seguinte conjunto de dados: 21, 21, 21, 22, 22, 23, 23, 24, 25, 25, 25, 25, 26, 26, 26, 28, 30. Construa uma distribuição com todas as frequências. Solução: Para construirmos uma tabela de frequências para variáveis contínuas, os dados devem ser agrupados em intervalos de classe, para construirmos essas classes algumas definições são necessárias: Amplitude Total ou "Range" (R): é a diferença entre o maior e o menor valor observado. Ex.: R= 30 - 21 = 9. Fórmula de Sturges Intervalos de Classe: conjunto de observações apresentadas na forma contínua, sem superposição de intervalos, de tal modo que cada valor do conjunto de observação possa ser alocado em um dos intervalos. k = 1 + 3,322(log10 n) k= intervalos n= valor total Ex.: para um conjunto com 50 observações obtemos log10(50) ≈ 1,699; k = 1 + 3,322 x 1,699 ≈ 6,6 ≈ 7 intervalos Tamanho do intervalo (W): é obtido pela divisão do valor da diferença entre o maior e o menor valor = R, pelo número de intervalos = K. w = R/k É de onde inicia e onde termina os valores de cada intervalo de classe. No exemplo a seguir o Tamanho da Classe é 5, sendo assim, a amplitude dessa classe contemplará os 5 números que sucedem o número 19. Etapas para a construção de Tabelas de Frequência para dados agrupados: Encontrar o menor e o maior valor do conjunto de dados (R); Calcular o número de classes (K); Calcular o tamanho do intervalo (W); Determinar a frequência relativa de cada classe. 1. 2. 3. 4. Frequência simples ou absoluta: são os valores que realmente representam o número de dados de cada classe. Frequência relativa: são os valores das razões entre as frequências absolutas de cada classe e a frequência total da distribuição. Cálculo: frequência relativa individual dividida pelo total e multiplicado por 100, pois é um valor em porcentagem (%). Exemplo: O conjunto de dados abaixo representa as idades de mulheres operadas no HEAA, e 2018 pelo serviço de ginecologia. Construa intervalos de classes para o mesmo. 19 19 20 21 23 23 23 23 24 24 25 25 26 26 26 27 27 27 29 29 29 29 30 31 31 31 33 33 33 34 37 37 37 37 40 40 40 40 43 43 44 44 47 48 48 48 51 52 52 53 R= 53 - 19 = 50 K = 1 + 3,322 x 1,699 ≈ 7 intervalos W = 34/7 ≈ 5 idades em cada O traço logo após o número 19 indica que ele está incluso dentro dessa classe. Sendo assim, estarão inclusas, nessa classe, as mulheres com 19, 20, 21, 22 e 23 anos, pois o 24 estará incluso somente na classe de baixo. L I S A B R E U B A R C E L O S 2 0 2 6 . 2 Distribuição de Frequências Exemplo: Os dados seguintes são referentes ao nível de glicose de 60 crianças: 1- Construa uma Distribuição de Frequência, determine o Nº de classes e o melhor intervalo de classes: 2- Determine as Frequências simples de cada classe: 3- Determine das Frequências Relativas de casa classe: 4- Calcule a média, mediana, moda e amplitude (R=Range) dos valores. L I S A B R E U B A R C E L O S 2 0 2 6 . 2 Média= 3976/ 60= 66,27 mg/dl Moda= 65 Mediana= 65 R= 28 R= 83-55 = 28 K= 1+3,322 (Log 10 N) K= 1+3,322 (Log 10 60) K= 1+3,322 X 1,778 K= 1+5,9 K= 6,9 7 intervalos W= R/K W= 28/7 W= 4 ~- Números Ordenados de forma Crescente: 0-5 = -5 4-5 = -1 6-5 = 1 8-5 = 3 7-5 = 2 (-5) = 25 E assim suscetivelmente... Esse X com um traço em cima significa Média, portanto, seguindo os valores do Banco de Dados do exemplo, a média é 5. O desvio dos valores em relação à média no exemplo acima foi encontrado diminuindo o valor do banco de dados pelo valor da média: A Variância foi encontrada a partir dos seguintes passos: 1º Realizou-se o quadrado de cada valor do banco de dados: 2º Realizou-se a somatória de todos valores quadrados e por fim, dividiu o valor da somatória pela quantidade de números do banco de dados, menos 1 (5-1= 4). 2 Quando coletamos dados para observar padrões, testar hipóteses, ou mesmo apenas para descrever um fenômeno, o resultado é quase sempre um conjunto de informações muito complexo para ser facilmente interpretado de maneira bruta. Temos duas soluções práticas para estas situações: Medidas de Variabilidade O U D I S P E R S Ã O As medidas de dispersão reduzem a variação entre os dados a um único valor. Todas as medidas a seguir são baseadas na média, então só podem ser usadas se a média for a medida de tendência central adequada para aquele conjunto de dados. Podemos calcular medidas que sumarizem os nossos dados; E podemos apresentá-los de maneira gráfica Amplitude Total Também conhecido como Range (R). É a diferença entre o maior e o menor valor do conjunto de dados. Variância A variância é uma medida muito usada, e é calculada a partir da distância, ou o desvio, de cada medida para a média ao quadrado e dividido por N menos 1: Nós elevamos os desvios ao quadrado para que o somatório não dê um resultado zero, já que temos desvio “para cima” e “para baixo” da média. A variância é sempre maior ou igual a zero e é uma medida quadrática. A variância é a soma dos quadrados dos desvios, dividido por N menos 1 (n-1). A Variância nos dá o desvio médio ao quadrado de cada valor para a média. É quanto aquele valor se distância/desvia da média. Realizar a raiz quadrada da Variância (S ) Desvio Padrão Amostral (S) É definido como sendo a raiz quadrada positiva da variância amostral. Além de realizar a raiz quadrada do valor da Variância para encontrar o valor do Desvio Padrão, podemos: Exemplo: L I S A B R E U B A R C E L O S 2 0 2 6 . 2 2 S: (X1 - média) + (X2 - média) +... n-1 2 2 2 É razão entre o Desvio Padrão (S) e a Média ( X ) multiplicado por 100. Coeficiente de Variação (CV) É o desvio padrão expresso em porcentagem. Nos auxilia a comparar desvios de variáveis que possuem diferentes ordens de magnitude. Grupo I: 3,1,5 anos Grupo II: 55,57,53 anos (x = 3 anos; s2 = 4; s=2) : CV = 66,67% (x = 55 anos; s2 = 4; s = 2) : CV = 3,64% Vejam à dispersão dos dados em ambos os grupos é a mesma, mas os CV são diferentes (no grupo I a dispersão relativa é ALTA) Exemplo: Erro Padrão É igual ao Desvio Padrão dividido pela raiz quadrada do número de unidades amostrais (n): Esta medida leva novamente em consideração o número de unidades amostrais, o que faz com que o esforço amostral de um pesquisador tenha grande efeito sobre esta medida. Pois, quanto maior o denominador (n), a tendencia é que o erro seja menor (S). Intervalo de Confiança Expressa a probabilidade de 95% de que a média real de uma população esteja de fato dentro do intervalo: Padrão da Sociedade Científica: Intervalo de Confiança de 95% Para o nível de significância de 5%, esse valor é de 1,96. É muito frequente a confusão entre os conceitos de erro padrão e desvio padrão. Apesar de ambos tratarem sobre a variação da média, são conceitos bem diferentes entre si. O desvio padrão, como vimos, trata de um índice de dispersão da amostra em relação à média, enquanto o erro padrão é uma medida que ajuda a avaliar a confiabilidade da média calculada. Desvio Padrão Erro Padrãoxxx Os CV permitem comparar a homogeneidadedos dados de fenômenos de qualquer natureza. Mas o que é HOMOGENEIDADE dos dados de um fenômeno? Homogeneidade é a característica do fenômeno em que se procura identificar a improtância da dispersão dos dados em relação à magnitude das observações. Dados mais homogêneos têm dispersão relativamente menor. L I S A B R E U B A R C E L O S 2 0 2 6 . 2 Padrão Mundial para significância de análise de testes: maior que 95% Menor valor dividido pelo maior valor, depois diminui por 1 (resultado em módulo) e multiplica po 100 (pois é porcentagem). No Grupo A, o maior peso no fim do período foi 84,71 Kg e o menor foi 75,85 Kg. No Grupo B o maior foi 85,20 Kg e o menor foi 81,00 Kg Diferença Significativa/ Significância É um meio que utilizamos para avaliar se as variáveis são significantes entre os grupos analisados. Como encontrar esse valor? O enunciado da questão vai direcionar o seu raciocínio, e você poderá dizer se entre os grupos analisados há um resultado significante ou não. Ex.: Dois grupos de indivíduos foram analisados em relação à perda de peso durante seis meses. No enunciado da questão dizia que para ter uma significância na perda de peso, o grupo deveria apresentar mais de 5%. Grupo A 75,85/84,71 = 0,895 = 0,90 1 - 0,90 = 0,10 0,10 x 100 = 10% Grupo B 81,00/82,20 = 0,985 = 0,98 1 - 0,98 = 0,02 0,02 x 100 = 2% Sendo assim, o Grupo A apresentou uma significância perda de peso, ao contrário do Grupo B. = 32,8 Variância (S ): 4 32,8 = 8,20 Ela NÃO é um bicho de sete cabeças, vamos desvendá-la por etapas... Inicialmente vamos nos deparar com os valores que o professor dará na questão, para facilitar a explicação, vou chamar essas valores de banco de dados. Essa tabela nos ajudará a encontrar a Variância (S ) Primeiro vamos realizar a média dos valores do banco de dados: 9+7+5+3+2/5 = 5,2 Ainda não acabou, vamos calcular o quadrado dos desvios agora, para iniciarmos o raciocínio da Variância. 3 3,8 = 14,44 1,8 = 3,24 (-0,2) = 0,04 (-2,2) = 4,84 (-3,2) = 10,24 2 2 2 2 2 Por fim vamos realizar a somatória dos valores correspondente ao quadrado dos desvios. Logo depois, vamos dividir a somatória pela quantidade de números do banco de dados menos 1 e encontraremos a variância. 5-1 = 4 4 Bônus "MARROM" TABELA Agora vamos encontrar o desvio dos valores em comparação à média, como? Diminuindo o valor do banco de dados pelo valor da média: 9-5,2 = 3,8 7-5,2 = 1,8 5-5,2 = -0,2 3-5,2 = -2,2 2-5,2 = -3,2 OBS.: NÃO tem problema dar um valor negativo nessa etapa. Quantidade de números do Banco de Dados 1 2 3 4 5 L I S A B R E U B A R C E L O S 2 0 2 6 . 2 OBS.: A questão pode pedir ainda o desvio padrão, assim você vai realizar a raiz quadrada do valor da variância. 2 Desvio Padrão (S): 8,20 = 2,86 ARANGO, Héctor Gustavo. Bioestatística: teórica e computacional. 3. ed. Rio de Janeiro, RJ: Guanabara Koogan, c2009. 438 p. PAGANO, Marcello; GAUVREAU, Kimberlee. Princípios de bioestatística. São Paulo, SP: Cengage Learning, c2004. 506 p. VIEIRA, Sonia. Introdução a bioestatística. 4. ed. Rio de Janeiro, RJ: Elsevier, 2008. 345 p Bibliografia L I S A B R E U B A R C E L O S 2 0 2 6 . 2 Utilização de Calculadora Científica; Facilita se você realizar os cálculos na seguinte ordem: Variância - Desvio Padrão - Erro Padrão - Coeficiente de Variação (CV); Procure arredondar somente o valor de resposta final. Se não for possível, pode arredondar ao decorrer da conta, mas tome cuidado para não arredondar demais e alterar o resultado; Utilize duas casas depois da vírgula para as respostas (0,00). Dicas para a Prova Média= Variância Amostral S= soma do quadrado dos desvios n-1 Desvio Padrão S= S Erro Padrão da Média S(X)= S n CV% = S . 100 X x N 2 2
Compartilhar