Baixe o app para aproveitar ainda mais
Prévia do material em texto
13/07/2021 Saúde Coletiva Métodos Estatísticos Danieli J Garbuio Tomedi Unidade de Ensino: 4 Competência da Unidade de Ensino: Compreender a importância e a utilização da bioestatística; a apresentação de dados em tabelas e gráficos ; a utilização das medidas de tendência central e medidas de dispersão utilizadas nas saúde coletiva. Resumo: O conceito de bioestatística e a sua utilização na saúde pública, os gráficos mais indicados para cada tipo de variável, os elementos que compõe as tabelas e os cuidados para a elaboração de ambas, as medidas de tendência central (média, moda e mediana) e as medidas que demonstram variabilidade. Palavras-chave: Tendência, variabilidade, bioestatística Título da teleaula: Métodos estatísticos Teleaula nº: 04 Fonte da imagem: Freepik 985240 Contextualização Estatística: Planejamento, coleta, análise, tabulação e interpretação de informações, extraindo delas conclusões que permitem a tomada de decisões. Bioestatística: Investigar informações para estudos epidemiológicos, como perfis de demografia, natalidade e mortalidade, incidência e prevalência de doenças. Fonte da imagem: Freepik 985240 • Compreender elementos básicos da bioestatística. • Compreender a diferença entre população e amostra no contexto científico. • Diferenciar os tipos de gráficos. Contextualização Introdução à bioestatística Bioestatística • Estatística aplicada às ciências da vida. • Possibilita quantificar e analisar dados a respeito da mortalidade, morbidade, incidência de doenças, incidência de doenças eficiência de medicamentos, vacinações e ações em saúde. Fonte da imagem: Shutterstock 1282770046 Técnicas de amostragem, cálculos de medidas, formas de apresentação dos dados e de sua interpretação. 1 2 3 4 5 6 13/07/2021 Censo e amostra População: conjunto de elementos que têm determinada característica em comum. Censo: exame de todos os elementos de uma população. Amostra: subconjunto de elementos retirados de uma população para se obter a informação desejada. Como definir o tamanho da amostra? O tamanho da amostra é determinado em relação: • Tamanho da população. • Nível de confiança e erro máximo permitido. • Percentagem com que o fenômeno se verifica. Amostras excessivamente grandes acarretam desperdício de tempo e de dinheiro, enquanto amostras muito pequenas podem levar a resultados não confiáveis. Fonte da imagem: Dreamstime 34462046 ProbabilísticaProbabilística É constituída por n unidades retiradas ao acaso da população, por sorteio. Não probabilísticaNão probabilística Requer critérios de inclusão e exclusão rígidos e uso de uma amostra maior para evitar erros amostrais. Técnicas de amostragem Fonte da imagem: Freepik 5357453 Amostras probabilísticas Amostra aleatória estratificada Unidades ou elementos heterogêneos Elementos similares organizados em subgrupos, ou estratos Amostra aleatória simples Sorteio de uma população Unidades ou elementos homogêneos Fonte das imagens: Freepik 15616283 e 10303303 Sorteio de cada estrato Motivação à prática regular de atividade física Estudo realizado com homens e mulheres, 18 a 55 anos de idade 18 a 20 anos 21 a 40 anos 41 a 55 anos Amostras probabilísticas Amostra sistemática Escolhe-se qualquer unidade amostral As unidades são selecionadas de acordo com um intervalo Amostra por conglomerados Unidades retiradas de conglomerados Conjunto de unidades agrupadas Fonte das imagens: Freepik 2587156. Amostra de 20% dos 500 alunos: 100 alunos Intervalo da amostra: 500/100 = 5 Sorteio de um número entre 1 e 5. Exemplo: 3. 3+5 = 8/ 8 + 5 = 13/ 13+5 = 18 ... Amostras não probabilísticas Amostra por quotas Unidades retiradas da população segundo quotas estabelecidas O pesquisador faz um julgamento, seleciona e depois confirma as características selecionadas Amostra por conveniência Participantes são acessíveis ou próximos ao pesquisador As amostras devem ser bem descritas para evitar generalizações equivocadas Fonte das imagens: Shutterstock 423521503 ; 1016393509 7 8 9 10 11 12 13/07/2021 Cálculo amostral Estudo descritivo desenvolvido na Unidade Básica de Saúde (UBS) sobre o perfil demográfico e epidemiológico dos usuários assistidos no grupo Hiperdia. Ao analisar uma UBS e os pacientes que compõe o programa Hiperdia, identificou-se que a população de participantes desse grupo era de 500 pacientes. Como selecionar o tamanho da amostra para o estudo? Qual o tamanho da amostra para que seja representativa? Fonte da imagem: Freepik 5699316 Diabéticos 3% Hipertensos 70% Hipertensos e diabéticos 27% Hiperdia A seleção amostral indicada para esse estudo é a amostra aleatória estratificada, pois a população contém elementos heterogêneos. Organizar os 500 participantes do Hiperdia em estratos Sortear da proporção para a composição da amostra Atenção: selecionar elementos de forma proporcional aos estratos Nível de confiança O nível de confiança interfere no tamanho da amostra! Mas o que isso significa? O nível de confiança está ligado diretamente com a margem de erro. Representa a probabilidade de uma pesquisa ter os mesmos resultados se for aplicada com um outro grupo de pessoas. Fonte da imagem: Freepik 5033693 Os estudos na área da saúde geralmente apresentam 95% no nível de confiança, ou seja, 5% de margem de erro Encontrado o n0 , utilizaremos a seguinte fórmula para determinar o tamanho da amostra: Para amostragem estratificada proporcional, serão selecionados 155 hipertensos, 60 hipertensos e diabéticos e 7 diabéticos entre os estratos/subgrupos n0 = é uma aproximação do tamanho da amostra E0 = erro amostral aceitável = margem de erro 5% Portanto, a amostra deve ser de 222 participantes, considerando N=500 Apresentação de dados 13 14 15 16 17 18 13/07/2021 Apresentação de dados TabelaGráfico Indicada para apresentar resultados mais complexos Mais fácil de ser elaborada Visualização imediata de todos os valores Visualmente mais atraente Utiliza menos espaçoMais utilizado em publicaçõesFo nt e: h tt ps :/ /b it. ly /2 Pl nV hj . A ce ss o em 0 2 ab r2 02 1. Variáveis quantitativas São as características que podem ser medidas em uma escala numérica: Variáveis contínuas Valores fracionais fazem sentido Peso Altura Pressão arterial Variáveis discretas Somente valores inteiros fazem sentido Nº de filhos Nº bactérias por litro de leite Nº cigarros fumados por dia Fonte da imagem: Freepik 6802062 Variáveis qualitativas Nominais Três ou mais categorias sem hierarquia Estado civil Tipo de patologia Tipo de atividade física Dicotômicas Duas possibilidades de resposta Sim/Não Doente/Sadio Fumante/Não fumante Ordinais Organizadas segundo uma ordem Escolaridade Estágio da doença Mês de observação As variáveis qualitativas também são denominadas categóricas. Fonte da imagem: Freepik 11108589 Tabelas Tabela 1 - Distribuição do peso ao nascer de crianças (n=359) pertencentes a um estudo de coorte, Pelotas, Brasil, 1993 Peso ao nascer em gramas Freqüência absoluta (n) Freqüência relativa (%) 1000 a 2000 24 6,69 2001 a 3000 148 41,23 3001 a 4000 172 47,90 4001 a 5000 15 4,18 Total 359 100,00 Fonte: https://bit.ly/328Id0h. Acesso em 7 abr. 2021. Intervalos ou categorias Gráfico de Barras Figura 1 – Distribuição do peso ao nascer em crianças com seis meses de idade (n = 359). Pelotas, Brasil, 1993. Fonte: https://bit.ly/328Id0h. Acesso em 7 abr. 2021. A altura das barras representa os valores de cada intervaloBarras sem espaço entre si: Histograma Polígono de Frequência Figura 2 – Distribuição do peso ao nascer em crianças com seis meses de idade (n = 359). Pelotas, Brasil, 1993. Fonte: https://bit.ly/328Id0h. Acesso em 7 abr. 2021. Pode ser elaborado a partir gráfico de barras. A linha une extremidades superiores das barras, nos pontos médios 19 20 21 2223 24 13/07/2021 Gráfico de Setores ou de Pizza Figura 3 – Distribuição dos óbitos por causa básica e associada às hepatites virais segundo agente etiológico. Brasil, 2000 a 2016 Fonte: Ministério da saúde, 2018. Disponível em: https://goo.gl/SvTMvN. Acesso em: 20 set. 2018. Hepatite A 2% Hepatite B 21% Hepatite C 76% Hepatite D 1% Hepatite A Hepatite B Hepatite C Hepatite D Tabelas e gráficos Fonte da imagem: Freepik 12200462 Após a apuração dos dados coletados em um estudo sobre perfil demográfico e epidemiológico do grupo Hiperdia de uma UBS, os alunos precisam organizar os dados para facilitar a análise e a compreensão das conclusões, mas estavam com uma dúvida: Como elaborar uma tabela? Qual o melhor tipo de gráfico? Tabela Numeração e título Cabeçalho Colunas Fonte Sexo Participantes (N) Participantes (%) Masculino 150 30% Feminino 350 70% Total 500 100% Tabela 1 - População estudada, segundo sexo, de acordo com DATASUS, 2015. Fonte: Elaborado pela autora, 2021. Laterais abertas Qual gráfico escolher? • Colunas em tamanhos proporcionais aos valores • Comparar dados ou expor um desenvolvimento crescente ou decrescente Barras • Uma linha une os valores • Apresenta o progresso dos valores de uma variável no transcorrer do tempo Polígono de frequências • Círculo dividido em setores com tamanhos proporcionais aos valores • Relação de proporcionalidade dentro de um todo Setores 0 50 100 150 200 250 300 350 400 Sexo dos participantes Masculino Feminino 30% 70% Masculino Feminino Fonte: Elaborado pela autora, 2021. Figura 1 - População estudada, segundo sexo, de acordo com DATASUS, 2015. 25 26 27 28 29 30 13/07/2021 Medidas de tendência central Medidas de tendência central Utilizadas para sintetizar dados e indicam o centro de distribuição de frequências de variáveis na amostra: MédiaMédia ModaModa MedianaMediana Fonte da imagem: Shutterstock 1077515045 MédiaX = xi n X = x1 + x2 + x3 + ... + xn n • Ponto de equilíbrio ou central na distribuição de frequências. • Fica entre o valor máximo e mínimo da distribuição. • Não pode ser menor que o valor mínimo e nem maior que o valor máximo. Média ou média aritmética Exemplo A nutricionista mediu a circunferência abdominal de 10 participantes do grupo Hiperdia e obteve os seguintes valores em centímetros: 88; 83; 79; 76; 78; 70; 80; 82; 86; 105. X = 88 + 83 + 79 + 76 + 78 + 70 + 80 + 82 + 86 + 105 10 = 827 10 = 82,7 cm Fonte da im agem : Freepik 5808720 • Divide a amostra em duas partes: números menores e iguais à mediana; números maiores e iguais à mediana. • Os valores devem ser dispostos em ordem crescente ou decrescente, para depois selecionar o valor da posição central. Mediana (Md) Mediana 2, 2, 3, 7, 8, 9, 9 1, 4, 4, 5, 6, 7, 7, 77 5, 6 (5+6) 2 = 5,5 31 32 33 34 35 36 13/07/2021 • Indica o valor que ocorre com mais frequência, aquele que mais se repete dentro de uma série de observações. • Em um conjunto de dados pode ser que não exista moda (caso nenhum dos valores se repita), ou ainda, podem existir duas ou mais modas. Moda Fo nt e: h tt ps :/ /b it. ly /2 Q 76 uR y. A ce ss o em 0 7 ab r. 20 21 . Moda Média, moda, mediana Fonte da imagem: Freepik 12200462 Os alunos precisavam resumir dados para apresentá-los em gráficos e tabelas, para simplificar as informações e facilitar comparações entre variáveis. Para isso, precisavam utilizar as medidas de tendência central. Como calcular média, moda e mediana? MÉDIA: Cada paciente hipertenso do programa Hiperdia de uma UBS faz uso de uma quantidade de medicamentos para o controle da pressão arterial. Nesse sentido, busca-se investigar a média da quantidade de medicamentos utilizados. 64 pacientes 1 medicamento 53 pacientes 2 medicamentos 31 pacientes 3 medicamentos 8 pacientes 4 medicamentos 156 pacientes (1 x 64) + (2 x 53) + (3 x 31) + (4 x 8) ÷ 156 64 + 106 + 62 + 32 ÷ 156 264 ÷ 156 Média = 1,7 MEDIANA: considere o conjunto de dados abaixo, referentes à medida da glicemia dos pacientes do programa Hiperdia em mg/dL: {160; 120; 110; 125; 170; 110; 115; 121; 198} {110; 110; 115; 120; 121; 125; 160; 170; 198} {160; 120; 130; 170; 110; 115; 140; 110} {110; 110; 115; 120; 130; 140; 160; 170} 120 + 130 ÷ 2 = Md = 125 mg/dL Md = 121 mg/dL MODA: os dados abaixo se referem à idade dos pacientes atendidos em uma UBS no programa Hiperdia. {50, 40, 30, 35, 50, 48, 50, 40, 30, 50, 50, 48, 50, 40, 50, 30, 50, 48, 50, 50} Mo = 50 (idade que mais aparece) Para calcular a moda é necessário observar o valor que mais se repete dentro de uma série de observações. 37 38 39 40 41 42 13/07/2021 Medidas de dispersão Medidas de dispersão Indicam como os valores de um conjunto variam e se dispersam dos valores de tendência central, ou seja, o quanto eles estão distantes da média. AmplitudeAmplitude VariânciaVariância Desvio-padrãoDesvio-padrão Fonte da imagem: Freepik 1305098 Medidas de dispersão Grupo heterogêneo 6 pessoas com idades de: 3, 6, 26, 30, 50 e 55 anos Média de idade: 28 anos Grupo homogêneo 6 pessoas com 28 anos de idade Média de idade: 28 anos As medidas de dispersão tornam a análise da amostra mais confiável, pois as medidas de tendência central muitas vezes escondem a homogeneidade ou não dos dados. Fo nt e da s i m ag en s: S hu tt er st oc k 11 46 92 13 4; 1 68 96 79 54 0 Amplitude At = xmáx - xmín • É obtida por meio da diferença entre o valor mais alto e o mais baixo de um conjunto de dados. • Medida de dispersão rápida obtenção e fácil interpretação. • Útil para conjuntos pequenos de dados. Amplitude Exemplo Amplitude total: 6 Idades de alunos atendidos pela equipe de saúde bucal na escola são 3, 6, 5, 7 e 9 anos. Portanto, a amplitude será: Fonte da imagem: Freepik 4063985 O valor maior (X máximo) 9 O menor valor (X mínimo) 3 • É uma medida que mostra o quão distante cada valor de um conjunto está do valor central (médio). • Quanto menor é a variância, mais próximos os valores estão da média, mas quanto maior ela é, mais os valores estão distantes da média. Variância Variância S2 = (xi - x)2 n - 1 43 44 45 46 47 48 13/07/2021 Exemplo Idades de alunos atendidos pela equipe de saúde bucal na escola são 3, 6, 5, 7 e 9 anos. Fonte da imagem: Freepik 4063985 X = 3 + 6 + 5 + 7 + 9 5 Passo 1: Cálculo da média aritmética = 30 5 = 6 X = 6 9 + 0 + 1 + 1 + 9 4 Passo 2: Cálculo dos desvios = 20 4 = 5 Passo 3: Somatória dos quadrados dos desvios, divididos por n-1 Idades de alunos atendidos: 3, 6, 5, 7 e 9 anos. Desvio-padrão • É uma das medidas mais utilizadas, pois mede bem a dispersão dos dados e informa o quão “confiável” é esse valor. • É a raiz quadrada da variância, com sinal positivo. Desvio-padrão Como calcular o desvio-padrão? 1. Calcular a média aritmética. 2. Calcular os desvios, subtraindo de cada escore, o valor da média. 3. Elevar os desvios ao quadrado. 4. Somar os desvios ao quadrado. 5. Dividir a somatória pelo número total de casos menos 1. 6. Extrair raiz quadrada do resultado (sinal positivo). Desvio-padrão da variância calculada anteriormente 5 = 2.24 Fonte da imagem: Shutterstock 504691354 Análise do desvio-padrão Quanto maior o desvio-padrão: maior variabilidade e heterogeneidade entre os dados. Menor representatividade na amostra. Quanto menor o desvio-padrão: menor variabilidade dos dados. Dados mais homogêneos. Maior representatividade na amostra. Medidas de dispersão 49 50 51 52 53 54 13/07/2021 Fonte da imagem: Freepik 12200462 Os alunos perceberam que alguns dados coletados do programa Hiperdia dispersavam do valor central, e entenderam que para resumi-los com medidas de tendência central precisariam conhecer também as medidas de variabilidade. Quais são as medidas de dispersão e como é possível utilizá-las? Medidas de dispersão Variância Mensura todos os desvios em relaçãoà média Obtida por meio da média dos quadrados dos desvios Amplitude Diferença entre o valor mais alto e o valor mais baixo de um conjunto de dados Utilizada em conjuntos de dados pequenos Desvio-padrão Mensura o quanto cada valor se distancia da própria média aritmética de uma distribuição É a raiz quadrada da variância Fonte da imagem: Freepik 6802062 Recapitulando • Introdução à bioestatística • Censo e amostra, técnicas de amostragem, cálculo da amostra • Apresentação de dados • Tipos de variáveis, gráficos e tabelas • Medidas de tendência central • Média, Mediana, Moda • Medidas de dispersão • Amplitude, Variância, Desvio-padrão 55 56 57 58 59
Compartilhar