Baixe o app para aproveitar ainda mais
Prévia do material em texto
Lista de Exercícios - Epidemiologia 1. Classifique as seguintes variáveis como quantitativa contínua, quantitativa discreta, qualitativa ordinal ou qualitativa nominal: a. Região de residência do paciente, no início do tratamento oncológico ambulatorial (Norte, Nordeste, Centro-Oeste, Sudeste ou Sul): qualitativa nominal b. Estadiamento clínico do paciente, no momento do diagnóstico clínico de câncer de boca (in situ, I, II, III ou IV): qualitativa ordinal c. Renda familiar de uma pessoa, em salários mínimos: quantitativa discreta d. Número de consultas pré-natais de uma primigesta: quantitativa discreta e. Utilização de medicamentos na gestação (sim ou não): qualitativa nominal f. Área em que o paciente reside (urbana ou rural): qualitativa nominal g. Classificação socioeconômica do chefe do domicílio (muito pobre, pobre, regular, rico, muito rico): qualitativa ordinal h. Frequência com que um paciente se sente cansado durante as atividades rotineiras (nunca, raramente, algumas vezes, muitas vezes, sempre): qualitativa ordinal i. Peso ao nascer (em quilogramas) das crianças de uma maternidade: quantitativa contínua 2. Os números a seguir referem-se às concentrações séricas de hemoglobina (em g/dl) em uma amostra de 200 crianças. Construa um histograma para essa variável, considerando amplitudes de 0,5g/dl. Concentração sérica de hemoglobina (g/dL) em uma amostra de 200 crianças Fonte: Hospital X, 2022. 3. A duração da gestação é classificada como pré-termo se a criança nasce em idade gestacional inferior a 37 semanas, a termo se a idade gestacional está entre 37 e 41 semanas, e pós-termo se a idade gestacional é igual ou maior que 42 semanas. No mês de janeiro de 2013 nasceram em uma maternidade 50 crianças de gestações pré-termo, 145 crianças de gestações a termo e 25 crianças de gestações pós-termo. Esboce um gráfico que descreva adequadamente esses números. Número de crianças nascidas por idade gestacional na Maternidade X em janeiro de 2013 Fonte: Maternidade X, janeiro de 2013. 4. Em junho de 2006, o Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto (HCFMRP) da Universidade de São Paulo (USP) contava com uma equipe de 4.306 funcionários. As tabelas a seguir mostram a distribuição desses funcionários por tempo de serviço e nível. Represente as informações dessas tabelas em gráficos adequados. Distribuição dos funcionários do HCFMRP por tempo de serviço Fonte: Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto, jun. de 2006. Distribuição dos funcionários do HCFMRP por nível de escolaridade Fonte: Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto, jun. de 2006. 5. Um estudante está conduzindo um estudo que objetiva descrever os doadores de sangue de um serviço de hemoterapia. Ele utiliza uma amostra de 651 doadores, sendo 410 de sexo masculino e 241 de sexo feminino. Dentre os doadores de sexo masculino, ele encontrou 161 portadores de sangue tipo A, 56 portadores de sangue tipo B, 14 portadores de sangue tipo AB e 179 portadores de sangue tipo O. Dentre os doadores de sexo feminino, ele encontrou 81 portadores de sangue tipo A, 44 portadores de sangue tipo B, 13 portadores de sangue tipo AB e 103 portadores de sangue tipo O. Para descrever esses dados, o estudante construiu o gráfico de barras abaixo. Neste gráfico, os homens são identificados por M, de masculino, e as mulheres por F, de feminino. Seu professor, no entanto, lhe disse que esse gráfico contém um erro bastante sério. a. Comente o que está errado neste gráfico. O erro do gráfico consiste no fato de ele estar comparando amostras de tamanhos diferentes com a frequência absoluta, sendo que o correto neste caso é utilizar as frequências relativas. b. Esboce novamente um gráfico de barras para esses dados, de modo que esse erro não seja novamente cometido. Comparação da Frequência Relativa dos Doadores do Serviço de Hemoterapia X de acordo com sexo e tipo sanguíneo 6. Uma nutricionista deseja comparar os efeitos de duas dietas, que ele identifica por dietas A e B. Um total de 100 pessoas é submetido à dieta A e outras 100 pessoas são submetidas à dieta B. A nutricionista percebeu que 46% das pessoas submetidas à dieta A tiveram redução de peso, e o mesmo aconteceu com 41% das pessoas submetidas à dieta B. Para uma apresentação em um evento científico, ele esboçou dois gráficos para esses dados, exibidos a seguir. Porém, somente um desses gráficos é adequado. Identifique o gráfico adequado (A ou B), e explique o erro cometido no gráfico que é inadequado. O gráfico A é o adequado. Isso porque os rótulos do eixo Y no gráfico B, por não se iniciarem no “0%”, acabam por distorcer o tamanho real da representação gráfica, ocasionando a impressão de que a dieta A é muito superior à dieta B, sendo que a diferença entre as dietas é de apenas 5%. Com isso, deve-se escolher o gráfico mais fidedigno em relação aos dados coletados com a pesquisa, e este é o gráfico A. 7. Responda: a. O desvio padrão amostral pode ser um número menor que zero? Não, pois o desvio padrão é a raiz quadrada da variância, a qual é a média das diferenças quadráticas de n valores em relação a sua média. Pelo fato de na fórmula do DP haver um potência quadrada, mesmo quando a subtração resultar em um número negativo, ao final restará um número positivo, o que impede que o desvio padrão resulte em um número menor que zero. b. O desvio padrão amostral pode ser um número igual a zero? Sim, o DP pode assumir um valor igual a zero quando não há variabilidade entre os dados, ou seja, eles são todos iguais entre si. Com isso, quando for realizada a diferença entre os valores em relação a sua média, o resultado será zero, e zero dividido por qualquer número é igual a zero. 8. A média do peso dos 100 alunos de uma determinada turma de alunos é 68,4 kg. Essa turma possui 25 homens e 75 mulheres. O peso médio das mulheres dessa turma é 62,6 kg. Qual é o peso médio dos homens dessa turma? (75*62,6+25*x)/100 = 68,4 25x = 6840 – 4695 X = 85,8 Kg 9. Os valores de densidade mineral óssea medida no colo do fêmur de n = 9 mulheres são listados a seguir, em g/cm2. 0,903 0,847 1,115 0,866 0,657 0,997 1,114 0,943 0,861 Encontre a média amostral, a mediana amostral e a amplitude dos dados. Média = (0,903 + 0,847 + 1,115 + 0,866 + 0,657 + 0,997 + 1,114 + 0,943 + 0,861)/9 = 0,9225 g/cm². Mediana = 0,903 g/cm². Amplitude = 1,115 – 0,657 = 0,458 g/cm². 10. O que são estatísticas descritivas? A estatística descritiva é uma subárea da estatística que busca descrever dados. Para isso, sintetiza valores de uma mesma natureza, organiza e descreve os dados por meio de tabelas, gráficos e de medidas descritivas. 11. Como os dados ordinais diferem dos nominais? Os dados ordinais podem ser organizados hierarquicamente, pois apresentam uma ordem lógica; já os dados nominais são organizados em categorias arbitrárias e não podem ser hierarquizados. 12. Ao se construir uma tabela, quando é vantajoso usar frequências relativas em vez de absolutas? A frequência relativa é útil para comparar amostras com tamanhos diferentes, já que a comparação da frequência absoluta resultará em uma descrição viesada dos dados por conta do número desigual de observações presentes nas amostras. 13. Que tipo de gráficos podem ser usados para exibir observações nominais ou ordinais? E observações discretas ou contínuas? Para variáveis qualitativas utilizam-se gráficos de barra e de setores; e para quantitativas, gráficos de linhas e histograma. 14. O que são os percentis de um conjunto de dados? O percentil é uma medida que divide a amostra em 100 partes iguais, sendo que cada parte contém uma porcentagem de dados iguais. 15. Descreva se cada uma das seguintes observações é um exemplode dados discretos ou contínuos: a. O número de suicídios nos Estados Unidos em um ano específico. É um dado discreto, pois é composto apenas por números inteiros. b. A concentração de chumbo em uma amostra de água. Dado contínuo, pois pode conter números decimais. c. A duração de tempo em que um paciente de câncer sobrevive depois de um diagnóstico. Dado contínuo, pois pode conter números decimais. d. O número de abortos prévios que uma mãe teve. Dado discreto, pois é só pode ser representado por um número inteiro. 16. A tabela abaixo categoriza 10.614.000 visitas ao consultório de especialistas de doenças cardiovasculares nos Estados Unidos por duração de cada visita. Uma duração de 0 (zero) minuto implica que o paciente não teve contato com o especialista. Pode-se fazer a afirmação de que as visitas a consultórios de especialistas de doenças cardiovasculares têm duração mais frequente entre 16 e 30 minutos. Você concorda com essa afirmação? Por quê? Justifique: Não. Essa afirmação está incorreta porque os intervalos de classes apresentam tamanhos diferentes. Por exemplo: se forem somados os números de visitas que duraram de 1-15 minutos, o resultado seria maior que o número de visitas de 16-30 minutos; ou seja, quando adequamos a amplitude dos intervalos, o intervalo de 16-30 minutos deixa de ser o mais frequente. 17. A distribuição de frequências a seguir exibe os números de casos pediátricos de Aids registrados nos Estados Unidos entre 1983 e 1989. Construa um gráfico de barras que mostre o número de casos por ano. O que o gráfico lhe conta sobre a Aids pediátrica neste período de tempo? Número de casos de Aids nos EUA de 1983 a 1989 Fonte: Governo dos Estados Unidos da América 18. Em uma investigação dos fatores de risco para as doenças cardiovasculares, os níveis séricos de cotinina - produto metabólico da nicotina - foram registrados para um grupo de fumantes e um grupo de não fumantes. As distribuições de frequências correspondentes são as mostradas abaixo. a. É correto comparar as distribuições dos níveis de cotinina para fumantes e não- fumantes, com base nas frequências absolutas em cada intervalo? Por quê? Não, pois as amostras de fumantes e não fumantes apresentam números diferentes; o correto seria utilizar as frequências relativas. b. Calcule as frequências relativas das leituras dos níveis séricos de cotinina para cada grupo. Tabela 1. Frequências Relativas dos Níveis Séricos de Cotinina para os grupos de fumantes e não fumantes Nível de Cotinina (ng/mL) Fumantes Não Fumantes 0 - 13 5,1% 95,8% 14 - 49 8,6% 2,1% 50 - 99 9,2% 0,7% 100 - 149 13,4% 0,4% 150 - 199 12,8% 0,2% 200 - 249 14,3% 0,2% 250 - 299 9,8% 0,3% 300 - 349 26,8% 0,3% Total 100,0% 100,0% Fonte: Pesquisa X, 2019 c. Construa um par de polígonos de frequência. Ogiva Frequências Relativas Acumuladas dos Níveis de Cotinina para os grupos de Fumantes e Não Fumantes Fonte: Pesquisa X, 2019. Polígono de Frequências Frequências Relativas para os níveis de cotinina de fumantes e não fumantes Fonte: Pesquisa X, 2019. d. Descreva a forma de cada polígono. O que você pode dizer sobre a distribuição de níveis de cotinina registrados em cada grupo? Pelo gráfico de ogivas, pode-se perceber que 98,5% dos não fumantes apresentam níveis baixos de cotinina (níveis menores que 100 ng/mL) e apenas 23% dos fumantes apresentam níveis baixos desse composto. Com isso, pode-se perceber que os participantes não fumantes tendem a ter níveis consideravelmente mais elevados do metabólito estudado. e. Para todos os indivíduos nesse estudo, o status do fumo é auto- registrado. Você acha que algum indivíduo pode estar mal classificado? Por quê? Sim, pois o auto registro por si só já é uma fonte de viés, já que a pessoa pode errar, sem querer ou propositadamente, quando for se auto registrar. Além disso, uma pequena parcela de não fumantes (menos de 2%) apresentam níveis altos de cotinina, compatíveis com os níveis de fumantes, o que pode indicar uma classificação errônea. 19. Responda: a. Defina e compare a média, mediana e moda como medidas de tendência central. A média é a razão da soma de todos os valores observados pelo número total de observações. Já a mediana é o valor central em uma série ordenada de valores. A moda, por sua vez, é o valor que tem a maior frequência. b. Sob que condições é preferível o uso da média? E o da mediana? E o da moda? É interessante que se use a média quando a amostra não apresenta valores extremos, quando a dispersão dos dados é baixa; isso porque, como a média utiliza todos os valores da amostra, ela é sensível a valores dissonantes do resto dos dados da amostra. A mediana pode ser uma alternativa ao uso da média nos casos em que há valores extremos. A moda é interessante de ser utilizada quando ser quer encontrar o valor mais frequente em um determinado conjunto. c. Defina e compare as três medidas de dispersão comumente usadas – a amplitude, o intervalo interquartil e o desvio-padrão. A amplitude é a diferença entre o maior e o menor número de uma amostra. Assim, quanto maior a amplitude, maior a dispersão. O desvio padrão é a raiz quadrada da variância e indica a dispersão dos dados em torno da média. O intervalo interquartil é a diferença entre o primeiro e o terceiro quartil, é basicamente a amplitude dos quartis. 20. Para observações que foram classificadas na forma de uma distribuição de frequências, de modo que as medidas originais não estejam mais disponíveis, é possível calcular as medidas-resumo numéricas? Explique brevemente. Por que poderiam informações pessoais - tal como rendimentos anuais - ser coletadas dessa maneira? Sim, para encontrar a média de dados agrupados deve-se multiplicar o ponto médio de cada intervalo pela frequência correspondente, somar todos esses produtos e dividir pela frequência total do conjunto de dados. A variância e o desvio padrão podem ser encontradas seguindo a mesma lógica. Porque ao se coletar os dados de forma agrupadas, as informações coletadas já estarão em uma forma mais resumida, e ainda assim será possível o cálculo da média e das medidas de dispersão. 21. Um estudo foi conduzido para investigar o prognóstico a longo prazo de crianças que sofreram um episódio agudo de meningite bacteriana (inflamação das membranas que envolvem o cérebro e a medula espinhal). Abaixo estão listados os tempos para o ataque apoplético de 13 crianças que tomaram parte no estudo. Em meses as medidas foram: 0,10 0,25 0,50 4 12 12 24 24 31 36 42 55 96 Obtenha as seguintes medidas-resumo numérica dos dados a. Média 25,9 b. Mediana 24 c. Moda 12 d. Amplitude 95,9 e. Intervalo interquartil Segundo o LibreOffice, o Intervalo Interquartil (Q3 – Q1) é de 32. Porém, seguindo o que consta no livro “Bioestatística para os cursos de graduação da área da saúde”, o resultado será diferente: Q1 = 2,25; Q3 = 39; IQR = 36,75. f. Desvio padrão 27,37 22. Em Massachusetts oito indivíduos sofreram episódio inexplicável de intoxicação por vitamina D 15 dias hospitalização; pensou-se que essas ocorrências extraordinárias pudessem resultar de uma excessiva suplementação de leite. Os níveis de cálcio e albumina é um tipo de proteína no sangue para cada indivíduo no momento da internação no hospital são mostrados abaixo: a. Obtenha a média, a mediana e o desvio padrão e a amplitude dos níveis de cálcio registrado Média: 3,14 Mediana: 3,08 DP: 0,51 Amplitude: 1,47 b. Calcule a média, mediana e o desvio padrão e a amplitude para os dados de níveis de albumina Média: 40,37 Mediana: 42 DP: 3,02 Amplitude: 9 c. Para indivíduos saudáveis no intervalo normal de valores de cálcio é de 2,12 até 2,74mmol/l enquanto o intervalo de níveis de albumina é de 32 até 55g/l. Você acredita queos pacientes que sofreram intoxicação por vitamina D tinham níveis normais de cálcio e albumina no sangue? Em relação à albumina, todos os pacientes que sofreram intoxicação apresentavam níveis normais. Já no caso dos níveis de cálcio, apenas dois pacientes apresentaram níveis normais, o que significa que a maioria dos que se intoxicaram tinham níveis alterados. 23. Um estudo foi conduzido comparando mulheres adolescentes que sofriam de bulimia com mulheres adolescentes com composição normal e níveis de atividade física similares. Abaixo estão listadas as medidas de entrada calórica diária registradas em kcal por kg para as amostras de adolescentes de cada grupo. a. Obtenha o consumo calórico diário mediano tanto para as adolescentes bulímicas como para as saudáveis. Medianabulímicas = 21,55 Kcal/Kg Medianasaudáveis = 28,15 Kcal/Kg b. Calcule o intervalo interquartil para cada grupo. IQTb = 7,33 IQTs = 11,9 c. Um valor típico do consumo calórico diário é maior para os indivíduos que sofrem de bulimia ou para saudáveis? Que grupo tem maior variabilidade nas medidas? Média bul. = 21,6 Kcal/Kg Média saud. = 29,63 Kcal/Kg É maior para os indivíduos saudáveis. DP bul. = 6,23 Kcal/Kg DP saud. = 6,73 Kcal/Kg O grupo dos indivíduos saudáveis tem maior variabilidade nas medidas. 24. Abaixo está uma distribuição de frequências que contém um resumo das pressões sanguíneas sistólica sem repouso para uma amostra de 35 pacientes com doença isquêmica do coração ou supressão do fluxo de sangue para o coração. a. Calcule a média e o desvio padrão dos dados agrupados. Média = 149,78 mmHg DP = 19,32 mm Hg
Compartilhar