Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE FEDERAL DE MINAS GERAIS ESCOLA DE ENFERMAGEM PROGRAMA DE PÓS-GRADUAÇÃO EM ENFERMAGEM Disciplina Bioestatística – ENA820 Lista de exercícios – Análises Descritivas Questão 1. Um estudo foi conduzido para conhecer o perfil dos casos moderados/graves de COVID internados em um hospital de Belo Horizonte. Abaixo estão listadas as idades dos 14 pacientes que fizeram parte deste estudo. 40, 45, 46, 50, 52, 54, 61, 63, 67, 72, 72, 72, 74, 81 a) Obtenha as seguintes medidas-resumo a. Média = 60,6 40+45+50+61+72+54+46+52+67+72+63+74+72+81= 849 849/14= 60,6 b. Mediana = 62 Posição: 14 + 1 / 2 = 7,5 Mediana entre a 7ª e 8ª posições 61 + 63 / 2 = 62 c. Moda = 72 Observação mais frequente na amostra: 72 d. Amplitude = 41 Máx = 81; Mín: 40 81 - 40 = 41 e. Intervalo interquartil: Q1 = 48; Q2 = 62; Q3 = 72 Posição Q1 = 0,25 x (14 + 1) = 3,75 Entre 3ª e 4ª posições: 46 + 50/2 = 48 Posição Q2 = 0,5 x (14+1) = (14+1) /2 = 7,5 Entre 7ª e 8ª posições: 61 + 63 / 2 = 62 Posição Q3 = 0,75 x (14+1) = 11,25 Entre 11ª e 12ª posições: 72+72 / 2 = 72 f. Desvio-padrão xi xi - média (xi - média)2 40 40 – 60,6 = -20,6 (-20,6)² = 424,36 45 45 – 60,6 = -15,6 (-15,6)² = 243,36 46 46 – 60,6 = -14,6 213,16 50 -10,6 112,36 52 -8,6 73,96 54 -6,6 43,56 61 0,4 0,16 63 2,4 5,76 67 6,4 40,96 72 11,4 129,96 72 11,4 129,96 72 11,4 129,96 74 13,4 179,56 81 20,4 416,16 Soma 2143,24 s² = 2143,24/ (14-1) = 164,9 s = 12,8 b) Mostre que é igual a zero xi xi - média 40 -20,6 45 -15,6 46 -14,6 50 -10,6 52 -8,6 54 -6,6 61 0,4 63 2,4 67 6,4 72 11,4 72 11,4 72 11,4 74 13,4 81 20,4 Soma ≅ 0 As questões 2 a 6 referem-se ao exemplo abaixo: Suponha que uma amostra de 20 pacientes com suspeita de COVID em uma UBS de Fortaleza foi selecionada para participar de um estudo sobre sintomas relacionados à doença. Por meio telefônico, dentre outras questões, os pacientes foram interrogados sobre presença e persistência de tosse e febre durante o adoecimento. Os dias de duração de tosse e febre para cada paciente estão apresentados a seguir: Tabela 1 – Resultados Número de Ordem do Paciente Persistência da tosse em dias Persistência da febre em dias 1 0 0 2 3 0 3 4 1 4 0 0 5 0 0 6 6 2 7 0 0 8 7 2 9 6 2 10 7 3 11 0 0 12 0 0 13 8 3 14 20 8 15 25 14 16 0 0 17 7 2 18 6 2 19 5 1 20 6 2 Questão 2 – A duração média de tosse entre os pacientes analisados foi de aproximadamente 5 dias. Calcule agora, as demais medidas de tendência central para a variável persistência da tosse e classifique o tipo dessa variável. Posição mediana = 0,5 x (20+1) = 10,5 entre a 10ª e 11ª posições = (5+6)/2 = 5,5 Mediana = 5,5 Moda = 0 Variável numérica discreta Questão 3 - Qual medida de tendência central deveria ser utilizada preferencialmente nesse caso? Por quê? Mediana ou média, pois são similares demonstrando uma distribuição simétrica. Tabela 2: Tabela de distribuição de frequências de duração da tosse dos pacientes monitorados pela UBS de Fortaleza no ano de 2020. Peso Frequência absoluta simples Frequência absoluta acumulada Frequência relativa simples Frequência relativa acumulada 0 |- 5 dias 9 9 45% 45% 5 |- 10 dias 9 18 45% 90% 10 |- 15 dias 0 18 0% 90% 15 |- 20 dias 0 18 0% 90% 20 |- 22 dias 2 20 10% 100% Total 20 A tabela 2 apresenta a distribuição de frequências de persistência de tosse entre os pacientes monitorados. Analisando os dados da tabela, responda: Questão 4 - Em qual categoria se encontra a mediana da persistência de tosse desses pacientes? Posição mediana = 0,5 x (20+1) = 10,5 entre a 10ª e 11ª posições = 7 + 0 / 2 = 3,5 Primeira categoria: 0 |- 5 dias Questão 5 - Qual o percentual de pacientes que tiveram duração de tosse abaixo de 10 dias? 90% Questão 6 - Em que faixa está o percentil 90 do persistência de tosse desses pacientes? Posição mediana = 0,75 x (20+1) = 15,75 entre a 15ª e 16ª posições = 25 + 0 / 2 = 12,5 Terceira categoria: 10 |- 15 dias Questão 7. O tabagismo configura-se como fator de risco para o coronavírus, tendo o fumante mais chances de desenvolver sintomas graves da doença. A cotinina é uma substância presente no tabaco e é considerada um bom marcador da exposição do mesmo. Abaixo está um par de distribuições de frequências que contêm níveis séricos de cotinina para um grupo de fumantes e um grupo de não-fumantes. Níveis de Cotinina (ng/ml) Fumantes Não-fumantes 0-13 78 3300 14-49 133 72 50-99 142 23 100-149 206 15 150-199 197 7 200-249 220 8 250-299 151 9 300+ 412 11 Total 1539 3445 a) Complete as tabelas de frequências para o grupo dos fumantes e o grupo dos não fumantes. Construa duas tabelas separadamente. Tabela X: Tabela de distribuição de frequências dos níveis séricos de cotinina para um grupo de fumantes Níveis de Cotinina (ng/ml) Frequência absoluta simples Frequência relativa simples Frequência absoluta acumulada Frequência relativa acumulada 0-13 78 5,1% 78 5,1% 14-49 133 8,6% 211 13,7% 50-99 142 9,2% 353 22,9% 100-149 206 13,4% 559 36,3% 150-199 197 12,8% 756 49,1% 200-249 220 14,3% 976 63,4% 250-299 151 9,8% 1127 73,2% 300+ 412 26,8% 1539 100,0% Total 1539 100,0% Tabela X: Tabela de distribuição de frequências dos níveis séricos de cotinina para um grupo de não fumantes Níveis de Cotinina (ng/ml) Frequência absoluta simples Frequência relativa simples Frequência absoluta acumulada Frequência relativa acumulada 0-13 3300 95,8% 3300 95,8% 14-49 72 2,1% 3372 97,9% 50-99 23 0,7% 3395 98,5% 100-149 15 0,4% 3410 99,0% 150-199 7 0,2% 3417 99,2% 200-249 8 0,2% 3425 99,4% 250-299 9 0,3% 3434 99,7% 300+ 11 0,3% 3445 100,0% Total 3445 100,0% b) Calcule a média dos dados agrupados das medidas do nível sérico de cotinina tanto para fumantes como para não-fumantes. Para o último intervalo considere o ponto médio como 340 ng/ml. Fumantes Níveis de Cotinina (ng/ml) Frequência absoluta simples Ponto médio Ponto médio X frequência 0-13 78 6,5 507 14-49 133 31,5 4189,5 50-99 142 74,5 10579 100-149 206 124,5 25647 150-199 197 174,5 34376,5 200-249 220 224,5 49390 250-299 151 274,5 41449,5 300+ 412 340 140080 Total 1539 Soma 306218,5 Média = 306.218,5/1539 = 198,98 Não Fumantes Níveis de Cotinina (ng/ml) Frequência absoluta simples Ponto médio Ponto médio X frequência 0-13 3300 6,5 21450 14-49 72 31,5 2268 50-99 23 74,5 1713,5 100-149 15 124,5 1867,5 150-199 7 174,5 1221,5 200-249 8 224,5 1796 250-299 9 274,5 2470,5 300+ 11 340 3740 Total 3445 Soma 36527 Média = 36527/3445 = 10,6 c) Compare as distribuições dos níveis de cotinina para os fumantes e os não-fumantes. Os níveis de cotinina são mais elevados entre fumantes se comparados aos não-fumantes. Questão 8. As figuras 1 a 3 exibem as taxas de casos confirmados de COVID em três países: Itália, África do Sul e China, num mesmo período. As figuras fornecem os histogramas que ilustram a distribuição dos casos diários em cada país. a) Sem fazer qualquer cálculo, qual país você espera ter a menor média? E a maior mediana? E o menor desvio-padrão? Explique seu raciocínio. Menor média = China (maioria dos valores são baixos) Maior mediana = Itália (valor do “meio” é maior que os demais) Menor desvio-padrão = China (apesar de ter havido pico em um dia, os demais valores são mais próximos entre si) b) Para a Itália, você esperaria que a média e mediana da confirmação de casos diários fossem próximas? Você esperaria que a média e a mediana fossem iguais para a África do Sul? Por quê? Sim, para a Itália as taxas média e mediana são aproximadamente iguais porque a distribuição é simétrica.Espera-se o contrário para a África do Sul, já que nesse caso a distribuição é assimétrica Figura 1: Histograma das taxas de casos confirmados de COVID na Itália, 2020. Figura 2: Histograma das taxas de casos confirmados de COVID na China, 2020. Figura 3: Histograma das taxas de casos confirmados de COVID na África do Sul, 2020. Questão 9. No intuito de conhecer as relações da COVID-19 com aspectos sociais e fatores de risco, um estudo numa cidade do Rio de Janeiro traçou o perfil de 20 pessoas que evoluíram a óbito para esta doença. A tabela 2 apresenta uma dessas análises, que compara escolaridade (em anos de estudo) entre pessoas que eram fumantes e não fumantes. Tabela 2: Estatísticas descritivas da escolaridade em anos de estudo de 20 pessoas do estado do Rio de Janeiro, em 2020, estratificando pelo status de hábitos tabagistas anteriores Escolaridade (em anos de estudo) Fumantes Não fumantes n 12 8 Média 8,5 8,3 Mediana 8,5 8,0 Desvio-padrão 1,0 1,0 Mìnimo 7,0 7,0 Máximo 10,0 10,0 Percentil 25 8,0 7,3 Percentil 50 8,5 8,0 Percentil 75 9,0 9,0 a) Construa um gráfico tipo box-plot utilizando os dados da Tabela 2. b) Observando os resultados da tabela 2, responda: qual dos grupos tem maior variabilidade com relação à escolaridade, os fumantes ou os não fumantes? Justifique sua resposta. CV fumantes = 1,0/8,5 = 0,118 CV não fumantes = 1,0/8,3 = 0,120 A variabilidade é um pouco maior entre os não fumantes (> CV). c) A partir dos resultados apresentados na tabela 2 e do gráfico construído na letra a, responda: a escolaridade parece ser um fator associado ao tabagismo, isto é, há diferenças na escolaridade entre jovens fumantes e não fumantes da amostra estudada? Justifique sua resposta. Não, pois tanto a média quanto a mediana dos dois grupos são muito próximas. Entretanto, uma resposta precisa para essa pergunta só poderia ser dada a partir de um teste de hipóteses. Questão 10. Com o advento da quarentena, o número de pedidos de divórcios aumentou consideravelmente. A figura abaixo mostra a distribuição de frequências acumuladas do número de desquites, segundo a duração do casamento em uma cidade de Minas Gerais: a) Reproduza as informações do gráfico em uma tabela de frequências para a duração do casamento. Anos de casamento Frequência absoluta acumulada Frequência relativa acumulada Frequência absoluta simples Frequência relativa simples 0 |- 6 2300 57,5% 2300 57,5% 6 |- 12 3300 82,5% 1000 25,0% 12 |- 18 3850 96,3% 550 13,8% 18 |- 24 4000 100,0% 150 3,8% b) 25% dos desquites se deram com casamentos de até quantos anos? Até 6 anos Q1 = 0,25 x (24 – 1) = 5,75 Questão 11. Considerando os dados da questão 10 relativos ao número de desquites na cidade, de acordo com a duração do casamento: a) Qual a duração média dos casamentos? E a mediana? Anos de casamento Frequência absoluta simples Ponto médio Ponto médio x frequência 0 |- 6 2300 3 6900 6 |- 12 1000 9 9000 12 |- 18 550 15 8250 18 |- 24 150 21 3150 Total 4000 Soma 27300 Média =27300/4000 = 6,825 Mediana está entre 0 e 6 anos b) Construa o histograma da distribuição. c) Encontre os percentis 10 e 90. P10 = 0,10 x (4000+1) = 400,1 0 |- 6 P90 = 0,90 x (4000+1) =3600,9 12 |- 18 Questão 12. A Clínica Geriátrica Reviver necessitará passar por uma reformulação do quadro de profissionais devido ao déficit encontrado em sua contabilidade, proveniente da crise sanitária, social e econômica advinda da pandemia. A distribuição salarial dos 30 funcionários atualmente trabalhando na clínica é a seguinte: A decisão do gestor da Clínica, após análises dos salários, foi por alcançar uma mediana de salários de R$2.800,00. Quantos funcionários que recebem R$3.600,00 devem ser demitidos para alcançar este objetivo? 0,5.(n+1)=10,5 n+1=10,5/0,5 n+1=21 n=21-1 n=20 Para n=20 devem ser demitidos 10 funcionários. Nas questões 13 a 17 marque a resposta certa e justifique fazendo os cálculos necessários quando houver. Com base no gráfico a seguir, que representa a distribuição etária de 2 diferentes populações (A e B), responda as questão 13 e 14 Questão 13 - Quanto à mediana de idade das distribuições “A” e “B” pode-se afirmar que: a) A mediana de “A” é igual a mediana de “B”. b) A mediana de “A” é menor que a mediana de “B”. c) A mediana de “A” é maior que a mediana de “B”. d) Não é possível inferir. Questão 14 - Quanto à variância amostral das distribuições de idade “A” e “B” pode-se afirmar que: a) Variância de “A” é igual à variância de “B”. b) Variância de “A” é maior que variância de “B”. c) Variância de “A” é menor que variância de “B”. d) Não é possível inferir. Questão 15 - Associe a série de dados estatísticos com o tipo de gráfico mais adequado para apresentá-la. SÉRIE DE DADOS S1: Evolução do número de casos de COVID-19 por mês na cidade de Ipatinga; S2: Número de casos de COVID-19 nas regiões urbana e rural de Ipatinga; S3: Quantidade de casos de COVID-19 na cidade de Ipatinga no mês de junho por faixa etária; GRÁFICOS G1: Gráfico de setores; G2: Gráfico de linhas; G3: Gráfico de barras; Marque a alternativa CORRETA: a) (S1,G2);(S2,G3);(S3,G2) b) (S1,G1);(S2,G2);(S3,G3) c) (S1,G2);(S2,G1);(S3,G3) d) (S1,G3);(S2,G1);(S3,G2) Questão 16 - Para comparar as rendas de dois grupos de pessoas (Grupo A – casos confirmados de COVID-19 em Minas Gerais que não evoluíram a óbito e Grupo B – casos confirmados de COVID-19 em Minas Gerais que evoluíram a óbito), foram preparados diagramas de caixas (box-plots) com os valores observados dos salários, representados na figura a seguir: A respeito desses diagramas, considere as seguintes afirmativas: I. O salário médio dos dois grupos é o mesmo. II. A distribuição dos salários no grupo A é assimétrica à direita. III. Há mais pessoas no grupo A do que no grupo B. IV. 3/4 das pessoas do grupo A tem salários menores que 2500 Assinale a alternativa correta: a) Somente a alternativa I é verdadeira b) Somente a alternativa II é verdadeira c) Somente a alternativa III é verdadeira d) As alternativas I e III são verdadeiras e) As alternativas II e IV são verdadeiras Questão 17 – Considerando o gráfico (Box-plot) a seguir, que ilustra a distribuição da idade dos jovens de determinado estudo estratificada por sexo, marque a resposta correta e justifique. (A) Não existem pontos extremos nos valores de idade independentemente do sexo dos jovens. (B) a distribuição de idade das mulheres apresenta menor variabilidade que a distribuição de idade dos homens. (C) Os homens analisados apresentam menor mediana de idade que as mulheres. (D) Para a distribuição de idade das mulheres, pode-se afirmar que 75% possuem menos de 21 anos. (E) o terceiro quartil da distribuição de idade das mulheres é maior que o máximo da distribuição dos homens. média DP x s CV = =
Compartilhar