Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE ESTADUAL DO CEARÁ CENTRO DE CIÊNCIAS DA SAÚDE CURSO DE NUTRIÇÃO DISCIPLINA DE BIOESTATÍSTICA Atividade de Bioestatística Esmael do Nascimento Gouveia Emily Silva dos Santos Lívia Barros Cavalcante Maynara Germano Facó Melissa Perote Gurgel Monique Emilly Frota Moura [footnoteRef:0] [0: Graduandos de nutrição] Fortaleza, julho de 2021 1. Risque F (falso) ou V (verdadeiro), JUSTIFICANDO CADA RESPOSTA. (F) Título da tabela: Distribuição do Nº de pacientes, segundo comorbidades, Jan/Jun/2020 (Falsa, pois falta informar o local). (V) São variáveis qualitativas: sexo, faixa etária, nível de escolaridade, religião e nível de ansiedade - São qualitativas de ordem nominal e ordinal. (V) São variáveis quantitativas discretas: nº de filhos, nº de abortos, nº mulheres e nº refeições. - Representam apenas números inteiros, contagem. (V) São variáveis quantitativas contínuas: idade, anos de estudo, glicemia, IMC, horas de atividade física - Aferição. (V) Hipertensão X idade Se RC = 2,3, então podemos dizer que a proporção de pessoas hipertensas entre os idosos é 2,3 vezes mais do que entre os mais jovens. (F) A RC sempre será um número maior que um. A razão pode ser maior ou menor que um. Quando a razão de chances é maior do que 1, quer dizer que a o evento tem maior probabilidade de ocorrer no primeiro grupo, em relação ao segundo. Uma razão de chances menor do que 1 indica que a probabilidade é menor de ocorrer no primeiro grupo do que no segundo grupo. (V) Os gráficos que apenas se poderia fazer para Hipertensão X idade seria o de colunas e barras horizontais (V) Para a análise de Hipertensão X glicemia a variável desfecho será glicemia. (F) Os três objetivos da Estatística num trabalho científico são Organizar, Resumir e Sumariar (falsa, pois resumir e sumariar são sinônimos, o correto seria: organizar, sumariar e inferir). (V) o gráfico ideal para se apresentar nº casos de covid ao longo de dois meses será o de colunas ou barras horizontais. 2. Dê dois exemplos práticos para cada tipo de amostragem: a) Probabilística: Lista de clientes de uma empresa e conjunto de endereços de casas. b) não probabilística: Pesquisas eleitorais e produtos ou marcas novas no mercado 3. Seja a seguinte tabela: a) Quanto % não tem ansiedade? 81 - 100% 31 - X% X ≅ 38,3% (APROXIMADAMENTE 38,3% DOS INDIVÍDUOS NÃO APRESENTAM ANSIEDADE) b) Quanto % dos executivos não estão ansiosos? 54 - 100% 24 - X% X ≅ 44,4 (APROXIMADAMENTE 44,4% DOS EXECUTIVOS NÃO ESTÃO ANSIOSOS) c) Quanto % dos ansiosos são da construção civil? 50 - 100% 20 - X% X = 40% ( 40% DOS INDIVÍDUOS ANSIOSOS SÃO DA CONSTRUÇÃO CIVIL) d) Quanto % não são ansiosos e não são executivos? 30 - 100% 7 - X% X ≅ 23,3% ( APROXIMADAMENTE 23,3% DOS INDIVÍDUOS NÃO SÃO ANSIOSOS, BEM COMO NÃO SÃO EXECUTIVOS) e) Calcule e interprete as RC e RP. RC = ad/bc = 20x24/30x7 ≅ 2,28. A chance de ter ansiedade dado que são da construção civil é 2,28 vezes mais as que são do executivo; RP=a/(a+b)/c/(c+d)=20/27 / 30/54 = 20/27 x 54/30 = 1080/810 ≅ 1,33 . A proporção de indivíduos da construção civil com ansiedade é 1,33 vezes mais dos que são da ocupação executiva. f) Supondo que a prevalência de ansiosos na população seja de 30%, o que dizer dessa doença nessa amostra? X/81=30% X=24,3≅24 Supondo que a prevalência de ansiosos na população seja de 30%, obteria-se, aproximadamente, cerca de 24 pessoas acometidas por essa doença. g) Analise a tabela em termos estatísticos e em termos “clínicos” Estatisticamente: É notória, após a análise estatística, que 61,7% dos trabalhadores entrevistados são acometidos pela doença em questão, no qual, constata-se, o fato de que ocorre uma maior prevalência da doença em indivíduos pertencentes à área da construção civil. Termos Clínicos: É possível constatar que a doença de ansiedade, de acordo com a tabela, ordinariamente, vem acometendo uma boa parte do grupo de estudo. Haja vista, mais de 50% (50 pessoas de 81) do grupo entrevistado sofrem com essa enfermidade. 4. Calcule a melhor medida para os oito valores de colesterol (Mg/dl) de cada grupo, : JUSTIFICANDO CADA RESPOSTA Grupo 1: 200 210 190 456 205 199 203 e 201 Grupo 2: 190 210 190 456 190 199 190 e 201 Grupo 3. 200 210 190 216 205 199 203 e 201 Grupo 1: A melhor medida nesse caso é a mediana, visto que existe um valor discrepante em relação aos outros. A mediana desse grupo é de 202. Grupo 2: A melhor medida seria a moda, pois o valor de 190 mg/dl se repete 4 vezes. Grupo 3: A melhor medida é a média. Em média, cada paciente deste grupo apresenta 203 mg/dl de colesterol. 5. Interprete as seguintes medidas para os níveis de glicemia (mg/dl): Média = 90: com a média em 90, podemos afirmar que, em média, o nível de glicemia dos pacientes é de 90 mg/dl Moda = 90: o valor glicêmico que mais se repete é o de 90 mg/dl Mediana = 90: significa que metade dos pacientes têm glicemia abaixo de 90 mg/dl DP = 10 se o desvio padrão foi de 10 mg/dl, significa que os níveis de glicemia variaram em torno +/- 10mg/dl. 6. Calcule o tamanho da amostra para os dados a seguir (P=49%, z=2 e erro relativo = 12%). JUSTIFIQUE O USO DE CADA FÓRMULA a) Num hospital são atendidos 48.000 pacientes/ano, e a coleta dos dados será em seis meses. 12 meses ---> 48.000 6 meses ---> N N = 24.000 No = z^2 * P * Q/ e^2 No = 4*49*51/ 144 No ≅ 69 5% de 24.000= 1200. No < 5% de N, logo N=No. Portanto N = 24.000. b) Num hospital são atendidos 48.000 pacientes/ano, e a coleta dos dados será em dois meses 12 meses ---> 48.000 2 meses ---> N N = 8.000 No = z^2 * P * Q/ e^2 No = 4*49*51/ 144 No ≅ 69 5% de 8.000= 400. No < 5% de N, logo N=No. Portanto N = 8.000. c) Num hospital são atendidos 600 pacientes/ano, e a coleta dos dados será em três meses 12 meses ---> 600 3 meses ---> N N = 150 N < 200, conclui-se, portanto, que o tamanho da amostra é igual a N. 150<200, logo N=150 7. Para os dados a seguir, faça uma tabela com título e as porcentagens; calcule e INTERPRETE a média e o desvio padrão. Durante o período de Março a Maio de 2021 a SMS do município X informou que houve 10 adolescentes fizeram cinco abortos; oito mulhres com idade entre 20 e 30 anos fizeram 10 abortos; e cinco mulheres entre 31 e 40 anos fizeram dois abortos. Média: 8,23 abortos Desvio padrão: 1,78dfv Idade Mulheres que tentaram abortar Abortos Até 20 anos 10 5 20 - 30 8 10 31 - 40 5 2 Fonte: S.M.S. do município 8. Sejam os seguintes pesos de 29 pacientes Coloque o total entre 25 e 35 e complete as duas frequências em branco Peso (kg) Nº(F) f % F% Ẋ.f 53 /--- 57 4 4 14 14 55*4=220 57 /--- 61 8 4 14 28 59*4=236 61 /--- 65 13 5 17 45 63*5=315 65 /--- 69 23 10 34 79 67*10=670 69 /--- 73 29 6 21 100 71*6=426 TOTAL - 29 100 - 1867 (Observação: interprete os resultados, excetuando os da letra b). a) Quanto % dos pacientes pesam acima ou igual a 64 kg (Fórmula) Pi = LI + [(n.i/100 – Fant )/f]xAC 64 = 61 + [(29.i/100 - 8)/5]x4 3 = [(0,29i - 8)/5]x4 3 = 1,16i - 32 / 5 15 = 1,16i - 32 1,16i = 32+15 1,16i = 47 i ≅ 40,5; i”= 100-40,5 = 59,5% LOGO, 59,5% DOS PACIENTES PESAM ACIMA DE 64Kg. b) Faça as colunas %, e F% NO GRÁFICO FOI REALIZADO A SOLICITAÇÃO DO ITEM c) Que peso tem acima dele 35% dos pacientes? (Fórmula) O PESO QUE ACIMA DELE TEM 35% DOS PACIENTES É PERCENTIL 65 (POIS, ABAIXO DO P65 TEM 65%,OU SEJA, TEM 35% ACIMA) P65 = 65% X 29 ≅ 19, LOGO, OS PACIENTES QUE TÊM PESO ACIMA DE 35%, SÃO DA SEGUINTE CLASSE: 65 /--- 69 P i = LI + [(n.i/100 – F ant )/f]xAC AC = 69-65 = 4 P65=65+[29 x 65/100-13)/10]x 4 d) Que peso tem abaixo dele 35% dos pacientes? O PESO QUE ABAIXO DELE TEM 35% DOS PACIENTES É PERCENTIL 35 (POIS, ACIMA DO P35 TEM 65%,OU SEJA, TEM 35% ABAIXO) P35 = 35% X 29 ≅ 10, LOGO, OS PACIENTES QUE TÊM PESO ABAIXO DE 35%, SÃO DA SEGUINTE CLASSE: 61 /--- 65 AC = 65-61 = 4 Pi = LI + [(n.i/100 – F ant )/f]xAC P35=61+[29 x 35/100-8)/5]x 4 e) Qual a média dos pesos? Ẋ=1867/29 = 64,3793 ≅ 64 f) Qual opeso que mais se repete? (sem fórmula) O PESO QUE MAIS SE REPETE ESTÁ INSERIDO NA SEGUINTE VARIAÇÃO: 65 /--- 69 HAJA VISTA, A SUA FREQUÊNCIA É A MAIOR. g) Qual o peso mediano? (sem fórmula) O PESO MEDIANO ESTÁ INSERIDO NA SEGUINTE VARIAÇÃO: 65 /--- 69 (29+1)/2 = 15 (PESO MEDIANO) h) Calcule P23, D9 e Q1 P23 23%X 29 = 6,67 ≅ 7, logo, a classe do P23 é 57-61 P23=57+[29 x 23/100-4)/4]x 4 D9=P9 9%X 29 = 2,61 ≅ 3, logo, a classe do D9 é 53-57 D9=53+[29 x 9/100-0)/4]x 4 Q1 (é o peso que abaixo dele tem 25% das pessoas) 25% de 29 = 14,75 ≅ 15, logo, a classe do Q1 é 65-69 Q1 = LI + [(n.i/4 – F ant )/f]xAC Q1 = 65 + [(29.1/4 – 13 )/10]x4 PARA O EXERCÍCIO 10 ARREDONDE AS MÉDIAS 10. Analise (estatisticamente e clinicamente) a) correlação e b) regressão linear entre glicemia e idade: Idade(ano): 24, 29 32, 65, 74, 60, 39, 48, 56, 49. Glicemia (mg/dl): 70, 75, 92, 150, 180, 120, 100, 115, 118, 117 Glicemia (Y) Idade (X) y = Y - média x = X - média y2 x2 x*y 70 24 y= 70 - 114 = -44 x= 24 - 48 = -24 1.936 576 1.056 75 29 y= 75 - 114 = -39 x= 29 - 48 = -19 1.521 361 741 92 32 y= 92 - 114 = -22 x= 32 - 48 = -16 484 256 352 150 65 y= 150 - 114 = 36 x= 65 - 48 = 17 1.296 289 612 180 74 y= 180 - 114 = 66 x= 74 - 48 = 26 4.356 676 1.716 120 60 y= 120 - 114 = 6 x= 60 - 48 = 12 36 144 72 100 39 y= 100 - 114 = -14 x= 39 - 48 = -9 196 81 126 115 48 y= 115 - 114 = 1 x= 48 - 48 = 0 1 0 0 118 56 y= 118 - 114 = 4 x= 56 - 48 = 8 16 64 32 117 49 y= 117 - 114 = 3 x= 49 - 48 = 1 9 1 3 1.137 476 --- --- 9.854 2.448 4.710 Méd Y= 1.137/10 = 113,7 Méd X= 476/10 = 47,6 r = 4.710 / 49,3 * 99,1 a) 0,7 < r < 1 = forte; correlação diretamente proporcional. Glicemia tem correlação forte e diretamente proporcional com a idade. b) Quanto maior for a idade, maior o nível de glicemia. Y = a + bX b = ∑xy / ∑x2 Y= a+b*X b= 4.710/ 2.448 = 1,9 a= 114 - 1,9 * 48 = 22,8 Y = 22,8 + 1,9x 11) Analise (estatisticamente e clinicamente) a correlação linear entre Nível de satisfação : 7, 8, 4, 10, 9, 8, 2, 8, 6, 3, 9, 7, 5, 1, 7 e 2 Nível de escolaridade: 3, 2, 8, 0, 1, 3, 10, 3, 5, 8, 0, 2, 6, 8, 4, e 9 Nível de Satisfação Escolaridade di di² 7 (9) 8 3 (7) 6 9-7=2 4 8 (12) 11 2 (4,5) 4 12-4,5=7,5 56,25 4 (5) 5 8 (13) 12 5-13=-8 64 10 (16) 16 0 (1,5) 1 16-1,5=14,5 210,25 9 (14,5) 14 1 (3) 3 14,5-3=11,5 132,25 8 (12) 12 3 (7) 7 12-7=5 25 2 (2,5)2 10 (16) 16 2,5-16=-13,5 182,25 8 (12) 13 3 (7) 8 12-7=5 25 6 (7) 7 5 (10) 10 7-10=-3 9 3 (4) 4 8 (13) 13 4-13=-9 81 9 (14,5) 15 0(1,5)2 14,5-1,5=13 169 7 (9) 9 2 (4,5) 5 9-4,5=4,5 20,25 5 (6) 6 6 (11) 11 6-11=-5 25 1 (1) 1 8 (13) 14 1-13=-12 144 7 (9) 10 4 (9) 9 9-9=0 0 2 (2,5) 3 9 (15) 15 2,5-15=-12,5 156,25 - - - ∑ di² = 1303,5 rs = 1- 6x1303,5/ 163-16 = 1 -7821/ 4096-16 = 1- 7821/ 4080 = 1 - 1,91 ≅ -0,91 ⇒ ESTATISTICAMENTE APRESENTA CORRELAÇÃO FORTE E INVERSAMENTE PROPORCIONAL ⇒ CLINICAMENTE QUANTO MAIOR O NÍVEL DE SATISFAÇÃO, MENOR SERÁ O GRAU DE ESCOLARIDADE. 12) Seja o seguinte objetivo: Analisar a percepção da auto imagem em adolescentes. Baseado no mesmo, indique os pares de variáveis, onde se deva empregar as medidas de associação: Qui-Quadrado: Par 1: Par 2: Coeficiente de correlação r de Pearson Par 1: Par 2: Coeficiente de correlação rs de Spearman Par 1: Par 2: 13) Os pesos de uma população tem distribuição normal com média 65kg e desvio padrão 7kg. Quanto % dos pacientes pesam: a) entre 56,9 e 73,2 kg? Transformando a sentença em Português para sentença Matemática: P(56,9≤X≤72,1),no qual, X são os pesos, X1 = 56,9 e X2 = 72,1; transformando X1 em Z1 e X2 em Z2 por meio da expressão Z = (X - µ)/σ: z1=(56,9- 65)/7 ≅ -1,15 e z2=(72,1-65)/7 ≅ 1,01. Então, a P(56,9≤ X≤ 72,1) = P(-1,15 ≤ Z ≤ 1,01) = P(0≤ Z ≤ -1,15) - P(0≤ Z ≤ 1,01) = 0,3749- 0,3438=0,0311=3,11% b) mais que 68,4kg? P(X ≥ 68,4) ⇒ z=(68,4- 65)/7≅ 0,48; P(Z ≥ 0,48) = P(0≤ Z ≤ 0,48) + P(Z ≥0) = 0,1844 + 0,5(metade da área) = 0,6844= 68,44% c) menos que 53,3 kg P(X≤ 53,3) ⇒ z=(53,3- 65)/7≅ -1,67; P(Z ≤ 1,67) = P(-1,67 ≤ Z ≤ 0) + P(Z ≤0) = 0,4525 + 0,5(metade da área) = 0,9525= 95,25% d) entre 51 e 61 kg? Transformando a sentença em Português para sentença Matemática: P(56,9≤X≤72,1),no qual, X são os pesos, X1 = 51 e X2 = 61; transformando X1 em Z1 e X2 em Z2 por meio da expressão Z = (X - µ)/σ: z1=(51- 65)/7 ≅ -2 e z2=(61-65)/7 ≅ -0,57. Então, a P(51≤ X≤ 61) = P(-2 ≤ Z ≤ -0,57) = P(0≤ Z ≤ -2) - P(0≤ Z ≤ -0,57) = 0,4772-0,2157=0,2615= 26,15% e) Qual o peso que abaixo dele tem 23,67% dos pacientes? Z = (X - µ)/σ ⇒ X = Z. σ + µ = -0,63*7+65 = 60,59 Kg · 23,67%=0,2367, NO QUAL, Z= 0,63 f) Qual o peso que abaixo dele tem 75,37% dos pacientes? Z = (X - µ)/σ ⇒ X = Z. σ + µ = 0,69*7+65 = 69,83 Kg · 75,37%=0,7537-0,5=0,2537, NO QUAL, Z= 0,69 g) Qual o peso que acima dele tem 30,5% dos pacientes? 100-30,5=69,5% Z = (X - µ)/σ ⇒ X = Z. σ + µ = 0,51*7+65 = 68,57 Kg · 69,5%=0,695-0,5=0,1950, NO QUAL, Z= 0,51 14) Cite as etapas para se estimar a média populacional µ de uma variável X (por ponto e por intervalo) Por ponto: É a própria média amostral. (Essa estimativa diz-se pontual, pois é somente a média de uma amostra). Por intervalo: Pr( Ȳ – z . σ√n ≤ µ ≤ Ȳ + z . σ√n ) Etapas para se calcular o IC para a média populacional µ: • Calcular o tamanho da amostra n e a média amostral Ȳ • Fixar uma Confiança C (geralmente C é fixado em 95%) e encontrar o valor de z (calcular a área C/2 e procurá-la na tabela). • Identificar média amostral de Y Ȳ e o desvio padrão da população σ e aplicar na fórmula Pr( Ȳ – z . σ√n ≤ µ ≤ Ȳ + z . σ√n ) Obs. Caso não se conheça o desvio da população σ, estima-se-o por meio do desvio padrão amostral (DP) e, se o tamanho da amostra for menor que 30, o IC será dado por: Pr( Ȳ – t.s/√n ≤ µ ≤ Ȳ + t.s/√n) = C Onde t é o valor da distribuição t de Student. Se N<30, então, o valor de t = valor de z 15) Cite as etapas para se estimar a proporção populacional P de uma variável X (por ponto e por intervalo) Por ponto: 1. Calcular “n”; 2. Encontrar o número x de pessoas com a característica a se estudar (ou a doença) nessa amostra; 3. Estimar a prevalência populacional da doença por ponto: p = x/n. A estimativa por ponto da prevalência populacional é a própria prevalência amostral p. Essa estimativa p não é confiável, pois, é baseada numa só amostra, e como existirão milhões de amostras, existirão, por conseguinte, milhões de prevalências. Por intervalo: 1. Calcular “n”; 2. Encontrar o número x de pessoas com a característica a se estudar (ou a doença) nessa amostra; 3. Estimar a prevalência populacional da doença por ponto: p = x/n. Essa estimação não é confiável, pois, existirão milhares (milhões) de amostras possíveis e, por conseguinte, milhões de prevalências p; 4. Fixar uma confiança C. Calcular o Intervalo de Confiança para P, dado por: Pr( p – z α/2 ≤ P ≤ p + z α/2 . ) = C Se n<30, usa-se t no lugar de z: Pr( p – t α/2 . ≤ P ≤ + t α/2 . ) = C 16) Com o objetivo de se estimar a média de colesterol de uma população de 100.000 hab, cujo desvio padrão era 25mg/dl, encontrou-se numa amostra de 125 média de 190mg/dl. Estime essa média, interpretando os resultados: a) por ponto. Justifique porque esta estimação não é confiável. Média =190 mg/dl. Em média cada pessoa tem 190mg/dl de colesterol. Não é confiável, pois, ela foi baseada numa única amostra, quando existirão milhares de amostras possíveis e, por conseguinte, milhares de médias. b) Por intervalo para uma confiança de 97,23%. Compare este resultado com o valor ideal recomendado. Se C= 97,23%, α =p=2,77% e α/2 ≅ 1,38%; z = 2,20 (tabela de distribuição normal). C/2 = 0,48615; logo, z=2,20 Pr( Ȳ – z . σ√n ≤ µ ≤ Ȳ + z . σ√n ) = C Pr( 190 – 2,20 . 25/√125 ≤ µ ≤ 190 + 2,20 .25/√125 ) = 0,9723 Pr( 185 ≤ µ ≤ 195 ) = 0,9723 IC 97,23%: [185; 195] Interpretação: Em 97,23% das vezesa média de colesterol da população estará entre 185 e 195 mg/dl. A população tem colesterol normal, haja vista, a faixa ideal é quando o mesmo encontra-se abaixo de 200 mg/dl. 17) Com o objetivo de se estimar a proporção de colesterol elevado de uma população de 100.000 hab, encontrou-se em uma amostra de 125 que 95 tinham colesterol normal. Estime a prevalência populacional da doença interpretando os resultados: a) por ponto. Justifique porque está estimação não é confiável. p=30/125=24% Essa estimação não é confiável, uma vez que ela foi calculada com apenas uma amostra e, como existirão milhares de amostras, existirão milhares de proporções amostrais p. Assim sendo, a melhor estimativa para a proporção populacional P é a feita por meio de um Intervalo de Confiança (IC), pois, o IC leva em consideração todas as proporções amostrais. b) Por intervalo para uma confiança de 85,9%. Se C85,9%, α=14,1% e α/2 ≅ 7,05%; Z = 1,47 (tabela de distribuição normal). C/2 = 0,4295; logo, z=1,47 p=30/125=24% p+q=100%; q=100- p q=100 - 24 = 76% pr={ p-z(α/2)⋅√pq/n ≤ P ≤ p+z(α/2)⋅√pq/n } 85,9%={ 24 - 1,47⋅√24x76/125 ≤ P ≤ 24 +1,47⋅√24x76/125} 85,9%= { 24-5,6 ≤ P ≤ 24 +5,6} 85,9%={ 18,4 ≤ P ≤ 29,6} IC85,9%: [18,4%; 29,6%]. ⇒ Interpretação: em 85,9% das vezes a prevalência de indivíduos com colesterol alto na população estará entre 18,4 e 29,6%. 18) Resolva o exercício 4, para uma amostra de apenas 19, sabendo que o desvio padrão da amostra era 20mg/dl e t5% = 2,01 Pr( Ȳ – z . σ√n ≤ µ ≤ Ȳ + z . σ√n ) = C (125 – 2,01x20/4,35 < µ< 125 + 2,01x20/4,35 ) = 0,95 (125 – 40,2 / 4,35 < µ< 125 + 40,2 / 4,35) = 0,95 (125 – 9,24 < µ< 125 + 9,24) = 0,95 (115,76 < µ< 134,24) = 0,95 19) Resolva o exercício 5, para uma amostra de apenas 19, sabendo que t5% = 2,01
Compartilhar