Baixe o app para aproveitar ainda mais
Prévia do material em texto
1ª LISTA DE EXERCÍCIOS Estatística – Eng. Ambiental e Sanitária Estatística Descritiva Profa: Michelle Borges Aluno: Wanderson Matheus Silva de Miranda Turma: Eng. Amb. Sanitária 2021 - Manhã 1. Classifique as variáveis (qualitativa nominal, qualitativa ordinal, quantitativa discreta, quantitativa contínua): - Qualitativa nominal quando a resposta em palavra não segue uma ordenação. - Qualitativa Ordinal quando a resposta em palavra segue uma ordenação - Quantitativa Discreta quando é um número natural, não fracionado. - Quantitativa Contínua quando passa a idéia de variação, continuidade, podendo ser números reais, fracionados. a) Qualitativa Nominal b) Quantitativa Contínua c) Qualitativa Ordinal d) Qualitativa Ordinal e) Qualitativa Nominal f) Qualitativa Ordinal g) Qualitativa Nominal h) Quantitativa Discreta i) Quantitativa Contínua j) Quantitativa Contínua k) Qualitativa Nominal 2. Os dados abaixo referem-se ao número de pessoas que residem em uma amostra de 35 domicílios do bairro Esperança no 1°sem/99: 2 3 4 4 5 3 4 Construa uma distribuição de frequência em classes. 5 6 5 3 1 5 5 1° Organizar os valores em ROL para facilitar a análise 1 3 4 5 5 5 3 2° Encontrar a Amplitude Total = máx - mín (Valor nos dados) 2 2 5 4 4 2 3 3° Encontrar o N° de Intervalos/classes pode ser utilizada a Regra 5 4 5 4 2 4 9 de Sturges → K= Onde N é o número de dados.1 + 3, 3 𝑙𝑜𝑔𝑁 4° Encontrar a Amplitude do Intervalo utilizando 𝐴𝐼 = 𝐴𝑀𝑃. 𝑇𝑂𝑇𝐴𝐿𝑁° 𝐷𝐸 𝐼𝑁𝑇𝐸𝑅𝑉𝐴𝐿𝑂𝑆 RESPOSTA: N° de Dados N° de Intervalos Amplitude Total Amplitude do Intervalo 35 6 8 Apx 1,3 → 2 N° pessoas Domicílios [1,2[ 2 [2,4[ 11 [4,6[ 20 [6,8[ 1 [8,10[ 1 [10,12[ 0 Total 35 3. Os dados seguintes são referentes ao nível de glicose de 60 crianças. 56 61 57 77 62 75 63 55 64 60 | a) Construa uma distribuição de freqüência 60 57 61 57 67 62 69 67 68 59 | b) Determine as frequências simples acumuladas. 65 72 65 61 68 73 65 62 75 80 | de cada classe 66 61 69 76 72 57 75 68 83 64 | c) Determine as frequências relativas de cada classe. 69 64 66 74 65 76 65 58 65 64 | d) Determine as frequências relativas acumuladas 65 60 65 80 66 80 68 55 66 71 | de cada classe. RESPOSTA: N° de Dados N° de Intervalos Amplitude Total Amplitude do Intervalo 60 1 + 3, 3𝑙𝑜𝑔60 ≈ 7 83 − 55 = 28 28 7 = 4 Nível de Glicose N° de Crianças Fi. Acumulada freq. relativa Fr. Acumulada 55 ├ 59 8 8 13,33% 13,33% 59 ├ 63 11 19 18,33% 31,67% 63 ├ 67 17 36 28,33% 60,00% 67 ├ 71 9 45 15,00% 75,00% 71 ├ 75 5 50 8,33% 83,33% 75 ├ 79 6 56 10,00% 93,33% 79 ├ 83 4 60 6,67% 100,00% TOTAL ( ) 60 100,00% 4. Os dados a seguir referem-se ao tempo, em horas, que 80 pacientes hospitalizados dormiram durante a administração de certo anestésico: a) Encontre a frequência relativa de cada classe. b) Determine a frequência acumulada de cada classe. c) Determine o ponto médio de cada classe. d) Dê a interpretação para a frequência relativa de 3a classe. e) Qual o percentual de pacientes que dormiram menos de 12 horas? RESPOSTA: Tempo (horas) N° de pacientes Fi. Acumulada freq. relativa Ponto Médio 0 ├ 4 8 8 10,00% 2,0 4 ├ 8 15 23 18,75% 6,0 8 ├ 12 24 47 30,00% 10,0 12 ├ 16 20 67 25,00% 14,0 16 ├ 20 13 80 16,25% 18,0 d) A Frequência relativa da terceira classe mostra que 30% do total de 80 pacientes dormiram em média 10 horas durante a administração do anestésico. e) A 1°, 2° e 3° classes representam o número de pacientes que dormiram menos de 12 horas, totalizando o percentual de 58,75% do total de pessoas medicadas com o anestésico. 5. Uma amostra de gaúchos foi investigada em relação ao consumo de sal diário, obtendo-se o seguinte: Determine e interprete o consumo médio, o consumo modal e o consumo mediano. Consumo Médio - O consumo médio é de 11g de sal por dia. Pois é o valor resultante do total em g de sal dividido pelo número de consumidores na amostra. Consumo Modal - O consumo modal é de 13g de sal, logo, é a quantidade de consumo que mais se repete nas respostas. Consumo Mediano - O consumo mediano é de 10,5g de sal, já que é o valor encontrado exatamente no meio(centro) dos dados quando colocados em ROL. 6. Os resultados baseados em uma escala de ansiedade para uma amostra de nove sujeitos são: 67 75 63 72 77 78 81 77 80 Determine as medidas de tendência central (média, moda, mediana) e interprete cada uma. Média - 𝑆𝑜𝑚𝑎 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑖𝑣𝑖𝑑𝑖𝑑𝑜 𝑝𝑒𝑙𝑜 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑑𝑜𝑠 (67 + 75 + 63 + 72 + 77 + 78 + 81 + 77 + 80)/ 9 = 74, 44444444 Representa o resultado médio entre os valores obtidos como respostas na amostra. Moda - É 𝑜 𝑣𝑎𝑙𝑜𝑟 𝑞𝑢𝑒 𝑚𝑎𝑖𝑠 𝑠𝑒 𝑟𝑒𝑝𝑒𝑡𝑒 𝑛𝑎𝑠 𝑟𝑒𝑠𝑝𝑜𝑠𝑡𝑎𝑠 77 Representa o valor que mais se repetiu nos resultados obtidos na amostra, traz a ideia de padrão ao analisar os resultados. Mediana - É 𝑜 𝑣𝑎𝑙𝑜𝑟 𝑞𝑢𝑒 𝑒𝑠𝑡á 𝑛𝑜 𝑐𝑒𝑛𝑡𝑟𝑜 𝑑𝑜𝑠 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑜𝑏𝑡𝑖𝑑𝑜𝑠 𝑞𝑢𝑎𝑛𝑑𝑜 𝑜𝑟𝑔𝑎𝑛𝑖𝑧𝑎𝑑𝑜𝑠 𝑒𝑚 𝑅𝑂𝐿 77 Representa o valor que ficou no meio das respostas quando analisados em ROL, com a mesma quantidade de distância entre o menor resultado e o maior. 7. A incidência de doenças infecto-contagiosas no Est.de S.Paulo, 1974, é apresentado a seguir. Que medida estatística (média, moda, mediana) você usaria para descrever esta tabela? Justifique adequadamente sua resposta, levando em conta a classificação da variável. Média - Logo, a média do92000 / 5 = 18400 número de casos representa 20% do valor total, usado para interpretar a tabela. Moda - O conjunto de dados é amodal pois não apresenta repetição de valores nos resultados. Mediana - A mediana é 19000, número de casos da doença tuberculose. Logo, podemos interpretar que registrou-se no estado de São Paulo, em 1974, que 20% do total já havia tido alguma das 5 doenças citadas na pesquisa, quase o mesmo número de pessoas que têm ou já tiveram tuberculose. Variável Quantitativa Discreta. 8. As crianças vacinadas pela vacina Sabin em certo ambulatório foram registradas na tabela abaixo de acordo com a idade. Determine as medidas de tendência central (média, moda e mediana) e dê as interpretações respectivas: Medidas de tendência central Média - Realiza-se a multiplicação das respostas pela frequência absoluta (o número de vezes que a resposta se repete) para então somar e dividir pelo número total de valores. Σ(𝑖𝑑𝑎𝑑𝑒 * 𝑛° 𝑑𝑒 𝑐𝑟𝑖𝑎𝑛ç𝑎𝑠)/𝑛° 𝑑𝑒 𝑑𝑎𝑑𝑜𝑠 501/160 = 3, 13 Moda - Observa-se na frequência o valor que mais se repete. Na questão em foco percebe-se que a idade de 3 anos foi a que mais vacinou, sendo 50 crianças, logo, esta será a moda. Mediana - Necessário verificar o valor que está na posição central dos dados organizados em ROL, a frequência acumulada pode ser utilizada para identificar a posição de cada valor na tabela, e para encontrar o valor central basta dividir o n° total de valores por 2. 160/2 = 80 Idade N° de crianças Fi acumulada Posição 0 12 12 1 - 12 1 13 25 13 - 25 2 22 47 26 - 47 3 50 97 48 - 97* 4 31 128 98 - 128 5 22 150 129 - 150 6 10 160 151 - 160 Total 160 *A posição 80 está entre a 48° e a 97° que corresponde a crianças de 3 anos de idade, como o valor total de dados (160) é par, faz se a média aritmética do valor central e seu valor sucessor. 3+3 3 = 3, 𝐿𝑜𝑔𝑜 𝑎 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 𝑠𝑒𝑟á 3 Mais de 30% das crianças vacinadas tinham 03 anos de idade. 9. Um grupo de adolescentes foi entrevistado sobre o número de vezes que utilizaram droga injetável. Os resultados foram: a) Qual o valor da moda desta informação? O que ela nos informa? b) Qual é a mediana? O que ela significa? c) Determine a média. Interprete. N° de vezes que usaram drogas N° de adolescentes Fi acumulada Posição 0 47 47 1 - 47 1 2976 48 - 76* 2 13 89 77 - 89 3 8 97 90 - 97 Total 97 Média Mediana Moda 0,8144329897 1 0 É o valor representativo do número de vezes que os adolescentes da pesquisa usaram drogas. No centro dos resultados concentraram-se os adolescentes que usaram drogas ao menos uma vez. Mostra que quase 50% dos adolescentes da pesquisa nunca usaram drogas. 10. Maiores exportadores de carne suína (mil t), em 2001: a) A tabela é identificada como dados agrupados ou não agrupados? Resposta: Os dados apresentam-se como não agrupados, pois aparecem individualmente na frequência e não em classes. b) Utilize as medidas de tendência central para descrever os dados. Média - 590,5 mil toneladas. Mediana - o valor central foi 619 mil toneladas. Moda - Amodal pois não há repetição de dados. 11. Um levantamento realizado em uma amostra de pessoas normais, segundo a quantidade de hemoglobina ( g/ 100 ml) existente no sangue forneceu os seguintes resultados: 13,5 12,5 10,6 15,1 11,7 12,9 12,8 9,4 14,9 12,0 Calcule o desvio padrão e o coeficiente de variação. Variância 𝑉 = (𝑥1−𝑥) 2 +(𝑥2−𝑥) 2 + . . . +(𝑥𝑛−𝑥) 2 𝑛 , 𝑥 = 𝑚é𝑑𝑖𝑎 Logo, temos a variância: 2,7864. Para encontrar o Desvio Padrão basta obter a raiz quadrada da variância. então ,𝐷𝑝 = 𝑉 , 𝐷𝑒𝑠𝑣𝑖𝑜 𝑃𝑎𝑑𝑟ã𝑜 = 2, 7864 Desvio Padrão = 1,669251329 Agora podemos encontrar o coeficiente de variação. 𝐶𝑣 = (𝐷𝑝/𝑀é𝑑𝑖𝑎) * 100 Coeficiente de variação = 13,31% 12. Os dados seguintes são referentes a uma amostra de diâmetros de coração de adultos normais, em mm (medidas em radiografias 36 x 43 cm): 146 125 139 132 121 135 114 114 130 169 114 130 169 125 103 a) Determine a média, a moda e a mediana. b) Calcule a variância e o desvio padrão. Resposta Média Mediana Moda Variância Desvio Padrão 131,0666667 130 114 334,5955556 18,2919533 13. Um farmacêutico comprou um material específico de dois diferentes fornecedores. Para comparar o nível de impurezas presentes nas compras feitas aos dois fornecedores, o farmacêutico mediu a porcentagem de impurezas presentes em cada um dos grupos, obtendo o que segue: Fornecedor A: 1,8 2,5 1,5 1,2 1,0 Fornecedor B: 1,6 2,5 1,2 2,3 1,5 Qual das compras apresenta maior uniformidade nas impurezas? Justifique adequadamente. FORNECEDOR Média Desvio Padrão Coeficiente de Variação A 1,6 0,5253570215 32,83% B 1,82 0,4955804677 27,23% De acordo com os resultados obtidos pode-se perceber o menor desvio padrão no material do fornecedor B, comprovando a maior uniformidade das impurezas. Vale ressaltar o menor coeficiente de variação também apontando a maior uniformidade na amostra do fornecedor B. 14. A tabela abaixo indica a idade de uma amostra de pacientes com hipertensão arterial: a) Determine e interprete a idade média. b) Determine interprete a idade modal. c) Calcule o desvio padrão da idade. d) Qual o percentual de pacientes hipertensos com no mínimo 50 anos? e) Qual o percentual de pacientes hipertensos com menos de 40 anos? Idade (anos) n° de pacientes Ponto Médio Xm*fi |med-xm| Desvio Fr 20 ├ 30 2 25 50 22,5 5,00% 30 ├ 40 11 35 385 12,5 27,50% 40 ├ 50 10 45 450 2,5 25,00% 50 ├ 60 9 55 495 7,5 22,50% 60 ├ 70 8 65 520 17,5 20,00% Total 40 1900 100,00% Idade Média Idade Modal Desvio padrão Coeficiente deVariação % hipertensos menos de 40 anos % hipertensos mínimo de 50 anos 47,5 39 11,98957881 25,24% 32,50% 42,50% A média de idade dos pacientes é de 47,5 anos. a Moda representa o maior número de pessoas com a mesma idade, 39 anos. 15. Número de vezes que 35 indivíduos com lombalgia procuram o serviço de fisioterapia. Calcule o desvio padrão da amostra. No de vezes: 0 1 2 3 4 5 No de pessoas: 18 10 3 2 1 1 n° de vezes n° de pessoas xi(fi) (|xm-xi|^2)*fi 0 18 0 14,12081633 1 10 10 0,1306122449 2 3 6 3,724897959 3 2 6 8,940408163 4 1 4 9,69877551 5 1 5 16,92734694 total 35 31 53,54285714 Média Desvio Padrão Variância 0,8857142857 1,23684919 1,529795918 16. O Hospital de Clínicas de Porto Alegre realizou um estudo sobre Síndrome de Down: características clínicas, perfil epidemiológico e citogenético em recém-nascidos. Foi realizado um rastreamento em todos os nascidos com peso acima de 500 gramas no HCPA entre junho de 1988 e março de 1995, sendo anotado a idade das mães de crianças com Síndrome de Down no grupo de caso e a idade das mães de crianças normais no grupo de controle. Com base nas informações dadas abaixo, qual das amostras de mães é mais homogênea em relação à idade? Justifique a resposta. Casos Controle Média 31,67 anos 26 anos Desvio Padrão 7,08 anos 5,08 anos Variância 60,84 33,64 Média 31,67 26 Coef. Variação 22,36% 19,54% Logo, com base no coeficiente de variação e desvio padrão, pode-se constatar que a com a menor variância temos maior homogeneidade dos resultados em relação a idade. A amostra das mães de crianças “normais” é mais homogênea. 17. O gráfico a seguir apresenta a taxa de desemprego em % da população economicamente ativa no período de 1982 a 1997: a) Classifique a variável de interesse. b) Qual a moda da variável? c) Determine e interprete a média. d) Determine e interprete a mediana. A variável de interesse é quantitativa contínua, pois apresenta característica de continuidade e pode ser mensurada. A moda é a taxa de desemprego de 4,4% que aparece nos anos 1993 e 1995. A média mostra que durante os nove anos a taxa média de desemprego no país foi de 3,95%. A mediana é o valor central nos resultados e foi a taxa de 4,1% 18. O gráfico a seguir expressa o número de animais doentes encontrados num levantamento de 350 propriedades rurais em MG, 1998: a) Classifique a variável. b) Quantas propriedades apresentaram no máximo dois animais doentes? c) Qual é o percentual de propriedades que apresentaram somente um animal doente? d) Qual é o percentual de propriedades que apresentaram pelo menos um animal doente? e) Qual foi a moda? f) Determine a mediana A variável de interesse é quantitativa discreta, pois só admite números naturais, valores inteiros. 172 propriedades apresentaram no máximo 2 animais doentes, no mínimo 1 animal doente. 17,14%, 60 propriedades apresentaram apenas 1 animal doente. 84,25% das propriedades apresentaram pelo menos 1 animal doente. A moda foi 2, pois foi o resultado que mais se repetiu, na maioria das propriedades havia dois animais doentes. A mediana foi 2, pois foi o valor central. 19. Foram obtidos os tempos (em segundos) decorridos entre a formulação de um pedido e a entrega de um determinado sanduíche em uma lanchonete McDonalds. 135 90 85 121 83 69 159 177 120 133 90 80 70 93 80 110 Calcule média, mediana, moda, desvio padrão e coeficiente de variação. Interprete os resultados e comente sobre como está sendo o atendimento nesta loja. Média Mediana Moda Desvio Padrão Coef. de Variação 105,9375 91,5 Bimodal 80 e 90 31,15 29,40% Considerando que a pesquisa utilizou segundos para a contagem do tempo, houve grande disparidade no tempo de pedido e entrega dos lanches, como mostra o coeficiente de variação de 29,40%. A média indica que o tempo de espera é de, em média, aproximadamente 106 segundos. 20. Em um Haras, verificou-se a taxa de protrombina no plasma de cavalos. Com base nos resultados apresentados a seguir, construa um histograma e veja o que ele sugere em relação à taxa de protrombina. Calcule e interprete as seguintes medidas: Média, Mediana, Moda, Desvio Padrão, Coeficiente de Variação, variância, erro padrão da média. A média é 35,5, sendo a taxa de representatividade da tabela. A moda é 22,2 sendo o resultado com maior frequência. A Mediana representa o valor central nos resultados, é 28,7. O desvio padrão é 18,14, representa o distanciamento médio dos resultados em relação à média. O coeficiente de variação é de 51,09% e mostra que houve grande distanciamento em relação à média. A variância foi 329. O erro padrão da média foi 2,57. 21) Foram obtidas em uma determinada empresa, a idade dos carros deprofissionais do Haras Cavalo de Ouro, com nível médio e profissionais com nível superior. Determine média, Mediana, Moda, Desvio Padrão, Coeficiente de Variação, variância, erro padrão da média. Comparando as duas amostras, elas apresentam a mesma variabilidade? Idade (anos) Nível Médio Nível Superior Ponto médio 0 - 2 23 35 1 3 - 5 33 57 4 6 - 8 63 41 7 9 - 11 68 10 10 12 - 14 19 8 13 15 -17 10 0 16 18 - 20 1 1 19 21 - 23 0 0 22 Total 217 152 1° Nível Padrão Erro padrão Variância média 0,2621298995 14,91052227 7,843317972 Coef de Variação Desvio Padrão Moda 49,23% 3,861414543 9,185185185 Mediana 7,666666667 2° Nível Profissional Erro padrão Variância média 0,2751697215 11,5091931 5,085526316 Mediana Desvio Padrão Moda 4,438596491 3,392520169 4,157894737 Coef de Variação 66,71% Portanto pode-se constatar que a não possuem a mesma variabilidade,com diferenças na variância e nos coeficientes de variação, com resultados aproximadamente similares no desvio e erro padrão.
Compartilhar