Baixe o app para aproveitar ainda mais
Prévia do material em texto
Lista geral 1 – Bioestatística Responda CERTO ou ERRADO, justificando sua resposta Suponha 2 amostras colhidas de uma mesma população, sendo uma de tamanho 100 e outra de tamanho 80. Então a amostra maior representa melhor a população. Duas variáveis diferentes podem apresentar histogramas idênticos. Duas variáveis com Boxplot iguais não podem ter valores diferentes. (a) ERRADO. Nem sempre uma amostra maior irá representar melhor a população. Depende de como essa amostra for coletada. Se as duas amostras forem coletadas com o mesmo cuidado usando o método de amostragem mais adequado, ou sim a maior representará tão bem ou melhor que a menor. (b) CERTO. Se as duas variáveis em questão forem tão correlacionadas que suas frequências sejam as mesmas. (c) ERRADO. Duas variáveis com boxplot’s iguais podem ter valores diferentes, bastando pra isso este valor diferente não influenciar o cálculo dos quartis (1º, 3º e mediana) e nem os valores mínimo e máximo do conjunto de dados. 2) Quinze pacientes de uma clínica de ortopedia foram entrevistados quanto ao número de meses previstos de fisioterapia, se haverá (S) ou não (N) sequelas após o tratamento e o grau de complexidade da cirurgia realizada: alto(A), médio(M) ou baixo(B). Os dados são apresentados abaixo: Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Fisioterapia 7 8 5 6 4 5 7 7 6 8 6 5 5 4 5 Sequelas S S N N N S S N N S S N S N N Cirurgia A M A M M B A M B M B B M M A No conjunto de dados, cada observação é um paciente, e cada variável é um atributo do caso do paciente ( tempo de fisioterapia, presença de sequelas e grau de complexidade da cirurgia). Classifique cada variável em nominal, ordinal ou cardinal Construa uma tabela de frequências absoluta e relativa para cada variável Faça um gráfico de barras com a frequência absoluta para cada variável e um gráfico de setores com a frequência relativa para cada variável. Para o grupo de pacientes que não ficaram com sequelas, faça um gráfico de barras para variável tempo de fisioterapia. Faça também um gráfico de barras para a variável (tempo de fisioterapia) para o grupo que ficou com sequelas. Você acha que essa variável se comporta de modo diferente comparando os gráficos dos dois grupos e o gráfico do conjunto total construído no item c? Interprete o resultado Repita o procedimento do item d mas desta vez com a variável Grau de Complexidade da cirurgia, fazendo os gráficos separados para cada grupo que ficou com sequelas e para o grupo que não ficou com sequelas. Compare os resultados com o grupo total. Calcule a moda, média, mediana, 1º e 3º quartis da variável tempo de fisioterapia. Construa um boxplot da variável tempo de fisioterapia com base nos resultados do item anterior Fisioterapia → Cardinal Sequelas → Nominal Cirurgia → Ordinal Número de pacientes previstos para fisioterapia de 15 pacientes de uma clínica ortopédica após tratamento. Nº de meses Freq. Absoluta Freq. Abs. Acum. Freq. Relativa Freq. Rel. Acum. Xi fi 4 2 2 13,3% 13,3% 8 5 5 7 33,4% 46,7% 25 6 3 10 20,0% 66,7% 18 7 3 13 20,0% 86,7% 21 8 2 15 13,3% 100,0% 16 Total 15 - 100,0% - 88 Presença de sequelas em 15 pacientes de uma clínica ortopédica após tratamento Presença de seq. Freq. Abs Freq. Abs. Acum. Freq. Rel. Freq. Rel. Acum. Sim 7 7 46,7 46,7 Não 8 15 53,3 100,0 Total 15 - 100,0 - Grau de Complexidade da cirurgia realizada em 15 pacientes de uma clínica ortopédica GCR Freq. Abs. Freq. Abs. Acum. Freq. Rel. Freq. Rel. Acum. Baixo 4 4 26,7% 26,7% Médio 7 11 46,6% 73,3% Alto 4 15 26,7% 100,0% Total 15 - 100,0% - GCR = grau de complexidade da cirurgia Meses de Fisioterapia e tratamento(pizza) Presença de sequelas e tratamento(pizza) Grau de complexidade da cirurgia.... ortopédica Paciente 3 4 5 8 9 12 14 15 Fisioterapia 5 6 4 7 6 5 4 5 Sequelas N N N N N N N N Cirurgia A M M M B B M A De maneira geral, em ambos os gráficos a variável ( meses de fisioterapia) se comporta de maneira semelhante, o que indica a pouca influência nesta variável (fisioterapia) quando o paciente não tem sequelas, já para os pacientes com sequelas, podemos perceber que temos mais pacientes fazendo poucos meses de fisioterapia ou muitos meses. O fato de ter ou não sequelas não é influenciado pelo grau de Complexidade da cirurgia para estes pacientes. Moda (x)= 5 ; Med(x) = 6 3) Um estudo pretende verificar se o problema de desnutrição ( medida pelo peso em quilos das pessoas) em uma região agrícola ( derrotada por região A) é maior do que em uma região industrial ( região B). Para tanto, uma amostra foi tomada em cada região, fornecendo as tabelas de frequência a seguir: Região A: Peso Freq. 30 |−40 46 40 |−50 22 50 |−60 18 60 |−70 12 70 |−80 9 Total 107 Região B: Peso Freq 50 |−60 10 60 |−70 34 70 |−80 109 80 |−90 111 90 |−100 55 Total 319 Calcule a média para cada região Os dados apresentados sugerem que o grau de desnutrição é diferente nas duas regiões? Neste caso, qual região teria grau de desnutrição maior? (Note que o total de observações difere em cada região) Construa a partir dos dados das tabelas um histograma para cada região Complete as tabelas a cima com as frequências relativa e relativa acumulada e, diga a classe da qual pertence a mediana, o 1º e o 3º quartis do peso para cada região. OBS: Lembre-se que a mediana pertence a classe onde está a frequência relativa acumulada de 50%, o 1º quartil onde está a frequência relativa acumulada de 25% e o 3 º Quartil onde está a frequência relativa acumulada de 75%. Considerando que, para a região A, os valores de mediana, 1º e 3º quartis são, respectivamente, 43,41; 35,81 e 56,81; e para a região B, são, respectivamente, 80,6; 73,28 e 87,78, construa o Boxplot um para cada região. Com base nas representações gráficas dos itens (c) e (e), rediscuta o item (b). a) Região A: Região B: Sim, as tabelas sugerem um grau de desnutrição maior na região A. Resultado provado calculando a média de peso em cada Região (Região A tem média menor, logo nível de desnutrição maior). Letra c e letra d ) Os gráficos dos itens (c) e (e) apenas reforçam a conclusão obtida em (b), que realmente na Região A se concentram maior nº de desnutridos. Visivelmente existe uma maioria da população com baixo peso na região A. 4) O posto de saúde de um certo bairro mantém um arquivo com o nº de crianças em cada família que se utilizam do posto: 1,3,3,2,5,4,2,4,10,5,4,3,1,3,4,5,6,11,5,4,5,3,2,5,1,3,5,3,3 e 6. Quantas famílias tem o conjunto de dados, isto é, qual o tamanho da amostra? Apresente os dados numa tabela de Freq. Incluindo a frequência relativa e as acumuladas(Abs e Rel) Calcule a média, moda, mediana, 1º e 3º Quartis. Calcule a variância(S*), o desvio padrão (S), a diferença interquartil(DIQ) e o coef de variação(CV). Construa o boxplot desde conjunto de dados. Pareceu ter havido valores discrepantes no conjunto de dados, verifique este fato usando os 2 critérios de identificação de outliers, apresentados em aula. Refaça os itens (b) até (e) retirando os outliers encontrados no 2º Critério usado no item (f) e comente as diferenças encontradas. 30 famílias Letras e , f
Compartilhar