Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade de Bras´ılia Departamento de Estat´ıstica Lista de exerc´ıcios 1 Bioestat´ıstica - Turma A - 1o/2018 1. Classifique as seguintes varia´veis: a) Prefereˆncias pol´ıticas (esquerda, direita ou centro). b) Marcas de cerveja. c) Velocidade em hm/h. d) O peso em kg. e) Signo do zod´ıaco. f) Nı´vel educacional (prima´rio, secunda´rio, superior). g) Anos de estudos completos. h) Tipo de ensino (privado ou pu´blico). i) Nu´mero de empregados de uma empresa. j) A temperatura de um paciente em graus Celsius. k) A classe social (baixa, me´dia ou alta). l) A pressa˜o de um pneu em Nw/cm2. 2. Classifique as va´ria´veis que aparecem no seguinte questiona´rio: a. Qual sua idade? b. Qual o seu estado civil? I. Solteiro II. Casado III. Divorciado IV. Viu´vo c. Quanto tempo leva para voceˆ se locomover ao trabalho? d. Qual e´ o tamanho do munic´ıpio onde voceˆ reside? I. menos de 2.000 habitantes II. de 2.000 a 10.000 habitantes III. de 10.000 a 50.000 habitantes IV. de 50.000 a 100.000 habitantes V. mais de 100.000 habitantes e. Voceˆ e´ associado a` Prevideˆncia Social? 3. No seguinte conjunto de dados, sa˜o fornecidos os pesos (arredondados em quilos) de crianc¸as nascidas em certo intervalo de tempo: 1.8, 3.6, 1.8, 2.7, 3.6, 2.7, 3.2, 3.2, 3.2, 3.6, 4.5, 4.1, 3.2, 2.7, 4.5, 3.6, 2.3, 4.1, 2.7, 1.4, 3.2, 2.7, 1.8, 3.2, 2.7, 4.1, 3.2, 1.8, 3.2, 2.7, 3.6, 3.6, 4.1, 5.0, 3.6, 3.2, 4.5, 3.6, 2.3, 3.2, 3.2, 2.7, 2.3, 4.5, 3.6, 4.1, 3.2, 2.3, 2.7, 2.3. a) Construa uma dristribuic¸a˜o de frequeˆncia desses pesos. b) Encontre as frequeˆncias relativas, frequeˆncias acumuladas e frequeˆncias relativas acumuladas. c) Desenhe um histograma com os dados do item a). d) Por que se utilizou um histograma para representar tais dados em vez de um gra´fico de barras? e) Calcule as medidas de tendeˆncia central f) Calcule as medidas de dispersa˜o g) A distribuic¸a˜o e´ sime´trica? Caso na˜o seja, em que direc¸a˜o esta´ a assimetria? 4. Com a finalidade de observar a relac¸a˜o entre a inteligeˆncia e o n´ıvel socioeconoˆmico (medido pela renda mensal familiar), foram constitu´ıdos dois grupos, um formado com indiv´ıduos de quociente intelectual inferior a 95 e outro formado pelos demais. De cada indiv´ıduo, foi anotada a renda mensal familiar. Considere os resultados indicados na tabela: Nı´vel socioeconoˆmico Indiv´ıduos com CI < 95 Indiv´ıduos com CI ≥ 95 Intervalos Frequeˆncia Frequeˆncia 10 ou menos ≡ (4, 10] 75 19 10−| 16 35 26 16−| 22 20 25 22−| 28 30 30 28−| 34 25 54 mais de 34 ≡ (34, 40] 15 46 a) Desenhe um gra´fico que permita comparar ambos os grupos. b) Calcule as medidas de tendeˆncia central para cada grupo. c) Calcule as medidas de dispersa˜o para cada grupo. d) Fac¸a uma ana´lise comparativa entre os dois grupos. 5. Um estudo consistiu em anotar o nu´mero de palavras lidas em 15 segundos por um grupo de 120 indiv´ıduos disle´xicos e por outro de 120 indiv´ıduos normais. Considerando os resultados da tabela: No de palavras lidas Disle´xicos nD Normais nN 25 ou menos ≡ 25 56 1 26 24 9 27 16 21 28 12 29 29 10 28 30 ou mais ≡ 30 2 32 a) Calcule as me´dias aritme´ticas de ambos os grupos. b) Calcule as medianas de ambos os grupos. c) Calcule as medidas de dispersa˜o para cada grupo. d) Fac¸a uma ana´lise comparativa entre os dois grupos. 6. A tabela seguinte mostra a composic¸a˜o por idade, sexo e trabalho de um grupo de pessoas com tuberculose pulmonar na prov´ıncia de Viscaya no ano de 1979: Idade Trabalhadores Na˜o-trabalhadores Totais Homem Mulher Total Homem Mulher Total Homem Mulher Total 14 |− 19 2 1 3 25 40 65 27 41 68 19 |− 24 10 4 14 20 36 56 30 40 70 24 |− 29 32 10 42 15 50 65 47 60 107 29 |− 34 47 12 59 13 34 47 60 46 106 34 |− 39 38 8 46 10 25 35 48 33 81 39 |− 44 22 4 26 7 18 25 29 22 51 a) Represente graficamente a distribuic¸a˜o de frequeˆncias daquelas pessoas trabalha- doras que padecem de tuberculose. b) Represente graficamente a distribuic¸a˜o de frequeˆncias dos homens na˜o-trabalhadores que padecem de tuberculose. c) Represente graficamente a distribuic¸a˜o de frequeˆncias do nu´mero total de mulheres que padecem de tuberculose. d) Qual e´ a idade em que se observa, com maior frequeˆncia, que os homens na˜o trabalham? E as mulheres? Determine tambe´m a idade mais frequente (sem distinc¸a˜o de sexo e ocupac¸a˜o). e) Abaixo de que idade esta˜o 50% dos homens? f) Acima de que idade esta˜o os 80% das mulheres? g) Obtenha a me´dia, mediana e o desvio padra˜o da distribuic¸a˜o das idades da amostra total. h) Estude a assimetria das treˆs distribuic¸o˜es. 7. Durante uma epidemia de escarlatina, recolheu-se um certo nu´mero de mortos em 40 cidades de um pa´ıs, obtendo-se a seguinte tabela: No de mortos 0 1 2 3 4 5 6 7 Cidades 7 11 10 7 1 2 1 1 a) Represente graficamente esses dados. b) Obtenha a distribuic¸a˜o acumulada e represente-a. c) Calcule a me´dia, a mediana e a moda. d) Calcule a variaˆncia e o desvio padra˜o. e) Calcule a porcentagem de cidades com, pelo menos, 2 mortos. f) Calcule a porcentagem de cidades com mais de 3 mortos. g) Calcule a porcentagem de cidades com, no ma´ximo, 5 mortos. 8. As taxas me´dias geome´tricas de incremento anual (por 100 habitantes) dos 30 maiores munic´ıpios do Brasil esta˜o listadas abaixo 3,67 1,82 3,73 4,10 4,30 1,28 8,14 2,43 4,17 5,36 3,96 6,54 5,84 7,35 3,63 2,93 2,82 8,45 5,28 5,41 7,77 4,65 1,88 2,12 4,26 2,78 5,54 0,90 5,09 4,07 a) Construa a distribuic¸a˜o de frequeˆncias com classes de amplitude de tamanho 2 comec¸ando em zero e terminando em 10. b) Fac¸a um histograma a partir de a). 9. Dispomos uma relac¸a˜o de 200 alugue´is de imo´veis urbanos e uma relac¸a˜o de 100 alugue´is de imo´veis rurais. Classes de aluguel (codificados) Zona Urbana Zona Rural 2|−3 10 30 3|−5 40 50 5|−7 80 15 7|−10 50 5 10|−15 20 0 Total 200 100 a) Construa o histograma das duas distribuic¸o˜es. b) Represente as distribuic¸o˜es em um mesmo gra´fico, utilizando pol´ıgonos de frequeˆncias. c) Com base nos itens acima, discuta e compare as distribuic¸o˜es. 10. O nu´mero de divo´rcios em uma cidade, de acordo com a durac¸a˜o do casamento, esta´ representado na tabela abaixo Anos de casamento No de divo´rcios 0|−6 2.800 6|−12 1.400 12|−18 600 18|−24 150 24|−30 50 a) Qual a durac¸a˜o me´dia dos casamentos? E a mediana b) Encontre a variaˆncia e desvio padra˜o dos casamentos. c) Construa o histograma da distribuic¸a˜o. d) Encontre o P25 e P75. e) A distribuic¸a˜o parece sime´trica? 11. O que acontece com a mediana, me´dia e o desvio padra˜o de uma se´rie de dados quando: a) Cada observac¸a˜o e´ multiplicada por 2. b) Soma-se 10 a cada observac¸a˜o. c) Subtrai-se a me´dia geral x¯ de cada observac¸a˜o. d) De cada observac¸a˜o subtrai-se a me´dia x¯ e divide-se o valor pelo desvio padra˜o dp(x). 12. Numa pesquisa sobre rotatividade da ma˜o de obra, para uma amostra de 40 pessoas foram observadas duas varia´veis: Nu´mero de empregos nos u´ltimos dois anos (X) e sala´rio mais recente, em nu´mero de sala´rios mı´nimos (Y ). Os resultados foram: Indiv´ıduo X Y Indiv´ıduo X Y 1 1 6 21 2 4 2 3 2 22 3 2 3 2 4 23 4 1 4 3 1 24 1 5 5 2 4 25 2 4 6 2 1 26 3 2 7 3 3 27 4 1 8 1 5 28 1 5 9 2 2 29 4 4 10 3 2 30 3 3 11 2 5 31 2 2 12 3 2 32 1 1 13 1 6 33 4 1 14 2 6 34 2 6 15 3 2 35 4 2 16 4 2 36 3 1 17 1 5 37 1 4 18 2 5 38 3 2 19 2 1 39 2 3 20 2 1 40 2 5 a) Usando a mediana, classifique os indiv´ıduos em dois n´ıveis, alto e baixo, para cada uma das varia´veis e construa a distribuic¸a˜o de frequeˆncias conjunta das duas classificac¸o˜es. b) Qual a porcentagem de pessoas com baixa rotatividade e ganhando pouco? c) Qual a porcentagem de pessoas que ganham pouco? d) Entre as pessoas com baixa rotatividade,qual a porcentagem das pessoas que ganham pouco? e) A informac¸a˜o de adicional dada em d) mudou muito em relac¸a˜o a porcentagem obtida em c)? O que isso significa? f) Verifique se ha´ associac¸a˜o entre as varia´veis rotatividade e sala´rio. g) Se houver associac¸a˜o, ajuste a reta de regressa˜o que explique o sala´rio pela rotati- vidade. 13. Se 0 < α < 1, uma me´dia aparada a 100α% e´ obtida eliminando 100α% dentre as maiores e menores observac¸o˜es e calculando-se a me´dia aritme´tica das restantes. Por exemplo, se tivermos 10 observac¸o˜es ordenadas x(1) < x(2) < . . . < x(10), a me´dia aparada a 10% e´: x¯(0, 10) = x(2) + . . .+ x(9) 8 . Abaixo temos os dados de sala´rio (em sala´rios mı´nimos) de 36 funciona´rios de uma empresa: 4,00 4,56 5,25 5,73 6,26 6,66 6,86 7,39 7,59 7,44 8,12 8,46 8,74 8,95 9,13 9,35 9,77 9,80 10,53 10,76 11,06 11,59 12,00 12,79 13,23 13,60 13,85 14,69 14,71 15,99 16,22 16,61 17,26 18,75 19,40 23,30 a) Calcule a me´dia aparada a 10% e 25% para os dados de sala´rio. b) Qual o objetivo do autor ao criar a me´dia aparada? 14. A companhia A de detetizac¸a˜o afirma que o processo de por ela utilizado garante um efeito mais prolongado do que aquele obtido por seu concorrentes diretos. Uma amostra de va´rios ambientes foi dedetizados foi colhida e anotou-se a durac¸a˜o do efeito da dedetizac¸a˜o. Os resultados esta˜o na tabela abaixo. Voceˆ acha que existe alguma evideˆncia a favor ou contra a afirmac¸a˜o feita pela companha A? Compania Durac¸a˜o do efeito da dedetizac¸a˜o Menos de 4 meses De 4 a 8 meses Mais de 8 meses A 64 120 16 B 104 17 21 C 27 48 5 15. Prove que 1 n n∑ i=1 ( xi − x¯ dp(x) )( yi − y¯ dp(y) ) = ∑n i=1 xiyi − nx¯y¯√ ( ∑n i=1 x 2 i − nx¯2)( ∑n i=1 y 2 i − ny¯2) 16. Foi realizado um estudo para estabelecer uma equac¸a˜o mediante a qual se possa utilizar a concentrac¸a˜o de estro´geno na saliva (X) para predizer a concentrac¸a˜o de estro´geno em plasma livre (Y ). Foram extra´ıdos os seguintes dados de 14 homens sadios: X 1,4 7,5 8,5 9 9 11 13 14 14,5 16 17 18 20 23 Y 30 25 31,5 27,5 39,5 38 43 49 55 48,5 51 64,5 63 68 a) Estude a poss´ıvel relac¸a˜o linear entre ambas a varia´veis. b) Obtenha a equac¸a˜o mencionada no enunciado do problema. c) Determine a variac¸a˜o da concentrac¸a˜o de estro´geno em plasma livre por unidade de estro´geno na saliva. 17. Pesquisadores esta˜o estudando a correlac¸a˜o entre obesidade e resposta individual a dor. A obesidade e´ medida como porcentagem sobre o peso ideal (X), e a resposta a` dor e´ medida utilizando o limiar do reflexo de flexa˜o nociceptiva (Y ), que e´ uma medida de sensac¸a˜o de ser pungido. Obteˆm-se os seguintes dados: X 89 90 75 30 51 75 62 45 90 20 Y 2 3 4 4,5 5,5 7 9 13 15 14 a) Que porcentagem da variaˆncia do peso e´ explicada mediante um modelo de regressa˜o linear pela variac¸a˜o do limiar do reflexo? b) Estude a poss´ıvel relac¸a˜o entre ambas varia´veis, obtendo seu grau de ajuste. c) Que porcentagem de sobrepeso podemos esperar um limiar de reflexo 10? 18. Para estudar o efeito das a´guas residuais dos bueiros que desa´guam em um lago, sa˜o utilizadas as medidas da concentrac¸a˜o de nitrato na a´gua. Para monitorar a varia´vel, utilizava-se um antigo me´todo manual, agora, idealiza-se um novo me´todo automa´tico. Se evidenciarmos uma alta correlac¸a˜o positiva entre as medidas consideradas empre- gando os dois me´todos, enta˜o faremos uso habitual do me´todo automa´tico. Os dados obtidos sa˜o os seguintes: Manual ≡ X 25 40 120 75 150 300 270 400 450 575 Automa´tico ≡ Y 30 80 150 80 200 350 240 320 470 583 a) Determine o coeficiente de determinac¸a˜o para ambas as varia´veis. b) Comprove a idoneidade do modelo linear de regressa˜o. Caso o modelo seja apropri- ado, determine a reta de regressa˜o de Y sobre X e utilize-a para predizer a leitura que se obteria empregando a te´cnica automa´tica com uma amostra de a´gua, cuja leitura manual e´ 100. c) Para cada uma das observac¸o˜es, determine as predic¸o˜es que o modelo linear de regressa˜o oferece para Y em func¸a˜o de X, ou seja, Yˆ . d) Calcule os erros para cada uma das predic¸o˜es, ou seja, Y − Yˆ . e) Que relac¸a˜o existe entre as medidas Y e Yˆ . f) Calcule a me´dia de Y − Yˆ . O valor obtido foi esperado? g) Calcule as variaˆncias de Y , Yˆ e Y − Yˆ . h) Que relac¸a˜o existe entre S2Y e S 2 Yˆ ? i) Que relac¸a˜o existe entre S2Y e S 2 Yˆ ? j) Justifique, a partir de todas as considerac¸o˜es anteriores, por que r2 e´ denominado grau de qualidade do ajuste linear. 19. Realizaram-se 9 tomadas de pressa˜o intracraniana em animais de laborato´rio, por meio de um me´todo padra˜o direto e por meio de uma nova te´cnica experimental indireta, obtendo-se os seguintes resultados em mm de Hg: Me´todo padra˜o ≡ X 9 12 28 72 30 38 76 26 52 Me´todo experimental ≡ Y 6 10 27 67 25 35 75 27 53 a) Determine a equac¸a˜o linear que expressa a relac¸a˜o existente entre as presso˜es in- tracranianas determinadas pelos dois me´tods. b) Que porcentagem da variabilidade de Y e´ explicada pela regressa˜o? Determine o grau de dependeˆncia entre as duas varia´veis.
Compartilhar