Baixe o app para aproveitar ainda mais
Prévia do material em texto
MAE116 – Noc¸o˜es de Estat´ıstica 1o semestre de 2017 Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A Exerc´ıcio 1. (20 pontos). Os dados a seguir representam medidas de Temperatura (em ◦C) e Salinidade (em partes por mil) tomadas em 12 pontos da Regia˜o Anta´rtica no comec¸o do vera˜o de 2011. Amostra 1 2 3 4 5 6 7 8 9 10 11 12 Salinidade 0,3 0,5 1,0 1,3 1,1 1,5 1,4 1,2 1,4 1,1 2,1 2,1 Temperatura 34,0 34,2 34,2 34,3 34,1 34,5 34,4 34,3 34,5 34,7 35,0 34,9 (a) (5 pontos). Calcule o coeficiente de correlac¸a˜o entre Salinidade e Temperatura. Resposta: O coeficiente de correlac¸a˜o de Pearson pode ser calculado como: r = ∑n i=1(xi − x)(yi − y) (n− 1)sxsy em que x e y sa˜o as me´dias amostrais de X e Y , respectivamente, e sx e sy sa˜o os desvios padro˜es de X e Y , respectivamente. Alternativamente, podemos calcular o coeficiente de correlac¸a˜o de Pearson como: r = ∑n i=1 xiyi − nx y (n− 1)sxsy Do enunciado consideramos, Salinidade(X) e Temperatura(Y) e portanto temos que: 12∑ i=1 xi = 15 ; 12∑ i=1 yi = 413, 1 12∑ i=1 xi 2 = 21, 88 ; 12∑ i=1 yi 2 = 14222, 03 ; 12∑ i=1 xiyi = 517, 93. Assim temos que: • x = ∑n i=1 xi n = 15 12 = 1, 25 • y = ∑n i=1 yi n = 413, 1 12 = 34, 425 • sx = √∑n i=1 x 2 i − nx2 n− 1 = √ 21, 88− 12× (1, 25)2 12− 1 = √ 3, 13 11 ∼= 0, 533 • sy = √∑n i=1 y 2 i − ny2 n− 1 = √ 14222, 03− 12× (34, 425)2 12− 1 = √ 1, 0625 11 ∼= 0, 311. 1 MAE116 – Noc¸o˜es de Estat´ıstica 1o semestre de 2017 Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A Portanto, o coeficiente de correlac¸a˜o linear de Pearson entre a Salinidade(X) e a Temperatura(Y) e´ dado por: r = 517, 93− 12× (1, 25)(34, 425) (12− 1)× (0, 533)(0, 311) = 1, 555 1, 823 = 0, 853 � (b) (5 pontos). Sem o uso de recursos computacionais, fac¸a o diagrama de dispersa˜o entre Salinidade e Temperatura. Resposta: A Figura 1 apresenta o diagrama de dispersa˜o entre Salinidade e Temperatura. � Figura 1: Obs.: O aluno deve fazer o gra´fico a` ma˜o. (c) (5 pontos). Usando recursos computacionais, refac¸a o diagrama de dispersa˜o entre Salinidade e Temperatura. Resposta: O diagrama de dispersa˜o pode ser obtido pelo Rcmdr, depois de ter criado ou importado o arquivo de dados,por: Gra´ficos → Diagrama de dispersa˜o, e escolhemos as varia´veis de interesse, neste caso, Salinidade(X) e Temperatura(Y). A Figura 2 apresenta o diagrama de dispersa˜o entre Salinidade e Temperatura obtido pelo Rcmdr. � 2 MAE116 – Noc¸o˜es de Estat´ıstica 1o semestre de 2017 Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A Figura 2: (d) (5 pontos). Comente os resultados. Resposta: Nota-se do item (a) que o valor de r e´ igual 0,853; indicando que ha´ uma correlac¸a˜o linear posi- tiva entre as varia´veis Salinidade e Temperatura, ou seja, a` medida que a Salinidade aumenta a Temperatura aumenta, o que e´ coerente com o gra´fico de dispersa˜o apresentado no item (b) ou (c). � Exerc´ıcio 2. (25 pontos). Considere o estudo realizado com jovens anore´xicas (arquivo Anorexia, da lista 2 de classe). (a) (5 pontos). Construa o diagrama de dispersa˜o de Peso antes do tratamento versus Peso depois do tratamento. Resposta: O diagrama de dispersa˜o pode ser obtido pelo Rcmdr, depois de importado o arquivo de dados, por: Gra´ficos → Diagrama de dispersa˜o, e escolhemos as varia´veis de interesse, neste caso, Peso antes(X) e Peso depois(Y). A Figura 3 apresenta o diagrama de dispersa˜o do peso antes do tratamento (kg) vs. o peso depois 3 MAE116 – Noc¸o˜es de Estat´ıstica 1o semestre de 2017 Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A do tratamento(kg). Figura 3: Diagrama de dispersa˜o: Peso antes do tratamento (kg.) vs. Peso depois do tratamento(kg.) De acordo com a Figura 3, o diagrama de dispersa˜o sugere a existeˆncia de uma relac¸a˜o linear crescente entre as varia´veis peso antes do tratamento (kg) e o peso depois do tratamento(kg). Note que, geralmente o peso depois do tratamento tende a aumentar quando o peso antes do tratamento tambe´m aumenta. � (b) (5 pontos). Calcule o coeficiente de correlac¸a˜o entre essas varia´veis. Resposta: O coeficiente de correlac¸a˜o pode ser obtido pelo Rcmdr, depois de importado o arquivo de dados, por: Estat´ısticas → Resumos → Matriz de correlac¸a˜o, e escolhemos as varia´veis de interesse, neste caso, Peso antes e Peso depois. O resultado e´ o seguinte: cor(exerc2b[,c("Peso.antes","Peso.depois")], use="complete") Peso.antes Peso.depois Peso.antes 1.0000000 0.5275684 Peso.depois 0.5275684 1.0000000 Pode-se observar que o coeficiente de correlac¸a˜o entre as varia´veis e´ 0,5276; indicando simplesmente que ha´ uma fraca relac¸a˜o linear entre as varia´veis estudadas. 4 MAE116 – Noc¸o˜es de Estat´ıstica 1o semestre de 2017 Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A Outra maneira (Fazendo ca´lculos): O coeficiente de correlac¸a˜o de Pearson pode ser calculado como: r = ∑n i=1(xi − x)(yi − y) (n− 1)sxsy em que x e y sa˜o as me´dias amostrais de X e Y , respectivamente, e sx e sy sa˜o os desvios padra˜o de X e Y , respectivamente. Alternativamente, podemos calcular o coeficiente de correlac¸a˜o de Pearson como: r = ∑n i=1 xiyi − nx y (n− 1)sxsy Enta˜o, lembrando que Peso antes(X) e Peso depois(Y), usamos recursos computacionais para cal- cular: 72∑ i=1 xi = 2679, 3 ; 72∑ i=1 yi = 2974, 5 72∑ i=1 xi 2 = 100202, 3 ; 72∑ i=1 yi 2 = 124301, 2 ; 72∑ i=1 xiyi = 111132, 16. Assim temos que: • x = ∑n i=1 xi n = 2679, 3 72 = 37, 2125 • y = ∑n i=1 yi n = 2974, 5 72 = 41, 3125 • sx = √∑n i=1 x 2 i − nx2 n− 1 = √ 100202, 3− 72× (37, 2125)2 72− 1 = √ 498, 85 71 = √ 7, 026 ∼= 2, 651; • sy = √∑n i=1 y 2 i − ny2 n− 1 = √ 124301, 2− 72× (41, 3125)2 72− 1 = √ 1417, 17 71 = √ 19, 96 ∼= 4, 468. Portanto, o coeficiente de correlac¸a˜o linear de Pearson entre X e Y e´ dado por: r = 111132, 16− 72× (37, 2125)(41, 3125) 71× (2, 651)(4, 468) = 443, 579 840, 971 = 0, 527 � 5 MAE116 – Noc¸o˜es de Estat´ıstica 1o semestre de 2017 Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A (c) (5 pontos). Obtenha a equac¸a˜o da reta de regressa˜o do Peso depois do tratamento em func¸a˜o do Peso antes do tratamento. Resposta: Para ajustar uma reta de regressa˜o usando Rcmdr, depois de importado o arquivo de dados, escolhemos as opc¸o˜es: Estat´ısticas → Ajuste de modelos → regressa˜o linear, e escolhemos o Peso depois como varia´vel resposta e o Peso antes como varia´vel explicativa. Os resultados obtidos sa˜o os seguintes: Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 8.2236 6.3842 1.288 0.202 Peso.antes 0.8892 0.1711 5.196 1.92e-06 *** Temos enta˜o que a reta de regressa˜o ajustada: Yˆ = a + bX e´ dada por: Yˆ = 8, 22 + 0, 889X. Outra maneira (Fazendo ca´lculos): A equac¸a˜o da reta de regressa˜o ajustada relacionando as varia´veis Y e X e´ dada por: Yˆ = a + bX em que b = ∑n i=1 xiyi − nx y (n− 1)s2x = 111132, 16− 72× (37, 2125)(41, 3125) (72− 1)× (2, 651)2 = 0, 8892 a = y − bx = 41, 3125− 0, 8892× 37, 2125 = 8, 223. A reta de regressa˜o estimada da varia´vel Peso depois do tratamento (Y) em func¸a˜o do Peso antes do tratamento (X) e´ dada por Yˆ = 8, 22 + 0, 889X. � (d) (5 pontos). Interprete o coeficiente ”b”da equac¸a˜o da reta encontrada. Resposta: Para um aumento de 1 kg. no peso antes do tratamento (X), o peso depois do tratamento (Y ) aumenta, emme´dia, 0,889 kg. � 6 MAE116 – Noc¸o˜es de Estat´ıstica 1o semestre de 2017 Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A (e) (5 pontos). Usando a equac¸a˜o da reta, fac¸a uma previsa˜o do Peso depois do tratamento para uma jovem que tenha Peso antes do tratamento igual a 40 kg. Resposta: Para X = 40 kg; temos que Yˆ = 8, 22 + 0, 889 × 40 = 43, 78 kg. Logo uma jovem que tenha um peso antes do tratamento de 40kg; espera-se em me´dia, que seu peso depois do tratamento seja de 43, 78 kg. � Exerc´ıcio 3. (20 pontos). Uma amostra aleato´ria de 352 pessoas foi entrevistada, sendo anotados de cada partici- pante o geˆnero (Masculino; Feminino), a faixa eta´ria (Menos de 40 anos; 40 anos ou mais) e o resultado da prefereˆncia por um de dois adoc¸antes (A; B). Os resultados esta˜o apresentados no quadro a seguir. PrefereˆnciaGeˆnero e Faixa eta´ria Adoc¸ante A Adoc¸ante B Feminino e Menos de 40 anos 20 40 Masculino e Menos de 40 anos 30 70 Feminino e 40 anos ou mais 50 16 Masculino e 40 anos ou mais 100 26 (a) (10 pontos). Verifique se ha´ indicac¸a˜o de associac¸a˜o entre Prefereˆncia pelo adoc¸ante e Geˆnero. Comente. Resposta: Para determinar se ha´ ind´ıcios de relac¸a˜o entre Prefereˆncia pelo adoc¸ante e geˆnero, vamos calcular os percentagens segundo as linhas da tabela de contingeˆncia apresentada como segue: Tabela 1: Percentagens por linhas da relac¸a˜o conjunta entre Prefereˆncia pelo adoc¸ante e geˆnero. Geˆnero / Prefereˆncia Adoc¸ante A Adoc¸ante B Total Feminino 70 (55,6%) 56 (44,4%) 126 (100%) Masculino 130 (57,5%) 96 (42,5%) 226 (100%) Total 200 (56,8%) 152 (43,2%) 352 (100%) Segundo os resultados da Tabela 1 podemos observar que na˜o ha´ diferenc¸as expressivas nas porcen- tagens de cada uma das linhas com relac¸a˜o a` porcentagem total. Aparentemente na˜o ha´ indicac¸a˜o de associac¸a˜o entre a Prefereˆncia pelo adoc¸ante e geˆnero. � 7 MAE116 – Noc¸o˜es de Estat´ıstica 1o semestre de 2017 Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A (b) (10 pontos). Verifique se ha´ indicac¸a˜o de associac¸a˜o entre Prefereˆncia pelo adoc¸ante e Faixa eta´ria. Comente. Resposta: Para determinar se ha´ ind´ıcios de relac¸a˜o entre Prefereˆncia pelo adoc¸ante e Faixa eta´ria, vamos calcular as percentagens segundo as linhas da tabela de contingeˆncia apresentada como segue: Tabela 2: Percentagens por linhas da relac¸a˜o conjunta entre Prefereˆncia pelo adoc¸ante e Faixa eta´ria. Faixa eta´ria / Prefereˆncia Adoc¸ante A Adoc¸ante B Total Menos de 40 anos 50 (31,25%) 110 (68,75%) 160 (100%) 40 anos ou mais 150 (78,125%) 42 (21,875%) 192 (100%) Total 200 (56,82%) 152 (43,18%) 352 (100%) Segundo os resultados da Tabela 2 podemos observar que ha´ diferenc¸as nas porcentagens de cada uma das linhas com relac¸a˜o a` porcentagem total. Aparentemente ha´ indicac¸a˜o de associac¸a˜o entre a Prefereˆncia pelo adoc¸ante e Faixa eta´ria. Podemos dizer que, entre as pessoas entrevistadas com 40 anos ou mais, a maioria (78,125%) prefere o adoc¸ante A, enquanto que entre as pessoas entrevistadas com menos de 40 anos, 68,75% prefere o adoc¸ante B. � Obs.: Uma ana´lise semelhante pode ser feita igualmente usando as %’s em coluna. Exerc´ıcio 4. (35 pontos). Considere o arquivo aeusp (da lista 2 de casa). (a) (10 pontos). Usando recursos computacionais, construa tabelas de contingeˆncia para Renda fami- liar (Renda) versus cada uma das seguintes varia´veis: sexo (Sexo), Estado civil (Ecivil) e Tipo de trabalho (Ttrab). Resposta: Lembrando cada uma das varia´veis a trabalhar com sua codificac¸a˜o: Sexo (Sexo) : 1 = masculino; 2 = feminino Estado civil (Ecivil) : 1 = solteiro; 2 = casado; 3 = divorciado; 4 = viu´vo; 5 = outro Tipo de trabalho, so´ para os que trabalham (Ttrab): 1 = empregado com carteira; 2 = empregado sem carteira; 3 = profissional liberal; 4 = autoˆnomo; 5 = rural Renda familiar em faixas de reais (Renda) : 1 =[0, 150); 2 = [150, 300); 3 = [300, 450); 4 =[450, 900); 5 = [900, 1500); 6 = [1500, 3000) As tabelas de contingeˆncia podem ser obtidas pelo Rcmdr, depois de ter importado o arquivo de dados, por: Estat´ısticas → Tabelas de contingeˆncia → Tabela de dupla entrada, e escolhemos as varia´veis de interesse e tambe´m na opc¸a˜o ”Estat´ısticas“: Percentual nas linhas. As tabelas de contingeˆncia solicitadas sa˜o apresentadas na continuac¸a˜o: 8 MAE116 – Noc¸o˜es de Estat´ıstica 1o semestre de 2017 Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A Tabela 3: Tabela de contingencia para as varia´veis Renda familiar e Sexo Renda Sexo 1 2 3 4 5 6 Total 1 12(7,1%) 30(17,91%) 39(23,2%) 51(30,4%) 27 (16,1%) 9(5,4%) 168(100%) 2 25(11,6%) 46(21,3%) 34(15,7%) 69(31,9%) 21(9,7%) 21(9,7%) 216(100%) Total 37(9,6%) 76(19,8%) 76(19,0%) 120(31,3%) 48(12,5%) 30(7,8%) 384(100%) Tabela 4: Tabela de contingencia para as varia´veis Renda familiar e Estado civil Renda Ecivil 1 2 3 4 5 6 Total 1 18(11,0%) 34(20,7%) 32(19,5%) 50(30,5%) 20(12,2%) 10(6,1%) 164(100%) 2 10(6,0%) 29(17,5%) 28(16,9%) 56(33,7%) 28(16,9%) 15(9,0%) 166(100%) 3 1(10,0%) 1(10,0%) 3(30,0%) 3(30,0%) 0(0,0%) 2(20,0%) 10(100%) 4 5(41,7%) 2(16,7%) 2(16,7%) 1(8,3%) 0(0,0%) 2(16,7%) 12(100%) 5 3(9,4%) 10(31,3%) 8(25,0%) 10(31,3%) 0(0,0%) 1(3,1%) 32(100%) Total 37(9,6%) 76(19,8%) 73(19,0%) 120(31,3%) 48(12,5%) 30(7,8%) 384(100,0%) Tabela 5: Tabela de contingencia para as varia´veis Renda familiar e Tipo de trabalho Renda Ttrab 1 2 3 4 5 6 Total 1 1(1,3%) 11(14,1%) 19(24,4%) 30(38,51%) 8(10,3%) 9(11,5%) 78(100%) 2 3(5,4%) 11(19,6%) 9(16,1%) 21(37,5%) 9(16,1%) 3(5,4%) 56(100%) 3 3(25,0%) 0(0,0%) 1(8,3%) 3(25,0%) 5(41,7%) 0(0,0%) 12(100%) 4 4(4,2%) 23(24,2%) 19(20,0%) 23(24,2%) 18(18,9%) 8(8,4%) 95(100%) Total 11(4,6%) 45(18,7%) 48(19,9%) 77(32,0%) 40(16,6%) 20(8,3%) 241(100%) Obs.: Segundo os dados, na varia´vel Tipo de trabalho (Ttrab), so´ foram contabilizadas 241 respostas. � (b) (5 pontos). Dentre as famı´lias cujo respondente era do sexo feminino, qual e´ a porcentagem que tinham renda entre 300 e 450 reais? Resposta: Segundo o resultado da tabela 3, as famı´lias cujo respondente foi do sexo feminino (Sexo=2) foram 216, e dessas, 34 tinham renda entre 300 e 450 reais (Renda=3). Assim, a porcentagem solicitada e´ : 34 216 = 0, 1574, ou seja, 15,74% tinham renda entre 300 e 450 reais. � 9 MAE116 – Noc¸o˜es de Estat´ıstica 1o semestre de 2017 Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A (c) (5 pontos). Dentre as famı´lias com renda entre 300 e 450 reais, qual e´ a porcentagem que tiveram como respondente uma pessoa casada? Resposta: Segundo o resultado da tabela 4, as famı´lias com renda entre 300 e 450 reais (Renda=3) foram 73, e dessas, 28 tiveram como respondente uma pessoa casada (Ecivil=2). Assim, a porcentagem solicitada e´ : 28 73 = 0, 3836, ou seja, 38,36% tiveram como respondente uma pessoa casada. � (d) (5 pontos). Qual e´ a porcentagem de famı´lias com renda entre 300 e 450 reais e cujo respondente estava empregado com carteira? Resposta: Segundo o resultado da tabela 5, o nu´mero de famı´lias com renda entre 300 e 450 reais (Renda=3) e cujo respondente estava empregado com carteira(Ttrab=1) foi 19. Assim, a porcentagem solici- tada e´ a raza˜o: 19 241 = 0, 0788, ou seja, 7,88%. � (e) (10 pontos). Voceˆ diria que ha´ indicac¸a˜o de associac¸a˜o entre Renda familiar e sexo? Justifique. Resposta: Para determinar se ha´ indicac¸a˜o de associac¸a˜o entre Renda familiar e sexo, analisamos as porcen- tagens segundo as linhas da tabela de contingeˆncia como segue: Segundo os resultados da Tabela 3 podemos observar que na˜o ha´ diferenc¸as expressivas nas porcen- tagens das linhas com relac¸a˜o a` porcentagemtotal. Aparentemente na˜o ha´ indicac¸a˜o de associac¸a˜o entre a Renda familiar e sexo do respondente. � 10
Compartilhar