Buscar

Estatística Descritiva III

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

MAE116 – Noc¸o˜es de Estat´ıstica
1o semestre de 2017
Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A
Exerc´ıcio 1.
(20 pontos). Os dados a seguir representam medidas de Temperatura (em ◦C) e Salinidade (em partes
por mil) tomadas em 12 pontos da Regia˜o Anta´rtica no comec¸o do vera˜o de 2011.
Amostra 1 2 3 4 5 6 7 8 9 10 11 12
Salinidade 0,3 0,5 1,0 1,3 1,1 1,5 1,4 1,2 1,4 1,1 2,1 2,1
Temperatura 34,0 34,2 34,2 34,3 34,1 34,5 34,4 34,3 34,5 34,7 35,0 34,9
(a) (5 pontos). Calcule o coeficiente de correlac¸a˜o entre Salinidade e Temperatura.
Resposta:
O coeficiente de correlac¸a˜o de Pearson pode ser calculado como:
r =
∑n
i=1(xi − x)(yi − y)
(n− 1)sxsy
em que x e y sa˜o as me´dias amostrais de X e Y , respectivamente, e sx e sy sa˜o os desvios padro˜es
de X e Y , respectivamente.
Alternativamente, podemos calcular o coeficiente de correlac¸a˜o de Pearson como:
r =
∑n
i=1 xiyi − nx y
(n− 1)sxsy
Do enunciado consideramos, Salinidade(X) e Temperatura(Y) e portanto temos que:
12∑
i=1
xi = 15 ;
12∑
i=1
yi = 413, 1
12∑
i=1
xi
2 = 21, 88 ;
12∑
i=1
yi
2 = 14222, 03 ;
12∑
i=1
xiyi = 517, 93.
Assim temos que:
• x =
∑n
i=1 xi
n
=
15
12
= 1, 25
• y =
∑n
i=1 yi
n
=
413, 1
12
= 34, 425
• sx =
√∑n
i=1 x
2
i − nx2
n− 1 =
√
21, 88− 12× (1, 25)2
12− 1 =
√
3, 13
11
∼= 0, 533
• sy =
√∑n
i=1 y
2
i − ny2
n− 1 =
√
14222, 03− 12× (34, 425)2
12− 1 =
√
1, 0625
11
∼= 0, 311.
1
MAE116 – Noc¸o˜es de Estat´ıstica
1o semestre de 2017
Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A
Portanto, o coeficiente de correlac¸a˜o linear de Pearson entre a Salinidade(X) e a Temperatura(Y)
e´ dado por:
r =
517, 93− 12× (1, 25)(34, 425)
(12− 1)× (0, 533)(0, 311) =
1, 555
1, 823
= 0, 853
�
(b) (5 pontos). Sem o uso de recursos computacionais, fac¸a o diagrama de dispersa˜o entre Salinidade
e Temperatura.
Resposta:
A Figura 1 apresenta o diagrama de dispersa˜o entre Salinidade e Temperatura. �
Figura 1:
Obs.: O aluno deve fazer o gra´fico a` ma˜o.
(c) (5 pontos). Usando recursos computacionais, refac¸a o diagrama de dispersa˜o entre Salinidade e
Temperatura.
Resposta:
O diagrama de dispersa˜o pode ser obtido pelo Rcmdr, depois de ter criado ou importado o arquivo
de dados,por:
Gra´ficos → Diagrama de dispersa˜o, e escolhemos as varia´veis de interesse, neste caso, Salinidade(X)
e Temperatura(Y).
A Figura 2 apresenta o diagrama de dispersa˜o entre Salinidade e Temperatura obtido pelo Rcmdr.
�
2
MAE116 – Noc¸o˜es de Estat´ıstica
1o semestre de 2017
Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A
Figura 2:
(d) (5 pontos). Comente os resultados.
Resposta:
Nota-se do item (a) que o valor de r e´ igual 0,853; indicando que ha´ uma correlac¸a˜o linear posi-
tiva entre as varia´veis Salinidade e Temperatura, ou seja, a` medida que a Salinidade aumenta a
Temperatura aumenta, o que e´ coerente com o gra´fico de dispersa˜o apresentado no item (b) ou
(c). �
Exerc´ıcio 2.
(25 pontos). Considere o estudo realizado com jovens anore´xicas (arquivo Anorexia, da lista 2 de
classe).
(a) (5 pontos). Construa o diagrama de dispersa˜o de Peso antes do tratamento versus Peso depois do
tratamento.
Resposta:
O diagrama de dispersa˜o pode ser obtido pelo Rcmdr, depois de importado o arquivo de dados,
por: Gra´ficos → Diagrama de dispersa˜o, e escolhemos as varia´veis de interesse, neste caso, Peso
antes(X) e Peso depois(Y).
A Figura 3 apresenta o diagrama de dispersa˜o do peso antes do tratamento (kg) vs. o peso depois
3
MAE116 – Noc¸o˜es de Estat´ıstica
1o semestre de 2017
Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A
do tratamento(kg).
Figura 3: Diagrama de dispersa˜o: Peso antes do tratamento (kg.) vs. Peso depois do tratamento(kg.)
De acordo com a Figura 3, o diagrama de dispersa˜o sugere a existeˆncia de uma relac¸a˜o linear
crescente entre as varia´veis peso antes do tratamento (kg) e o peso depois do tratamento(kg).
Note que, geralmente o peso depois do tratamento tende a aumentar quando o peso antes do
tratamento tambe´m aumenta. �
(b) (5 pontos). Calcule o coeficiente de correlac¸a˜o entre essas varia´veis.
Resposta:
O coeficiente de correlac¸a˜o pode ser obtido pelo Rcmdr, depois de importado o arquivo de dados,
por: Estat´ısticas → Resumos → Matriz de correlac¸a˜o, e escolhemos as varia´veis de interesse, neste
caso, Peso antes e Peso depois.
O resultado e´ o seguinte:
cor(exerc2b[,c("Peso.antes","Peso.depois")], use="complete")
Peso.antes Peso.depois
Peso.antes 1.0000000 0.5275684
Peso.depois 0.5275684 1.0000000
Pode-se observar que o coeficiente de correlac¸a˜o entre as varia´veis e´ 0,5276; indicando simplesmente
que ha´ uma fraca relac¸a˜o linear entre as varia´veis estudadas.
4
MAE116 – Noc¸o˜es de Estat´ıstica
1o semestre de 2017
Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A
Outra maneira (Fazendo ca´lculos):
O coeficiente de correlac¸a˜o de Pearson pode ser calculado como:
r =
∑n
i=1(xi − x)(yi − y)
(n− 1)sxsy
em que x e y sa˜o as me´dias amostrais de X e Y , respectivamente, e sx e sy sa˜o os desvios padra˜o
de X e Y , respectivamente.
Alternativamente, podemos calcular o coeficiente de correlac¸a˜o de Pearson como:
r =
∑n
i=1 xiyi − nx y
(n− 1)sxsy
Enta˜o, lembrando que Peso antes(X) e Peso depois(Y), usamos recursos computacionais para cal-
cular:
72∑
i=1
xi = 2679, 3 ;
72∑
i=1
yi = 2974, 5
72∑
i=1
xi
2 = 100202, 3 ;
72∑
i=1
yi
2 = 124301, 2 ;
72∑
i=1
xiyi = 111132, 16.
Assim temos que:
• x =
∑n
i=1 xi
n
=
2679, 3
72
= 37, 2125
• y =
∑n
i=1 yi
n
=
2974, 5
72
= 41, 3125
• sx =
√∑n
i=1 x
2
i − nx2
n− 1 =
√
100202, 3− 72× (37, 2125)2
72− 1 =
√
498, 85
71
=
√
7, 026 ∼= 2, 651;
• sy =
√∑n
i=1 y
2
i − ny2
n− 1 =
√
124301, 2− 72× (41, 3125)2
72− 1 =
√
1417, 17
71
=
√
19, 96 ∼= 4, 468.
Portanto, o coeficiente de correlac¸a˜o linear de Pearson entre X e Y e´ dado por:
r =
111132, 16− 72× (37, 2125)(41, 3125)
71× (2, 651)(4, 468) =
443, 579
840, 971
= 0, 527
�
5
MAE116 – Noc¸o˜es de Estat´ıstica
1o semestre de 2017
Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A
(c) (5 pontos). Obtenha a equac¸a˜o da reta de regressa˜o do Peso depois do tratamento em func¸a˜o do
Peso antes do tratamento.
Resposta:
Para ajustar uma reta de regressa˜o usando Rcmdr, depois de importado o arquivo de dados,
escolhemos as opc¸o˜es: Estat´ısticas → Ajuste de modelos → regressa˜o linear, e escolhemos o Peso
depois como varia´vel resposta e o Peso antes como varia´vel explicativa.
Os resultados obtidos sa˜o os seguintes:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 8.2236 6.3842 1.288 0.202
Peso.antes 0.8892 0.1711 5.196 1.92e-06 ***
Temos enta˜o que a reta de regressa˜o ajustada: Yˆ = a + bX e´ dada por: Yˆ = 8, 22 + 0, 889X.
Outra maneira (Fazendo ca´lculos):
A equac¸a˜o da reta de regressa˜o ajustada relacionando as varia´veis Y e X e´ dada por:
Yˆ = a + bX
em que
b =
∑n
i=1 xiyi − nx y
(n− 1)s2x
=
111132, 16− 72× (37, 2125)(41, 3125)
(72− 1)× (2, 651)2 = 0, 8892
a = y − bx = 41, 3125− 0, 8892× 37, 2125 = 8, 223.
A reta de regressa˜o estimada da varia´vel Peso depois do tratamento (Y) em func¸a˜o do Peso antes
do tratamento (X) e´ dada por
Yˆ = 8, 22 + 0, 889X.
�
(d) (5 pontos). Interprete o coeficiente ”b”da equac¸a˜o da reta encontrada.
Resposta:
Para um aumento de 1 kg. no peso antes do tratamento (X), o peso depois do tratamento (Y )
aumenta, emme´dia, 0,889 kg. �
6
MAE116 – Noc¸o˜es de Estat´ıstica
1o semestre de 2017
Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A
(e) (5 pontos). Usando a equac¸a˜o da reta, fac¸a uma previsa˜o do Peso depois do tratamento para uma
jovem que tenha Peso antes do tratamento igual a 40 kg.
Resposta:
Para X = 40 kg; temos que Yˆ = 8, 22 + 0, 889 × 40 = 43, 78 kg. Logo uma jovem que tenha um
peso antes do tratamento de 40kg; espera-se em me´dia, que seu peso depois do tratamento seja
de 43, 78 kg.
�
Exerc´ıcio 3.
(20 pontos). Uma amostra aleato´ria de 352 pessoas foi entrevistada, sendo anotados de cada partici-
pante o geˆnero (Masculino; Feminino), a faixa eta´ria (Menos de 40 anos; 40 anos ou mais) e o resultado
da prefereˆncia por um de dois adoc¸antes (A; B). Os resultados esta˜o apresentados no quadro a seguir.
PrefereˆnciaGeˆnero e Faixa eta´ria
Adoc¸ante A Adoc¸ante B
Feminino e Menos de 40 anos 20 40
Masculino e Menos de 40 anos 30 70
Feminino e 40 anos ou mais 50 16
Masculino e 40 anos ou mais 100 26
(a) (10 pontos). Verifique se ha´ indicac¸a˜o de associac¸a˜o entre Prefereˆncia pelo adoc¸ante e Geˆnero.
Comente.
Resposta:
Para determinar se ha´ ind´ıcios de relac¸a˜o entre Prefereˆncia pelo adoc¸ante e geˆnero, vamos calcular
os percentagens segundo as linhas da tabela de contingeˆncia apresentada como segue:
Tabela 1: Percentagens por linhas da relac¸a˜o conjunta entre Prefereˆncia pelo adoc¸ante e geˆnero.
Geˆnero / Prefereˆncia Adoc¸ante A Adoc¸ante B Total
Feminino 70 (55,6%) 56 (44,4%) 126 (100%)
Masculino 130 (57,5%) 96 (42,5%) 226 (100%)
Total 200 (56,8%) 152 (43,2%) 352 (100%)
Segundo os resultados da Tabela 1 podemos observar que na˜o ha´ diferenc¸as expressivas nas porcen-
tagens de cada uma das linhas com relac¸a˜o a` porcentagem total. Aparentemente na˜o ha´ indicac¸a˜o
de associac¸a˜o entre a Prefereˆncia pelo adoc¸ante e geˆnero. �
7
MAE116 – Noc¸o˜es de Estat´ıstica
1o semestre de 2017
Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A
(b) (10 pontos). Verifique se ha´ indicac¸a˜o de associac¸a˜o entre Prefereˆncia pelo adoc¸ante e Faixa eta´ria.
Comente.
Resposta:
Para determinar se ha´ ind´ıcios de relac¸a˜o entre Prefereˆncia pelo adoc¸ante e Faixa eta´ria, vamos
calcular as percentagens segundo as linhas da tabela de contingeˆncia apresentada como segue:
Tabela 2: Percentagens por linhas da relac¸a˜o conjunta entre Prefereˆncia pelo adoc¸ante e Faixa eta´ria.
Faixa eta´ria / Prefereˆncia Adoc¸ante A Adoc¸ante B Total
Menos de 40 anos 50 (31,25%) 110 (68,75%) 160 (100%)
40 anos ou mais 150 (78,125%) 42 (21,875%) 192 (100%)
Total 200 (56,82%) 152 (43,18%) 352 (100%)
Segundo os resultados da Tabela 2 podemos observar que ha´ diferenc¸as nas porcentagens de cada
uma das linhas com relac¸a˜o a` porcentagem total. Aparentemente ha´ indicac¸a˜o de associac¸a˜o entre
a Prefereˆncia pelo adoc¸ante e Faixa eta´ria. Podemos dizer que, entre as pessoas entrevistadas
com 40 anos ou mais, a maioria (78,125%) prefere o adoc¸ante A, enquanto que entre as pessoas
entrevistadas com menos de 40 anos, 68,75% prefere o adoc¸ante B. �
Obs.: Uma ana´lise semelhante pode ser feita igualmente usando as %’s em coluna.
Exerc´ıcio 4.
(35 pontos). Considere o arquivo aeusp (da lista 2 de casa).
(a) (10 pontos). Usando recursos computacionais, construa tabelas de contingeˆncia para Renda fami-
liar (Renda) versus cada uma das seguintes varia´veis: sexo (Sexo), Estado civil (Ecivil) e Tipo de
trabalho (Ttrab).
Resposta:
Lembrando cada uma das varia´veis a trabalhar com sua codificac¸a˜o:
Sexo (Sexo) : 1 = masculino; 2 = feminino
Estado civil (Ecivil) : 1 = solteiro; 2 = casado; 3 = divorciado; 4 = viu´vo; 5 = outro
Tipo de trabalho, so´ para os que trabalham (Ttrab): 1 = empregado com carteira; 2 = empregado
sem carteira; 3 = profissional liberal; 4 = autoˆnomo; 5 = rural
Renda familiar em faixas de reais (Renda) : 1 =[0, 150); 2 = [150, 300); 3 = [300, 450); 4 =[450,
900); 5 = [900, 1500); 6 = [1500, 3000)
As tabelas de contingeˆncia podem ser obtidas pelo Rcmdr, depois de ter importado o arquivo de
dados, por:
Estat´ısticas → Tabelas de contingeˆncia → Tabela de dupla entrada, e escolhemos as varia´veis de
interesse e tambe´m na opc¸a˜o ”Estat´ısticas“: Percentual nas linhas.
As tabelas de contingeˆncia solicitadas sa˜o apresentadas na continuac¸a˜o:
8
MAE116 – Noc¸o˜es de Estat´ıstica
1o semestre de 2017
Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A
Tabela 3: Tabela de contingencia para as varia´veis Renda familiar e Sexo
Renda
Sexo 1 2 3 4 5 6 Total
1 12(7,1%) 30(17,91%) 39(23,2%) 51(30,4%) 27 (16,1%) 9(5,4%) 168(100%)
2 25(11,6%) 46(21,3%) 34(15,7%) 69(31,9%) 21(9,7%) 21(9,7%) 216(100%)
Total 37(9,6%) 76(19,8%) 76(19,0%) 120(31,3%) 48(12,5%) 30(7,8%) 384(100%)
Tabela 4: Tabela de contingencia para as varia´veis Renda familiar e Estado civil
Renda
Ecivil 1 2 3 4 5 6 Total
1 18(11,0%) 34(20,7%) 32(19,5%) 50(30,5%) 20(12,2%) 10(6,1%) 164(100%)
2 10(6,0%) 29(17,5%) 28(16,9%) 56(33,7%) 28(16,9%) 15(9,0%) 166(100%)
3 1(10,0%) 1(10,0%) 3(30,0%) 3(30,0%) 0(0,0%) 2(20,0%) 10(100%)
4 5(41,7%) 2(16,7%) 2(16,7%) 1(8,3%) 0(0,0%) 2(16,7%) 12(100%)
5 3(9,4%) 10(31,3%) 8(25,0%) 10(31,3%) 0(0,0%) 1(3,1%) 32(100%)
Total 37(9,6%) 76(19,8%) 73(19,0%) 120(31,3%) 48(12,5%) 30(7,8%) 384(100,0%)
Tabela 5: Tabela de contingencia para as varia´veis Renda familiar e Tipo de trabalho
Renda
Ttrab 1 2 3 4 5 6 Total
1 1(1,3%) 11(14,1%) 19(24,4%) 30(38,51%) 8(10,3%) 9(11,5%) 78(100%)
2 3(5,4%) 11(19,6%) 9(16,1%) 21(37,5%) 9(16,1%) 3(5,4%) 56(100%)
3 3(25,0%) 0(0,0%) 1(8,3%) 3(25,0%) 5(41,7%) 0(0,0%) 12(100%)
4 4(4,2%) 23(24,2%) 19(20,0%) 23(24,2%) 18(18,9%) 8(8,4%) 95(100%)
Total 11(4,6%) 45(18,7%) 48(19,9%) 77(32,0%) 40(16,6%) 20(8,3%) 241(100%)
Obs.: Segundo os dados, na varia´vel Tipo de trabalho (Ttrab), so´ foram contabilizadas 241
respostas.
�
(b) (5 pontos). Dentre as famı´lias cujo respondente era do sexo feminino, qual e´ a porcentagem que
tinham renda entre 300 e 450 reais?
Resposta:
Segundo o resultado da tabela 3, as famı´lias cujo respondente foi do sexo feminino (Sexo=2) foram
216, e dessas, 34 tinham renda entre 300 e 450 reais (Renda=3). Assim, a porcentagem solicitada
e´ :
34
216
= 0, 1574, ou seja, 15,74% tinham renda entre 300 e 450 reais. �
9
MAE116 – Noc¸o˜es de Estat´ıstica
1o semestre de 2017
Gabarito Lista de Exerc´ıcios 3 - Estat´ıstica Descritiva III– C A S A
(c) (5 pontos). Dentre as famı´lias com renda entre 300 e 450 reais, qual e´ a porcentagem que tiveram
como respondente uma pessoa casada?
Resposta:
Segundo o resultado da tabela 4, as famı´lias com renda entre 300 e 450 reais (Renda=3) foram
73, e dessas, 28 tiveram como respondente uma pessoa casada (Ecivil=2). Assim, a porcentagem
solicitada e´ :
28
73
= 0, 3836, ou seja, 38,36% tiveram como respondente uma pessoa casada. �
(d) (5 pontos). Qual e´ a porcentagem de famı´lias com renda entre 300 e 450 reais e cujo respondente
estava empregado com carteira?
Resposta:
Segundo o resultado da tabela 5, o nu´mero de famı´lias com renda entre 300 e 450 reais (Renda=3)
e cujo respondente estava empregado com carteira(Ttrab=1) foi 19. Assim, a porcentagem solici-
tada e´ a raza˜o:
19
241
= 0, 0788, ou seja, 7,88%. �
(e) (10 pontos). Voceˆ diria que ha´ indicac¸a˜o de associac¸a˜o entre Renda familiar e sexo? Justifique.
Resposta:
Para determinar se ha´ indicac¸a˜o de associac¸a˜o entre Renda familiar e sexo, analisamos as porcen-
tagens segundo as linhas da tabela de contingeˆncia como segue:
Segundo os resultados da Tabela 3 podemos observar que na˜o ha´ diferenc¸as expressivas nas porcen-
tagens das linhas com relac¸a˜o a` porcentagemtotal. Aparentemente na˜o ha´ indicac¸a˜o de associac¸a˜o
entre a Renda familiar e sexo do respondente. �
10

Outros materiais