Buscar

Lista 1 - Estatística Descritiva - Ana Maria FariasGABARITO

Prévia do material em texto

GET00117 - Me´todos Estat´ısticos Aplicados a` Economia I
Gabarito da Lista de Exerc´ıcios - Estat´ıstica Descritiva
Profa. Ana Maria Farias - 2015-2
1.
Sexo Frequeˆncia Simples
Absoluta Relativa
Masculino 14 60,87
Feminino 9 39,13
Total 23 100,00
Figura 1 – Questa˜o 1 - gra´fico de setores Figura 2 – Questa˜o 1 - gra´fico de colunas
2. (a) • Geˆnero e Mate´ria predileta: varia´veis qualitativas
• Nota no teste: varia´vel quantitativa discreta
(b)
Sexo Frequeˆncia Simples
Absoluta Relativa
Masculino 21 50,0
Feminino 21 50,0
Total 42 100,00
Figura 3 – Questa˜o 2
Mate´ria Frequeˆncia Simples
Predileta Absoluta Relativa
Histo´ria 7 16,667
Geografia 8 19,048
Cieˆncias 3 7,143
Portugueˆs 10 23,810
Matema´tica 14 33,333
Total 42 100,000
Figura 4 – Questa˜o 2
Departamento de Estat´ıstica 1
Nota Frequeˆncia Simples Frequeˆncia Acumulada
Absoluta Relativa Absoluta Relativa
1 1 2,381 1 2,381
2 2 4,762 3 7,143
3 1 2,381 4 9,524
4 3 7,143 7 16,667
5 12 28,571 19 45,238
6 7 16,667 26 61,905
7 5 11,905 31 73,810
8 7 16,667 38 90,476
9 4 9,524 42 100,000
Total 42 100,00
Figura 5 – Questa˜o 2
3. A novidade aqui e´ que podemos agrupar, na classe Outros Sabores, todos aqueles com
frequeˆncia inferior a 1%.
Figura 6 – Questa˜o 3 - gra´fico de setores Figura 7 – Questa˜o 3 - gra´fico de colunas
4. Vamos denotar por ni a frequeˆncia simples absoluta da classe i e por Ni, a frequeˆncia
acumulada. Para a primeira classe, temosN1 = n1 e para as classes seguintes, a frequeˆncia
acumulada e´ a frequeˆncia acumulada da classe anterior mais a frequeˆncia simples, ou seja,
N1 = n1
Nk = Nk−1 + nk
Logo, para obter a frequeˆncia simples de cada classe, basta subtrair as frequeˆncias acu-
muladas de classes consecutivas. Obtemos, assim, a seguinte distribuic¸a˜o para o nu´mero
de sinistros:
Departamento de Estat´ıstica 2
Nu´mero de Nu´mero de apo´lices
Sinistros Frequeˆncia Simples Frequeˆncia Acumulada
Absoluta Relativa Absoluta Relativa
0 2913 58,26 2913 58,26
1 4500-2913=1587 31,74 4500 90,00
2 4826-4500=326 6,52 4826 96,52
3 4928-4826=102 2,04 4928 98,56
4 5000-4928=72 1,44 5000 100,00
5. Para o lucro anual, vamos trabalhar em milhares de reais. Assim, nossos dados va˜o de
150 a 360, o que da´ uma amplitude de ∆ = 360 − 150 = 210. Para garantir a inclusa˜o
dos valores minimo e ma´ximo e para manter o mesmo tipo de intervalo de classe, vamos
tomar a amplitude como sendo o pro´ximo mu´ltiplo de 5, ou seja, vamos trabalhar com a
amplitude ∆′ = 215. Como queremos 5 classes , comprimento de cada classe sera´
δ =
215
5
= 43
Dessa forma, os limites inferiores das classes sera˜o:
150
150 + 43 = 193
193 + 43 = 236
236 + 43 = 279
279 + 43 = 322
322 + 43 = 365
Para incluir o limite inferior, temos que trabalhar com intervalos fechados no extremo in-
ferior e aberto no extremo superior, por exemplo, [150,193). A distribuic¸a˜o de frequeˆncias
e´
Lucro anual (em milhares de R$)
Frequeˆncia Simples Frequeˆncia Acumulada
Classes Absoluta Relativa Absoluta Relativa
150 ` 193 9 0,346 9 0,346
193 ` 236 5 0,192 14 0,538
236 ` 279 6 0,231 20 0,769
279 ` 322 2 0,077 22 0,846
322 ` 365 4 0,154 26 1,000
Total 26 1,000
Figura 8 – Questa˜o 5 Figura 9 – Questa˜o 5
Departamento de Estat´ıstica 3
Para a varia´vel Clientes cadastrados, os dados va˜o de 128 a 258, resultando na amplitude
∆ = 258 − 128 = 130. Vamos trabalhar com a amplitude ∆′ = 135, que resulta nos
seguintes limites inferiores de classes:
128
128 + 27 = 155
155 + 27 = 182
182 + 27 = 209
209 + 27 = 236
236 + 28 = 263
Clientes cadastrados
Frequeˆncia Simples Frequeˆncia Acumulada
Classes Absoluta Relativa Absoluta Relativa
128 ` 155 9 0,346 9 0,346
155 ` 182 9 0,346 18 0,692
182 ` 209 5 0,192 23 0,885
209 ` 236 1 0,038 24 0,923
236 ` 263 2 0,077 26 1,000
Total 26 1,000
Figura 10 – Questa˜o 5 Figura 11 – Questa˜o 5
folha=10
12 8
13 0 0
14 0 1 5 5
15 0 0 5
16 0 0 5 5
17 0 5 5
18 0 5 5
19 0 5
20 0
21
22 0
23
24
25 0 8
Figura 12 – Questa˜o 5
6. Do pol´ıgono de frequeˆncias dado, vemos que os pontos me´dios das classes sa˜o 3; 5; 7; 9;
11. Assim, cada classe tem comprimento 2. A dsitribuic¸a˜o completa e´:
Departamento de Estat´ıstica 4
Frequeˆncia Simples Frequeˆncia Acumulada
Classes Absoluta Relativa Absoluta Relativa
2 ` 4 10 13,33 10 13,33
4 ` 6 15 20,00 25 33,33
6 ` 8 25 33,33 50 66,67
8 ` 10 20 26,67 70 93,33
10 ` 12 5 6,67 75 100,00
Total 75 100,00
Figura 13 – Renda de funciona´rios de uma empresa
7. Como na˜o foi dada informac¸a˜o contra´ria, vamos assumir que as classes teˆm comprimentos
iguais (essa e´ a unica maneira de resolver esse problema). A amplitude e´ 16 e ha´ 8 classes;
logo, o comprimento de classe e´ 16/8=2 e as classes sa˜o:
[0, 2); [2, 4); [4, 6); [6, 8); [8, 10); [10, 12); [12, 14); [14, 16)
Para a primeira classe, sa˜o dadas as frequeˆncias absolutas simples e relativa. Sabemos
que
0, 04 =
4
n
=⇒ n = 4
0, 04
=⇒ n = 100
Podemos, assim, completar as seguintes informac¸o˜es:
Classe Freq. Simples Freq.Acumulada
Absoluta Relativa (%) Absoluta Relativa (%)
0 ` 2 4 0,04 4 0,04
2 ` 4 8 0,08 12 0,12
4 ` 6 30 0, 30
6 ` 8 27
8 ` 10 72
10 ` 12 83
12 ` 14 10
14 ` 16
TOTAL 100
Subtraindo as frequeˆncias acumuladas de duas classes consecutivas, obtemos a frequeˆncia
simples de uma das classes: 30 − 12 = 18. Continuando com esse processo, podemos
completar a tabela:
Departamento de Estat´ıstica 5
Classe Freq. Simples Freq.Acumulada
Absoluta Relativa Absoluta Relativa
0 ` 2 4 0,04 4 0,04
2 ` 4 8 0,08 12 0,12
4 ` 6 18 0,18 30 0, 30
6 ` 8 27 0,27 57 0,57
8 ` 10 15 0,15 72 0, 72
10 ` 12 11 0,11 83 0, 83
12 ` 14 10 0,10 93 0,93
14 ` 16 7 0,07 100 1,00
TOTAL 100 1,00
8. Para calcular o sala´rio hora´rio me´dio, temos que dividir o total dos vencimentos pelo
total de horas trabalhadas pelos quatro amigos.
x =
10× 3, 50 + 12× 2, 6 + 15× 3, 80 + 8× 2, 20
10 + 12 + 15 + 8
=
10× 3, 50 + 12× 2, 6 + 15× 3, 80 + 8× 2, 20
45
=
10
45
× 3, 50 + 12
45
× 2, 6 + 15
45
× 3, 80 + 8
45
× 2, 20
=
140, 8
45
= 3, 1289
Note que o sala´rio me´dio e´ uma me´dia ponderada dos sala´rios individuais, com o peso
sendo definido pelo nu´mero de horas de trabalho.
9. A carga hora´ria semanal total e´ 4 + 4 + 4 + 6 + 2 = 20. Logo, o CR do aluno e´
CR =
4
20
× 7, 5 + 4
20
× 6, 1 + 4
20
× 8, 3 + 6
20
× 6, 5 + 2
20
× 7, 5
=
141, 6
20
= 7, 08
10. O diagrama de ramos-e-folhas e´ o seguinte:
0 6 8 9
1 0 0 0 2 2 2 2 4 5 5 5 6 8 8 8
2 0 4
A me´dia e´
x =
6 + 8 + 9 + · · ·+ 20 + 24
20
=
274
20
= 13, 7
A moda e´ x∗ = 12 e a mediana e´ a me´dia dos valores centrais:
Q2 =
x(10) + x(11)
3
=
12 + 14
2
= 13
Todos esses resultados esta˜o medidos em horas por semana.
Departamento de Estat´ıstica 6
11. Todos os sala´rios ficaram aumentados em 250 reais. Se chamamos de xi o sala´rio do
funciona´rio i no meˆs de novembro e de yi o sala´rio desse mesmo funciona´rio em dezembro,
enta˜o
yi = xi + 250.
De acordo com a Propriedade 2, o sala´rio me´dio em dezembro e´
y = x+ 250 = 920 + 250 = 1170 reais
12. Seja xi o sala´rio do funciona´rio i no meˆs anterior ao diss´ıdio. Depois do aumento, seu
sala´rio passa a ser
yi = xi + 0, 089xi = 1, 089xi.
Logo, todos os sala´rios ficam multiplicados por 1,089 e, pela Propriedade 3, a me´dia
tambe´m fica multiplicada por este valor, ou seja, depois do diss´ıdio, o sala´rio me´dio passa
a ser
y = 1, 089x = 1, 089× 580 = 631, 62 reais.
13. A diferenc¸a se deve a` existeˆncia de grandes empresas no setor de bebidas, com muitos
empregados. Como vimos, a me´dia e´ bastante influenciada pelos valores discrepantes.
14. Completando a tabela, obtemosClasse de PO Ponto Frequeˆncia Simples Frequeˆncia Acumulada
me´dio Absoluta Relativa (%) Absoluta Relativa (%)
[10, 30) 20 489 53,9735 489 53,9735
[30, 100) 65 269 29,6909 758 83,6645
[100, 500) 300 117 12,9139 875 96,5784
[500, 1000) 750 15 1,6556 890 98,2340
[1000, 2000) 1500 9 0,9934 899 99,2274
[2000, 4000) 3000 7 0,7726 906 100,0000
Total 906 100,0000
Como as frequeˆncias relativas esta˜o em forma percentual, temos que dividir o resultado
por 100, ou seja:
x = (20× 53, 9735 + 65× 29, 6909 + 300× 12, 9139 +
750× 1, 6556 + 1500× 0, 9934 + 3000× 0, 7726)/100
= 119, 3322 empregados
A mediana esta´ na classe 10 ` 30. A frequeˆncia abaixo desta classe e´ nula. Logo, a regra
de treˆs e´
Q2 − 10
50
=
30− 10
53, 9735
⇒ Q2 − 10 = 1000
53, 9735
⇒
Q2 = 28, 528 empregados
Note a diferenc¸a da me´dia para a mediana, resultado da presenc¸a de empresas com muitos
empregados – muitas empresas teˆm poucos empregados, mas poucas empresas teˆm muitos
empregados, o que “puxa” a me´dia para cima.
Departamento de Estat´ıstica 7
15. (a) A me´dia e´
x =
3× 10 + 5× 15 + 7× 25 + 9× 20 + 11× 5
75
= 6, 8667
(b) O ca´lculo dos limites de classe corresponde ao ca´lculo das seguintes separatrizes:
P15, P50, P95. Veja a Figura ?? que ilustra as regras de proporcionalidades envolvidas.
• P15 : [4, 6)
P15 − 4
6− 4 =
15− 13, 33
20
=⇒ P15 = 4, 167
• P50 : [6, 8)
Q2 − 6
8− 6 =
50− 33, 33
33, 33
=⇒ Q2 = 7, 0
• P95 : [10, 12)
P95 − 10
12− 10 =
95− 93, 33
6, 67
=⇒ P95 = 10, 5
Note que, no denominador da frac¸a˜o do lado direito, aparece a frequeˆncia da classe
envolvida. Um erro comum consiste em se tomar a frequeˆncia acumulada.
4 P15 6 6 P50 8 10 P95 12
13,33
15-13,33 50-33,33
33,33
95-93,33
93,33
Figura 14 – Questa˜o 15 – Ca´lculo das separatrizes
16. O diagrama de ramos e folhas e´ o seguinte:
0 6 8 9
1 0 0 0 2 2 2 2 4 5 5 5 6 8 8 8
2 0 4
Conforme calculado no Exerc´ıcio 10, a me´dia e´ x = 13, 7∑
x2i = 6
2 + 82 + · · ·+ 202 + 242 = 4132
σ2 =
4132
20
− 13, 72 = 18, 91⇒ σ =
√
18, 91 = 4, 3486
Como temos n = 20, obervac¸o˜es, a mediana deixa 10 abaixo e 10 acima. Logo, o pri-
meiro quartil e´ a me´dia da quinta e sexta observac¸o˜es (mediana da parte inferior) e o
terceiro quartil e´ a me´dia da de´cima quinta e de´cima sexta observac¸o˜es (mediana da parte
superior). Analisando o diagrama de ramos-e-folhas acima, temos que
Q1 =
x5 + x6
2
=
10 + 10
2
= 10
Q3 =
x15 + x16
2
=
16 + 18
2
= 17
AIQ = 17− 10 = 7
Departamento de Estat´ıstica 8
17.
x =
20× 489 + 65× 269 + 300× 117 + 750× 15 + 1500× 9 + 3000× 7
489 + 269 + 117 + 15 + 9 + 7
=
108115
906
= 119, 3322
∑
fix
2
i =
202 × 489 + 652 × 269 + 3002 × 117 + 7502 × 15 + 15002 × 9 + 30002 × 7
489 + 269 + 117 + 15 + 9 + 7
=
103549625
906
= 114293, 1843 =⇒
σ2 = 114293, 1843− 119, 33222 = 100053, 0033 =⇒ σ =
√
100053, 0033 = 316, 3116
O primeiro quartil esta´ na primeira classe e o terceiro quartil esta´ na segunda classe. Veja
a Figura ??.
• Primeiro quartil
Q1 − 10
30− 10 =
25
53, 9735
=⇒ Q1 = 19, 2638
• Terceiro quartil
Q3 − 30
100− 30 =
75− 53, 9735
26, 6909
=⇒ Q3 = 85, 1444
10 Q1 30 30 Q3 100
25% 75-539735
0 53,9735
Figura 15 – Questa˜o 16 – Ca´lculo dos quartis
18. (a) Os quartis foram calculados anteriormente:
Q1 = 10
Q2 = 13
Q3 = 17
AIQ = 17− 10 = 7
Q1 − 1, 5×AIQ = 17 + 1, 5× 7 = 27, 5
Logo, na˜o ha´ outliers. Veja a Figura ??.
(b) A me´dia e o desvio-padra˜o foram calculados como x = 13, 7 e σ = 4, 3486.O escore
padronizado de uma observac¸a˜o x e´ z =
x− x
σ
. Na tabela a seguir, temos as ob-
servac¸o˜es e seus respectivos escores padronizados. Podemos ver que na˜o ha´ valores
discrepantes, ou seja, nenhum escore padronizdo e´ maior que 3.
Departamento de Estat´ıstica 9
Figura 16 – Questa˜o 16 – Ca´lculo dos quartis
Observac¸a˜o Escore padronizado Observac¸a˜o Escore padronizado
6 -1,7707 14 0,0690
8 -1,3108 15 0,2989
9 -1,0808 15 0,2989
10 -0,8509 15 0,2989
10 -0,8509 16 0,5289
10 -0,8509 18 0,9888
12 -0,3909 18 0,9888
12 -0,3909 18 0,9888
12 -0,3909 20 1,4488
12 -0,3909 24 2,3686
19. Na tabela a seguir temos as informac¸o˜es importantes para o ca´lculo do coeficiente de
correlac¸a˜o.
Pa´ıs X Y X2 Y 2 XY
Islaˆndia 240 63 57600 3969 15120
Noruega 255 100 65025 10000 25500
Sue´cia 340 140 115600 19600 47600
Dinamarca 375 140 140625 30625 65625
Canada´ 510 160 260100 25600 81600
Austra´lia 490 180 240100 32400 88200
Holanda 490 250 240100 62500 122500
Suic¸a 180 180 32400 32400 32400
Finlaˆndia 1125 360 1265625 129600 405000
Gra˜-Bretanha 1150 470 1322500 220900 540500
Estados Unidos 1275 200 1625625 40000 255000
Soma 6430 2278 5365300 607594 1679045
• Me´dias
X =
6430
11
= 584, 5455 Y =
2278
11
= 207, 0909
Departamento de Estat´ıstica 10
• Variaˆncias
σ2X =
5365300
11
−584, 54552 = 146061, 157 σ2Y =
607594
11
−207, 09092 = 12349, 1736
• Covariaˆncia
Cov(X,Y ) =
1679045
11
− 584, 5455× 207, 0909 = 31586, 40496
• Coeficiente de correlac¸a˜o
ρ(X,Y ) =
31586, 40496√
146061, 157× 12349, 1736 = 0, 743727574
Ha´ uma forte correlac¸a˜o linear positiva, ou seja, aumentando o conusumo de cigarros,
aumenta o nu´mero de mortes por caˆncer de pulma˜o.
20. No enunciado, os valores dos somato´rios esta˜o errados. Eis os valores corretos:
59∑
i=1
Xi = 14433
59∑
i=1
Yi = 10470
59∑
i=1
XiYi = 2667063
59∑
i=1
X2i = 3736397
59∑
i=1
Y 2i = 1976794
• Me´dias
X =
14433
59
= 244, 627119 Y =
10470
59
= 177, 457627
• Variaˆncias
σ2X =
3736397
59
−244, 6271192 = 3486, 335536 σ2Y =
1976794
59
−177, 4576272 = 2013, 773628
• Covariaˆncia
Cov(X,Y ) =
2667063
59
− 244, 627119× 177, 457627 = 1793, 509624
• Coeficiente de correlac¸a˜o
ρ(X,Y ) =
1793, 509624√
3486, 335536× 2013, 773628 = 0, 676883
Ha´ uma forte correlac¸a˜o linear positiva, ou seja, aumentando a a´rea da casa, aumenta o
prec¸o de venda.
Departamento de Estat´ıstica 11

Continue navegando