Buscar

Estatística Descritiva I

Prévia do material em texto

MAE116 – Noc¸o˜es de Estat´ıstica
Grupo A - I semestre de 2017
Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito)
Exerc´ıcio 1.
(30 pontos). Os dados a seguir representam medidas de Sil´ıcio (%) de amostras de 13 sedimentos
da cordilheira marinha central do Oceano I´ndico.
Amostra 1 2 3 4 5 6 7 8 9 10 11 12 13
Sil´ıcio 20,1 22,3 19,2 24,2 21,5 20,4 46,8 22,2 22,1 19,1 22,6 21,3 17,7
(a) (15 pontos). Calcule a me´dia, a mediana, o desvio padra˜o e os quartis.
Resposta:
Me´dia:
x¯ =
∑n
i=1 xi
n
=
20, 1 + 22, 3 + 19, 2 + ... + 22, 6 + 21, 3 + 17, 7
13
= 23, 03846.
Ou seja, em me´dia foi verificado um percentual de 23,038% de Sil´ıcio nos sedimentos
observados na cordilheira marinha central do Oceano I´ndico.
Mediana:
Primeiro ordenamos os dados: 17,7 19,1 19,2 20,1 20,4 21,3 21,5 22,1 22,2 22,3 22,6 24,2
46,8 e calculamos a posic¸a˜o da mediana n+1
2
= 13+1
2
= 7, portanto Md = 21, 5 gramas.
Desvio padra˜o:
O desvio padra˜o corresponde a raiz quadrada da variaˆncia,
s =
√
s2 =
√∑n
i=1(xi − x¯)2
n− 1
=
√
(x1 − x¯)2 + (x2 − x¯)2 + · · ·+ (xn − x¯)2
n− 1
=
√
(20, 1− 23, 03846)2 + (22, 3− 23, 03846)2 + (19, 2− 23, 03846)2 + · · ·+ (17, 7− 23, 03846)2
13− 1
=
√
648, 0108
12
=
√
54, 0009 = 7, 34853.
Pa´gina 1 de 11
MAE116 – Noc¸o˜es de Estat´ıstica
Grupo A - I semestre de 2017
Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito)
De outra maneira,
s =
√
s2 =
√∑n
i=1 x
2
i − nx¯2
n− 1 =
√
x21 + x
2
2 + · · ·+ x215 − nx¯2
n− 1
=
√
20, 12 + 22, 32 + 19, 22 + · · ·+ 17, 72 − (13)(23, 03846)2
13− 1
=
√
7548, 03− (13)(530, 7706)
12
=
√
648, 0109
12
= 7, 34853.
Quartis:
Quando um conjunto de dados ordenado e´ dividido em 4 partes iguais, temos 3 quartis,
que correspondem aos percentis 25, 50 e 75, calculados como o valor da varia´vel que ocupa
a posic¸a˜o p× (n + 1), com p=0,25, p=0,50 e p=0,75.
Dados ordenados: 17,7 19,1 19,2 20,1 20,4 21,3 21,5 22,1 22,2 22,3 22,6 24,2 46,8.
• Primeiro Quartil
Q1 = Percentil 25 ⇒ posic¸a˜o 0, 25(13 + 1) = 3, 5 ⇒ Q1 = (19, 2 + 20, 1)/2 = 19, 65.
Assim, 25% das amostas de sedimentos da cordilheira marinha central do Oceano
I´ndico possuem quantidade de Sil´ıcio menor ou igual a 19,65%.
• Segundo Quartil
Q2 = Percentil 50 = Mediana (ja´ calculada). Assim, 50% das amostas de sedimentos
da cordilheira marinha central do Oceano I´ndico possuem quantidade de Sil´ıcio menor
ou igual a 21,5%.
• Terceiro Quartil
Q3 = Percentil 75 ⇒ posic¸a˜o 0, 75(13 + 1) = 10, 5 ⇒ Q3 = (22, 3 + 22, 6)/2 = 22, 45.
Assim, 75% das amostas de sedimentos da cordilheira marinha central do Oceano
I´ndico possuem quantidade de Sil´ıcio menor ou igual a 22,45%.
�
(b) (15 pontos). Note que a amostra 7 apresenta um valor at´ıpico. Remova esse valor e refac¸a
o item anterior. Comente as diferenc¸as encontradas.
Resposta:
Pa´gina 2 de 11
MAE116 – Noc¸o˜es de Estat´ıstica
Grupo A - I semestre de 2017
Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito)
Me´dia:
x¯ =
∑n
i=1 xi
n
=
20, 1 + 22, 3 + ... + 21, 3 + 17, 7
12
= 21, 05833.
Mediana:
Primeiro ordenamos os dados: 17,7 19,1 19,2 20,1 20,4 21,3 21,5 22,1 22,2 22,3 22,6 24,2
e calculamos a posic¸a˜o da mediana n+1
2
= 12+1
2
= 6, 5. Neste caso, como n = 12 e´ par, a
mediana sera´ dada pela me´dia dos valores das duas observac¸o˜es centrais, ou seja, posic¸o˜es
6 e 7, deste modo, temos: Md =
21,3+21,5
2
= 21, 4.
Desvio padra˜o (s)
s =
√
s2 =
√∑n
i=1(xi − x¯)2
n− 1
=
√
(x1 − x¯)2 + (x2 − x¯)2 + · · ·+ (xn − x¯)2
n− 1
=
√
(20, 1− 21, 05833)2 + (22, 3− 21, 05833)2 + (19, 2− 21, 05833)2 + · · ·+ (17, 7− 21, 05833)2
12− 1
=
√
36, 34917
11
=
√
3, 30447 = 1, 81782.
De outra maneira,
s =
√
s2 =
√∑n
i=1 x
2
i − nx¯2
n− 1 =
√
x21 + x
2
2 + · · ·+ x215 − nx¯2
n− 1
=
√
20, 12 + 22, 32 + 19, 22 + · · ·+ 17, 72 − (12)(21, 05833)2
12− 1
=
√
5357, 79− (12)(443, 4534)
12
=
√
36, 34917
11
= 1, 81782.
Quartis
Similar ao item (a), teremos:
Dados ordenados: 17,7 19,1 19,2 20,1 20,4 21,3 21,5 22,1 22,2 22,3 22,6 24,2.
• Primeiro Quartil
Pa´gina 3 de 11
MAE116 – Noc¸o˜es de Estat´ıstica
Grupo A - I semestre de 2017
Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito)
Q1 = Percentil 25 ⇒ posic¸a˜o 0, 25(12 + 1) = 3, 25 ⇒ Q1 = (19, 2 + 20, 1)/2 = 19, 65.
Assim, 25% das amostas de sedimentos da cordilheira marinha central do Oceano
I´ndico possuem quantidade de Sil´ıcio menor ou igual a 19,65%.
• Segundo Quartil
Q2 = Percentil 50 = Mediana (ja´ calculada). Assim, 50% das amostas de sedimentos
da cordilheira marinha central do Oceano I´ndico possuem quantidade de Sil´ıcio menor
ou igual a 21,4%.
• Terceiro Quartil
Q3 = Percentil 75 ⇒ posic¸a˜o 0, 75(12 + 1) = 9, 75 ⇒ Q3 = (22, 2 + 22, 3)/2 = 22, 25.
Assim, 75% das amostas de sedimentos da cordilheira marinha central do Oceano
I´ndico possuem quantidade de Sil´ıcio menor ou igual a 22,25%.
Comenta´rios: Note que, no item (a) a me´dia ficou levemente afastada da mediana e com
a remoc¸a˜o da observac¸a˜o 7 (item (b)) a me´dia ficou mais pro´xima da mediana, logo, observe
que a me´dia e´ influenciada por valores mais elevados.
A maior diferenc¸a que podemos observar com a remoc¸a˜o da observac¸a˜o 7 esta relacionada
ao desvio padra˜o. Com a remoc¸a˜o, o desvio padra˜o passou de 7,34853 para 1,81782, ou
seja, o desvio padra˜o mais que quadruplica com a permaneˆncia da observac¸a˜o 7. O desvio
padra˜o diminui muito com a retirada da observac¸a˜o at´ıpica.
Em relac¸a˜o aos percentis praticamente na˜o houve diferenc¸a nos dois casos, o que nos mostra
a pouca (ou quase nenhuma) influeˆncia em valores at´ıpicos para o ca´lculo destas medidas
de posic¸a˜o. �
Pa´gina 4 de 11
MAE116 – Noc¸o˜es de Estat´ıstica
Grupo A - I semestre de 2017
Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito)
Exerc´ıcio 2.
(40 pontos). Um estudo foi realizado para comparar o peso da carne, em gramas, de mexilho˜es
de dois locais: sambaqui e manguezal. Para isso, foram coletados e pesados, 15 mexilho˜es de
cada local. Os dados esta˜o apresentados na Tabela 1.
Tabela 1: Peso da carne de mexilho˜es, em gramas, em dois locais.
Sambaqui Manguezal
30,61 25,34
28,89 25,67
32,21 17,64
24,25 33,97
25,63 11,13
42,88 9,49
36,22 16,92
28,86 12,91
22,56 14,05
22,92 14,88
27,94 19,17
41,45 21,60
42,59 20,01
15,25 19,81
33,29 16,22
Estat´ısticas descritivas obtidas para esses dados sa˜o apresentadas a seguir (Tabela 2):
Tabela 2: Estat´ısticas descritivas dos pesos dos mexilho˜es.
Local n me´dia Desvio Padra˜o CV Min Q1 mediana Q3 Ma´x
Sambaqui 15 30,37 7,97
Manguezal 15 18,59 6,32 14,05 17,64 21,6
(a) (5 pontos). Quais sa˜o as varia´veis do estudo? Classifique-as.
Resposta:
Para cada tipo de local estamos interessados em estudar o peso da carne dos mexilho˜es.
Logo, a varia´vel peso corresponde a uma varia´vel quantitativa cont´ınua e o local corres-
ponde a uma varia´vel qualitativa nominal. �
(b) (5 pontos). Complete a tabela de estat´ısticas descritivas (Tabela 2).
Resposta:
Sambaqui:
Pa´gina 5 de 11
MAE116 – Noc¸o˜es de Estat´ıstica
Grupo A - I semestre de 2017
Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito)
Ordenando os valores (15,25 22,56 22,92 24,25 25,63 27,94 28,86 28,89 30,61 32,21 33,29
36,22 41,45 42,59 42,88) pode-se observar que Min=15,25 e o Ma´x=42,88, bem como
CV = (s/x¯)× 100% = (6, 32/18, 59)× 100% = 26, 243%.
Ale´m disso,
• Primeiro Quartil
Q1 = Percentil 25 ⇒ posic¸a˜o 0, 25(15 + 1) = 4 ⇒ Q1 = 24, 25.
• Segundo Quartil (Mediana)
Q2 = Percentil 50 ⇒ posic¸a˜o 0, 5(15 + 1) =8 ⇒ Q2 = 28, 89.
• Terceiro Quartil
Q3 = Percentil 75 ⇒ posic¸a˜o 0, 75(15 + 1) = 12 ⇒ Q3 = 36, 22.
Manguezal:
Ordenando os valores (9,49 11,13 12,91 14,05 14,88 16,22 16,92 17,64 19,17 19,81 20,01
21,60 25,34 25,67 33,97) pode-se observar que Min=9,49 e o Ma´x=33,97. Ale´m disso,
CV = (s/x¯) × 100% = (7, 97/30, 37) × 100% ≈ 34%. Note tambe´m que, posic¸a˜o Q1=4o
⇒ Q1 = 14, 05, posic¸a˜o Q3=12o ⇒ Q3 = 21, 6.
Tabela 3: Estat´ısticas descritivas (completas) dos pesos dos mexilho˜es.
Local n me´dia Desvio Padra˜o CV Min Q1 mediana Q3 Ma´x
Sambaqui 15 30,37 7,97 26,243% 15,25 24,25 28,89 36,22 42,88
Manguezal 15 18,59 6,32 34% 9,49 14,05 17,64 21,6 33,97
�
(c) (5 pontos). 50% dos mexilho˜es do Sambaqui apresentam peso da carne inferior a qual
valor? E se considerarmos 75% dos mexilho˜es?
Resposta:
Note que 50% e´ o limite correspondente ao segundo quartil (mediana), logo podemos obser-
var que 50% dos mexilho˜es do Sambaqui apresentam peso inferior ou igual a 28,89 gramas.
Da mesma forma que 75% corresponde ao terceiro quartil, podemos observar que 75% dos
mexilho˜es do Sambaqui apresentam peso inferior ou igual a 36,22 gramas. �
Pa´gina 6 de 11
MAE116 – Noc¸o˜es de Estat´ıstica
Grupo A - I semestre de 2017
Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito)
(d) (5 pontos). 25% dos mexilho˜es do Manguezal apresentam peso da carne superior a qual
valor? E se considerarmos 75% dos mexilho˜es?
Resposta:
Podemos observar que 25% dos mexilho˜es do Manguezal apresentam peso superior ou igual
a 21,6 gramas.
Podemos observar que 75% dos mexilho˜es do Manguezal apresentam peso superior ou igual
a 14,05 gramas. �
(e) (5 pontos). Escolhendo casualmente um mexilha˜o do Manguezal, o que seria mais prova´vel:
peso da carne maior ou menor que 21,6 gramas? Justifique.
Resposta:
Note que 21,6 gramas corresponde ao terceiro quartil, ou seja, 75% dos dados possuem va-
lores dos pesos menores ou iguais a 21,6 granas, logo se escolhermos ao acaso um mexilha˜o
do Manguezal e´ mais prova´vel que este tenha um peso inferior a 21,6 gramas. �
(f) (5 pontos). Utilizando o desvio padra˜o, compare os dois locais quanto a` homogeneidade.
Resposta:
Note que para o Sambaqui temos um desvio padra˜o de 7,97 e para o Manguezal o desvio
padra˜o e´ de 6,32, logo observando esses dois valores podemos concluir que o Sambaqui
e´ um pouco menos homogeˆneo quanto aos pesos dos mexilho˜es. O desvio padra˜o para o
Sambaqui corresponde a 1,26 vezes maior que o desvio padra˜o para o Manguezal. �
(g) (5 pontos). Calcule o coeficiente de variac¸a˜o para cada local. A conclusa˜o e´ a mesma do
item anterior? Qual e´ a medida de variabilidade mais adequada? Justifique.
Resposta:
Podemos observar pela Tabela 3 que os coeficientes de variac¸a˜o do Sambaqui e do Man-
guezal correspondem, respectivamente, a 26,243% e 34%. Logo, por esta medida podemos
concluir que o local Manguezal e´ menos homogeˆneo (mais heterogeˆneo) quanto aos pesos
dos mexilho˜es.
Note que a conclusa˜o difere de quando usado o desvio padra˜o. No entanto, a medida de
dispersa˜o mais adequada para comparar dois (ou mais) grupos e´ o CV, pois este nos for-
nece uma medida de variabilidade relativa a me´dia. Ale´m disso, o CV elimina o efeito de
Pa´gina 7 de 11
MAE116 – Noc¸o˜es de Estat´ıstica
Grupo A - I semestre de 2017
Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito)
magnitude dos dados e corresponde a uma medida adimensional. �
(h) (5 pontos). Voceˆ diria que o crescimento dos mexilho˜es esta´ associado ao local?
Resposta:
Observando as medidas obtidas (Tabela 3), nota-se que os mexilho˜es do Sambaqui possuem
medidas de peso superiores a`s medidas do local Manguezal, seja a me´dia, Min, mediana,
Ma´x, ale´m dos percentis. Logo, as medidas nos indicam que ha´ uma relevante diferenc¸a nos
pesos dos mexilho˜es dados os dois locais distintos. Apesar do local Manguezal possuir uma
menor variabilidade, este forneceu mexilho˜es com peso de carne inferior ao local Sambaqui.
�
Exerc´ıcio 3.
(30 pontos). Uma amostra de 150 alunos da USP foi selecionada e para cada estudante foi
perguntado o nu´mero de vezes que ele prestou o vestibular da FUVEST (x). Observou-se que
75 estudantes prestaram o vestibular da FUVEST, uma u´nica vez, 47 prestaram duas vezes e
assim por diante. Os dados esta˜o na tabela abaixo:
Tabela 4: Freq. observada dos alunos submetidos ao vestibular da FUVEST.
Nu´mero de vezes
que prestou FUVEST (x) ni
1 75
2 47
3 21
4 7
(a) (5 pontos). Qual e´ a varia´vel de interesse do estudo? Classifique-a.
Resposta:
A varia´vel (X) de interesse nesse estudo corresponde ao nu´mero de vezes que o aluno entre-
vistado prestou o vestibular da FUVEST. Observe que temos uma contagem, logo podemos
caracterizar a varia´vel X como sendo uma varia´vel quantitativa discreta. �
(b) (12 pontos). Calcule a me´dia, a mediana, a moda, a variaˆncia e o desvio padra˜o do nu´mero
de vezes que o estudante prestou o vestibular da FUVEST.
Resposta:
Pa´gina 8 de 11
MAE116 – Noc¸o˜es de Estat´ıstica
Grupo A - I semestre de 2017
Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito)
me´dia amostral:
Como os valores observados se repetem, a me´dia pode ser calculada da seguinte forma:
x¯ =
4∑
i=1
xi × ni
n
=
1× 75 + 2× 47 + 3× 21 + 4× 7
150
= 260/150 = 1, 733.
Ou seja, em me´dia os alunos prestam o vestibular da FUVEST 1,733 vezes.
mediana:
Para calcularmos a mediana, precisamos obter a posic¸a˜o da mediana que e´ dada por
0,5×(n+1) = 0,5×151=75,5. Logo, a mediana sera a me´dia aritme´tica entre os valores
das posic¸o˜es 75 e 76. Temos que 75o=1 e 76o=2. Portanto, Mediana=(1+2)/2=1,5. Note
que a mediana na˜o divergiu tanto em relac¸a˜o a me´dia que foi de 1,733 vezes.
moda:
A moda equivale a observac¸a˜o que e´ mais frequente, e pela segunda coluna da tabela
podemos observar que a observac¸a˜o que mais aparece na base de dados e´ o valor 1.
variaˆncia:
Pela fo´rmula da variaˆncia temos s2 =
∑n
i=1 (xi−x¯)2
n−1 . No entanto, observe que ter´ıamos que
fazer 75 vezes a diferenc¸a (1− 1, 733)2, 47 vezes a diferenc¸a (2− 1, 733)2, e assim sucessiva-
mente. Enta˜o, podemos reescrever a nossa expressa˜o como sendo s2 =
∑4
i=1 ni(xi−x¯)2
n−1 , o que
nos fornece:
s2 =
∑4
i=1 ni(xi − x¯)2
n− 1
=
75× (1− 1, 733)2 + 47× (2− 1, 733)2 + 21× (3− 1, 733)2 + 7× (4− 1, 733)2
150− 1
= 113, 3333/149 = 0, 76063.
Obs.: Se usar 1,73 ao inve´s de 1,733, enta˜o s2 = 0, 76064.
desvio padra˜o:
O desvio padra˜o sera´ dado por s =
√
s2 =
√
0, 76063 = 0, 87214 (ou 0,87215). �
(c) (13 pontos). Existe interesse em estudar o gasto dos alunos com as despesas do vestibular.
Suponha, para simplificar, que cada aluno tem uma despesa fixa de R$ 5000,00, relativa
a` preparac¸a˜o e mais R$ 150,00 para cada vestibular prestado. Desta forma tem-se que a
despesa e´ d = 5000+150x. Calcule a me´dia, a mediana, a moda, a variaˆncia e o desvio
Pa´gina 9 de 11
MAE116 – Noc¸o˜es de Estat´ıstica
Grupo A - I semestre de 2017
Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito)
padra˜o da despesa com vestibular da FUVEST.
Resposta:
me´dia:
Calculando as despesas para cada grupo teremos:
No de vezes (xi) ni Despesa (di)
1 75 5000+150×1=5150
2 47 5000+150×2=5300
3 21 5000+150×3=5450
4 7 5000+150×4=5600
Σ 150 - -
Logo, a me´dia da despesa gasta com o vestibular da FUVEST e´ dada por:
d¯ =
4∑
i=1
ni × di
150
=
75× 5150 + 47× 5300 + 21× 5450 + 7× 5600
150
=
789000
150
= 5260.
Ou seja, a despesa me´dia com o vestibular e´ de R$ 5.260,00.
variaˆncia:
Como temos medidas repetidas, enta˜o a variaˆncia sera´ dada por:
s2d =
∑4
i=1 ni(di − d¯)2
n− 1=
75× (5150− 5260)2 + ... + 7× (5600− 5260)2
149
=
2550000
149
= 17114, 09.
desvio padra˜o:
Note que a unidade de medida para a variaˆncia na˜o faz sentido na pra´tica, enta˜o calcu-
lemos o desvio padra˜o para normalizarmos a unidade de medida. Ou seja, sd =
√
s2d =√
17114, 09 = 130, 8208. Logo, sd = R$130, 82.
mediana:
Posic¸a˜o da mediana: 0,5×(n+1)=0,5×(151)=75,5 ⇒ Med(d)=(5150+5300)/2=5225.
moda:
A moda de d e´ o valor da despesa mais frequente. Logo, moda(d)=5150.
Pa´gina 10 de 11
MAE116 – Noc¸o˜es de Estat´ıstica
Grupo A - I semestre de 2017
Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito)
Formas alternativas para a me´dia e desvio padra˜o:
A seguir temos uma forma alternativa para o ca´lculo da me´dia e do desvio padra˜o. Relem-
bre, do exerc´ıcio 2 (d) da Lista 1 de classe, que:
Se y = a + bx, enta˜o y¯ = a + bx¯. Ale´m disso, s2y = b
2s2x, bem como sy = bsx.
Portanto, voltando ao nosso exemplo e sendo d = 5000 + 150x, teremos que d¯ = a + bx¯,
onde a = 5000 e b = 150. Logo,
d¯ = 5000 + 150× x¯ = 5000 + 150× 1, 733 = 5259, 95 ≈ 5260.
E para a variaˆncia de d teremos: s2d = b
2s2x = 150
2 × 0, 76063 = 17114, 17. Ou seja,
s2d = (R$)
217.114, 17. (Se s2x = 0, 76064⇒ s2d = 17114, 4)
Obs.: A diferenc¸a do valor 17114,17 para 17114,09 foi devido ao arredondamento da me´dia
(1,733).
E o desvio padra˜o sera´ dado por: sd = bsx ⇒ sd = 150× 0, 87214 = 130, 82. �
Pa´gina 11 de 11

Continue navegando