Buscar

ESTATÍSTICA basica unidade02 atividades resolvidas v02

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
 
Exercícios resolvidos da unidade 02 
QUESTÃO 1 - O Sr. José anotou o saldo (em reais) em sua conta corrente no final de cada 
mês durante o segundo semestre de 20xx. Considere estes dados como se fosse uma amostra. 
 
-100 150 -80 150 203 -200 
 
a) Calcule as medidas de posição central usuais para o saldo: média amostral, mediana 
amostral e a moda. 
b) Calcule as medidas de dispersão usuais para o saldo: variância amostral, desvio-padrão 
amostral, amplitude e coeficiente de variação. 
c) Calcule as seguintes medidas de posição não central para o saldo: Percentil 80 (P80) e o 
primeiro quartil (Q1). 
 
Solução ------------------------------------------------------------------------------------------------------------------- 
a) 
Repare que temos dados individuais que não estão agrupados em tabela de frequência. 
Considerando que os saldos acima representam uma amostra, então: 
 
• Media amostral – É a média aritmética simples dos dados 
 
5,20
6
123
6
)200(203150)80(150)100(
n
x
x
i



 reais 
 
• Mediana amostral – É o valor que está no centro do conjunto de dados ORDENADO 
 
Primeiro vamos ordenar os dados 
-200 -100 -80 150 150 203 
 
Como o conjunto tem seis valores (n = 6), não teremos um único valor central e sim DOIS 
valores centrais. A mediana será, então, a média entre estes dois valores. 
 
Md = (-80 + 150) / 2 = 35 reais 
 
Lembre-se 
 Se n = par  A mediana será a média dos dois valores centrais 
 Se n = ímpar  A mediana será o único valor central 
 
• Moda (mo) - É o valor que apresenta maior frequência 
mo = 150 reais (valor que repete mais, ou seja, que aparece mais vezes 
 
 
2 
 
b) 
Considerando que os saldos acima representam uma amostra, então: 
 
• Variância amostral: 
 
       
2
222222
222222
2
n
2
2
2
1
2
i2
(reais) 5,28017
5
5,140087
16
)5,220()5,182()5,129()5,100()5,129()5,120(
16
)5,20200()5,20203()5,20150()5,2080()5,20150()5,20100(
1n
xxxxxx
1n
xx
s













 
 
 
De outra forma 
 
x x2 
-100 10000 
150 22500 
-80 6400 
150 22500 
203 41209 
-200 40000 
123 142609 
 
 
• Desvio-padrão amostral (s ou dp): 
 
reais 38,167 28017,5iânciavars 
 
 
• Amplitude 
 
At = Maior – Menor = [ 203 – (-200) ] = 403 reais 
 
• Coeficiente de variação 
 
CV = dp / média = 167,38 / 20,5 = 8,17 (ou 817%) 
 
OBS: Quando temos nos dados valores positivos e negativos, a média costuma ser muito 
pequena em relação ao desvio-padrão. Nestes casos, não é comum calcular o CV, pois seu 
valor poderá ser muito alto (como foi neste exemplo). 
 
 
Da tabela ao lado temos: 𝑛 = 6 ∑ 𝑥 = 123 ∑ 𝑥2 = 142609 
 
𝑠2 =
𝑛(∑ 𝑥2) − (∑ 𝑥)2
𝑛(𝑛 − 1)
=
6(142609) − (123)2
6 ∙ 5
= 28017,5 
 
3 
 
c) 
Para calcular percentil e quartil precisamos ordenar os dados antes. 
-200 -100 -80 150 150 203 
 
• Percentil 80 (P80) 
 
Precisamos calcular a posição do P80 
pos = 80*6/100 = 4,8 (como 4,8 não é um valor inteiro, vamos arredondá-lo para o 
próximo inteiro. Então P80 será o 5º valor) 
 
P80 = 150 reais (Interpretação: Cerca de 80% das vezes o saldo do Sr. José será menor 
ou igual que 203 reais) 
 
• Primeiro quartil (Q1) ATENÇÃO: Lembre-se de que o Q1 = P25 (percentil 25) 
 
Precisamos calcular a posição do P25 
pos = 25*6/100 = 1,5 (como 1,5 não é um valor inteiro, vamos arredondá-lo para o 
próximo inteiro. Então, Q1 será o 2º valor) 
 
Q1 = -100 reais (Interpretação: Cerca de 25% das vezes o saldo do Sr. José será menor ou 
igual a -100 reais) 
 
 
-200 -100 -80 150 150 203 
 
 
 
 
 
 
 
 
 
 Q1 P80 
4 
 
QUESTÃO 2 - O histograma abaixo mostra a distribuição das notas obtidas pelos alunos na 
primeira prova presencial de Estatística em 2007 no curso virtual de Ciências Contábeis. 
 
 
 
 
 
 
 
 
 
 
 
 
 
a) Usando os dados do histograma construa uma tabela de frequência com a frequência 
absoluta simples (fi), a frequência relativa simples (fri), a frequência absoluta acumulada (Fi) 
e a frequência relativa acumulada (Fri). 
 
b) Calcule a média e o desvio-padrão dos pontos obtidos pelos alunos. 
 
c) Calcule a mediana (Md) e o terceiro quartil (Q3) dos pontos obtidos pelos alunos. Escreva 
uma frase interpretando o Q3. 
 
d) Calcule a moda (usando método de Czuber) dos pontos obtidos pelos alunos. 
 
e) Compare a variabilidade das notas obtidas pelos alunos com a variabilidade do saldo na 
conta corrente do Sr. José (QUESTÃO 1). Onde ocorreu a maior variabilidade? Qual a 
medida estatística que você usou para comparar as variabilidades? 
 
Solução ------------------------------------------------------------------------------------------------------------------- 
 
a) 
Os pontos dos alunos foram divididos em cinco classes (intervalos) com a mesma amplitude. A 
primeira classe é a 0 | 6 pontos e a última é 24 | 30 pontos. O eixo vertical representa a 
quantidade de alunos. A tabela que representa o histograma acima é: 
 
Distribuição dos pontos obtidos 
Pontos 
obtidos 
Frequência 
f 
fr 
(em %) 
F 
Fr 
(em %) 
 0 | 6 7 7,3% 7 7,3% 
 6 | 12 8 8,3% 15 15,6% 
12 | 18 34 35,4% 49 51,0% 
18 | 24 25 26,0% 74 77,0% 
24 | 30 22 23,0% 96 100% 
Total 96 100% - - 
 
3024181260
35
30
25
20
15
10
5
0
Pontos obtidos na primeira prova presencial
Nú
m
er
o 
de
 a
lu
no
s
22
25
34
87
5 
 
b) 
Note que agora temos os dados agrupados em TABELA DE FREQUÊNCIA COM CLASSE. 
 
Para calcular a média, mediana e o desvio-padrão iremos precisar calcular inicialmente o 
ponto médio de cada classe (xi) e depois os produtos xi*fi, xi2*fi 
 
 Vamos usar a tabela de frequência 
Pontos 
obtidos 
Frequência 
f 
Ponto médio da 
classe 
x 
 
x·f 
 
x2·f 
 0 | 6 7 3 21 63 
 6 | 12 8 9 72 648 
12 | 18 34 15 510 7650 
18 | 24 25 21 525 11025 
24 | 30 22 27 594 16038 
Total  f = 96 -- 1722 35424 
 
Para ver como foram feitos os cálculos, pegaremos a quarta classe como referência. 
 
Quarta classe: 18 | 24 
 xi = (24 + 18)/2 = 21 (ponto médio da 4ª classe) 
 xi·fi = 21*25 = 525 
 xi2·f = (21)2*25 = 11025 
 
Do total da tabela temos: n =  fi = 96  xi·fi = 1722 e  xi2·fi = 35424 
 
• Media amostral: 
 
94,17
96
722.1
f
]fx[
x
i
ii


 pontos 
 
• Variância amostral (s2) e desvio-padrão amostral (s) 
 
Lembre-se de que o desvio-padrão é a raiz quadrada da variância. 
 
𝑉𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙: 𝑠2 =
𝑛(∑ 𝑥2𝑓) − (∑ 𝑥𝑓)2
𝑛(𝑛 − 1)
=
96(35424) − (1722)2
96 ∙ 95
= 47,74 
 
Desvio-padrão amostral: 
91,674342,47s 
 pontos 
 
RESPOSTA: A média amostral foi 17,94 pontos e o desvio-padrão amostral foi 6,91 pontos. 
 
 
 
 
6 
 
c) 
Vamos acrescentar a coluna de frequência acumulada (F). 
 
Pontos 
obtidos 
Frequência 
(f) 
Frequência 
acumulada 
(F) 
 0 | 6 7 7 
 6 | 12 8 15 
12 | 18 34 49 
18 | 24 25 74 
24 | 30 22 96 
 
• Mediana amostral (Md) 
 
Como estamos trabalhando com tabela de frequência, vamos usar a fórmula abaixo. 
 
Md = ℓ +
(
𝑛
2 − 𝐹𝑎𝑛𝑡)
𝑓
(𝐿 − ℓ) 
 
A classe onde está Md é a classe com frequência absoluta acumulada (Fi) imediatamente 
superiora posição da mediana pos = 48 (= n/2 = 96/2). Portanto, seria a 3ª classe (12 | 18) 
 
Da classe temos: ℓ = 12 L = 18 f = 34 Fant = 15 (Fi da classe anterior) 
 
Md = ℓ +
(
𝑛
2 − 𝐹𝑎𝑛𝑡)
𝑓
(𝐿 − ℓ) = 12 +
(
96
2 − 15)
34
(18 − 12) = 17,82 𝑝𝑜𝑛𝑡𝑜𝑠 
 
• Terceiro quartil (Q3) Lembre-se de que o Q3 = P75 (percentil 75) 
 
A classe onde está Q3 é classe com frequência acumulada (Fi) imediatamente superior a 
pos = 72 (= k·n/100 = 75·96/100). Portanto, a classe é quarta classe (18 | 24). 
 
Da classe temos: ℓ = 18 L = 24 f = 25 Fant = 49 (Fi da classe anterior) 
 
Md = ℓ +
(
𝑛
2 − 𝐹𝑎𝑛𝑡)
𝑓
(𝐿 − ℓ) = 18 +
(
75 ∙ 96
100 − 49)
25
(24 − 18) = 23,52 𝑝𝑜𝑛𝑡𝑜𝑠 
 
INTERPRETAÇÃO: Cerca de 75% dos alunos obtiveram notas menores ou iguais a 23,52 pontos. 
 
 
 
 
 
 
 
 
7 
 
d) 
 
Pontos 
obtidos 
Frequência 
(f) 
 0 | 6 7 
 6 | 12 8 
12 | 18 34 
18 | 24 25 
24 | 30 22 
 
Primeiro vamos identificar a classe modal que é a aquela com maior frequência absoluta (fi) 
Classe modal: 3ª classe (12 | 18) 
 
Da classe temos: ℓ = 12 L = 18 f = 34 fant = 8 e fpos = 25 
 
Mo = ℓ +
(𝑓 − 𝑓𝑎𝑛𝑡)
(𝑓 − 𝑓𝑎𝑛𝑡) + (𝑓 − 𝑓𝑝𝑜𝑠)
(𝐿 − ℓ) = 12 +
(34 − 8)
(34 − 8) + (35 − 25)
(18 − 12)
= 16,46 𝑝𝑜𝑛𝑡𝑜𝑠 
 
 
8 
 
e) 
 
NOTAS: média = 17,94 pts desvio-padrão = 6,91 pts 
SALDO: média = 20,5 reais desvio-padrão = 167,38 reais 
 
Como se trata de variáveis com unidades de medidas diferentes (um é em pontos e o outro é 
em reais), então não há como usar o desvio-padrão para comparar a variabilidade. Devemos, 
portanto, usar o coeficiente de variação (CV) 
 
NOTAS: CV = 6,91 / 17,94 = 0,38 (ou 38%) 
SALDO: CV = 167,38 / 20,5 = 8,16 (ou 816%) 
A maior variabilidade ocorreu nos saldos, pois o seu CV é maior. 
 
9 
 
QUESTÃO 3 - Em uma empresa com 14 funcionários e mais o gerente, o salário médio era de 
R$ 1.800,00. O gerente que ganhava R$ 15.000,00 foi demitido. 
a) Qual é a média salarial dos funcionários que permaneceram? Houve uma grande diferença 
no salário médio desta empresa com o gerente e sem o gerente? 
b) Você acha justo dizer (antes de o gerente sair) que os funcionários ganhavam em média R$ 
1.800,00? 
 
Solução ------------------------------------------------------------------------------------------------------------------- 
a) 
Se o salário médio dos 15 era 1800, então os 15 juntos ganhavam um salário total de 
15*1800 = 27000 reais. Se o gerente saiu, e ele ganhava 15000, então os 14 funcionários que 
ficaram a ganham 27000 – 15000 = 12000 reais. Portanto, a média agora será 
média = 12000 / 14 = 857,14 reais  média = 857,14 reais 
 
b) 
Não acho que a média salarial de 1800 reais fosse uma medida justa para melhor representar 
os salários dos funcionários. O alto salário do gerente “puxava” a média salarial para cima. 
QUESTÃO 4 - Considerando a amostra x = {62, 75, b, 78, 82, 64} e que a média amostral é 
5,69x 
, determine a o valor de ‘b’. 
 
Solução ------------------------------------------------------------------------------------------------------------------- 
 
5,69
6
648278b7562
n
x
x
i



 
 
361 + b = 6*69,5  361 + b = 417  b = 417 – 361  b = 56 
 
10 
 
QUESTÃO 5 - Se a média e o desvio-padrão da variável aleatória X são 10 e 3 
respectivamente, então a média e o desvio-padrão da variável aleatória Y = 4X + 5 são dadas 
respectivamente por: 
 
(A) 40 e 17 
(B) 45 e 12 
(C) 40 e 12 
(D) 45 e 17 
 
Solução ------------------------------------------------------------------------------------------------------------------- 
 
Veja que para obter a variável Y = 4X + 5 temos multiplicar o X por 4 e depois somar 5. 
 
• Pela propriedade da média para a média do Y será igual a 4*(média de X) + 5 = 4(10) + 
5 = 45 (ambas multiplicação e soma têm o mesmo efeito na média) 
 
• Pela propriedade do desvio-padrão o desvio-padrão do Y será igual a 4*(dp de X) = 
4(3) = 12 (a soma não altera o valor do desvio-padrão) 
 
Resposta: letra B 
 
11 
 
QUESTÃO 6 - Uma amostra de doze mulheres adultas foi escolhida ao acaso e foi registrado 
a pressão arterial (y) e a idade (x) em meses de cada uma. Abaixo temos os somatórios dos 
valores obtidos. 
 
𝑛 = 12 ∑ 𝑦 = 1684 ∑ 𝑦2 = 238822 ∑ 𝑥 = 7536 ∑ 𝑥2 = 4955904 ∑ 𝑥𝑦 = 1078728 
 
a) Calcule a covariância entre as variáveis 
b) Calcule o coeficiente de correlação de Pearson entre as variáveis. 
c) O que você pode dizer sobre a associação entre as variáveis estudadas? 
 
Solução ------------------------------------------------------------------------------------------------------------------- 
 
a) 
 
A covariância é 𝑆𝑥𝑦 = 0,896 
 
𝑆𝑥𝑦 =
𝑛∑𝑥𝑦 − ∑𝑥∑𝑦 
𝑛(𝑛 − 1)
=
12 ∙1078728 − 7536∙1684
12 ∙ (12 − 1)
=
254112
132
= 1925,09 
 
O valor positivo do 𝑆𝑥𝑦 indica uma correlação linear positiva. 
 
b) 
O coeficiente de Pearson é 𝑟𝑥𝑦 = 0,896, indicando uma forte correlação linear entre as 
variáveis. 
 
𝑟𝑥𝑦 =
𝑛∑𝑥𝑦 − ∑𝑥∑𝑦 
√𝑛∑𝑥2 − (∑𝑥)2 ∙ √𝑛∑𝑦2 − (∑𝑦)2
 
 
=
12 ∙1078728 − 7536∙1684
√12∙4955904 − (7536)2 ∙ √12∙238822 − (1684)2
 
 
=
254112
√2679552 ∙ √30008
= 0,896 
 
c) 
 
O coeficiente de Pearson é 𝑟𝑥𝑦 = 0,896 indicando que há uma forte correlação linear entre as 
variáveis. Para confirmar esta conclusão seria necessário fazer o gráfico de dispersão entre os 
dados das variáveis, o que não é possível com apenas os somatórios fornecidos.

Outros materiais