Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Exercícios resolvidos da unidade 02 QUESTÃO 1 - O Sr. José anotou o saldo (em reais) em sua conta corrente no final de cada mês durante o segundo semestre de 20xx. Considere estes dados como se fosse uma amostra. -100 150 -80 150 203 -200 a) Calcule as medidas de posição central usuais para o saldo: média amostral, mediana amostral e a moda. b) Calcule as medidas de dispersão usuais para o saldo: variância amostral, desvio-padrão amostral, amplitude e coeficiente de variação. c) Calcule as seguintes medidas de posição não central para o saldo: Percentil 80 (P80) e o primeiro quartil (Q1). Solução ------------------------------------------------------------------------------------------------------------------- a) Repare que temos dados individuais que não estão agrupados em tabela de frequência. Considerando que os saldos acima representam uma amostra, então: • Media amostral – É a média aritmética simples dos dados 5,20 6 123 6 )200(203150)80(150)100( n x x i reais • Mediana amostral – É o valor que está no centro do conjunto de dados ORDENADO Primeiro vamos ordenar os dados -200 -100 -80 150 150 203 Como o conjunto tem seis valores (n = 6), não teremos um único valor central e sim DOIS valores centrais. A mediana será, então, a média entre estes dois valores. Md = (-80 + 150) / 2 = 35 reais Lembre-se Se n = par A mediana será a média dos dois valores centrais Se n = ímpar A mediana será o único valor central • Moda (mo) - É o valor que apresenta maior frequência mo = 150 reais (valor que repete mais, ou seja, que aparece mais vezes 2 b) Considerando que os saldos acima representam uma amostra, então: • Variância amostral: 2 222222 222222 2 n 2 2 2 1 2 i2 (reais) 5,28017 5 5,140087 16 )5,220()5,182()5,129()5,100()5,129()5,120( 16 )5,20200()5,20203()5,20150()5,2080()5,20150()5,20100( 1n xxxxxx 1n xx s De outra forma x x2 -100 10000 150 22500 -80 6400 150 22500 203 41209 -200 40000 123 142609 • Desvio-padrão amostral (s ou dp): reais 38,167 28017,5iânciavars • Amplitude At = Maior – Menor = [ 203 – (-200) ] = 403 reais • Coeficiente de variação CV = dp / média = 167,38 / 20,5 = 8,17 (ou 817%) OBS: Quando temos nos dados valores positivos e negativos, a média costuma ser muito pequena em relação ao desvio-padrão. Nestes casos, não é comum calcular o CV, pois seu valor poderá ser muito alto (como foi neste exemplo). Da tabela ao lado temos: 𝑛 = 6 ∑ 𝑥 = 123 ∑ 𝑥2 = 142609 𝑠2 = 𝑛(∑ 𝑥2) − (∑ 𝑥)2 𝑛(𝑛 − 1) = 6(142609) − (123)2 6 ∙ 5 = 28017,5 3 c) Para calcular percentil e quartil precisamos ordenar os dados antes. -200 -100 -80 150 150 203 • Percentil 80 (P80) Precisamos calcular a posição do P80 pos = 80*6/100 = 4,8 (como 4,8 não é um valor inteiro, vamos arredondá-lo para o próximo inteiro. Então P80 será o 5º valor) P80 = 150 reais (Interpretação: Cerca de 80% das vezes o saldo do Sr. José será menor ou igual que 203 reais) • Primeiro quartil (Q1) ATENÇÃO: Lembre-se de que o Q1 = P25 (percentil 25) Precisamos calcular a posição do P25 pos = 25*6/100 = 1,5 (como 1,5 não é um valor inteiro, vamos arredondá-lo para o próximo inteiro. Então, Q1 será o 2º valor) Q1 = -100 reais (Interpretação: Cerca de 25% das vezes o saldo do Sr. José será menor ou igual a -100 reais) -200 -100 -80 150 150 203 Q1 P80 4 QUESTÃO 2 - O histograma abaixo mostra a distribuição das notas obtidas pelos alunos na primeira prova presencial de Estatística em 2007 no curso virtual de Ciências Contábeis. a) Usando os dados do histograma construa uma tabela de frequência com a frequência absoluta simples (fi), a frequência relativa simples (fri), a frequência absoluta acumulada (Fi) e a frequência relativa acumulada (Fri). b) Calcule a média e o desvio-padrão dos pontos obtidos pelos alunos. c) Calcule a mediana (Md) e o terceiro quartil (Q3) dos pontos obtidos pelos alunos. Escreva uma frase interpretando o Q3. d) Calcule a moda (usando método de Czuber) dos pontos obtidos pelos alunos. e) Compare a variabilidade das notas obtidas pelos alunos com a variabilidade do saldo na conta corrente do Sr. José (QUESTÃO 1). Onde ocorreu a maior variabilidade? Qual a medida estatística que você usou para comparar as variabilidades? Solução ------------------------------------------------------------------------------------------------------------------- a) Os pontos dos alunos foram divididos em cinco classes (intervalos) com a mesma amplitude. A primeira classe é a 0 | 6 pontos e a última é 24 | 30 pontos. O eixo vertical representa a quantidade de alunos. A tabela que representa o histograma acima é: Distribuição dos pontos obtidos Pontos obtidos Frequência f fr (em %) F Fr (em %) 0 | 6 7 7,3% 7 7,3% 6 | 12 8 8,3% 15 15,6% 12 | 18 34 35,4% 49 51,0% 18 | 24 25 26,0% 74 77,0% 24 | 30 22 23,0% 96 100% Total 96 100% - - 3024181260 35 30 25 20 15 10 5 0 Pontos obtidos na primeira prova presencial Nú m er o de a lu no s 22 25 34 87 5 b) Note que agora temos os dados agrupados em TABELA DE FREQUÊNCIA COM CLASSE. Para calcular a média, mediana e o desvio-padrão iremos precisar calcular inicialmente o ponto médio de cada classe (xi) e depois os produtos xi*fi, xi2*fi Vamos usar a tabela de frequência Pontos obtidos Frequência f Ponto médio da classe x x·f x2·f 0 | 6 7 3 21 63 6 | 12 8 9 72 648 12 | 18 34 15 510 7650 18 | 24 25 21 525 11025 24 | 30 22 27 594 16038 Total f = 96 -- 1722 35424 Para ver como foram feitos os cálculos, pegaremos a quarta classe como referência. Quarta classe: 18 | 24 xi = (24 + 18)/2 = 21 (ponto médio da 4ª classe) xi·fi = 21*25 = 525 xi2·f = (21)2*25 = 11025 Do total da tabela temos: n = fi = 96 xi·fi = 1722 e xi2·fi = 35424 • Media amostral: 94,17 96 722.1 f ]fx[ x i ii pontos • Variância amostral (s2) e desvio-padrão amostral (s) Lembre-se de que o desvio-padrão é a raiz quadrada da variância. 𝑉𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙: 𝑠2 = 𝑛(∑ 𝑥2𝑓) − (∑ 𝑥𝑓)2 𝑛(𝑛 − 1) = 96(35424) − (1722)2 96 ∙ 95 = 47,74 Desvio-padrão amostral: 91,674342,47s pontos RESPOSTA: A média amostral foi 17,94 pontos e o desvio-padrão amostral foi 6,91 pontos. 6 c) Vamos acrescentar a coluna de frequência acumulada (F). Pontos obtidos Frequência (f) Frequência acumulada (F) 0 | 6 7 7 6 | 12 8 15 12 | 18 34 49 18 | 24 25 74 24 | 30 22 96 • Mediana amostral (Md) Como estamos trabalhando com tabela de frequência, vamos usar a fórmula abaixo. Md = ℓ + ( 𝑛 2 − 𝐹𝑎𝑛𝑡) 𝑓 (𝐿 − ℓ) A classe onde está Md é a classe com frequência absoluta acumulada (Fi) imediatamente superiora posição da mediana pos = 48 (= n/2 = 96/2). Portanto, seria a 3ª classe (12 | 18) Da classe temos: ℓ = 12 L = 18 f = 34 Fant = 15 (Fi da classe anterior) Md = ℓ + ( 𝑛 2 − 𝐹𝑎𝑛𝑡) 𝑓 (𝐿 − ℓ) = 12 + ( 96 2 − 15) 34 (18 − 12) = 17,82 𝑝𝑜𝑛𝑡𝑜𝑠 • Terceiro quartil (Q3) Lembre-se de que o Q3 = P75 (percentil 75) A classe onde está Q3 é classe com frequência acumulada (Fi) imediatamente superior a pos = 72 (= k·n/100 = 75·96/100). Portanto, a classe é quarta classe (18 | 24). Da classe temos: ℓ = 18 L = 24 f = 25 Fant = 49 (Fi da classe anterior) Md = ℓ + ( 𝑛 2 − 𝐹𝑎𝑛𝑡) 𝑓 (𝐿 − ℓ) = 18 + ( 75 ∙ 96 100 − 49) 25 (24 − 18) = 23,52 𝑝𝑜𝑛𝑡𝑜𝑠 INTERPRETAÇÃO: Cerca de 75% dos alunos obtiveram notas menores ou iguais a 23,52 pontos. 7 d) Pontos obtidos Frequência (f) 0 | 6 7 6 | 12 8 12 | 18 34 18 | 24 25 24 | 30 22 Primeiro vamos identificar a classe modal que é a aquela com maior frequência absoluta (fi) Classe modal: 3ª classe (12 | 18) Da classe temos: ℓ = 12 L = 18 f = 34 fant = 8 e fpos = 25 Mo = ℓ + (𝑓 − 𝑓𝑎𝑛𝑡) (𝑓 − 𝑓𝑎𝑛𝑡) + (𝑓 − 𝑓𝑝𝑜𝑠) (𝐿 − ℓ) = 12 + (34 − 8) (34 − 8) + (35 − 25) (18 − 12) = 16,46 𝑝𝑜𝑛𝑡𝑜𝑠 8 e) NOTAS: média = 17,94 pts desvio-padrão = 6,91 pts SALDO: média = 20,5 reais desvio-padrão = 167,38 reais Como se trata de variáveis com unidades de medidas diferentes (um é em pontos e o outro é em reais), então não há como usar o desvio-padrão para comparar a variabilidade. Devemos, portanto, usar o coeficiente de variação (CV) NOTAS: CV = 6,91 / 17,94 = 0,38 (ou 38%) SALDO: CV = 167,38 / 20,5 = 8,16 (ou 816%) A maior variabilidade ocorreu nos saldos, pois o seu CV é maior. 9 QUESTÃO 3 - Em uma empresa com 14 funcionários e mais o gerente, o salário médio era de R$ 1.800,00. O gerente que ganhava R$ 15.000,00 foi demitido. a) Qual é a média salarial dos funcionários que permaneceram? Houve uma grande diferença no salário médio desta empresa com o gerente e sem o gerente? b) Você acha justo dizer (antes de o gerente sair) que os funcionários ganhavam em média R$ 1.800,00? Solução ------------------------------------------------------------------------------------------------------------------- a) Se o salário médio dos 15 era 1800, então os 15 juntos ganhavam um salário total de 15*1800 = 27000 reais. Se o gerente saiu, e ele ganhava 15000, então os 14 funcionários que ficaram a ganham 27000 – 15000 = 12000 reais. Portanto, a média agora será média = 12000 / 14 = 857,14 reais média = 857,14 reais b) Não acho que a média salarial de 1800 reais fosse uma medida justa para melhor representar os salários dos funcionários. O alto salário do gerente “puxava” a média salarial para cima. QUESTÃO 4 - Considerando a amostra x = {62, 75, b, 78, 82, 64} e que a média amostral é 5,69x , determine a o valor de ‘b’. Solução ------------------------------------------------------------------------------------------------------------------- 5,69 6 648278b7562 n x x i 361 + b = 6*69,5 361 + b = 417 b = 417 – 361 b = 56 10 QUESTÃO 5 - Se a média e o desvio-padrão da variável aleatória X são 10 e 3 respectivamente, então a média e o desvio-padrão da variável aleatória Y = 4X + 5 são dadas respectivamente por: (A) 40 e 17 (B) 45 e 12 (C) 40 e 12 (D) 45 e 17 Solução ------------------------------------------------------------------------------------------------------------------- Veja que para obter a variável Y = 4X + 5 temos multiplicar o X por 4 e depois somar 5. • Pela propriedade da média para a média do Y será igual a 4*(média de X) + 5 = 4(10) + 5 = 45 (ambas multiplicação e soma têm o mesmo efeito na média) • Pela propriedade do desvio-padrão o desvio-padrão do Y será igual a 4*(dp de X) = 4(3) = 12 (a soma não altera o valor do desvio-padrão) Resposta: letra B 11 QUESTÃO 6 - Uma amostra de doze mulheres adultas foi escolhida ao acaso e foi registrado a pressão arterial (y) e a idade (x) em meses de cada uma. Abaixo temos os somatórios dos valores obtidos. 𝑛 = 12 ∑ 𝑦 = 1684 ∑ 𝑦2 = 238822 ∑ 𝑥 = 7536 ∑ 𝑥2 = 4955904 ∑ 𝑥𝑦 = 1078728 a) Calcule a covariância entre as variáveis b) Calcule o coeficiente de correlação de Pearson entre as variáveis. c) O que você pode dizer sobre a associação entre as variáveis estudadas? Solução ------------------------------------------------------------------------------------------------------------------- a) A covariância é 𝑆𝑥𝑦 = 0,896 𝑆𝑥𝑦 = 𝑛∑𝑥𝑦 − ∑𝑥∑𝑦 𝑛(𝑛 − 1) = 12 ∙1078728 − 7536∙1684 12 ∙ (12 − 1) = 254112 132 = 1925,09 O valor positivo do 𝑆𝑥𝑦 indica uma correlação linear positiva. b) O coeficiente de Pearson é 𝑟𝑥𝑦 = 0,896, indicando uma forte correlação linear entre as variáveis. 𝑟𝑥𝑦 = 𝑛∑𝑥𝑦 − ∑𝑥∑𝑦 √𝑛∑𝑥2 − (∑𝑥)2 ∙ √𝑛∑𝑦2 − (∑𝑦)2 = 12 ∙1078728 − 7536∙1684 √12∙4955904 − (7536)2 ∙ √12∙238822 − (1684)2 = 254112 √2679552 ∙ √30008 = 0,896 c) O coeficiente de Pearson é 𝑟𝑥𝑦 = 0,896 indicando que há uma forte correlação linear entre as variáveis. Para confirmar esta conclusão seria necessário fazer o gráfico de dispersão entre os dados das variáveis, o que não é possível com apenas os somatórios fornecidos.
Compartilhar