Baixe o app para aproveitar ainda mais
Prévia do material em texto
MAE116 – Noc¸o˜es de Estat´ıstica Grupo A - I semestre de 2017 Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito) Exerc´ıcio 1. (30 pontos). Os dados a seguir representam medidas de Sil´ıcio (%) de amostras de 13 sedimentos da cordilheira marinha central do Oceano I´ndico. Amostra 1 2 3 4 5 6 7 8 9 10 11 12 13 Sil´ıcio 20,1 22,3 19,2 24,2 21,5 20,4 46,8 22,2 22,1 19,1 22,6 21,3 17,7 (a) (15 pontos). Calcule a me´dia, a mediana, o desvio padra˜o e os quartis. Resposta: Me´dia: x¯ = ∑n i=1 xi n = 20, 1 + 22, 3 + 19, 2 + ... + 22, 6 + 21, 3 + 17, 7 13 = 23, 03846. Ou seja, em me´dia foi verificado um percentual de 23,038% de Sil´ıcio nos sedimentos observados na cordilheira marinha central do Oceano I´ndico. Mediana: Primeiro ordenamos os dados: 17,7 19,1 19,2 20,1 20,4 21,3 21,5 22,1 22,2 22,3 22,6 24,2 46,8 e calculamos a posic¸a˜o da mediana n+1 2 = 13+1 2 = 7, portanto Md = 21, 5 gramas. Desvio padra˜o: O desvio padra˜o corresponde a raiz quadrada da variaˆncia, s = √ s2 = √∑n i=1(xi − x¯)2 n− 1 = √ (x1 − x¯)2 + (x2 − x¯)2 + · · ·+ (xn − x¯)2 n− 1 = √ (20, 1− 23, 03846)2 + (22, 3− 23, 03846)2 + (19, 2− 23, 03846)2 + · · ·+ (17, 7− 23, 03846)2 13− 1 = √ 648, 0108 12 = √ 54, 0009 = 7, 34853. Pa´gina 1 de 11 MAE116 – Noc¸o˜es de Estat´ıstica Grupo A - I semestre de 2017 Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito) De outra maneira, s = √ s2 = √∑n i=1 x 2 i − nx¯2 n− 1 = √ x21 + x 2 2 + · · ·+ x215 − nx¯2 n− 1 = √ 20, 12 + 22, 32 + 19, 22 + · · ·+ 17, 72 − (13)(23, 03846)2 13− 1 = √ 7548, 03− (13)(530, 7706) 12 = √ 648, 0109 12 = 7, 34853. Quartis: Quando um conjunto de dados ordenado e´ dividido em 4 partes iguais, temos 3 quartis, que correspondem aos percentis 25, 50 e 75, calculados como o valor da varia´vel que ocupa a posic¸a˜o p× (n + 1), com p=0,25, p=0,50 e p=0,75. Dados ordenados: 17,7 19,1 19,2 20,1 20,4 21,3 21,5 22,1 22,2 22,3 22,6 24,2 46,8. • Primeiro Quartil Q1 = Percentil 25 ⇒ posic¸a˜o 0, 25(13 + 1) = 3, 5 ⇒ Q1 = (19, 2 + 20, 1)/2 = 19, 65. Assim, 25% das amostas de sedimentos da cordilheira marinha central do Oceano I´ndico possuem quantidade de Sil´ıcio menor ou igual a 19,65%. • Segundo Quartil Q2 = Percentil 50 = Mediana (ja´ calculada). Assim, 50% das amostas de sedimentos da cordilheira marinha central do Oceano I´ndico possuem quantidade de Sil´ıcio menor ou igual a 21,5%. • Terceiro Quartil Q3 = Percentil 75 ⇒ posic¸a˜o 0, 75(13 + 1) = 10, 5 ⇒ Q3 = (22, 3 + 22, 6)/2 = 22, 45. Assim, 75% das amostas de sedimentos da cordilheira marinha central do Oceano I´ndico possuem quantidade de Sil´ıcio menor ou igual a 22,45%. � (b) (15 pontos). Note que a amostra 7 apresenta um valor at´ıpico. Remova esse valor e refac¸a o item anterior. Comente as diferenc¸as encontradas. Resposta: Pa´gina 2 de 11 MAE116 – Noc¸o˜es de Estat´ıstica Grupo A - I semestre de 2017 Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito) Me´dia: x¯ = ∑n i=1 xi n = 20, 1 + 22, 3 + ... + 21, 3 + 17, 7 12 = 21, 05833. Mediana: Primeiro ordenamos os dados: 17,7 19,1 19,2 20,1 20,4 21,3 21,5 22,1 22,2 22,3 22,6 24,2 e calculamos a posic¸a˜o da mediana n+1 2 = 12+1 2 = 6, 5. Neste caso, como n = 12 e´ par, a mediana sera´ dada pela me´dia dos valores das duas observac¸o˜es centrais, ou seja, posic¸o˜es 6 e 7, deste modo, temos: Md = 21,3+21,5 2 = 21, 4. Desvio padra˜o (s) s = √ s2 = √∑n i=1(xi − x¯)2 n− 1 = √ (x1 − x¯)2 + (x2 − x¯)2 + · · ·+ (xn − x¯)2 n− 1 = √ (20, 1− 21, 05833)2 + (22, 3− 21, 05833)2 + (19, 2− 21, 05833)2 + · · ·+ (17, 7− 21, 05833)2 12− 1 = √ 36, 34917 11 = √ 3, 30447 = 1, 81782. De outra maneira, s = √ s2 = √∑n i=1 x 2 i − nx¯2 n− 1 = √ x21 + x 2 2 + · · ·+ x215 − nx¯2 n− 1 = √ 20, 12 + 22, 32 + 19, 22 + · · ·+ 17, 72 − (12)(21, 05833)2 12− 1 = √ 5357, 79− (12)(443, 4534) 12 = √ 36, 34917 11 = 1, 81782. Quartis Similar ao item (a), teremos: Dados ordenados: 17,7 19,1 19,2 20,1 20,4 21,3 21,5 22,1 22,2 22,3 22,6 24,2. • Primeiro Quartil Pa´gina 3 de 11 MAE116 – Noc¸o˜es de Estat´ıstica Grupo A - I semestre de 2017 Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito) Q1 = Percentil 25 ⇒ posic¸a˜o 0, 25(12 + 1) = 3, 25 ⇒ Q1 = (19, 2 + 20, 1)/2 = 19, 65. Assim, 25% das amostas de sedimentos da cordilheira marinha central do Oceano I´ndico possuem quantidade de Sil´ıcio menor ou igual a 19,65%. • Segundo Quartil Q2 = Percentil 50 = Mediana (ja´ calculada). Assim, 50% das amostas de sedimentos da cordilheira marinha central do Oceano I´ndico possuem quantidade de Sil´ıcio menor ou igual a 21,4%. • Terceiro Quartil Q3 = Percentil 75 ⇒ posic¸a˜o 0, 75(12 + 1) = 9, 75 ⇒ Q3 = (22, 2 + 22, 3)/2 = 22, 25. Assim, 75% das amostas de sedimentos da cordilheira marinha central do Oceano I´ndico possuem quantidade de Sil´ıcio menor ou igual a 22,25%. Comenta´rios: Note que, no item (a) a me´dia ficou levemente afastada da mediana e com a remoc¸a˜o da observac¸a˜o 7 (item (b)) a me´dia ficou mais pro´xima da mediana, logo, observe que a me´dia e´ influenciada por valores mais elevados. A maior diferenc¸a que podemos observar com a remoc¸a˜o da observac¸a˜o 7 esta relacionada ao desvio padra˜o. Com a remoc¸a˜o, o desvio padra˜o passou de 7,34853 para 1,81782, ou seja, o desvio padra˜o mais que quadruplica com a permaneˆncia da observac¸a˜o 7. O desvio padra˜o diminui muito com a retirada da observac¸a˜o at´ıpica. Em relac¸a˜o aos percentis praticamente na˜o houve diferenc¸a nos dois casos, o que nos mostra a pouca (ou quase nenhuma) influeˆncia em valores at´ıpicos para o ca´lculo destas medidas de posic¸a˜o. � Pa´gina 4 de 11 MAE116 – Noc¸o˜es de Estat´ıstica Grupo A - I semestre de 2017 Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito) Exerc´ıcio 2. (40 pontos). Um estudo foi realizado para comparar o peso da carne, em gramas, de mexilho˜es de dois locais: sambaqui e manguezal. Para isso, foram coletados e pesados, 15 mexilho˜es de cada local. Os dados esta˜o apresentados na Tabela 1. Tabela 1: Peso da carne de mexilho˜es, em gramas, em dois locais. Sambaqui Manguezal 30,61 25,34 28,89 25,67 32,21 17,64 24,25 33,97 25,63 11,13 42,88 9,49 36,22 16,92 28,86 12,91 22,56 14,05 22,92 14,88 27,94 19,17 41,45 21,60 42,59 20,01 15,25 19,81 33,29 16,22 Estat´ısticas descritivas obtidas para esses dados sa˜o apresentadas a seguir (Tabela 2): Tabela 2: Estat´ısticas descritivas dos pesos dos mexilho˜es. Local n me´dia Desvio Padra˜o CV Min Q1 mediana Q3 Ma´x Sambaqui 15 30,37 7,97 Manguezal 15 18,59 6,32 14,05 17,64 21,6 (a) (5 pontos). Quais sa˜o as varia´veis do estudo? Classifique-as. Resposta: Para cada tipo de local estamos interessados em estudar o peso da carne dos mexilho˜es. Logo, a varia´vel peso corresponde a uma varia´vel quantitativa cont´ınua e o local corres- ponde a uma varia´vel qualitativa nominal. � (b) (5 pontos). Complete a tabela de estat´ısticas descritivas (Tabela 2). Resposta: Sambaqui: Pa´gina 5 de 11 MAE116 – Noc¸o˜es de Estat´ıstica Grupo A - I semestre de 2017 Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito) Ordenando os valores (15,25 22,56 22,92 24,25 25,63 27,94 28,86 28,89 30,61 32,21 33,29 36,22 41,45 42,59 42,88) pode-se observar que Min=15,25 e o Ma´x=42,88, bem como CV = (s/x¯)× 100% = (6, 32/18, 59)× 100% = 26, 243%. Ale´m disso, • Primeiro Quartil Q1 = Percentil 25 ⇒ posic¸a˜o 0, 25(15 + 1) = 4 ⇒ Q1 = 24, 25. • Segundo Quartil (Mediana) Q2 = Percentil 50 ⇒ posic¸a˜o 0, 5(15 + 1) =8 ⇒ Q2 = 28, 89. • Terceiro Quartil Q3 = Percentil 75 ⇒ posic¸a˜o 0, 75(15 + 1) = 12 ⇒ Q3 = 36, 22. Manguezal: Ordenando os valores (9,49 11,13 12,91 14,05 14,88 16,22 16,92 17,64 19,17 19,81 20,01 21,60 25,34 25,67 33,97) pode-se observar que Min=9,49 e o Ma´x=33,97. Ale´m disso, CV = (s/x¯) × 100% = (7, 97/30, 37) × 100% ≈ 34%. Note tambe´m que, posic¸a˜o Q1=4o ⇒ Q1 = 14, 05, posic¸a˜o Q3=12o ⇒ Q3 = 21, 6. Tabela 3: Estat´ısticas descritivas (completas) dos pesos dos mexilho˜es. Local n me´dia Desvio Padra˜o CV Min Q1 mediana Q3 Ma´x Sambaqui 15 30,37 7,97 26,243% 15,25 24,25 28,89 36,22 42,88 Manguezal 15 18,59 6,32 34% 9,49 14,05 17,64 21,6 33,97 � (c) (5 pontos). 50% dos mexilho˜es do Sambaqui apresentam peso da carne inferior a qual valor? E se considerarmos 75% dos mexilho˜es? Resposta: Note que 50% e´ o limite correspondente ao segundo quartil (mediana), logo podemos obser- var que 50% dos mexilho˜es do Sambaqui apresentam peso inferior ou igual a 28,89 gramas. Da mesma forma que 75% corresponde ao terceiro quartil, podemos observar que 75% dos mexilho˜es do Sambaqui apresentam peso inferior ou igual a 36,22 gramas. � Pa´gina 6 de 11 MAE116 – Noc¸o˜es de Estat´ıstica Grupo A - I semestre de 2017 Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito) (d) (5 pontos). 25% dos mexilho˜es do Manguezal apresentam peso da carne superior a qual valor? E se considerarmos 75% dos mexilho˜es? Resposta: Podemos observar que 25% dos mexilho˜es do Manguezal apresentam peso superior ou igual a 21,6 gramas. Podemos observar que 75% dos mexilho˜es do Manguezal apresentam peso superior ou igual a 14,05 gramas. � (e) (5 pontos). Escolhendo casualmente um mexilha˜o do Manguezal, o que seria mais prova´vel: peso da carne maior ou menor que 21,6 gramas? Justifique. Resposta: Note que 21,6 gramas corresponde ao terceiro quartil, ou seja, 75% dos dados possuem va- lores dos pesos menores ou iguais a 21,6 granas, logo se escolhermos ao acaso um mexilha˜o do Manguezal e´ mais prova´vel que este tenha um peso inferior a 21,6 gramas. � (f) (5 pontos). Utilizando o desvio padra˜o, compare os dois locais quanto a` homogeneidade. Resposta: Note que para o Sambaqui temos um desvio padra˜o de 7,97 e para o Manguezal o desvio padra˜o e´ de 6,32, logo observando esses dois valores podemos concluir que o Sambaqui e´ um pouco menos homogeˆneo quanto aos pesos dos mexilho˜es. O desvio padra˜o para o Sambaqui corresponde a 1,26 vezes maior que o desvio padra˜o para o Manguezal. � (g) (5 pontos). Calcule o coeficiente de variac¸a˜o para cada local. A conclusa˜o e´ a mesma do item anterior? Qual e´ a medida de variabilidade mais adequada? Justifique. Resposta: Podemos observar pela Tabela 3 que os coeficientes de variac¸a˜o do Sambaqui e do Man- guezal correspondem, respectivamente, a 26,243% e 34%. Logo, por esta medida podemos concluir que o local Manguezal e´ menos homogeˆneo (mais heterogeˆneo) quanto aos pesos dos mexilho˜es. Note que a conclusa˜o difere de quando usado o desvio padra˜o. No entanto, a medida de dispersa˜o mais adequada para comparar dois (ou mais) grupos e´ o CV, pois este nos for- nece uma medida de variabilidade relativa a me´dia. Ale´m disso, o CV elimina o efeito de Pa´gina 7 de 11 MAE116 – Noc¸o˜es de Estat´ıstica Grupo A - I semestre de 2017 Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito) magnitude dos dados e corresponde a uma medida adimensional. � (h) (5 pontos). Voceˆ diria que o crescimento dos mexilho˜es esta´ associado ao local? Resposta: Observando as medidas obtidas (Tabela 3), nota-se que os mexilho˜es do Sambaqui possuem medidas de peso superiores a`s medidas do local Manguezal, seja a me´dia, Min, mediana, Ma´x, ale´m dos percentis. Logo, as medidas nos indicam que ha´ uma relevante diferenc¸a nos pesos dos mexilho˜es dados os dois locais distintos. Apesar do local Manguezal possuir uma menor variabilidade, este forneceu mexilho˜es com peso de carne inferior ao local Sambaqui. � Exerc´ıcio 3. (30 pontos). Uma amostra de 150 alunos da USP foi selecionada e para cada estudante foi perguntado o nu´mero de vezes que ele prestou o vestibular da FUVEST (x). Observou-se que 75 estudantes prestaram o vestibular da FUVEST, uma u´nica vez, 47 prestaram duas vezes e assim por diante. Os dados esta˜o na tabela abaixo: Tabela 4: Freq. observada dos alunos submetidos ao vestibular da FUVEST. Nu´mero de vezes que prestou FUVEST (x) ni 1 75 2 47 3 21 4 7 (a) (5 pontos). Qual e´ a varia´vel de interesse do estudo? Classifique-a. Resposta: A varia´vel (X) de interesse nesse estudo corresponde ao nu´mero de vezes que o aluno entre- vistado prestou o vestibular da FUVEST. Observe que temos uma contagem, logo podemos caracterizar a varia´vel X como sendo uma varia´vel quantitativa discreta. � (b) (12 pontos). Calcule a me´dia, a mediana, a moda, a variaˆncia e o desvio padra˜o do nu´mero de vezes que o estudante prestou o vestibular da FUVEST. Resposta: Pa´gina 8 de 11 MAE116 – Noc¸o˜es de Estat´ıstica Grupo A - I semestre de 2017 Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito) me´dia amostral: Como os valores observados se repetem, a me´dia pode ser calculada da seguinte forma: x¯ = 4∑ i=1 xi × ni n = 1× 75 + 2× 47 + 3× 21 + 4× 7 150 = 260/150 = 1, 733. Ou seja, em me´dia os alunos prestam o vestibular da FUVEST 1,733 vezes. mediana: Para calcularmos a mediana, precisamos obter a posic¸a˜o da mediana que e´ dada por 0,5×(n+1) = 0,5×151=75,5. Logo, a mediana sera a me´dia aritme´tica entre os valores das posic¸o˜es 75 e 76. Temos que 75o=1 e 76o=2. Portanto, Mediana=(1+2)/2=1,5. Note que a mediana na˜o divergiu tanto em relac¸a˜o a me´dia que foi de 1,733 vezes. moda: A moda equivale a observac¸a˜o que e´ mais frequente, e pela segunda coluna da tabela podemos observar que a observac¸a˜o que mais aparece na base de dados e´ o valor 1. variaˆncia: Pela fo´rmula da variaˆncia temos s2 = ∑n i=1 (xi−x¯)2 n−1 . No entanto, observe que ter´ıamos que fazer 75 vezes a diferenc¸a (1− 1, 733)2, 47 vezes a diferenc¸a (2− 1, 733)2, e assim sucessiva- mente. Enta˜o, podemos reescrever a nossa expressa˜o como sendo s2 = ∑4 i=1 ni(xi−x¯)2 n−1 , o que nos fornece: s2 = ∑4 i=1 ni(xi − x¯)2 n− 1 = 75× (1− 1, 733)2 + 47× (2− 1, 733)2 + 21× (3− 1, 733)2 + 7× (4− 1, 733)2 150− 1 = 113, 3333/149 = 0, 76063. Obs.: Se usar 1,73 ao inve´s de 1,733, enta˜o s2 = 0, 76064. desvio padra˜o: O desvio padra˜o sera´ dado por s = √ s2 = √ 0, 76063 = 0, 87214 (ou 0,87215). � (c) (13 pontos). Existe interesse em estudar o gasto dos alunos com as despesas do vestibular. Suponha, para simplificar, que cada aluno tem uma despesa fixa de R$ 5000,00, relativa a` preparac¸a˜o e mais R$ 150,00 para cada vestibular prestado. Desta forma tem-se que a despesa e´ d = 5000+150x. Calcule a me´dia, a mediana, a moda, a variaˆncia e o desvio Pa´gina 9 de 11 MAE116 – Noc¸o˜es de Estat´ıstica Grupo A - I semestre de 2017 Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito) padra˜o da despesa com vestibular da FUVEST. Resposta: me´dia: Calculando as despesas para cada grupo teremos: No de vezes (xi) ni Despesa (di) 1 75 5000+150×1=5150 2 47 5000+150×2=5300 3 21 5000+150×3=5450 4 7 5000+150×4=5600 Σ 150 - - Logo, a me´dia da despesa gasta com o vestibular da FUVEST e´ dada por: d¯ = 4∑ i=1 ni × di 150 = 75× 5150 + 47× 5300 + 21× 5450 + 7× 5600 150 = 789000 150 = 5260. Ou seja, a despesa me´dia com o vestibular e´ de R$ 5.260,00. variaˆncia: Como temos medidas repetidas, enta˜o a variaˆncia sera´ dada por: s2d = ∑4 i=1 ni(di − d¯)2 n− 1= 75× (5150− 5260)2 + ... + 7× (5600− 5260)2 149 = 2550000 149 = 17114, 09. desvio padra˜o: Note que a unidade de medida para a variaˆncia na˜o faz sentido na pra´tica, enta˜o calcu- lemos o desvio padra˜o para normalizarmos a unidade de medida. Ou seja, sd = √ s2d =√ 17114, 09 = 130, 8208. Logo, sd = R$130, 82. mediana: Posic¸a˜o da mediana: 0,5×(n+1)=0,5×(151)=75,5 ⇒ Med(d)=(5150+5300)/2=5225. moda: A moda de d e´ o valor da despesa mais frequente. Logo, moda(d)=5150. Pa´gina 10 de 11 MAE116 – Noc¸o˜es de Estat´ıstica Grupo A - I semestre de 2017 Lista de exerc´ıcios 1 - Estat´ıstica Descritiva I – C A S A (gabarito) Formas alternativas para a me´dia e desvio padra˜o: A seguir temos uma forma alternativa para o ca´lculo da me´dia e do desvio padra˜o. Relem- bre, do exerc´ıcio 2 (d) da Lista 1 de classe, que: Se y = a + bx, enta˜o y¯ = a + bx¯. Ale´m disso, s2y = b 2s2x, bem como sy = bsx. Portanto, voltando ao nosso exemplo e sendo d = 5000 + 150x, teremos que d¯ = a + bx¯, onde a = 5000 e b = 150. Logo, d¯ = 5000 + 150× x¯ = 5000 + 150× 1, 733 = 5259, 95 ≈ 5260. E para a variaˆncia de d teremos: s2d = b 2s2x = 150 2 × 0, 76063 = 17114, 17. Ou seja, s2d = (R$) 217.114, 17. (Se s2x = 0, 76064⇒ s2d = 17114, 4) Obs.: A diferenc¸a do valor 17114,17 para 17114,09 foi devido ao arredondamento da me´dia (1,733). E o desvio padra˜o sera´ dado por: sd = bsx ⇒ sd = 150× 0, 87214 = 130, 82. � Pa´gina 11 de 11
Compartilhar