Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA E INTRO. À ECONOMETRIA Lista 1 (gabarito no final) 1. Paulo e José são leitores ávidos. Recentemente, Paulo leu, num mês, 4 livros de ficção e dois de não-ficção, enquanto José leu e 3 livros de ficção e 3 de não ficção. Quais das conclusões seguintes podem ser obtidas desses números por métodos puramente descritivos e quais requerem generalizações? Explique suas respostas. a) No mês considerado, Paulo e José leram o mesmo número de livros. b) Paulo sempre lê mais livros de ficção do que José. c) Ao longo de um ano, a média de José é de 3 livros de não ficção por mês. d) A velocidade de leitura de Paulo e de José é praticamente a mesma. 2. Uma livraria registra as vendas diárias de 3 novas obras de escritores famosos de livros de suspenses. Decida se os dados obtidos constituem uma população ou uma amostra se a livraria pretende: a) usar os dados para pagamento de impostos; b) usar a informação na campanha publicitária para aumentar as vendas desses livros; c) determinar o tamanho do mercado desses livros para reedições futuras; d) decidir qual dos três livros deveria receber uma menção honrosa como melhor livro de suspense do ano. 3. Doze insetos sobreviveram a uma aplicação de um certo inseticida por 112, 83, 102, 84, 105, 121, 76, 110, 98, 91, 103 e 85 segundos. Encontre a média desses tempos de sobrevivência. 4. A editora de um livro sobre valores nutritivos precisa de um número para a quantidade de calorias de uma pizza de calabresa grande. Solicitando a um laboratório que faça o serviço com um calorímetro, ela recebe os seguintes números para uma fatia de pizza de seis fornecedores diferentes: 265, 332, 340, 225, 238 e 346. a) Calcule a média, já que a editora usará essa estatística. b) Suponha que, ao calcular a média, a editora cometa o erro de digitar 832, em vez de 238, em sua calculadora. Qual será o tamanho do erro no número que será impresso no livro? c) Suponha que a editora tivesse usado a mediana dos valores. Qual seria o erro introduzido pelo equívoco na digitação? 5. Um vendedor de uma companhia recebeu um bônus de 20.000 unidades monetárias por aposentadoria voluntária em julho de 2001, tendo investido 6.000 num fundo que paga 3,75%, 10.000 num fundo que paga 3,96% e 4.000 num fundo que paga 3,25%. Usando as respectivas quantias como pesos, encontre a média ponderada das três percentagens. 6. Observe atentamente os conceitos de média, mediana e moda e responda: a) Quais dessas medidas de tendência central são sensíveis a valores extremos? Explique. b) Qualquer conjunto de dados apresenta média, mediana e moda? c) Quais conceitos levam em consideração todos os elementos do conjunto de dados analisado? 7. Calcule a média, variância e desvio-padrão dos dados abaixo. Sete homens foram pesados, e os resultados em kg foram: 57.0, 62.9, 63.5, 64.1, 66.1, 67.1, 73.6. 8. Uma informação útil é que para qualquer conjunto de dados, pelo menos 75% deles fica dentro de uma distância de 2 desvio padrão da média, i.e. entre e. Verifique. 9. Em sala calculamos a média, amplitude, variância e desvio-padrão das notas lançadas por dois professores. Repita os cálculos e interprete os resultados obtidos mostrando, através dos conceitos estatísticos, qual professor você preferiria. Professor 1= 4, 4, 4, 4, 5, 5, 5, 5, 5, 10 Professor 2= 4, 9, 9, 9, 9, 9, 9, 9, 9, 10 10. Encontre a área sob a curva normal padrão: a. Entre z=-1,20 e z=0. b. Á esquerda de z=0,94; c. Á direita de z=1,76; Sx 2− S x 2 + d. Á esquerda de z=-0,85; e. Entre z=0,87 e z=1,28; f. Entre z=-0,34 e z=0,62 11. Se uma v. a. ~N(10, 5), qual é a probabilidade de assumir um valor entre 12 e 15? 12. Um histograma é uma maneira de representar um agrupamento que se utiliza de retângulos cuja altura é proporcional ao número de elementos em cada classe. Observe o histograma construído com os dados da tabela abaixo e calcule a média. 13. Pense no marcador das horas num relógio digital. a. Qual a probabilidade de que, ao olhar para ele num momento qualquer do dia, ele esteja mostrando um número particular? b. A probabilidade se altera se ele for um mostrador de 12 horas ou de 24 horas? c. Desenhe os histogramas para os dois casos d. Identifique a distribuição de probabilidade dos histogramas desenhados. 14. Em cada caso que envolve áreas sob a curva normal com média igual a 115, decida se a primeira área é maior, se a segunda é maior ou se as duas são iguais: a. A área à direita de 135 ou a área à esquerda de 85; b. A área entre 103 e 127 ou a área entre 115 e 139; c. A área à direita de 105 ou a área à esquerda de 125. 15. Se a quantidade de radiação cósmica a que uma pessoa está exposta enquanto atravessar o território do Japão de avião é uma v. a. ~N(4,35;0,59), encontre as probabilidades de que uma pessoa num tal voo esteja exposta a a. Mais de 5,00 mrem de radiação; b. Alguma quantidade de 3 a 4 mrem de radiação. 16. Qual a probabilidade de uma variável normal padrão estar entre -0,5 e 0,8? 17. Suponha que X~N(8,4). Qual a probabilidade de X vir a assumir um valor entre 4 e 12? 18. E qual a probabilidade de X exceder 12? 19. Se a v. a. X tem uma distribuição F8,7, qual a probabilidade dela assumir um valor acima de 2,50? E de assumir o valor de 1,70? 20. Dada uma v. a. X ~ F12,9 , quais os valores que ela pode assumir com probabilidades de 25%, 10%, 5% e 1%? 21. A v.a. X tem distribuição t com 10g. l. Qual a probabilidade monocaudal e bicaudal dessa variável assumir um valor acima de 1,812? 22. Tendo uma distribuição t26, quais os valores que a v. a. X pode assumir com probabilidade de 10% bicaudal? 23. Observe os valores assumidos por uma v.a. com distribuição χ2 com 30 g.l. e responda: a. Com qual probabilidade ela assume valores superiores a 4,256? b. Com qual probabilidade ela assume valores abaixo de 20,60? c. Quais os valores que ela pode assumir com 5% de probabilidade? d. E com 1% de probabilidade? Lista 2 1) Quando estamos diante de uma variável que apresenta distribuição normal e queremos obter alguma probabilidade em relação a ela procedemos com o processo de padronização da variável. Calcule E(x-𝜇), em que 𝜇 é a média de x e é uma constante. Para dp(x), faça dp( 𝑥 𝜎 ), em que 𝜎 ≠ 0, e 𝜎 é o desvio padrão de x e é uma constante. Assim, qual é o papel do processo de padronização, e como ele se relaciona com os parâmetros da Normal Padrão? 1) A variância é uma medida de dispersão que busca evidenciar os quão dispersos estão os valores de um conjunto e dados em torno da média dos mesmos. A fórmula da variância é a seguinte, em que f(x) é a FDP de x. 𝑣𝑎𝑟 (𝑥) = ∑(𝑥𝑖 − 𝜇) 2𝑓(𝑥𝑖) 𝑛 𝑖=1 Verifique por meio do uso de Esperança matemática o que aconteceria se a variância fosse definida com o termo (𝑥 − 𝜇) não elevado ao quadrado. O que se pode dizer, então, a respeito da razão desse termo ser ao quadrado? 2) Para um grupo de dados a com var(a) = 1200, e um grupo B com var(b)=1800. O que se pode dizer a respeito da dispersão de ambos os grupos? Qual é mais disperso? Que informação auxiliaria para uma resposta consistente? 3) Analisando a estrutura da fórmula da variância, dê um motivo para que x e y independentes conduzam a var(x+y)=var(x-y). 4) Para dado conjunto de dados A, qual é o efeito na média se todos os elementos de A forem multiplicados por b? Tendo em vista esta multiplicação, demonstre a partir da fórmulada variância definida em termos de esperança que var (b.x)=b²var(x) 5) Para um conjunto de dados B, qual é o efeito sobre a média se a todos os elementos de B forem acrescidos a, tal que a é uma constante? Tendo isto em vista, demonstre a partir da fórmula da variância definida em termos de esperança que var(a+x)=var(x). 6) Analise se a seguinte afirmativa é verdadeira: var(x)=cov(x,x). A partir disto, compare as propriedades de covariância e variância. 7)Analise se as seguintes afirmativas são verdadeiras ou falsas. Justifique. a) Todo caso de média aritmética é um caso de média ponderada. b) Para qualquer variável contínua x, a probabilidade de x assumir um valor a é zero. c) Coletados dados sobre as variáveis idade das mulheres (m) e idade dos homens (h) em anos, obteve-se o seguinte diagrama de dispersão. Com base nele pode-se afirmar que E(mh) = E(m)E(h). d) A covariância é uma medida que busca saber se variáveis são relacionadas, e se caso sejam, se são positivas ou negativamente, para quaisquer tipos de relação. e) As variáveis x e y são independentes sempre que cov (x,y) = 0. f) Supondo que as variáveis x e y estabeleçam uma relação que se aproxime da função y= x³, então é provável que 0 < cov (x,y) <1. g) Correlação é um ferramental útil, pois revela o grau e sentido da relação linear entre duas variáveis, de modo que se pode comparar quaisquer grupos de dados com quaisquer unidades de medidas. 8) É natural que com o passar da idade as pessoas percam massa muscular. Para estudar o fenômeno, uma pesquisadora selecionou 18 mulheres, com idade entre 40 e 79 anos, e observou em cada uma delas a idade (X) e a massa muscular (Y). Massa muscular (Y) Idade (X) 82.0 71.0 91.0 64.0 100.0 43.0 68.0 67.0 87.0 56.0 73.0 73.0 78.0 68.0 80.0 56.0 65.0 76.0 84.0 65.0 116.0 45.0 76.0 58.0 97.0 45.0 100.0 53.0 105.0 49.0 77.0 78.0 73.0 73.0 78.0 68.0 a) Calcule: var(x), var(y), cov(x,y), corr(x,y). ( sugestão: utilize as fórmulas em termos de esperança matemática) 9) Um pesquisador deseja verificar se um instrumento para medir a concentração de determinada substância no sangue está bem calibrado. Para isto, ele tomou 15 amostras de concentrações conhecidas (X) e determinou a respectiva concentração através do instrumento (Y), obtendo: X 2,0 2,0 2,0 4,0 4,0 4,0 6,0 6,0 6,0 8,0 8,0 8,0 10,0 10,0 10,0 Y 2,1 1,8 1,9 4,5 4,2 4,0 6,2 6,0 6,5 8,2 7,8 7,7 9,6 10,0 10,1 a) Construa o diagrama de dispersão para esses dados. b) Trace no gráfico a reta com 45º de inclinação passando pela origem. Como essa reta pode ser útil na avaliação do instrumento? c) Calcule: var(x), var(y), cov(x,y), corr(x,y). Respostas: 1 a) Verdadeiro, caso seja considerado o número total de livros; não obstante, o número de livros por categoria difira entre eles. b) Falso. A “amostra” não é significativa para que possamos afirmar o enunciado. c) Falso. O enunciado apresenta apenas um dado recente. É possível construir a média apenas com este dado, mas requer generalização pois deve-se sustentar que José mantém esta frequência de leitura ao longo do ano. d) Falso. Não se pode afirmar nada, pois ambos leram em um mês a mesma quantidade de livros. Mesmo que fosse diferente, a informação a respeito de um mês apenas é pouca e requer generalização para se concluir a respeito da velocidade dos leitores. 2. a) amostra; b) população; c) amostra; d) população 3) 97,5 4. a) 291; b) nova média 390. Erro (diferença entre as duas médias: 99); c) mediana considerando os dados corretos: 298,50 mediana considerando o equívoco: 298,50. Neste caso não haveria erro. Obs: caso se queira verificar a diferença da média para a mediana então Média inicial – mediana = 7,50 Média com erro digit – mediana = 91,50 5) Usar o conceito de esperança matemática. Logo, E(x) = 6000*0,0375 + 10000*0,0396 + 4000*0,0325 = 2250 + 3960 + 1300 = 751 A média dos rendimentos dos fundos é 751. 6. a) A média, pois considera todos os valores da amostra com pesos iguais entre eles. b) Não, há conjuntos que podem ser amodais (não possuem moda). c) Todos os três conceitos. 7) Sendo os dados: 57.0, 62.9, 63.5, 64.1, 66.1, 67.1, 73.6. Média: 64,9 Variância: (57 - 64,9)^2 + (62,9 - 64,9)^2 + (63,5 - 64,9)^2 + (64.1 - 64,9)^2 + (66,1 - 64,9)^2 + (67.1-64,9)^2 + (73.6 - 64,9)^2 / 7 = 62,41 + 4 + 1,96 + 0,64 + 1,44 + 4,84 + 75,69/7 = 21,56 Desvio-Padrão: 21,56 1⁄2 = 4,64 8. Proponha um conjunto de dados, calcule o desvio-padrão e mostre, através deste exemplo, o enunciado da questão. 9) Professor 1: Média: 5,1 Variância: (1,21*4 + 0,01*5 + 24,01) /10 = (4,84 + 0,05 + 24,1)/10 = 2,89 Desvio-Padrão: 1,7 Amplitude: 6 Professor 2: Média: 8,6 Variância: 21,16 + 0,16*8 + 1,96 = 21,16 + 1,28 + 1,96 = 24,4/10 = 2,44 Desvio-Padrão: 1,56 Amplitude: 6 10) a) P(-1,20<Z<0) = 0,3849 ou 38,49% b) P(Z<0,94) = 0,8264 ou 82,64% c) P(Z>1,76) = 0,0392 ou 3,92% d) P(Z<-0,85) = 0,1977 ou 19,77% e) P(0,87<Z<1,28) = 0,0919 ou 9,19% f) P(-0,34<Z<0,62) = 0,3655 ou 36,55% Obs: consultar tabela de Distribuição Normal Padronizada. 11) Devem-se padronizar a variável dada utilizando a média e o desvio-padrão fornecidos. Para X=12: (12-10)/5= Z1= 0,4. Para X=15: (15-10)/5=Z2=1. Fazendo as transformações de modo a calcular o valor de acordo com a tabela, tem-se: 0,3413-0,1554=0,1859. 12) Média = 175,33 13 a) Levando em consideração apenas as horas: 1/12 ou 1/24, dependendo se o relógio diferencia em as horas antes do meio dia e após o meio dia. Levando em consideração os minutos: 12 *60=720 se levarmos em consideração o relógio que marca apenas de 1 a 12 horas. Se levarmos em consideração o relógio que marca de 1 a 24 horas, então: 24*60=1440. b) Sim. c) O aluno deverá fazer. d) A distribuição é do tipo uniforme e discreta. 14) a) A área à esquerda de 85 é menor. b) A área entre 103 e 127 é maior. c) As áreas são iguais. 15) Assumindo 0,59 como desvio-padrão temos que: a) Z=1,101694. Arredondando para 1,10 P(Z>5) = 1 – 0,8643 = 0,1357 b) Z1= -2,29. Z2= -0,59. P(-2,29<Z<-0,59) = 0,989 – 0,7224 16) P(-0,5<Z<0) = 0,1915 P(0<Z<0,8) = 0,2881 P (-0,5<Z<0,8) = 0,4796 ou 47,96% 17) Assumindo que o a variância é 4. X~N(8,4) Z = X – u = -2 e 2 P(0<Z<2) = 0,4772 e P(-2<Z<0) = 0,4772 = 0,9544 ou 95,44% 18) Utilizando X~N(8,4) do exercício anterior: P (Z>12) = 1-0,8413 = 0,1587 19) P(F.2,50) pouco mais de 10% pois P(F>2,75)=10% P(F=1,70)=0 pois trata-se de uma distribuição contínua. 20) 25% = P(F>1,58) 10% = P(F>2,38) 5% = P(F>3,07) 1% = P(F>5,11) 21) Bicaudal=10% e monocaudal 5%. 22) P(X>1,706)=5% P(X<1,706)=5% P(-1,706<X<1,706)=90% 23) a) Houve um equívoco no enunciado. Não é possível encontrar o valor nas tabelas do Gujarati. b) 0,9 c) Valores maiores que 43,7729 d) Valores maiores que 50,8922. Gabarito da Lista de Exercícios 1 b 7) a) v b) v c) f d) f e) f f) f g) v 8) Var(x)= 180,55 Var(y)= 119,91 Cov(x,y)= -123,11 Corr(x,y)= -0,8366 9) Var(x)=8 Var(y)=7,7437 Cov(x,y)=7,84 Corr(x,y)=0,99608
Compartilhar