Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO DEPARTAMENTO DE ESTATI´STICA E INFORMA´TICA - DEInfo ESTATI´STICA EXPLORATO´RIA B Resoluc¸a˜o dos exerc´ıcios das listas 21-22 Monitor: Nielson Avelino de Santana Orientador: Paulo Renato Alves Firmino 6 de outubro de 2014 Suma´rio 0.1 Intervalo de Confianc¸a para Me´dia, variaˆncia conhecida . . . . . . . . . . . . . . 1 0.2 Intervalo de Confianc¸a para Me´dia, variaˆncia desconhecida . . . . . . . . . . . . . 2 0.3 Intervalo de Confianc¸a para a proporc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . 4 Intervalo de Confianc¸a 0.1 Intervalo de Confianc¸a para Me´dia, variaˆncia conhecida Exerc´ıcio 1 1. A variabilidade acerca do valor da cesta ba´sica de uma regia˜o e´ dada por um desvio-padra˜o de R$ 50.00. Qual e´ a estimativa intervalar para o valor me´dio da cesta ba´sica na regia˜o a um n´ıvel de confianc¸a de 90%, dado que o custo me´dio da cesta de uma amostra com 30 cidades foi de R$250,00? E para um n´ıvel de confianc¸a de 99%? 2. A variabilidade acerca do tempo de vida de laˆmpadas e´ dada por um desvio-padra˜o de 1000 horas. Qual e´ a estimativa intervalar para o tempo me´dio de vida do modelo de laˆmpadas sob um n´ıvel de confianc¸a de 95%, dado que o tempo me´dio de vida de uma amostra com 100 laˆmpadas e´ de 4000h? E para um n´ıvel de confianc¸a de 99.5%? 3. A previsa˜o para a temperatura me´dia em dado dia e´ baseada em uma amostra envolvendo dias semelhantes. A variabilidade da temperatura me´dia ao longo de dias semelhantes pode ser representada por um desvio-padra˜o de σ = 4oC. De uma amostra envolvendo 64 dias semelhantes, obte´m-se uma me´dia de 28oC.Qual e´ a estimativa intervalar para a temperatura me´dia do dia sob estudo a um n´ıvel de confianc¸a de: (a) 96%, (b) 99.9%? 4. Quais suposic¸o˜es embasam as ana´lises acima? Resoluc¸a˜o Exerc´ıcio 1 1) Nesta questa˜o, deseja-se inferir sobre a me´dia, a partir da um intervalo com determinado n´ıvel de confianc¸a. Temos que o desvio-padra˜o da populac¸a˜o e´ σ = R$ 50.00. Ja´ para a amostra aleato´ria, temos que n = 30, xobs = R$250.00. A partir dos dados observados na amostra (n=30 e xobs = 250), tem-se como estimativa intervalar para µ, sob um n´ıvel de confianc¸a de 1-α: IC(µ, 1− α) = [ xobs − σ√ n · z1−α 2 , xobs + σ√ n · z1−α 2 ] = [ 250− 50√ 30 · z1−α 2 , 250 + 50√ 30 · z1−α 2 ] , 1 onde z1−α 2 e´ o valor da normal-padra˜o que acumula ate´ ele uma a´rea de 1− α2 . Pede-se os intervalos de 90% e 99% de confianc¸a para a me´dia populacional. Para, IC(µ, 90%), temos que α = 10%, z95% = 1.64 e IC(µ, 99%), temos que α = 1%, z99.5% = 2.57. Assim, temos os seguintes intervalos: IC(µ, 90%) = [ 250− 50√ 30 1.64 , 250 + 50√ 30 1.64 ] = [235.03 , 264.97] IC(µ, 99%) = [ 250− 50√ 30 2.57 , 250 + 50√ 30 2.57 ] = [226.54 , 273.46] Logo, tem-se que o valor me´dio da cesta ba´sica da regia˜o estara´ entre R$ 235.03 e R$ 264.97, sob um n´ıvel de confianc¸a de 90% (a probabilidade de estarmos errados e´ de 10%). Perceba que quanto mais aumentarmos nosso n´ıvel de confianc¸a, maior sera´ nosso intervalo, como de fato e´ vis´ıvel para o n´ıvel de confianc¸a 99%. 2) A cargo do aluno. 3) A cargo do aluno. 4) A principal suposic¸a˜o para estas questo˜es e´ que X ∼ N ( µ, σ2 n ) . Assim, considera-se que o tamanho amostral adotado (n) e´ suficientemente grande para que se verifique normalidade da me´dia amostral (de acordo com o teorema do limite central). Por outro lado, supo˜e- se que os valores amostrados sa˜o independentes entre si. Apenas assim, teremos que a variaˆncia de X equivalera´ a σ2 n . Para o primeiro exerc´ıcio, por exemplo, supo˜e-se que o valor da cesta ba´sica de uma cidade e´ independente do de outra. Veja que esta suposic¸a˜o sera´ facilmente quebrada caso o pesquisador visite supermercados pertencentes a` mesma rede ou mesmo caso na˜o se desloque o suficiente em cada localidade ou ainda em situac¸o˜es de cartel. 0.2 Intervalo de Confianc¸a para Me´dia, variaˆncia desconhecida Exerc´ıcio 2 1. De uma amostra com 30 cidades, estima-se que o desvio-padra˜o e a me´dia do valor da cesta ba´sica de uma regia˜o e´ de R$50.00 e R$250,00, respectivamente. Qual e´ a estimativa intervalar para o valor me´dio da cesta ba´sica na regia˜o a um n´ıvel de confianc¸a de 90%? E para um n´ıvel de confianc¸a de 99%? E se o desvio-padra˜o, ao inve´s de uma estimativa, fosse populacional? 2. De uma amostra com 100 laˆmpadas, estima-se que o desvio-padra˜o e a me´dia do tempo de vida de um modelo de laˆmpadas e´ de 1000 horas e 4000h, respectivamente. Qual e´ a estimativa intervalar para o tempo me´dio de vida do modelo de laˆmpadas sob um n´ıvel de confianc¸a de 95%? E para um n´ıvel de confianc¸a de 99.9%? E se o desvio-padra˜o, ao inve´s de uma estimativa, fosse populacional? 3. A previsa˜o para a temperatura me´dia em dado dia e´ baseada em uma amostra envolvendo dias semelhantes. De uma amostra envolvendo 64 dias semelhantes, obte´m-se uma me´dia de 28oC e um desvio-padra˜o de 4oC para a temperatura. Qual e´ a estimativa intervalar para a temperatura me´dia do dia sob estudo a um n´ıvel de confianc¸a de: (a) 95%, (b) 99.9%? 2 4. Quais suposic¸o˜es embasam as ana´lises acima Resoluc¸a˜o Exerc´ıcio 2 1) Nesta questa˜o, apesar da semelhanc¸a com a primeira questa˜o do Exerc´ıcio 1, vale salientar que ela na˜o nos fornece o desvio-padra˜o da populac¸a˜o. Desta forma usaremos a distribuic¸a˜o t-Student. Temos para a amostra aleato´ria selecionada que a estimativa para o desvio- padra˜o e´ s=R$ 50, n = 30 e xobs = 250. A partir dos dados observados na amostra (n = 30, xobs = 250, s = 50), tem-se como estimativa intervalar para µ (o valor me´dio da cesta ba´sica na regia˜o). IC(µ, 1− α) = [ xobs − s√ n · t(n−1,1−α2 ) , xobs + s√ n · t(n−1,1−α2 ) ] = [ 250− 50√ 30 · t(29,1−α2 ) , 250 + 50√ 30 · t(29,1−α2 ) ] Pede-se os intervalos de 90% e 99% de confianc¸a para a me´dia populacional. Para, IC(µ, 90%), temos que α = 10%, t(29,95%) = 1.699 e para IC(µ, 99%), temos que α = 1%, t(29,99.5%) = 2.756 Assim, temos os seguintes intervalos: IC(µ, 90%) = [ 250− 50√ 30 1.699 , 250 + 50√ 30 1.699 ] = [234.49 , 265.51] IC(µ, 99%) = [ 250− 50√ 30 2.756 , 250 + 50√ 30 2.756 ] = [224.84 , 275.16] Logo, tem-se que o valor me´dio da cesta ba´sica da regia˜o estara´ entre R$ 234.49 e R$ 265.51, sob um n´ıvel de confianc¸a de 90% (a probabilidade de estarmos errados e´ de 10%). Veja que, embora as medidas estat´ısticas sejam semelhantes a`s da abordagem envolvendo uma variaˆncia conhecida (Exerc´ıcio 1.1), agora temos um intervalo de confianc¸a de maior comprimento. Isto decorre do fato de estarmos utilizando uma estimativa da variaˆncia no presente problema, o que eleva nosso n´ıvel de incerteza em comparac¸a˜o ao caso em que na˜o precisar´ıamos inferir sobre ela. Na modelagem isto e´ refletido ao substituirmos a distribuic¸ao normal pela t-Student. Veja que para o mesmo valor de α temos sempre valores mais expressivos da t-Student em relac¸ao a` normal. Se tivessemos um desvio-padra˜o da populac¸a˜o, deveriamos ter utilizado a distribuic¸a˜o Normal, visto que na˜o existiria incerteza sobre a variabilidade. Ale´m disso, a t-Student, assume uma maior variabilidade. 2) A cargo do aluno. 3) A cargo do aluno. 4) As suposic¸o˜es para estas questo˜es tambe´m se baseiam em normalidade e independeˆncia das varia´veis envolvidas. Destaque-se que sendo a varia´vel de interesse normalmete distri- buida, sua me´dia amostral tambe´m sera´. Assim, sendo, a tranformac¸ao X − µ s/ √ n seguira´ a distribuic¸a˜o t-Student com (n−1) graus de liberdade. Destaque-se, assim, o envolvimento de uma estimativa para a variaˆncia da populac¸a˜o. 30.3 Intervalo de Confianc¸a para a proporc¸a˜o Exerc´ıcio 3 1. De uma amostra com 3000 eleitores de um pa´ıs, a proporc¸a˜o de votantes em B foi de 46%. Qual e´ a estimativa intervalar para a proporc¸a˜o de votantes em B no pa´ıs a um n´ıvel de confianc¸a de 94%? E para um n´ıvel de confianc¸a de 98%? 2. De uma amostra com 100 laˆmpadas, 6 falharam antes de completar 8000 horas de operac¸a˜o. Qual e´ a estimativa intervalar para a probabilidade de uma laˆmpada falhar antes de com- pletar 8000 horas de funcionamento, sob um n´ıvel de confianc¸a de 96%? E para um n´ıvel de confianc¸a de 97%? 3. Deseja-se calcular uma estimativa intervalar para a probabilidade de que uma especulac¸a˜o financeira configure-se concretamente. De um banco de dados histo´ricos envolvendo 64 especulac¸o˜es, ele verificou que 28 se tornaram verdade. Qual n´ıvel de confianc¸a voceˆ adotaria? Por que? Qual e´ a estimativa intervalar associada? 4. Quais suposic¸o˜es embasam as ana´lises acima? Resoluc¸a˜o Exerc´ıcio 2 2) Nesta questa˜o, o paraˆmetro de interesse e´ a probabilidade de uma laˆmpada falhar antes de completar 8000 horas de funcionamento (p). Do enunciado, tem-se que n (tamanho da amostra adotada) = 100 laˆmpadas; pˆobs (a proporc¸ao de laˆmpadas que falharam antes de 8000 horas de operac¸ao) = 0.06. Para um dado n´ıvel de confianc¸a de 1 − α e considerando o maior n´ıvel de variabilidade poss´ıvel (quando σ = p · (1− p) = 1/4), o intervalo de confianc¸a para p e´ dado por IC(p, 1− α) = [ pˆobs − σ√nz1−α2 , pˆobs + σ√ n z1−α 2 ] = [ pˆobs − 0.5√nz1−α2 , pˆobs + 0.5√ n z1−α 2 ] = [ 0.06− 0.5√ 100 z1−α 2 , 0.06 + 0.5√ 100 .z1−α 2 ] Vale destacar que no intervalo acima adota-se 0.5 como sendo o maior valor a ser assumido pelo desvio-padra˜o de Pˆ , o estimador de p. Por sua vez, z1−α 2 representa o valor da normal- padra˜o que acumula uma a´rea de 1− α2 de probabilidade. Assim, se 1−α = 0.96, z1− 0.042 = z0.98 ≈ 2.05 e se 1− α = 0.97, z1− 0.03 2 = z0.985 = 2.17. Desta forma, IC(p, 0.96) = [0.06− 0.05× 2.05 , 0.06 + 0.05× 2.05] = [−0.0425, 0.1625] IC(p, 0.97) = [0.06− 0.05× 2.17 , 0.06 + 0.05× 2.17] = [−0.0485, 0.1685] Logo, o intervalo de confianc¸a para a probabilidade de que uma laˆmpada falhe durante 8000 horas de funcionamento (p), sob um n´ıvel de confianc¸a de 96%, envolve valores entre -0.0425 e 0.1625. Perceba-se que como p na˜o assume valores negativos, o limite inferior do intervalo deve ser substitu´ıdo por 0.0. Por outro lado, considerando como estimativa para a variaˆncia populacional (σ2) a amos- tral (s2 = pˆobs · (1− pˆobs) = 0.06 · (1− 0.06) = 0.056): 4 IC(p, 1− α) = [ pˆobs − s√nz1−α2 , pˆobs + s√ n z1−α 2 ] = [ 0.06− 0.237√ 100 z1−α 2 , 0.06 + 0.237√ 100 z1−α 2 ] Seguindo, IC(p, 0.96) = [0.06− 0.0237× 2.05 , 0.06 + 0.0237× 2.05] = [0.0114, 0.1086] IC(p, 0.97) = [0.06− 0.0237× 2.17 , 0.06 + 0.0237× 2.17] = [0.0086, 0.1114]. Assim, recorrendo a` variaˆncia amostral temos intervalos bem mais estreitos em relac¸a˜o a`queles de variaˆncia ma´xima; isto porque a proporc¸a˜o amostral foi bem menor que 0.5 (o valor que reflete a maior variabilidade poss´ıvel). Note-se que quando se envolve a proporc¸a˜o, a variaˆncia amostral na˜o nos conduz a` distribuic¸a˜o t-Student, principalmente devido a`s incertezas sobre a variaˆncia existirem exclusivamente devido a desconhecermos o valor de p: σ2 = p · (1 − p). Assim, uma vez conhecido o valor de p, σ2 sera´ tambe´m conhecido. Por outro lado, quando estudamos a me´dia de maneira geral, µ, ao inve´s da proporc¸a˜o p, as incertezas sobre σ2 envolvem outros fatores ale´m de µ: σ2 = ∑N i=1 (xi−µ)2 N , dando margem a` distribuic¸a˜o t-Student. 5
Compartilhar