Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO DEPARTAMENTO DE ESTATI´STICA E INFORMA´TICA - DEInfo ESTATI´STICA EXPLORATO´RIA B Resoluc¸a˜o dos exerc´ıcios das listas 23-26 Monitor: Nielson Avelino de Santana Orientador: Paulo Renato Alves Firmino 19 de outubro de 2014 Suma´rio 0.1 Teste de Hipo´tese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 0.2 Teste de hipo´teses: Passos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 0.3 Aulas 25-26: Teste de hipo´teses para a me´dia (variaˆncia conhecida) . . . . . . . . 3 1 Aulas 23-24: Teste de Hipo´teses 0.1 Teste de Hipo´tese Exerc´ıcio 1 Exerc´ıcio 1: Delineie H0 e descreva os respectivos erros do tipo I e do tipo II nos seguintes casos: 1. De acordo com as especificac¸o˜es de uma nova tecnologia adotada, a produc¸a˜o me´dia dia´ria de leite de dado rebanho sera´ de 10 litros. Um eventual comprador deseja estudar se tais especificac¸o˜es sa˜o satisfeitas. 2. De acordo com a literatura me´dica, a proporc¸a˜o de indiv´ıduos que desenvolvem dado caˆncer e´ de 5%. Deseja-se estudar se determinada droga e´ cancer´ıgena. 3. Estuda-se se determinada dieta eleva a resisteˆncia de cavalos. Sabe-se que, em me´dia, um cavalo e´ capaz de percorrer ate´ 12 km sem apresentar sinais de fadiga. 4. Determinado cirurgia˜o defende que desenvolveu um me´todo ciru´rgico que requer menor tempo. Sabe-se que o procedimento tradicional requer, em me´dia, 40 minutos. 5. A exemplo dos quesitos acima, sugira´ hipo´teses nulas (paradigmas ou pre´-especificac¸o˜es) relacionadas a problemas da sua futura a´rea de atuac¸a˜o profissional e estude os tipos de erro. Resoluc¸a˜o Exerc´ıcio 1 1) H0 : µ = 10 (µ ≡ Produc¸a˜o me´dia do rebanho que vivencia o novo me´todo; Tipo 1: Rejeitar H0 quando esta e´ verdadeira. � Concluir erradamente que o novo me´todo leva a uma produc¸ao me´dia diferente de 10 litros. Tipo 2: Na˜o rejeitar H0 quando esta e´ falsa. � Concluir erradamente que o novo me´todo leva a uma produc¸ao me´dia de 10 litros. 2) H0 : p = p0 = 5% (p ≡ Proporc¸a˜o de indiv´ıduos, dentre aqueles que consomem a droga, que desenvolvem o caˆncer; p0 ≡ Proporc¸a˜o de indiv´ıduos, dentre aqueles de toda a populac¸a˜o, que desenvol- vem o caˆncer (independente de consumirem ou na˜o a droga). Tipo 1: Rejeitar H0 quando esta e´ verdadeira. � Concluir erradamente que a droga e´ cancer´ıgena. Tipo 2: Na˜o rejeitar H0 quando esta e´ falsa. � Concluir erradamente que a droga na˜o e´ cancer´ıgena. Questa˜o 3,4 e 5 a cargo do aluno. 2 0.2 Teste de hipo´teses: Passos Exerc´ıcio 2 Exerc´ıcio 2: Delineie H1 para os casos abaixo 1. De acordo com as especificac¸o˜es de uma nova tecnologia adotada, a produc¸a˜o me´dia dia´ria de leite de dado rebanho sera´ de 10 litros. Um eventual comprador da tecnologia deseja estudar se tais especificac¸o˜es sa˜o satisfeitas. 2. Estuda-se se determinado produto e´ cancer´ıgeno. Sabe-se que a incideˆncia deste caˆncer em indiv´ıduos de um modo geral e´ de 5%. 3. Estuda-se se determinada dieta eleva a resisteˆncia de cavalos. Sabe-se que, em me´dia, um cavalo e´ capaz de percorrer ate´ 12 km sem apresentar sinais de fadiga. 4. Determinado cirurgia˜o defende que desenvolveu um me´todo ciru´rgico que requer menor tempo. Sabe-se que o procedimento tradicional requer, em me´dia, 40 minutos. 5. Considerando as hipo´teses elaboradas no quesito 5 do Exerc´ıcio 1, delineie as respectivas hipo´teses alternativas Resoluc¸a˜o Exerc´ıcio 1 1) H1 : µ < 10 (µ ≡ Produc¸a˜o me´dia de leite do rebanho que vivencia o novo me´todo). Note-se que H1 representa o interesse do eventual comprador citado no enunciado da questa˜o. Assim, neste caso na˜o haveria razo˜es para considerar como hipotese alternativa µ > 10 ja´ que neste caso o proprieta´rio da tecnologia teria, ele mesmo, elevado o valor de µ nas especificac¸o˜es do produto. 2) H1 : p > p0 = 0.05 (p ≡ Proporc¸a˜o de indiv´ıduos que desenvolvem caˆncer quando submetidos a` droga; p0 ≡ Proporc¸a˜o de indiv´ıduos que desenvolvem caˆncer independente de consumirem ou na˜o a droga). Em palavras, se a droga e´ cancer´ıgena, ela fara´ a proporc¸a˜o de incideˆncias de caˆncer aumentar entre os indiv´ıduos que a consomem em relac¸a˜o a` proporc¸a˜o de incideˆncia de caˆncer na populac¸a˜o como um todo. Questa˜o 3,4 e 5 a cargo do aluno. 3 Aulas 25-26: Teste de hipo´teses para a me´dia (variaˆncia conhecida) Exerc´ıcio 1 Questa˜o 1: Resolva os problemas de teste de hipotese a seguir: 1. Argumenta-se que devido a uma nova tecnologia adotada, a produc¸a˜o me´dia dia´ria de leite de dado rebanho sera´ maior que 10 litros. Sabe-se que a variabilidade na produc¸a˜o de leite do rebanho resulta em um desvio-padra˜o de 3 litros. Uma amostra aleato´ria de 25 ocasio˜es onde o desempenho da nova tecnologia foi medido, levou a uma me´dia de produc¸a˜o de 13 litros de leite. O que voceˆ concluiria sob um n´ıvel de significaˆncia de 5%? E sob um n´ıvel de significaˆncia de 1%? 2. Defende-se que determinada dieta reduz a resisteˆncia de cavalos. Sabe- se que, em me´dia, um cavalo e´ capaz de percorrer ate´ 12 km sem apresentar sinais de fadiga, sob um desvio- padra˜o de 3 km. Uma amostra aleato´ria com 16 cavalos submetidos a` tal dieta resultou em uma resisteˆncia me´dia de 10.5 km. O que voceˆ concluiria a um n´ıvel de significaˆncia de 5.5%? E sob um n´ıvel de significaˆncia de 2.5%? 3. Uma equipe de manutenc¸a˜o suspeita que dado equipamento de medic¸a˜o na˜o esteja cali- brado. Para uma determinada condic¸a˜o, sua medida deve ser de, em me´dia, 35 unidades, sob um desvio-padra˜o de 3 unidades. Montou-se uma amostra aleato´ria envolvendo 49 medic¸o˜es do equipamento e obteve-se o valor me´dio de 32 unidades. O que voceˆ concluiria a um n´ıvel de significaˆncia de 7%? E sob um n´ıvel de significaˆncia de 0.1%? 4. Para cada uma das questo˜es acima, responda: (a) Em palavras, quais hipo´teses esta˜o sendo confrontadas? (b) Quais sa˜o os paraˆmetros utilizados para abordar o problema? Quais sa˜o os respectivos estimadores associados? (c) Como as hipo´teses confrontadas podem ser matematicamente descritas a partir dos paraˆmetros utilizados? (d) Quais sa˜o as respectivas regras de decisa˜o elaboradas? (e) Quais suposic¸o˜es embasam suas ana´lises? Resoluc¸a˜o Exerc´ıcio 1 Para a resoluc¸a˜o das questo˜es acima, vale ressaltar que como regra de decisa˜o geral, ha´ razo˜es para rejeitar H0 se e so´ se a probabilidade p∗ de ocorrer um evento ”ao menos ta˜o estranho”quanto aquele revelado pela amostra for menor que a probabilidade mı´nima tolera´vel pelo decisor, expressa pelo n´ıvel de significaˆncia: α = P (Rejeitar H0|H0 ver- dadeira). Assim, α representaria a probabilidade mı´nima aceita´vel pelo decisor para considerar que as diferenc¸as observadas na amostra em relac¸a˜o ao que afirma H0 se deram devido ao acaso, simplesmente. Em outros termos, se p∗ < α conclui-se que o evento observado seria ta˜o raro que torna-se mais plaus´ıvel rejeitar H0. Por sua vez, o significado matema´tico de evento ”ao menos ta˜o estranho”dependera´ da hipo- tese alternativa associada ao teste. De maneira geral, considerando θˆobs como sendo a estimativa proveniente da amostra para o paraˆmetro de interesse θ, relativa a um estimador de θ, Θˆ, e θ0 como o valor de θ fixado em H0, tem-se que 4 i) Se H1 : θ > θ0, enta˜o p∗ = P (Θˆ ≥ θˆobs); ii) Se H1 : θ < θ0, enta˜o p∗ = P (Θˆ ≤ θˆobs); iii) Se H1 : θ 6= θ0, enta˜o p∗ = 2× P (Θˆ ≤ θˆobs) se θˆobs < θ0 ou p∗ = 2× P (Θˆ ≥ θˆobs) se θˆobs > θ0. Da linguagem estat´ıstica adotada pelos praticantes de testes de hipo´teses, as situac¸o˜es (i) e (ii) acima sa˜o tambe´m denominadas de testes de hipo´tese unilaterais, enquanto que (iii) e´ denomi- nada de teste bilateral. 1) H0 : µ = µ0 = 10 vs H1 : µ > 10 (µ ≡ Produc¸a˜o me´dia dos rebanhos que vivenciam o novo me´todo)Note-se, do enunciado, que questiona-se se a nova tecnologia leva a produc¸a˜o me´dia dia´ria de leite a superar os 10 litros. Note-se ainda que trata-se de um teste de hipo´teses sobre a me´dia, onde se conhece o desvio-padra˜o populacional (σ = 3 litros). O enunciado destaca ainda que adotou-se uma amostra de (n =) 25 ocasio˜es onde a produc¸a˜o de leite via nova tecnologia foi medida, gerando-se uma estimativa para µ de x¯obs = 13 litros, baseada no estimador me´dia amostral ( X¯ = ∑25 1 Xi 25 ) . Para o estimador, Xi ≡ Quantidade de leite produzida na ia ocasia˜o onde a nova tecnologia foi aplicada. Como a hipo´tese alternativa e´ dada por H1 : µ > 10, o coˆmputo de p∗ envolve: p∗ = P (X¯ ≥ x¯obs|µ = 10) Supondo que H0 seja verdadeira, que o tamanho da amostra (n = 25) e´ suficientemente grande para se fazer valer o teorema central do limite e, ainda, que a produc¸a˜o de leite em uma ocasia˜o onde a nova tecnologia foi adotada na˜o influencia na de outra ocasia˜o, tem-se que X¯ ∼ Normal ( µX¯ = µ = 10, σX¯ = σ√ n = 35 = 0.6 ) . Seguindo da propriedade acima, temos que p∗ = P (X¯ ≥ x¯obs|µ = 10) = P (Z ≥ x¯obs−µX¯σX¯ ) onde Z = X¯−µX¯ σX¯ de tal forma que Z ∼ Normal(0, 1), isto e´, Z segue uma distribuic¸ao normal-padra˜o (onde a me´dia e a variaˆncia equivalem, respectivamente, a 0.0 e a 1.0). Seguindo, p∗ = P ( Z ≥ x¯obs−µX¯σX¯ ) = P ( Z ≥ 13−100.6 ) = P (Z ≥ 5) = 1− P (Z < 5) ≈ 0. Nos ca´lculos acima, recorreu-se a` tabela da normal-padra˜o adotada durante as aulas. Con- tudo, de forma mais precisa a partir da func¸a˜o dist.norm(5.0, 0.0, 1.0, 1) do Excel ou da func¸a˜o pnorm(5) do R, obte´m-se que p∗ = P (Z ≥ 5) = 2.9 × 10−7. De qualquer forma, tanto para um n´ıvel de significaˆncia de (α =)5% quanto de 1%, conclui-se que ha´ razoo˜es para rejeitar H0. De fato, mostra-se bastante improva´vel que se observe uma estimativa para a me´dia ao menos ta˜o distante de µ = 10 (note que tal igualdade e´ defendida pela hipo´tese H0) quanto x¯obs. Para qualquer n´ıvel de significaˆncia maior que p∗, concluir-se- ia que H0 deve ser rejeitada. Assim, defende-se, a partir das evideˆncias provenientes da 5 amostra, que a produc¸a˜o me´dia dos rebanhos que vivenciam o novo me´todo e´ maior que 10 litros, sob uma probabilidade de 2.9× 10−7 de se estar tomando a decisa˜o errada. Vale destacar que caso a variaˆncia (σ2) fosse desconhecida e, no seu lugar, se envolvesse uma estimativa s2, seria necessa´rio recorrer a` distribuic¸a˜o t-Student ao inve´s da normal- padra˜o. Demais questo˜es a cargo do aluno. 6
Compartilhar