Baixe o app para aproveitar ainda mais
Prévia do material em texto
Prof. Arthur Lima Aula 12 1 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Aula 12 – Estatística Inferencial Raciocínio Analítico, Matemática Financeira e Estatística p/ Auditor do TCU – 2019 Prof. Arthur Lima Prof. Arthur Lima Aula 12 2 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Sumário ESTATÍSTICA INFERENCIAL ............................................................................................................................. 3 INTERVALOS DE CONFIANÇA ............................................................................................................................ 3 1º caso: intervalo de confiança para a MÉDIA – desvio padrão populacional CONHECIDO .................................. 4 2º caso: intervalo de confiança para a MÉDIA – desvio padrão populacional DESCONHECIDO ........................... 6 3º caso: cálculo do intervalo de confiança para PROPORÇÕES (ou probabilidades) ............................................ 9 DIMENSIONAMENTO DE AMOSTRAS ............................................................................................................. 11 TESTES DE HIPÓTESES .................................................................................................................................... 12 Teste de hipóteses para MÉDIAS, com desvio padrão populacional CONHECIDO ............................................. 13 Teste de hipóteses para MÉDIAS, com desvio padrão populacional DESCONHECIDO ....................................... 17 Teste de hipóteses para PROPORÇÕES .......................................................................................................... 20 Erros em um teste de hipóteses ...................................................................................................................... 20 Conceitos finais sobre testes de hipóteses ....................................................................................................... 23 QUESTÕES COMENTADAS PELO PROFESSOR ............................................................................................... 24 LISTA DE QUESTÕES DA AULA .................................................................................................................... 113 GABARITO .................................................................................................................................................. 150 Prof. Arthur Lima Aula 12 3 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Estatística Inferencial Olá, tudo bem? Aqui é o professor Arthur Lima. É com muita alegria que inicio mais essa aula. Vamos tratar sobre os seguintes tópicos do seu edital neste encontro: Noções de inferência estatística. Estimação de parâmetros por ponto e por intervalo. Intervalo de confiança. Testes de hipóteses. Testes paramétricos: médias e proporções. Aproveito para lembrá-lo de seguir as minhas redes sociais e acompanhar de perto o trabalho que desenvolvo: INTERVALOS DE CONFIANÇA Suponha que temos por objetivo conhecer a distribuição de idades da população de nosso bairro. Selecionamos uma amostra desta população com n = 30 indivíduos e calculamos parâmetros como a idade média e o desvio padrão. Para esta amostra, obtivemos a média 26=X anos. Esta é, por si só, uma estimativa pontual da média de idade da população ( ). Mas será que esta é realmente a média de idade da população? Pode ser que, ao escolher outra amostra do mesmo tamanho da primeira, vejamos que a idade média desta segunda amostra seja 2 26,5=X . Qual das duas estimativas é mais correta? Ao invés de simplesmente dizer que a estimativa da média de idade da população é 26=X ou 2 26,5=X , podemos definir um intervalo de idades dentro do qual esperamos que a média de idade da população ( ) se encontre, com certo grau de confiança. O grau de confiança normalmente é designado por “1- ”. Prof. Arthur Lima Aula 12 4 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 1º caso: intervalo de confiança para a MÉDIA – desvio padrão populacional CONHECIDO Esse é o caso mais comum em provas de concurso. Se o desvio padrão populacional for dado pelo exercício, a “receita de bolo” para a obtenção do intervalo de confiança para a média populacional a partir da média amostral X , do desvio padrão populacional e do grau de confiança 1 − é: 1) Encontrar o valor /2Z na tabela da curva normal padrão. Este valor é aquele tal que /2 /2( ) 1P Z Z Z − = − . Ex.: se nosso grau de confiança é 1 95%− = , devemos buscar na curva normal padrão o valor /2Z tal que /2 /2( ) 95%P Z Z Z − = . Neste caso, você verá que P(-1,96<Z<1,96) = 0,95. Portanto, devemos assumir /2 1,96Z = . 2) Construir o intervalo de confiança. Este intervalo tem como limite inferior o valor − /2 X Z n e limite superior + /2 X Z n , ou seja, o intervalo de confiança é: [ /2X Z n − , /2X Z n + ] Ex.: se o desvio padrão populacional dado foi 5anos = , a média amostral era 26=X anos , e a amostra continha n = 100 elementos, então o intervalo de confiança é simplesmente: [ 5 26 1,96 100 − ; 5 26 1,96 100 + ] ou simplesmente [25,02 ; 26,98] Portanto, ao invés de simplesmente obtermos a estimativa pontual de que a média populacional é de 26 anos, podemos dizer que a média populacional encontra-se entre 25,02 e 26,98 anos, com 95% de confiança. Dizemos ainda que a amplitude do intervalo é de 26,98 – 25,02 = 1,96 anos (diferença entre o máximo e o mínimo). Visualize no gráfico abaixo porque, para termos uma confiança de 1 95%− = , foi preciso encontrar o valor /2Z que permitisse eliminar / 2 2,5% = em cada extremidade da curva normal padrão: Prof. Arthur Lima Aula 12 5 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Repare também neste gráfico que o valor /2Z tal que /2 /2( ) 1P Z Z Z − = − é o mesmo que torna P(Z> /2Z ) = / 2 , ou então que torna /2(0 ) 0,50 / 2P Z Z = − . Obs.1: Grave essa relação entre Z = 1,96 e 1 − =95%. Esta é a mais utilizada nos exercícios de concursos, e também na prática. Obs.2: A título de exemplo, veja na tabela da normal padrão, que reproduzo abaixo, que para z = -1,96 temos que P(Z<-1,96) = 0,025, ou 2,5%, o que é equivalente a dizer que P(-1,96<Z<0) = 50% - 2,5% = 47,5%, que por sua vez é equivalente a dizer que P(-1,96<Z<1,96) = 2 x 47,5% = 95%: Prof. Arthur Lima Aula 12 6 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Repare que, em um intervalo de confiança na forma [ /2X Z n − , /2X Z n + ], a sua amplitude (diferença entre o máximo e o mínimo) é: = /22Amplitude Z n Basta fazer a subtração entre o valor máximo e o valor mínimo do intervalo. Saiba ainda que o trecho abaixo é chamado de “erro padrão”: 𝜀 = 𝜎 √𝑛 2º caso: intervalo de confiança para a MÉDIA – desvio padrão populacional DESCONHECIDO A diferença deste caso para o anterior é que agora o desvio padrão populacional não é conhecido (apesar do desvio padrão de uma amostra “s” ser conhecido). Assim, ao invés de usar a curva normal padrão em nossa análise, utilizaremos a curva “t de Student”, que, como vimos na aula passada, é uma aproximação teórica da curva normal. Ao invés de calcular /2Z na curvanormal padrão, vamos agora obter o valor /2t nas tabelas da distribuição “t de Student”. Prof. Arthur Lima Aula 12 7 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Obtido /2t , o intervalo de confiança será: [ /2 s X t n − , /2 s X t n + ] Veja que “s”, que é o desvio padrão da amostra, está substituindo o valor que agora não conhecemos (desvio padrão populacional). Para obter /2t , basta saber que se a amostra possuir n elementos, o número de graus de liberdade da distribuição “t de Student” será “n–1”. De posse do número de graus de liberdade e do valor de / 2 , você pode buscar na tabela o valor correto de /2t . Exemplificando, suponha que temos aquela mesma amostra onde a idade média é 26=X anos , o desvio padrão dessa amostra (e não da população!) é s = 5 anos, e queremos obter um intervalo de confiança para a média populacional com confiança de 1 95%− = . A nossa amostra possui n = 25 elementos. Se n = 25, então o número de graus de liberdade da distribuição t de Student é n-1 = 24. Na tabela t de Student, olhando a linha corresponde a 24 graus de liberdade e a coluna correspondente a / 2 2,5% = , temos t2,5% = 2,0639. Portanto, o nosso intervalo de confiança é: [ /2 s X t n − , /2 s X t n + ] [ 5 26 2,0639 25 − , 5 26 2,0639 25 + ] ou seja, [ 23,93; 28,06] Obs.1: veja abaixo um exemplo da tabela “t de Student”. Repare que, para n-1 = 24 graus de liberdade e / 2 2,5% = , temos t2,5% = 2,064. Veja ainda que utilizamos apenas / 2 2,5% = ao invés de 5% porque, para desenhar o intervalo de confiança para a média, com 95% de confiança, devemos retirar apenas 2,5% de cada extremidade da curva normal (totalizando 5%). O que você deve entender desta tabela é que P(- 2,064 < Z < 2,064) = 95%, conforme precisamos para construir o intervalo. Prof. Arthur Lima Aula 12 8 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Obs.2: em regra os exercícios não te obrigam a utilizar a tabela. Eles já apresentam alguns valores da tabela diretamente, para você selecionar dentre aqueles qual deve utilizar na resolução do seu exercício. Entretanto, considero interessante você conhecer a tabela para facilitar o entendimento. Repare ainda que, em um intervalo de confiança na forma: [ /2 s X t n − , /2 s X t n + ], a amplitude (diferença entre o máximo e o mínimo) é: = /22 s Amplitude t n Prof. Arthur Lima Aula 12 9 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 3º caso: cálculo do intervalo de confiança para PROPORÇÕES (ou probabilidades) Digamos que, a partir de uma amostra de pessoas de uma população, encontramos que a proporção de crianças é p = 15% do total. Esta proporção obtida na amostra pode ser considerada uma estimativa pontual da proporção de crianças naquela população. Um intervalo para esta proporção com grau de confiança igual a 1 − é dado por: [ /2 (1 )p p p Z n − − ; /2 (1 )p p p Z n − + ] Assim como no 1º caso, /2Z será obtido a partir da distribuição normal padronizada. Pratique esses conceitos resolvendo o exercício abaixo: FCC – SEFIN/RO – 2010) Em uma pesquisa realizada numa grande região, apurou-se que 90% dos habitantes eram favoráveis à implantação de uma indústria. O tamanho da amostra desta pesquisa foi de 1.600 e considerou-se normal a distribuição amostral da frequência relativa dos habitantes da região a favor desta implantação. O intervalo de confiança de 95,5% encontrado para a proporção foi igual a [88,5% ; 91,5%]. Caso o tamanho da amostra tivesse sido de 2.500 e apurando-se a mesma proporção anterior, tem-se que a amplitude do intervalo de 95,5% seria de a) 1,2% b) 2,4% c) 3,6% d) 4,8% e) 6,4% RESOLUÇÃO: Temos uma questão relativa a intervalo de confiança para proporções, que sabemos ser dado por: [ /2 (1 )p p p Z n − − , /2 (1 )p p p Z n − + ] No primeiro caso, temos que p = 90% (proporção de indivíduos favoráveis), n = 1600 (número de indivíduos na amostra pesquisada). O grau de confiança foi 1 95,5%− = (portanto, / 2 2,25% = ). Substituindo os valores conhecidos na fórmula do intervalo de confiança, temos: [ 2,25% 0,9(1 0,9) 0,9 1600 Z − − ; 2,25% 0,9(1 0,9) 0,9 1600 Z − + ] Comparando este intervalo com o primeiro dado pelo enunciado, isto é, [88,5% ; 91,5%], vemos que: Prof. Arthur Lima Aula 12 10 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 2,25% 2,25% 2,25% 2,25% 2,25% 0,9(1 0,9) 0,9 0,885 1600 0,9(1 0,9) 0,9 0,885 1600 0,09 0,015 1600 0,3 0,015 40 2 Z Z Z Z Z − − = − − = = = = Se a amostra fosse de n = 2500 indivíduos, teríamos o intervalo abaixo: [ 0,9(1 0,9) 0,9 2 2500 − − , 0,9(1 0,9) 0,9 2 2500 − + ] [ 0,3 0,9 2 50 − , 0,3 0,9 2 50 + ] [ 0,3 0,9 2 50 − , 0,3 0,9 2 50 + ] [0,888; 0,912] [88,8%; 91,2%] Portanto, a amplitude deste intervalo seria: 91,2% - 88,8% = 2,4% Resposta: B Repare ainda que, em um intervalo de confiança na forma: [ /2 (1 )p p p Z n − − , /2 (1 )p p p Z n − + ], a amplitude (diferença entre o máximo e o mínimo) é: − = /2 (1 ) 2 p p Amplitude Z n No caso de intervalos de confiança para proporções, o erro padrão é: Prof. Arthur Lima Aula 12 11 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 𝜀 = √ 𝑝. (1 − 𝑝) 𝑛 DIMENSIONAMENTO DE AMOSTRAS Imagine que você seja um funcionário do Ibope. Você foi contratado pelo Jornal Nacional para fazer uma pesquisa sobre o salário médio dos moradores de determinada região do país. Conforme o contrato, você deve obter essa média com um intervalo de 95% de confiança, e com um erro máximo de R$125,00 para cima ou para baixo. Neste cenário, quantas pessoas você precisa entrevistar? Estamos diante de um problema de dimensionamento de amostras! E a sua solução é bem simples. O número “n” de elementos da amostra é dado por: 𝑛 = ( 𝑍𝛼/2 . 𝜎 𝑑 ) 2 Na fórmula acima, d é o erro máximo tolerado. No caso, d = 125 reais (para cima ou para baixo). Além disso, 𝑍𝛼/2 é o valor na curva normal padrão relacionado com um intervalo de confiança de 95%. Já sabemos que, neste caso, 𝑍𝛼/2 = 1,96. Por fim, 𝜎 é o desvio padrão populacional, que normalmente é um dado conhecido por meio de pesquisas anteriores. Em nosso exemplo, vamos considerar que 𝜎 = 1000 reais, ok? Com os dados acima, podemos descobrir o tamanho da amostra que precisará ser pesquisada: 𝑛 = ( 𝑍𝛼/2 . 𝜎 𝑑 ) 2 𝑛 = ( 1,96.1000 125 ) 2 𝑛 = (1,96.8)2 𝑛 = (15,68)2 n = 245,86 Como não é possível entrevistar “245,86 pessoas”, devemos entrevistar 246 pessoas. Veja que o arredondamento é feito para cima, por questão de prudência. Veja essa questão comigo: FCC – SEFAZ/PI – 2015) Instruções: Se Z tem distribuição normal padrão, então: P(Z < 0,4) = 0,655; P(Z < 1,2) = 0,885; P(Z < 1,6) = 0,945; P(Z < 1,8) = 0,964; P(Z < 2) = 0,977. Atenção: O efeito do medicamento A é o de baixar a pressão arterial de indivíduos hipertensos. O tempo, em minutos, decorrido entre a tomada do remédio e a diminuição da pressão é uma variável aleatória X com distribuição normal, tendo média µ e desvio padrão D. Prof. Arthur Lima Aula 12 12 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Uma amostra aleatória de n indivíduos hipertensos foi selecionada com o objetivo de se estimar µ. Supondo que o valor de D é 10 min,o valor de n para que o estimador não se afaste de µ por mais do que 2 min, com probabilidade de 89%, é igual a (A) 49 (B) 64 (C) 36 (D) 100 (E) 81 RESOLUÇÃO: Queremos descobrir o tamanho da amostra “n” tal que o erro máximo tolerado é d = 2 minutos e o desvio padrão populacional é 𝜎 = 10 𝑚𝑖𝑛𝑢𝑡𝑜𝑠. Para jogar na fórmula do tamanho amostral, precisamos encontrar o valor de Z. Veja que queremos ter 89% de probabilidade, de modo que devemos descartar 11% de probabilidade (5,5% de cada lado da curva normal). Analisando os valores fornecidos, vemos que P(Z<1,6) = 0,945. Ou seja, a probabilidade de Z ser menor do que 1,6 é de 94,5%, de modo que a probabilidade de Z ser maior do que 1,6 é exatamente 5,5%, como queremos. Assim, vemos que Z = 1,6 nos permite retirar 5,5% de cada extremidade da curva normal. Jogando na fórmula do tamanho amostral: 𝑛 = ( 𝑍𝛼/2 . 𝜎 𝑑 ) 2 𝑛 = ( 1,6.10 2 ) 2 𝑛 = (8)2 n = 64 Resposta: B TESTES DE HIPÓTESES Os testes de hipóteses são técnicas que nos permitem, com algum grau de probabilidade, diferir o que provavelmente é uma característica da população do que provavelmente é uma mera “obra do acaso”. Ex.: ao calcular a média de idade das pessoas em uma amostra, pode ser que obtenhamos o valor 50 anos. Esse valor pode, de fato, ser uma boa aproximação da idade média da população, como pode ser um “azar” nosso (escolhemos para a amostra um grupo que não representava bem a média da população). Nos próximos tópicos veremos os principais testes de hipóteses que podem cair em sua prova. Prof. Arthur Lima Aula 12 13 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Teste de hipóteses para MÉDIAS, com desvio padrão populacional CONHECIDO Vamos trabalhar com o exemplo citado acima, ou seja, uma amostra de n = 100 pessoas cuja idade média amostral é 50X = anos. Vamos assumir que, com base em estudos científicos anteriores, suspeitássemos que a média de idade da população era menor, neste caso = 40 anos. Sabemos ainda que o desvio padrão da idade da população (e não apenas da amostra!) é 20 = . Queremos testar se, a um nível de significância 5% = , a idade média da população ( ) é de fato os 40 anos que tínhamos nos estudos anteriores. O método consiste, basicamente, em definir duas hipóteses: 1. Hipótese nula (H0): é a hipótese que queremos testar. Ex.: a média de idade da população é = 40 anos. 2. Hipótese alternativa (H1): é a hipótese a ser adotada caso comprove-se que a hipótese nula deve ser rejeitada. Ex.: neste caso, poderia ser a hipótese de a média de idade da população ser diferente de 40 anos, ou seja, 40 anos. Tentaremos confirmar a hipótese nula. Se conseguirmos, ela deve ser considerada verdadeira. Já se tivermos que rejeitá-la, automaticamente a hipótese alternativa tornar-se-á verdadeira. Agora, considerando o nível de significância dado ( 5% = ), devemos encontrar na curva normal padronizada uma região, que chamaremos de região de aceitação da hipótese nula. Esta região deve conter 1 - = 95% de probabilidade. Um teste como esse, onde a hipótese alternativa é 40 anos, é chamado de bilateral, ou bicaudal. Isto porque devemos eliminar da curva normal padrão ambas as extremidades, totalizando uma área de 5% (ou seja, devemos tirar / 2 2,5% = de cada lado da normal). Veja isso no desenho abaixo: Olhando na tabela da normal padrão, vemos que para termos /2 /2( ) 95%P Z Z Z − = , então o valor de /2Z é igual a 1,96. Com isso, a região de aceitação da hipótese nula é aquela onde os valores de Z estão compreendidos entre -1,96 e 1,96: Prof. Arthur Lima Aula 12 14 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 O próximo passo é calcular o valor calculadoZ na curva normal padronizada, com a fórmula abaixo: calculado X Z n − = , onde X é a média da nossa amostra (50 anos), é a média esperada para a população (40 anos, conforme a hipótese nula), é o desvio-padrão da população (20 anos) e n é o número de indivíduos na amostra (100). Portanto, 50 40 5 20 100 − − = = =calc X Z n Veja que o valor de calculadoZ está fora do intervalo de aceitação da hipótese nula (entre -1,96 e 1,96). Portanto, só nos resta rejeitar a hipótese nula, e com isso aceitar a hipótese alternativa (a idade média da população é diferente de 40 anos). Existem 3 tipos de teste de hipóteses: a) Teste unilateral à direita: quando temos uma H0 (ex.: 40anos = ) e a H1 é que do tipo 40anos . Isto é, nosso teste só rejeitará a hipótese nula se a idade média da amostra for superior a 40 anos. Nesse tipo de teste, a região crítica encontra-se toda à direita da curva normal padronizada: Prof. Arthur Lima Aula 12 15 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 A área dessa região crítica é igual a . b) Teste unilateral à esquerda: quando temos uma H0 (ex.: 40anos = ) e a H1 é que do tipo 40anos . Isto é, nosso teste só rejeitará a hipótese nula se a idade média da amostra for inferior a 40 anos. Aqui, a região crítica encontra-se à esquerda da curva: Novamente, a área da região crítica é igual ao nível de significância ( ). c) Teste bilateral: quando temos uma H0 (ex.: 40anos = ) e a H1 é que do tipo 40anos . Isto é, nosso teste terá resultado falso se a idade média da amostra for superior ou inferior a 40 anos. No teste bilateral, temos regiões críticas nas duas extremidades da curva normal, cada uma delas com área igual à metade de Prof. Arthur Lima Aula 12 16 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 : Resumindo, a “receita de bolo” para o teste de hipótese da média, com desvio padrão populacional conhecido, é: - identificar a média amostral X , o desvio padrão populacional e o nível de significância ( ), presentes no enunciado; - definir a hipótese nula H0 e a hipótese alternativa H1; - identificar o tipo de teste (bilateral, unilateral à esquerda ou à direita) de acordo com a hipótese alternativa H1; - consultando a tabela da normal padronizada, tendo em mãos o valor de e o tipo de teste, obter o valor de Z que delimita a região de aceitação da hipótese nula; - calcular o valor calculado X Z n − = ; - verificar se Zcalculado encontra-se dentro da região de aceitação da hipótese nula (aceitando-a) ou fora dela (aceitando a hipótese alternativa). Observe o exercício abaixo: FCC – SEFAZ/SP – 2009) O gerente de uma indústria de determinado componente eletrônico garante que a vida média do produto fabricado é igual a 100 horas. Um comprador desta indústria decide testar a afirmação do gerente e faz um teste estatístico formulando as hipóteses H0: μ = 100 e H1 : μ < 100, sendo que H0 é a hipótese nula, H1 é a hipótese alternativa e μ é a média da população considerada de tamanho infinito com uma distribuição normal. O desvio padrão populacional é igual a 10 horas e utilizou-se a informação da distribuição normal padrão (Z), segundo a qual a probabilidade P(Z ≥ 1,64) = 5%. H0 foi rejeitada com base em uma amostra aleatória de 64 componentes em um nível de significância de 5%. Então, o valor da média amostral foi, em horas, no máximo, (A) 94,75 (B) 95,00 (C) 96,00 Prof. Arthur Lima Aula 12 17 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 (D) 96,50 (E) 97,95 RESOLUÇÃO: Veja que temos um teste unilateral à esquerda, pois H1 é μ < 100. Além disso, foi dado que P(Z ≥ 1,64) = 5%, o que também nos diz que P(Z -1,64) = 5%. Portantodevemos usar: = −1,64Z Devemos aceitar a hipótese nula se Zcalculado > Z , isto é, Zcalculado > -1,64 (veja que estamos usando o valor negativo de Z , pois neste teste a região de rejeição fica na extremidade esquerda da curva normal padrão). Assim, utilizando os demais valores dados pelo enunciado, temos: Zcalculado > -1,64 1,64 − − X n 100 1,64 10 64 − − X 100 2,05− −X 97,95X Resposta: E Teste de hipóteses para MÉDIAS, com desvio padrão populacional DESCONHECIDO Praticamente tudo o que vimos no tópico anterior se aplica a este caso, cuja única diferença é o fato de o desvio padrão populacional ser DESCONHECIDO. Neste caso, ao invés de utilizar a curva normal padrão, vamos utilizar a curva “t de Student” em nossa análise. E como não temos o desvio padrão populacional , vamos usar sua aproximação, que é o desvio padrão amostral “s”. Assim, os passos a serem seguidos são: - identificar a média amostral X , o desvio padrão amostral “s” e o nível de significância ( ), presentes no enunciado; - definir a hipótese nula H0 e a hipótese alternativa H1; - identificar o tipo de teste (bilateral, unilateral à esquerda ou à direita) de acordo com a hipótese alternativa H1; - consultando a tabela de “t de Student”, tendo em mãos o valor de e o tipo de teste, obter o valor de “t” que delimita a região de aceitação da hipótese nula; Prof. Arthur Lima Aula 12 18 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 - calcular o valor − =calculado X t s n ; - verificar se tcalculado encontra-se dentro da região de aceitação da hipótese nula (aceitando-a) ou fora dela (aceitando a hipótese alternativa). Vamos exercitar isso com o seguinte exemplo, que é uma variação daquele primeiro: considere que, em uma amostra de n = 31 pessoas, obtivemos idade média 50X anos= e desvio-padrão amostral s = 20 anos. A um nível de significância = 5%, testar a hipótese de a idade média populacional ser inferior a 40 anos. Veja que agora temos 50X anos= , s = 20 anos e n = 31 pessoas e = 5%. A nossa hipóteses nula e alternativa são: H0 : = 40 anos H1 : < 40 anos Repare que agora não temos mais um teste bilateral, pois a hipótese alternativa não é do tipo 40 . Temos um teste unilateral à esquerda. Com o nível de significância = 5% em mãos, vamos consultar a tabela da distribuição “t de Student”, sabendo ainda que, como nossa amostra possui n – 1 = 31 – 1 = 30 graus de liberdade. Encontraremos que t0,05 = 1,697 (repare que buscamos na tabela por , e não por /2, como fizemos no teste bilateral). Podemos dizer que P(t > 1,697) = 0,05. Como a curva “t de Student” é simétrica, podemos dizer que P(t < -1,697) = 0,05. Como temos um teste unilateral à esquerda, queremos deixar uma região com probabilidade igual a 0,05 à esquerda da distribuição. Temos o esquema abaixo: O valor tcalculado é: 50 40 2,78 20 31 − − = = =calculado X t s n Prof. Arthur Lima Aula 12 19 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Veja que o valor de tcalculado encontra-se fora da região de rejeição da hipótese nula, motivo pelo qual devemos aceitar H0 (isto é, a média de idade da população é de 40 anos, a um nível de significância de 5%). Trabalhe essa questão: Instruções: Para responder à questão abaixo utilize as informações a seguir. Se Z tem distribuição normal padrão, então: P(Z > 1,64) = 0,05, P(Z > 2) = 0,02, P(0 < Z < 2,4) = 0,49, P(0 < Z < 0,68) = 0,25 Se t tem distribuição de Student com 3 graus de liberdade P(t > 1,638) = 0,10 Se t tem distribuição de Student com 4 graus de liberdade P(t > 1,533) = 0,10 FCC – TRT/3ª – 2009) Uma variável aleatória X tem distribuição normal com média μ e desvio padrão σ desconhecido. Desejando-se testar H0 : μ = 2 contra H1 : μ > 2 tomou-se uma amostra aleatória de 4 observações que forneceu os valores: 4, 2, 2 e 2. A um nível de significância de 10%, no teste mais poderoso, a hipótese H0 será rejeitada se a estatística média amostral X, apropriada ao teste, for maior ou igual a (A) 2,819 (B) 2,767 (C) 2,673 (D) 2,541 (E) 2,520 RESOLUÇÃO: Veja que temos um teste unilateral à direita (pois H1 é µ > 2). Foram dados os valores das observações que compõem a amostra (4, 2, 2, 2). Calculando a média e o desvio padrão amostrais, temos: X = (4 + 2 + 2 + 2)/4 = 2,5 2 1 ( ) 2,25 0,25 0,25 0,25 1 1 3 n i i X X s n = − + + + = = = − Como o desvio padrão populacional é desconhecido e n = 4 (menor que 30), devemos usar a tabela da distribuição “t de Student”. O número de graus de liberdade é n – 1 = 4 – 1 = 3. E o nível de significância é = 0,10. Na tabela, obtemos que: P(t > 1,638) = 0,10 Portanto, t0,10 = 1,638 Prof. Arthur Lima Aula 12 20 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Assim, a região de aceitação de H0 é aquela para valores de t abaixo de 1,638. Na fórmula de tcalculado, temos que: − =calculado X t s n Para que a hipótese nula seja rejeitada, é preciso que tcalculado seja maior ou igual a t0,10 = 1,638. Portanto, 0,10 1,638 2 1,638 1 4 2,819 − − calculadot t X s n X X Resposta: A Teste de hipóteses para PROPORÇÕES No caso de proporções podemos trabalhar de maneira análoga ao caso dos testes para as médias, porém considerando: 0 0 0(1 ) − = − calculado p p Z p p n Nesta equação, “p” é a proporção encontrada na amostra, e p0 é a proporção que queremos provar ser a correta para a população (hipótese nula). Assim, baseado no nível de significância devemos obter a região de aceitação da hipótese nula, e, comparando esta região com o valor de Zcalculado, tirar a nossa conclusão a respeito da aceitação ou rejeição da hipótese nula. Erros em um teste de hipóteses Finalizando, veja a tabela abaixo, que apresenta os tipos de erro que podemos cometer ao realizar um teste de hipóteses: Prof. Arthur Lima Aula 12 21 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 H0 verdadeira H0 falsa Aceitação de H0 Decisão correta Erro tipo II Rejeição de H0 Erro tipo I Decisão correta Basicamente, o que essa tabela nos diz é: - Sendo H0 verdadeira, aceitá-la é a decisão correta. Se ainda assim a rejeitarmos, estaremos cometendo um erro “tipo I”; - Sendo H0 falsa, rejeitá-la é a decisão correta. Se ainda assim a aceitarmos, estaremos cometendo um erro “tipo II”. Tente resolver a questão a seguir: Instruções: Para responder à questão abaixo utilize as informações a seguir. Se Z tem distribuição normal padrão, então: P(Z > 1,64) = 0,05, P(Z > 2) = 0,02, P(0 < Z < 2,4) = 0,49, P(0 < Z < 0,68) = 0,25 Se t tem distribuição de Student com 3 graus de liberdade P(t > 1,638) = 0,10 Se t tem distribuição de Student com 4 graus de liberdade P(t > 1,533) = 0,10 FCC – TRT/3ª – 2009) Suponha que sejam realizados 10 ensaios independentes, cada um com dois resultados possíveis: sucesso e fracasso. Suponha que a probabilidade de sucesso em cada ensaio seja p. Desejando-se testar H0 : p = 0,4 contra H1 : p = 0,5, adotou-se {8, 9,10} como região crítica. A probabilidade de se cometer erro do tipo dois é: a) 7/128 b) 5/256 c) 3/512 d) 1/1024 e) 5/512 RESOLUÇÃO: Um erro do tipo II consiste em aceitar H0 quando ela é falsa. Isto é, aceitar H0 quando, em realidade, H1 é verdadeira. Vamos calcular, portanto, a probabilidade de H1 ser verdadeira na região crítica. Veja que aqui a região crítica (região de rejeição de H0) é formada pelos casos onde ocorram mais de 7 sucessos (ou seja, 8, 9 e 10). A probabilidade de ocorrência de mais de7 sucessos é igual à soma das probabilidades de ocorrência de 8, 9 e 10 sucessos: Prof. Arthur Lima Aula 12 22 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 P(região crítica) = P(X>7) = P(X=8) + P(X=9) + P(X=10) Como estamos diante de uma binomial, onde a chance de sucesso em cada tentativa é p = 0,5 (para que H1 seja verdadeira) e o número de tentativas é n = 10, então a probabilidade de 8 sucessos é: 8 10 8 8 2 10 10 ( 8) (10,8) 0,5 (1 0,5) 1 1 ( 8) (10,2) 2 2 10 9 1 ( 8) 2 1 2 1 ( 8) 45 2 P X C P X C P X P X −= = − = = = = = = A probabilidade de 9 sucessos é: 9 10 9 9 1 10 ( 9) (10,9) 0,5 (1 0,5) 1 1 ( 9) (10,1) 2 2 1 ( 9) 10 2 P X C P X C P X −= = − = = = = A probabilidade de 10 sucessos é: 10 10 10 10 ( 10) (10,10) 0,5 (1 0,5) 1 ( 10) 1 2 P X C P X −= = − = = Assim, 10 10 10 10 1 1 1 ( ) 45 10 1 2 2 2 1 56 7 ( ) 56 2 1024 128 P região crítica P região crítica = + + = = = Prof. Arthur Lima Aula 12 23 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Assim, a probabilidade de não se aceitar H1 quando ela é verdadeira (ou aceitar H0 quando ela é falsa), cometendo um erro do tipo II, é de 7/128. Resposta: A Conceitos finais sobre testes de hipóteses Por fim, é bom você conhecer estes dois conceitos: - Poder do teste: em um teste de hipóteses, trata-se da probabilidade de se rejeitar corretamente a hipótese nula (ou seja, rejeitar quando ela é realmente falsa). Quando maior o poder do teste, menor será a chance de se aceitar H0 quando ela é falsa, ou seja, menor será a chance de se cometer um erro do tipo II. - p-valor: quando a hipótese nula é verdadeira (ex.: 10 = ), é improvável que encontremos uma amostra cuja média destoe muito deste valor, entretanto isso não é impossível. Mas imagine que, em uma dada amostra, encontramos média igual a 7. O p-valor é a probabilidade de encontrarmos outra amostra cuja média seja tão ou mais destoante que esta, ou seja, que seja menor ou igual a 7. Dessa forma, repare que o p-valor é calculado para uma amostra, e não a população. Também é conhecido como “probabilidade de significância”, ou “nível crítico do teste”. Em um linguajar mais técnico, o p- valor é a probabilidade de, mesmo a hipótese nula sendo verdadeira ( 10 = ), serem encontradas amostras com valores mais extremos do que o de uma determinada amostra (ex.: menor ou igual a 7). Caso o p-valor de uma amostra seja maior do que o nível de significância do teste, não devemos rejeitar a hipótese nula (pois de fato é provável que existam amostras com valores extremos, mesmo sendo H0 verdadeira). Já se o p-valor da amostra for inferior ao nível de significância do teste, podemos rejeitar a hipótese nula, pois é improvável que existam valores mais extremos do que o observado. Imagine que fizemos um teste de hipóteses com nível de significância 5% e, para uma dada amostra, encontramos o p-valor 7%. Isto significa que, mesmo a hipótese nula sendo verdadeira, existe uma chance de 7% de se encontrar médias amostrais mais extremas que aquela do teste. Isso prejudica a análise, e nos impede de rejeitar a hipótese nula, pois a precisão do nosso teste (5%) é menor que o p-valor (7%). Já se o p-valor fosse muito baixo (ex.: 1%), dificilmente a média amostral atingiria valores extremos, o que aumenta as chances de rejeitarmos a hipótese nula. Trabalhe essas questões: CESPE – STM – 2011) Julgue os itens que se seguem, acerca de definições da teoria estatística. ( ) O erro do tipo II de um teste de hipóteses ocorre quando se rejeita uma hipótese nula que é verdadeira. ( ) Quanto menor for o p-valor associado a uma estatística de determinado teste, maior será a evidência para se rejeitar a hipótese nula desse teste. RESOLUÇÃO: ( ) O erro do tipo II de um teste de hipóteses ocorre quando se rejeita uma hipótese nula que é verdadeira. Prof. Arthur Lima Aula 12 24 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 ERRADO. Este é o erro de tipo I. O erro do tipo II caracteriza-se por aceitar a hipótese nula quando ela é falsa. ( ) Quanto menor for o p-valor associado a uma estatística de determinado teste, maior será a evidência para se rejeitar a hipótese nula desse teste. CERTO. Quanto menor o p-valor, menor é a probabilidade de que a média de uma amostra atinja valores extremos. Portanto, maior será a probabilidade de se rejeitar a hipótese nula. Resposta: E C CESPE – TJ/ES – 2011) Com relação aos testes de hipóteses paramétricos, julgue os itens subsecutivos. ( ) Define-se poder do teste como a probabilidade de a hipótese nula ser rejeitada quando esta é, de fato, falsa. Logo, o poder do teste é igual a 1 – , em que é a probabilidade de haver o erro do tipo I RESOLUÇÃO: O poder do teste é a probabilidade de se rejeitar corretamente a hipótese nula (ou seja, rejeitar quando ela é realmente falsa). Ele está ligado, portanto, com o erro do tipo II, que ocorre quando H0 é falsa porém ainda assim é aceita. Quanto maior o poder do teste, menor a chance de se cometer um erro do tipo II. Item ERRADO. Resposta: E Chega de teoria! Vamos praticar tudo o que vimos até aqui? Questões comentadas pelo professor 1. FCC – ICMS/SC – 2018) Sabe-se que, em determinada cidade, o desvio padrão da altura de crianças da primeira série do ensino fundamental é 4 cm. Uma amostra aleatória de tamanho maior do que 30, com reposição, de n crianças, foi colhida do conjunto de todas essas crianças e obteve-se um intervalo de confiança para a média desse conjunto Prof. Arthur Lima Aula 12 25 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 dado por (129,02 cm; 130,98 cm) com coeficiente de confiança de 95%. Uma nova amostra de tamanho m será colhida e deseja-se que a amplitude do novo intervalo seja a metade daquela obtida com a amostra de tamanho n, com a mesma confiança. Nessas condições, o valor de m deverá ser igual a Dados: Se Z tem distribuição normal padrão: P(Z < 0,84) = 0,8 P(Z < 1) = 0,841 P(Z < 1,96) = 0,975 (A) 64 (B) 100 (C) 121 (D) 81 (E) 256 RESOLUÇÃO: Sabemos que a amplitude do intervalo de confiança é dada por: 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 = 2. 𝑍𝛼 2 . 𝜎 √𝑛 Sabemos que o desvio padrão da amostra é de 𝑠 = 4 (podemos usar o desvio padrão amostral e a distribuição normal, dado que a amostra tem mais de 30 elementos). Certamente você já sabia que, para 95% de confiança, temos 𝑍𝛼 2 = 1,96. De qualquer forma, o enunciado nos disse que P(Z < 1,96) = 0,975, de modo que P(Z >1,96) = 0,025 e, assim, P(Z < -1,96) = 0,025 também. Deste modo, P(-1,96 < Z < 1,96) = P(Z < 1,96) – P(Z< -1,96) = 0,975 – 0,025 = 0,95 = 95% No primeiro caso, a amplitude foi de 130,98 – 129,02 = 1,96. A nova amplitude deve ser a metade disso, ou seja, 0,98. Assim, o tamanho m da nova amostra pode ser obtido substituindo as informações na fórmula da amplitude: 0,98 = 2.1,96. 4 √𝑚 1 = 2.2. 4 √𝑚 1 = 16 √𝑚 Prof. Arthur Lima Aula 12 26 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 1 = 256 𝑚 m = 256 Resposta: E 2. FCC – ICMS/SC – 2018) Uma pesquisa afirma que a proporção p de crianças vacinadas, na faixa etária de zero a cinco anos, contra uma determinada doença é igual a 64% na cidade X. Desejando-se por à prova tal afirmação, selecionou-sealeatoriamente 100 crianças da faixa etária estipulada com o objetivo de se testar a (hipótese nula) H0: p = 0,64 contra a (hipótese alternativa) H1: p = 0,50. Supondo como estatística apropriada ao teste a frequência relativa de sucessos (sendo sucesso a criança ter sido vacinada) cuja distribuição pode ser aproximada por uma distribuição normal, o valor observado dessa estatística para que a probabilidade do erro do tipo I seja igual à probabilidade do erro do tipo II pertence ao intervalo (A) (0,55; 0,58) (B) (0,52; 0,55) (C) (0,51; 0,54) (D) (0,59; 0,61) (E) (0,58; 0,62) RESOLUÇÃO: No caso do erro tipo I, é verdadeira a hipótese nula, ou seja, p0 = 0,64. Entretanto, ela é rejeitada, ou seja, é obtida uma proporção inferior a ela no teste. A probabilidade de isto acontecer é: 𝛼 = 𝑃 ( 𝑍 < �̂� − 𝑝 √𝑝. 1 − 𝑝 𝑛 ) 𝛼 = 𝑃 ( 𝑍 < �̂� − 0,64 √0,64. 1 − 0,64 100 ) 𝛼 = 𝑃 ( 𝑍 < �̂� − 0,64 √0,64. 0,36 10 ) Prof. Arthur Lima Aula 12 27 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 𝛼 = 𝑃 (𝑍 < �̂� − 0,64 0,048 ) No caso do erro tipo II, é verdadeira a hipótese alternativa, ou seja, p0 = 0,50. Entretanto, a hipótese nula é aceita, ou seja, é obtida uma proporção superior no teste. A probabilidade de isto acontecer é: 𝛽 = 𝑃 ( 𝑍 ≥ �̂� − 0,50 √0,50. (1 − 0,50) 100 ) 𝛽 = 𝑃 (𝑍 ≥ �̂� − 0,50 0,05 ) Para que as probabilidades de erros tipo I e II sejam iguais, temos: 𝑃 (𝑍 < �̂� − 0,64 0,048 ) = 𝑃 (𝑍 ≥ �̂� − 0,50 0,05 ) Sendo Z1 = 𝑝−0,64 0,048 e Z2 = 𝑝−0,50 0,05 , a expressão acima poder escrita como: P(Z < Z1) = P(Z ≥ Z2) Para isto ocorrer, como a curva normal é simétrica, precisamos que: Z1 = -Z2. Isto é, �̂� − 0,64 0,048 = − �̂� − 0,50 0,05 �̂� − 0,64 4,8 = 0,50 − �̂� 5 �̂� − 0,64 9,6 = 0,50 − �̂� 10 �̂� − 0,64 9,6 = 0,50 − �̂� 10 10�̂� − 6,4 = 4,8 − 9,6�̂� 19,6�̂� = 11,2 Prof. Arthur Lima Aula 12 28 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 �̂� = 11,2 19,6 �̂� = 0,57 Resposta: A 3. FCC – TRT/SP – 2018) Em uma grande região de um país, uma empresa (E1) foi contratada para elaborar uma pesquisa referente a um atributo X, correspondente a uma população considerada normal, de tamanho infinito, média μ desconhecida e variância populacional igual a 144. Considerando uma amostra aleatória de tamanho 64, esta empresa apurou um intervalo de confiança com um nível de confiança (1 − α) para μ igual a [99,0; 105,0]. Uma outra empresa (E2) trabalhando independentemente da primeira, na mesma região, também elaborou uma pesquisa referente ao atributo X utilizando uma amostra de tamanho 400 e encontrando uma média amostral igual a 104,5. O intervalo de confiança para μ com um nível de confiança (1 − α) encontrado por E2 foi de a) [101,5; 107,5] b) [103,0; 106,0] c) [103,9; 105,1] d) [102,7; 106,3] e) [103,3; 105,7] RESOLUÇÃO: As empresas E1 e E2 construíram intervalos com mesmo nível de confiança. Para calcular o intervalo de confiança da empresa E2 só nos falta a informação do valor Z da normal padrão para o nível de confiança adotado, vamos obter esse valor a partir das informações que temos do intervalo de confiança da empresa E1. Sendo �̅� a média amostral, σ o desvio padrão populacional, n o tamanho amostral e Zα/2 o valor da tabela normal padrão tal que P(Z > Zα/2) = P(Z < - Zα/2) = α/2 e, portanto, tal que P(- Zα/2 ≤ Z ≤ - Zα/2) = 1 – α, temos que o limite inferior LI e o limite superior LS de um intervalo de confiança são dados por: 𝐿𝐼 = �̅� − 𝑍𝛼/2 ∙ 𝜎 √𝑛 𝐿𝑆 = �̅� + 𝑍𝛼/2 ∙ 𝜎 √𝑛 Reparem que ao subtrair LI de LS, chegamos a: 𝐿𝑆 − 𝐿𝐼 = �̅� + 𝑍𝛼 2 ∙ 𝜎 √𝑛 − (�̅� − 𝑍𝛼 2 ∙ 𝜎 √𝑛 ) 𝐿𝑆 − 𝐿𝐼 = 2 ∙ 𝑍𝛼 2 ∙ 𝜎 √𝑛 Sabemos que σ é igual à raiz quadrada da variância, e o enunciado nos informa que a variância é igual a 144. Portanto, temos que σ = √144 = 12. Para o intervalo de confiança da empresa E1, temos que LS = 105, LI = 99, e n = 64. Logo, substituindo os valores na fórmula acima, chegamos a: Prof. Arthur Lima Aula 12 29 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 105 − 99 = 2 ∙ 𝑍𝛼 2 ∙ 12 √64 6 = 𝑍𝛼 2 ∙ 24 8 6 = 𝑍𝛼 2 ∙ 3 𝑍𝛼 2 = 6 3 = 2 Agora, sabendo o valor de 𝑍𝛼 2 , podemos calcular o intervalo de confiança da empresa E2 (lembrando que o enunciado nos informa que, para a empresa E2, temos �̅� = 104,5 e n = 400). Assim, para a empresa E2 temos que: 𝐿𝐼 = �̅� − 𝑍𝛼 2 ∙ 𝜎 √𝑛 = 104,5 − 2 ∙ 12 √400 𝐿𝐼 = 104,5 − 24 20 = 104,5 − 1,2 = 103,3 Portanto, o limite superior LS é dado por: 𝐿𝑆 = 104,5 + 1,2 = 105,7 Por fim, nosso intervalo de confiança é igual a [103,3; 105,7] e a alternativa E é o gabarito da questão. Resposta: E 4. FCC – TRT/SP – 2018) Nos registros dos últimos anos, verifica-se que o número médio de pessoas atendidas em uma repartição pública por dia é igual a 20. Deseja-se testar a hipótese de que o número médio de pessoas atendidas por dia (μ) em outra repartição independente da primeira é o mesmo que o verificado na primeira repartição utilizando o teste t de Student. Foram formuladas então as seguintes hipóteses: H0: μ = 20 (hipótese nula) e H1: μ ≠ 20 (hipótese alternativa). Com base em 16 dias escolhidos aleatoriamente na segunda repartição obteve-se uma média igual a 22 pessoas atendidas por dia com um desvio padrão igual a 5. Se, tanto para a primeira repartição como para a segunda, a distribuição da população formada pelo número de pessoas atendidas é normalmente distribuída e de tamanho infinito, obtém-se que o valor da estatística t calculado para comparação com o t tabelado da distribuição t de Student com os respectivos graus de liberdade apresenta valor de a) 0,400 b) 1,250 c) 0,625 d) 1,600 e) 2,500 RESOLUÇÃO: Prof. Arthur Lima Aula 12 30 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Sendo µ0 o valor da média populacional sob a hipótese nula H0, n o tamanho amostral, S o desvio padrão amostral e �̅� a média amostral, temos que a estatística t é dada por: 𝑡 = √𝑛 ∙ �̅� − 𝜇0 𝑆 Do enunciado, temos que n = 16, �̅� = 22, µ0 = 20 e S = 5. Logo, temos que: 𝑡 = √16 ∙ 22 − 20 5 = 4 ∙ 2 5 = 8 5 = 1,6 Portanto, a alternativa D é o gabarito da questão. Resposta: D 5. CESPE – EBSERH – 2018) Os tempos de duração de exames de cateterismo cardíaco (Y, em minutos) efetuados por determinada equipe médica seguem uma distribuição normal com média µ e desvio padrão σ, ambos desconhecidos. Em uma amostra aleatória simples de 16 tempos de duração desse tipo de exame, observou-se tempo médio amostral igual a 58 minutos, e desvio padrão amostral igual a 4 minutos. A partir da situação hipotética apresentada e considerando Φ(2) = 0,977, em que Φ(z) representa a função de distribuição acumulada de uma distribuição normal padrão e z é um desvio padronizado, julgue os itens que se seguem, com relação ao teste de hipóteses H0 = µ ≥ 60 minutos, contra HA = µ < 60 minutos, em que H0 e HA denotam, respectivamente, as hipóteses nula e alternativa. ( ) Ao se aplicar o teste t de Student com nível de significância igual a 2,3%, conclui-se haver evidências estatisticamente significativas contra a hipótese H0. ( ) Nesse teste de hipóteses, comete-se o erro do tipo II caso a hipótese H0 seja rejeitada, quando, na verdade, H0 não deveria ser rejeitada. ( ) Se o teste for efetuado com nível de significância igual a 1%, o poder do teste será igual a 99% para qualquer valor hipotético µ. ( ) O P-valor (ou nível descritivo do teste) foi superior a 2,3%.RESOLUÇÃO: ( ) Ao se aplicar o teste t de Student com nível de significância igual a 2,3%, conclui-se haver evidências estatisticamente significativas contra a hipótese H0. Estamos diante de um teste de hipóteses unilateral, com a região de rejeição à esquerda, visto que a hipótese alternativa é HA = µ < 60. Como o nível de significância é 2,3%, veja que Φ(2) = 0,977, ou seja, P(t > 2) = 1 – 0,977 = 0,023. Pela simetria da curva t de Student, podemos dizer que P(t<-2) = 0,023 = 2,3%. Portanto, a nossa região de rejeição é delimitada por t < -2. A estatística do teste pode ser calculada assim: Prof. Arthur Lima Aula 12 31 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 𝑡𝑐𝑎𝑙𝑐 = 58 − 60 4 √4 = − 2 2 = −1 Como tcalc está fora da região de rejeição da hipótese nula, NÃO temos evidências significativas contra H0. Item ERRADO. ( ) Nesse teste de hipóteses, comete-se o erro do tipo II caso a hipótese H0 seja rejeitada, quando, na verdade, H0 não deveria ser rejeitada. ERRADO. O erro do tipo II ocorre quando a hipótese nula é aceita quando, na verdade, ela deveria ser rejeitada. ( ) Se o teste for efetuado com nível de significância igual a 1%, o poder do teste será igual a 99% para qualquer valor hipotético µ. O poder do teste nos dá a probabilidade de se rejeitar a hipótese nula quando ela realmente deveria ter sido rejeitada. Ou seja, ele é dado por 1 – B, onde B é a probabilidade de se cometer um erro do tipo II. Não há uma relação direta com o nível de significância da maneira como foi apresentada neste item. Item ERRADO. ( ) O P-valor (ou nível descritivo do teste) foi superior a 2,3%. CORRETO. Obtivemos tcalc = -1. Como P(t<-2) = 2,3%, a probabilidade de t < -1 será ainda maior. Resposta: E E E C 6. CESPE – ABIN – 2018) Em uma fábrica de ferragens, o departamento de controle de qualidade realizou testes na linha de produção de parafusos. Os testes ocorreram em dois campos: comprimento dos parafusos e frequência com que esse comprimento fugia da medida padrão. Historicamente, o comprimento médio desses parafusos é 3 cm, e o desvio padrão observado é 0,3 cm. Foram avaliados 10.000 parafusos durante uma semana. Desses, 1.000 fugiram às especificações técnicas da gerência: o comprimento do parafuso deveria variar de 2,4 cm a 3,6 cm. O chefe da linha de produção, porém, insiste em afirmar que, em média, 4% da produção de parafusos fogem às especificações. O departamento de controle de qualidade assume que os comprimentos dos parafusos têm distribuição normal. A partir dessa situação hipotética, julgue os itens subsequentes, considerando que Φ(1) = 0,841, Φ(1,65) = 0,95, Φ(2) = 0,975 e Φ(2,5) = 0,994, em que Φ(z) é a função distribuição normal padronizada acumulada, e que 0,002 seja valor aproximado para √ 0,0384 10000 ( ) Com base nos dados apresentados, pode-se rejeitar, com significância de 5%, a afirmação do chefe da linha de produção. RESOLUÇÃO: Prof. Arthur Lima Aula 12 32 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Este item é um exemplo de teste de hipótese para proporção. Devemos calcular o Z observado e comparar com o Z crítico, que está indicado com 5% de significância. Substituindo na fórmula Zobs = ( �̂� – p ) / √𝑝 (1−𝑝) 𝑛 = (0,1 – 0,04)/ √0,04 ∗ (0,96)/10.000 = 30 O Z crítico é calculado com o nível de significância. Com o nível de 5%, Z crítico = 2. A afirmação gera um Z = 2, que como é menor que o Z observado, é possível rejeitar a afirmação do chefe da linha de produção. Item CORRETO. Resposta: C 7. CESPE – POLÍCIA FEDERAL – 2018) Uma pesquisa realizada com passageiros estrangeiros que se encontravam em determinado aeroporto durante um grande evento esportivo no país teve como finalidade investigar a sensação de segurança nos voos internacionais. Foram entrevistados 1.000 passageiros, alocando-se a amostra de acordo com o continente de origem de cada um — África, América do Norte (AN), América do Sul (AS), Ásia/Oceania (A/O) ou Europa. Na tabela seguinte, N é o tamanho populacional de passageiros em voos internacionais no período de interesse da pesquisa; n é o tamanho da amostra por origem; P é o percentual dos passageiros entrevistados que se manifestaram satisfeitos no que se refere à sensação de segurança. Em cada grupo de origem, os passageiros entrevistados foram selecionados por amostragem aleatória simples. A última linha da tabela mostra o total populacional no período da pesquisa, o tamanho total da amostra e Ppop representa o percentual populacional de passageiros satisfeitos. A partir dessas informações, julgue os próximos itens. ( ) A estimativa do percentual populacional de passageiros originários da África que se mostraram satisfeitos com a sensação de segurança nos voos internacionais foi igual a 80% e a estimativa do erro padrão associado a esse resultado foi inferior a 4%. RESOLUÇÃO: De fato a estimativa para a África foi p = 80%. O erro padrão é dado por: 𝐸𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜 = √ 𝑝. (1 − 𝑝) 𝑛 Prof. Arthur Lima Aula 12 33 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 𝐸𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜 = √ 0,8. (1 − 0,8) 1000 𝐸𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜 = √ 0,16 1000 𝐸𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜 = 0,4 √1000 𝐸𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜 = 0,4 10√10 𝐸𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜 = 0,04 √10 𝐸𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜 = 4% √10 Veja que este valor resultará em algo MENOR do que 4%. Item CERTO. Resposta: C 8. CESPE – POLÍCIA FEDERAL – 2018) O tempo gasto (em dias) na preparação para determinada operação policial é uma variável aleatória X que segue distribuição normal com média M, desconhecida, e desvio padrão igual a 3 dias. A observação de uma amostra aleatória de 100 outras operações policiais semelhantes a essa produziu uma média amostral igual a 10 dias. Com referência a essas informações, julgue os itens que se seguem, sabendo que P(Z > 2) = 0,025, em que Z denota uma variável aleatória normal padrão. ( ) A expressão 10 dias ± 6 dias corresponde a um intervalo de 95% de confiança para a média populacional M. ( ) O erro padrão da média amostral foi inferior a 0,5 dias. ( ) Considerando-se o teste da hipótese nula H0: M ≤ 9,5 dias contra a hipótese alternativa H1: M > 9,5 dias, adotando-se o nível de significância igual a 1%, não haveria evidências estatísticas contra a hipótese H0. RESOLUÇÃO: ( ) A expressão 10 dias ± 6 dias corresponde a um intervalo de 95% de confiança para a média populacional M. Temos uma média amostral de 10 dias, desvio padrão populacional de 3 dias, amostra com n = 100 elementos. Como P(Z>2) = 0,025, então P(Z < -2) também é igual a 0,025, pois a curva normal é simétrica. Assim, P(-2<Z<2) Prof. Arthur Lima Aula 12 34 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 = 1 – 2x0,025 = 0,95. Ou seja, Z = 2 nos dá um intervalo de 95% de confiança. A margem de erro do intervalo é dada por: 𝑀𝑎𝑟𝑔𝑒𝑚 = 𝑍𝛼 2 . 𝜎 √𝑛 𝑀𝑎𝑟𝑔𝑒𝑚 = 2. 3 √100 = 6 10 = 0,6 Portanto, o intervalo de confiança é: 10 ± 0,6 Item ERRADO. ( ) O erro padrão da média amostral foi inferior a 0,5 dias. O erro padrão é dado por: 𝐸𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜 = 𝜎 √𝑛 = 3 √100 = 3 10 = 0,3 Item CERTO. ( ) Considerando-se o teste da hipótese nula H0: M ≤ 9,5 dias contra a hipótese alternativa H1: M > 9,5 dias, adotando-se o nível de significância igual a 1%, não haveria evidências estatísticas contra a hipótese H0. A estatística do teste é dada por: 𝑍𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = �̅� − 𝜇 𝜎 √𝑛 𝑍𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 10 − 9,5 3 √100 𝑍𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 0,5 3 10 = 0,5 0,3 = 1,67 Observeque P (Z>2) = 2,5%. Logo, P(Z>1,67) será ainda maior que 2,5%. Assim, se a região de rejeição é formada apenas por uma área de 1% na extremidade direita, certamente o Zcalculado cairá na região de aceitação da hipótese nula. Item CERTO, pois não haveria evidência estatística contra H0. Prof. Arthur Lima Aula 12 35 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Resposta: E C C 9. CESPE – POLÍCIA FEDERAL – 2018) Determinado órgão governamental estimou que a probabilidade p de um ex-condenado voltar a ser condenado por algum crime no prazo de 5 anos, contados a partir da data da libertação, seja igual a 0,25. Essa estimativa foi obtida com base em um levantamento por amostragem aleatória simples de 1.875 processos judiciais, aplicando-se o método da máxima verossimilhança a partir da distribuição de Bernoulli. Sabendo que P(Z < 2) = 0,975, em que Z representa a distribuição normal padrão, julgue os itens que se seguem, em relação a essa situação hipotética. ( ) O erro padrão da estimativa da probabilidade p foi igual a 0,01. ( ) A estimativa intervalar 0,25 ± 0,05 representa o intervalo de 95% de confiança do parâmetro populacional p. RESOLUÇÃO: ( ) O erro padrão da estimativa da probabilidade p foi igual a 0,01. O erro padrão para proporções é dado por: 𝜀 = √ 𝑝. (1 − 𝑝) 𝑛 𝜀 = √ 1 4 . (1 − 1 4 ) 1875 𝜀 = √ 1 4 . 3 4 1875 𝜀 = √ 0,1875 1875 𝜀 = √0,0001 𝜀 = 0,01 Item CERTO. ( ) A estimativa intervalar 0,25 ± 0,05 representa o intervalo de 95% de confiança do parâmetro populacional p. Prof. Arthur Lima Aula 12 36 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Podemos calcular a margem de erro do nosso intervalo de confiança para a proporção p assim: Queremos um intervalo com 95% de confiança. Para isso, precisamos tirar 2,5% de cada extremidade da curva normal padrão. A questão nos disse que P(Z<2) = 97,5%, de modo que P(Z>2) será exatamente 2,5%. Isto mostra que devemos usar 𝑍𝛼/2 = 2. Temos: Portanto, o intervalo de confiança será de: 𝑝 ± 𝑚𝑎𝑟𝑔𝑒𝑚 = 0,25 ± 0,02 = Item ERRADO. Resposta: C E 10.FGV – MPE/BA – 2017) Suponha que a qualidade de um produto está sendo testada com a ajuda da distribuição Geométrica. Para tanto, diversas unidades são testadas em sequência até que haja uma falha. O conjunto de hipóteses é o seguinte: Ho:p ≥ 0,25 contra Ha: p < 0,25 Prof. Arthur Lima Aula 12 37 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 onde p é a probabilidade de falha do produto. O critério de decisão é bem simples, rejeitando-se Ho quando a primeira falha ocorre depois da 3ª prova. Logo é fato que: a) o nível de significância do teste é de 5%; b) a probabilidade de ocorrência do erro do tipo I é 5/16 ; c) se p = 0,2 a probabilidade de um erro do tipo II é 3/5 ; d) o grau de confiança associado ao teste é de 9/16 ; e) o valor da potência do teste para p = 0,5 é igual a 1/8 ; RESOLUÇÃO: Vamos chamar de X a variável aleatória que representa o número de testes necessários até que ocorra a primeira falha. X segue uma distribuição geométrica de parâmetro p. Agora vamos analisar as alternativas: a) O nível de significância é a probabilidade de rejeitar Ho, quando Ho é verdadeira. O enunciado nos diz que rejeita-se Ho quando a primeira falha ocorre depois da terceira tentativa, ou seja, quando X > 3. Logo, devemos calcular P(X > 3): P(X > 3) = 1 − P(X ≤ 3) P(X ≤ 3) = P(X = 1) + P(X = 2) + P(X = 3) P(X = 1) = 0,25 = 1 4 P(X = 2) = (1 − 1 4 ) ∙ 1 4 = 3 4 ∙ 1 4 = 3 16 P(X = 3) = ( 3 4 ) 2 ∙ 1 4 = 9 16 ∙ 1 4 = 9 64 Portanto: P(X ≤ 3) = 1 4 + 3 16 + 9 64 P(X ≤ 3) = 16 + 12 + 9 64 = 37 64 Logo, temos que: P(X > 3) = 1 − 37 64 = 64 − 37 64 P(X > 3) = 27 64 = 0,42 = 42% Portanto, o nível de significância do teste é 42%, e não 5%, logo a alternativa A está incorreta Prof. Arthur Lima Aula 12 38 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 b) Probabilidade de ocorrência do erro do tipo I é o mesmo que nível de significância. Acabamos de calcular na análise da alternativa A que o nível de significância do teste (probabilidade de erro tipo I) é igual a 42%. A alternativa B afirma que é igual a 5/16, porém 5/16 = 31,25%, valor diferente de 42%. Logo, a alternativa B também está incorreta. c) Probabilidade de um erro do tipo II é a probabilidade de não rejeitar Ho, dado que Ho é falsa. Segundo o enunciado, Ho é rejeitado quando X > 3, logo concluímos que Ho não é rejeitado quando X ≤ 3. Assim, devemos calcular P(X ≤ 3), dado p = 0,2 P(X ≤ 3\p = 0,2) = P(X = 1) + P(X = 2) + P(X = 3) P(X = 1) = 0,2 = 1 5 P(X = 2) = (1 − 1 5 ) ∙ 1 5 = 4 5 ∙ 1 5 = 4 25 P(X = 3) = ( 4 5 ) 2 ∙ 1 5 = 16 25 ∙ 1 5 = 16 125 Portanto: P(X ≤ 3\p = 0,2) = 1 5 + 4 25 + 16 125 P(X ≤ 3\p = 0,2) = 25 + 20 + 16 125 = 61 125 = 0,488 Logo, a probabilidade de erro tipo II é 0,488 e não 3/5 (0,60), portanto a alternativa C também está incorreta. d) O grau de confiança, ou nível de confiança γ é a probabilidade complementar do nível de significância (42%, calculado na alternativa A). Logo: γ = 1 − 42% = 58% 9/16 = 56,25%, portanto a alternativa D também está incorreta. e) O valor da potência do teste para p = 0,5 (vamos chamar de 𝜋(0,5)) é a probabilidade de p pertencer à região crítica (probabilidade de rejeitarmos Ho), dado p = 0,5. Assim: 𝜋(0,5) = P(X > 3\p = 0,5) = 1 − P(X ≤ 3\p = 0,5) P(X ≤ 3) = P(X = 1) + P(X = 2) + P(X = 3) P(X = 1) = 0,5 = 1 2 P(X = 2) = (1 − 1 2 ) ∙ 1 2 = 1 2 ∙ 1 2 = 1 4 P(X = 3) = ( 1 2 ) 2 ∙ 1 2 = 1 8 Prof. Arthur Lima Aula 12 39 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Portanto: P(X ≤ 3\p = 0,5) = 1 2 + 1 4 + 1 8 P(X ≤ 3\p = 0,5) = 4 + 2 + 1 8 = 7 8 Logo, temos que: 𝜋(0,5) = P(X > 3\p = 0,5) = 1 − 7 8 = 1 8 Assim, a alternativa E está correta e é o gabarito da questão. Resposta: E 11. FCC – TRT/11 – 2017) Considere as informações abaixo para responder à questão. Se Z tem distribuição normal padrão, então: P(Z < 0,4) = 0,655; P(Z < 0,67) = 0,75; P(Z < 1,4) = 0,919; P(Z < 1,6) = 0,945; P(Z < 1,64) = 0,95; P(Z < 1,75) = 0,96; P(Z < 2) = 0,977; P(Z < 2,05) = 0,98. A porcentagem do orçamento gasto com educação nos municípios de certo estado é uma variável aleatória X com distribuição normal com média μ(%) e variância 4(%)². Uma amostra aleatória, com reposição, de tamanho n, X₁, X₂,..., Xn, é selecionada da distribuição de X. Sendo a média , amostral dessa amostra, o valor de n para que não se distancie de sua média por mais do que 0,41% com probabilidade de 96% é igual a a) 64 b) 100 c) 121 d) 81 e) 225 RESOLUÇÃO: O tamanho de amostra n pode ser calculado através da seguinte fórmula: n = σ2 ∙ 𝑍𝛾 2 ε2 σ2 é a variância, o enunciado nos diz que é 4(%)², que é o mesmo que 4/100² = 4/10000 = 0,0004 𝑍𝛾 é o valor da distribuição normal padrão para um intervalo de confiança com nível de confiança 𝛾 = 96%, tal que P(-𝑍𝛾 < 𝑍 < 𝑍𝛾) = 96% = 0,96. Logo, Prof. Arthur Lima Aula 12 40 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 P(Z<-𝑍𝛾) = 𝑃(𝑍 > 𝑍𝛾) = 2%. Potanto, 𝑍𝛾 é tal que 𝑃(𝑍 < 𝑍𝛾) = 1 − 2% = 98% O enunciado nos diz que P(Z < 2,05) = 0,98, logo 𝑍𝛾 = 2,05 ε é o valor máximo que a média amostral pode se distanciar da real, foi determinado ε = 0,41% = 0,0041 Substituindo os valores na fórmula acima, temos: n = 0,0004∙ 2,052 0,00412 = 0,0004 ∙ 4,2025 0,00001681 = 0,001681 0,00001681 = 100 Portanto, a alternativa B é o gabarito da questão. Resposta: B 12.FCC – TRT/11 – 2017) Uma população P de tamanho infinito tem distribuição normal com média μ e variância 2,25. A fim de proceder ao teste H₀: μ = 10 (hipótese nula) contra H₁: μ ≠ 10 (hipótese alternativa), ao nível de significância de 5%, extrai- se de P uma amostra aleatória de tamanho 100, estabelecendo-se a seguinte regra: “dado que é a média da amostra, então rejeita-se H₀ se < 10 − K ou > 10 + K, em que K > 0”. Considerando que na curva normal padrão (Z) as probabilidades P(|Z| > 1,96) = 0,05 e P(|Z| > 1,64) = 0,10, obtém-se que o valor de K é a) 0,270 b) 0,306 c) 0,294 d) 0,282 e) 0,246 RESOLUÇÃO: Ao nível de significância de 5% (Z = 1,96), chamando de 𝜎 o desvio padrão populacional e de n o tamanho amostral, temos que o valor de K é dado por: 𝐾 = 𝑍 ∙ √ 𝜎2 𝑛 𝐾 = 1,96 ∙ √ 2,25 100 𝐾 = 1,96 ∙ 1,5 10 = 1,96 ∙ 0,15 = 0,294 Portanto, a alternativa C é o gabarito da questão. Resposta: C Prof. Arthur Lima Aula 12 41 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 13. FCC – TRT/11 – 2017) A variância de uma população de tamanho infinito, normalmente distribuída com média μ, é desconhecida. Deseja-se testar as hipóteses H₀: μ = 12 (hipótese nula) contra H₁: μ > 12 (hipótese alternativa), ao nível de significância α, com a utilização do teste t de Student. Para isto, foi extraída da população uma amostra aleatória de tamanho 9 obtendo-se uma média amostral igual a 12,8 e uma variância amostral igual a 1,44. Considere que tα é o quantil da distribuição t de Student para o teste unicaudal tal que a probabilidade P(t > tα) = α, com n graus de liberdade. É correto afirmar que H₀ a) não é rejeitada ao nível de significância de 5% e é rejeitada ao nível de significância de 1%. b) não é rejeitada para qualquer nível de significância superior a 1% e inferior a 5%. c) é rejeitada tanto ao nível de significância de 1% como ao nível de significância de 5%. d) não é rejeitada para qualquer nível de significância inferior a 1%. e) não é rejeitada para qualquer nível de significância β tal que β > 5%. RESOLUÇÃO: Trata-se de um teste de hipóteses monocaudal à direita, em que rejeitamos H0 para valores grandes de t. Primeiro, vamos calcular o valor da estatística t observada para a amostra. Chamando tal estatística de to, a variância amostral de S², o tamanho amostral de n e a média amostral de t,̅ temos que: 𝑡𝑜 = t̅ − 𝜇 √𝑆 2 𝑛 𝑡𝑜 = 12,8 − 12 √1,44 9 𝑡𝑜 = 0,8 1,2 3 = 0,8 0,4 = 2 Sabemos que t tem n – 1 = 9 – 1 = 8 graus de liberdade. Assim, dos dados fornecidos pela questão, temos que a um nível de significância de 1%, rejeitamos H0 se 𝑡𝑜> 2,90 e, a um nível de significância de 5%, rejeitamos H0 se 𝑡𝑜> 1,86. Como 𝑡𝑜 obtido foi 2, e 2 é menor que 2,90 e maior que 1,86, concluímos pela não rejeição de H0 a um nível de significância de 1% e pela rejeição de H0 a um nível de significância de 5%. Portanto, as alternativas A, B e C estão incorretas. Ao observar os t críticos, nota-se que quanto menor o nível de significância, maior o valor de t crítico. Logo, se a um nível de significância de 1% não rejeitamos H0 porque a estatística observada 2 é menor que 2,90, a qualquer nível de significância menor que 1% t crítico será maior que 2,90 e portanto maior que 2, e logo não rejeitaremos H0. Assim, a alternativa D é o gabarito da questão. Prof. Arthur Lima Aula 12 42 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Resposta: D 14.FCC – TRT/11 – 2017) Um candidato a prefeito de uma cidade afirma que pelo menos 50% dos eleitores da cidade apóiam sua candidatura. Chamando de p a proporção de eleitores que apóia o candidato, resolveu-se fazer um teste para verificar se o candidato tem razão, ao nível de significância de 5%, em que foram formuladas as hipóteses H₀: p ≥ 0,5 (hipótese nula) contra H₁: p < 0,5 (hipótese alternativa). Então, uma amostra aleatória de tamanho 64 é extraída, com reposição, da população de eleitores e verifica-se que uma proporção p* dos eleitores apóia o candidato. Considere que é normal a distribuição amostral da frequência relativa dos eleitores que apóiam o candidato e que na curva normal padrão (Z) as probabilidades P(|Z| > 1,96) = 0,05 e P(|Z| > 1,64) = 0,10. O menor valor para p* tal que não ocorra o erro tipo I é a) 39,750% b) 44,875% c) 37,750% d) 38,250% e) 38,750% RESOLUÇÃO: A probabilidade de erro tipo I é o nível de significância do teste, segundo o enunciado é 5% e se trata de um teste monocaudal à esquerda. Temos que p tem distribuição normal de média p igual a 0,5 e desvio padrão igual a √ 𝑝∙(1−𝑝) 𝑛 . Se p = 0,5 e n = 64, temos que: desvio padrão = √ 0,5 ∙ 0,5 64 = 0,5 8 = 0,0625 Assim, queremos encontrar p*, tal que: P(Z < p ∗ −0,5 0,0625 ) = 0,05 Por simetria, temos que: p ∗ −0,5 0,0625 = −1,64 p ∗ −0,5 = −1,64 ∙ 0,0625 p ∗ −0,5 = −0,1025 p ∗= −0,1025 + 0,5 = 0,3975 = 39,75% Portanto, a alternativa A é o gabarito da questão. Resposta: A Prof. Arthur Lima Aula 12 43 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 15. CESPE – TRE/PE – 2017) Em geral, uma hipótese pode ser testada mediante realização de experimentos que permitam aos pesquisadores observar, descrever, mensurar, analisar e elaborar conclusões que expliquem a ocorrência de determinado fenômeno. Nesse contexto, caso a hipótese nula seja verdadeira, espera-se que a probabilidade de ter havido erro seja pequena. Essa probabilidade é denominada de a) confusão. b) risco. c) intervalo de confiança d) nível de significância. e) chance. RESOLUÇÃO: A probabilidade de rejeitarmos a hipótese nula quando ela é na realidade verdadeira é a probabilidade de cometermos o erro tipo I, também chamada de nível de significância. Portanto, a alternativa D é o gabarito da questão. Resposta: D 16.FUNRIO – SESAU/RO – 2017) Uma amostra aleatória simples de tamanho 36 de uma densidade normalmente distribuída com média µ desconhecida foi observada e apresentou os seguintes resultados: 36 2 1 x =12; ( ) 140i i x x = − = Um intervalo de 95% de confiança para µ será dado aproximadamente por: (A) (11,92; 13,28). (B) (11,78; 13,42). (C) (11,52; 13,68). (D) (11,18; 14,02). (E) (11,02; 14,18). RESOLUÇÃO: Repare que o desvio padrão populacional é desconhecido, mas é possível calcular o desvio padrão amostral. Por isso, nessa questão, em vez de usar a curva normal padrão, usaremos a curva “t de Student”, por ser uma aproximação teórica da curva normal. Com isso, ao invés de calcular 𝑍/2 na curva normal padrão, devemos obter o valor 𝑡/2 na tabela de distribuição “t de Student”. Podemos obter o desvio padrão da amostra da seguinte forma: 𝑆2 = ∑ (𝑥𝑖 − 𝑥) 2𝑛 𝑖=0 (𝑛 − 1) Prof. Arthur Lima Aula 12 44 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Já que n = 36, então 𝑆2 = ∑ (𝑥𝑖 − 𝑥) 236 𝑖 = 0 (36 − 1) = 𝑆2 = 140 35 = 4 → s = 2. Repare que se deseja um intervalo de confiança para a média populacional com confiança de 1 − = 95%, ou seja, = 5%. Veja que a amostra possui n = 36 elementos. Deste modo, o número de graus de liberdade da distribuição t de Student é n - 1 = 35. Verificando a tabela t de Student, percebemos que a linha corresponde a 35 graus de liberdade e a coluna correspondente a /2 = 2,5%, temos 𝑡2,5% = 2,03. Portanto, o nosso intervalo de confiança é: [𝑥 - 𝑡/2 x 𝑆 √𝑛 , 𝑥 + 𝑡/2 x 𝑆√𝑛 ] = [12,6 – 2,03 x 2 √36 , 12,6 + 2,03 x 2 √36 ] = [12,6 – 2,03 3 , 12,6 + 2,03 3 ] = [12,6 – 0,68, 12,6 + 0,68] = Prof. Arthur Lima Aula 12 45 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 [11,92, 13,28] Resposta: A 17. FEPESE – ISS/Criciúma – 2017) Em duas pesquisas independentes sobre educação em um município foram selecionados aleatoriamente alunos de quinto ano do ensino fundamental de todas escolas do município para realizarem provas de sondagem (as provas são identicas nas duas pesquisas). A média aritmética simples das notas obtidas pelos alunos que realizaram a prova de uma pesquisa foi 6,6, enquanto que a média aritmética simples das notas obtidas pelos alunos que realizaram a prova da outra pesquisa foi 5,4. O seguinte teste de hipótese foi desenhado: Hipótese H0: A média da população é igual a 6,6. Hipótese H1: A média da população é igual a 5,4. Serão aleatoriamente selecionadas 10 provas e calculada a média X dessas 10 provas. Se X > 6 será aceita a hipótese H0,caso contrário, será rejeitada a hipótese H0. Foi calculado que a probabilidade de se cometer o ERRO DE TIPO I é de 5,3%, e que a probabilidade de se cometer o ERRO DE TIPO II é de 4,3%. Ao realizar o teste de hipóteses acima, se encontrou X = 6,2. Analise a frase abaixo a respeito do experimento e do teste de hipóteses: Devemos …………………… que a média da população é 6,6, mas temos ……… de probabilidade de estarmos …………………… . Assinale a alternativa que completa corretamente as lacunas do texto. a. ( ) rejeitar • 4,3% • corretos b. ( ) rejeitar • 4,3% • errados c. ( ) aceitar • 4,3% • corretos d. ( ) aceitar • 4,3% • errados e. ( ) aceitar • 5,3% • errados RESOLUÇÃO: Veja que obtivemos média 6,2 (valor maior do que 6). De acordo com a definição do nosso teste de hipóteses, isto significa que devemos aceitar a hipótese nula, isto é, devemos ACEITAR que a média da população é 6,6. Entretanto, como a probabilidade de erro tipo II é 4,3%, isto significa que nós temos 4,3% de probabilidade de estarmos ERRADOS. Ou seja, é possível que a hipótese nula seja falsa e, mesmo assim, estejamos cometendo o erro de aceitá-la. Resposta: D Prof. Arthur Lima Aula 12 46 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 Atenção: Para resolver às questões abaixo, considere as informações dadas a seguir. Se Z tem distribuição normal padrão, então: P(Z < 1,64) =0,950; P(Z<2,05)=0,980; P(Z<2,40)=0,992. 18.FCC - ISS/Teresina - 2016) Com o objetivo de se estimar a média mensal salarial, que denotaremos por μ, de certa categoria de trabalhadores, tomou-se uma amostra aleatória de 400 desses trabalhadores. Os resultados estão apresentados na tabela de distribuição de frequências abaixo, onde a primeira coluna apresenta as faixas salariais mensais, em número de salários mínimos (SM), de tais trabalhadores: Considere: I. Que a população de onde a amostra foi retirada é infinita e tem distribuição normal com desvio padrão igual a 2 SM. II. Para a estimativa pontual de μ a média aritmética dos 400 salários apresentados, calculada considerando que todos os valores incluídos num intervalo de classe são coincidentes com o ponto médio do intervalo. Nessas condições, o intervalo de confiança para μ com coeficiente de confiança igual a 98,4%, baseado nessa amostra, é dado por (A) (6,96; 7,44). (B) (7,00; 7,40). (C) (7,04; 7,36). (D) (6,80;7,60). (E) (6,92; 7,48). RESOLUÇÃO: O salário médio pode ser obtido assim: Classe Frequência Ponto Médio PM x f 4 – 6 0,3 5 1,5 6 – 8 0,4 7 2,8 8 – 10 0,2 9 1,8 Prof. Arthur Lima Aula 12 47 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 10 – 12 0,1 11 1,1 SOMA = 7,2 A soma das frequências relativas é 1. Logo, Média = 7,2 / 1 = 7,2 Para 98,4% de confiança, devemos tirar 1,6% da curva normal, ou seja, 0,8% de cada lado. Sabendo que P(Z<2,4) = 0,992, podemos também dizer que P(Z>2,4) = 0,008 = 0,8%. Da mesma forma, pela simetria da curva normal, dizemos que P(Z<-2,4) = 0,8%. Assim, nosso intervalo de confiança fica: [𝑀é𝑑𝑖𝑎 − 𝑍. 𝜎 √𝑛 ,𝑀é𝑑𝑖𝑎 + 𝑍. 𝜎 √𝑛 ] [7,2 − 2,4. 2 √400 , 7,2 + 2,4. 2 √400 ] [7,2 − 2,4. 2 20 , 7,2 + 2,4. 2 20 ] [6,96, 7,44] Resposta: A 19.FCC - ISS/Teresina - 2016) Da receita dos municípios da região sul de determinado país, afirma-se que, em média, 8% são gastos com saúde. Desejando-se provar tal afirmação planejou-se um teste de hipóteses sobre a variável aleatória X, que representa a porcentagem dos gastos com saúde desses municípios relativamente às suas receitas. Supondo que X é uma variável com distribuição normal com média μ e desvio padrão de 2%, selecionou-se uma amostra aleatória de 400 desses municípios, e se considerou testar a hipótese nula μ = 8% versus a hipótese alternativa μ < 8% ao nível de significância de 2%. Supondo que a população de onde a amostra é proveniente é de tamanho infinito, o menor valor encontrado para a média amostral, tal que a hipótese nula não seja rejeitada é, em porcentagem, igual a (A) 7,995. (B) 7,795. (C) 6,950. (D) 7,850. (E) 7,750. Prof. Arthur Lima Aula 12 48 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 RESOLUÇÃO: A estatística do teste de hipóteses é: 𝑍𝑐𝑎𝑙𝑐 = 𝑋 − 𝜇 𝜎 √𝑛 = 𝑋 − 8% 2% √400 = 𝑋 − 8% 2% 20 Temos um teste unilateral no qual a região de rejeição encontra-se à esquerda, e deve ter probabilidade de 2% (0,02). Portanto, a região de rejeição é definida por P(Z < z0) = 0,02. Como foi dito que P(Z<2,05)=0,980, podemos dizer que P(Z > 2,05) = 0,02. Da mesma forma, pela simetria da curva normal, podemos afirmar que P (Z < -2,05) = 0,02. Assim, z0 = -2,05 delimita a região de rejeição. Para a hipótese nula não ser rejeitada, precisamos que: Zcalc > z0 𝑋 − 8% 2% 20 > −2,05 𝑋 − 0,08 0,001 > −2,05 𝑋 − 0,08 > −2,05 . 0,001 𝑋 > 0,08 − 2,05 . 0,001 𝑋 > 0,07795 𝑋 > 7,795% Resposta: B 20.FGV – CODEBA – 2016) Considere uma pesquisa feita junto a uma amostra de pessoas representativas da população brasileira. Foi questionado e cada pessoa informou o seu salário. Após a coleta dos dados, a média amostral foi igual a R$1000. De posse desse indicador e de sua variância amostral, o instituto de pesquisa realiza um teste de hipóteses para averiguar se a média da população brasileira é igual a R$ 1100. O par de valores que levaria o instituto a rejeitar a hipótese colocada é: a) P-valor=1% e nível de significância de 0,1%. b) P-valor=10% e nível de significância de 1%. Prof. Arthur Lima Aula 12 49 de 150| www.direcaoconcursos.com.br Raciocínio Analítico, Mat. Financeira e Estatística p/ Auditor do TCU – 2019 c) P-valor=2% e nível de significância de 1%. d) P-valor=100% e nível de significância de 200%. e) P-valor=5% e nível de significância de 10% RESOLUÇÃO: Para podermos rejeitar a hipótese nula, é preciso que o p-valor seja inferior ao nível de significância. Temos isto em D e E, porém em D temos valores absurdos (superiores a 100% para o nível de significância, o que não faz sentido). Ficamos com E. Resposta: E 21.CESPE – DEPEN – 2015) Com base na tabela mostrada, que apresenta os resultados sobre a presença (1) ou ausência (0) de antenas bloqueadoras de sinal de celular em uma amostra aleatória simples de 30 presídios, julgue os próximos itens. ( ) Caso outra amostra de presídios fosse selecionada aleatoriamente, a estimativa pontual do parâmetro estudado poderia ser diferente da estimativa encontrada na amostra apresentada. ( ) A estimativa
Compartilhar