Baixe o app para aproveitar ainda mais
Prévia do material em texto
Banca Cesgranrio Probabilidade e Estatística Questões desde o ano de 2005 Ano de 2012 Curso DSc Página 2 Questões da CESGRANRIO Divisão das Questões por assuntos (As questões resolvidas estão em destaque) 1) Medidas de posição (centralidade e dispersão), coeficiente de correlação (linear) ou coeficiente de correlação (linear) de Pearson, covariância, simetria e assimetria: 1 (Definições: coeficiente de correlação linear, covariância); 2 (Definições: média, população, variância populacional, amostra, variância amostral, desvio padrão); 3 (Definições: moda, estatística de ordem, mediana); 4 (Definições: espaço amostral, evento elementar ou ponto amostral, evento, evento certo, evento impossível, união de eventos, interseção de eventos, eventos disjuntos ou mutuamente exclusivos ou mutuamente excludentes); 5 (Definição: medida resistente); 6, 7, 15 (Definições: simetria e assimetria); 16; 23; 31; 33; 35; 36; 45; 50 (Definição: Coeficiente de variação); 54; 59; 66; 67; 68; 69; 70; 73; 75; 82; 85; 88 (Definições: média e variância de combinação linear de variáveis aleatórias ou quantidades de interesse); 90; 100; 107; 108; 109; 115; 123; 125 (Definição: média harmônica); 127; 129; 130; 131 (Cálculo da estimativa que minimiza a soma dos quadrados dos desvios); 139; 142; 143; 156; 162; 166; 171; 174; 182; 190; 195; 197 (Definição: média ponderada); 199; 200; 201; 207; 220; 224; 231; 236; 237; 239; 246. 2) Frequência relativa, freqüência absoluta, box plot, quantis: 11 (Definições: freqüência absoluta, freqüência relativa); 19 (Definições: Box plot, quartis, distância interquartil); 57; 140; 157; 159; 209 (Definições: coeficiente de assimetria, coeficiente de curtose); 217. 3) Interpolação linear (método da ogiva): 27; 28; 29; 30; 34; 41; 62; 63; 83; 84; 104; 189. 4) Princípio fundamental da contagem, combinação, arranjo, anagramas: 20 (Definição: combinação); 65; 98 (Definição: princípio fundamental da contagem); 99; 105; 119; 121;128; 135 (anagramas); 136; 137; 141; 144; 145; 147; 148; 152; 186; 198; 205; 208; 211; 212; 213; 215; 216; 222; 247; 248. 5) Cálculo de probabilidades, probabilidade condicional, diagrama de Euler-Venn: 9; 10 (Definição: probabilidade condicional); 12; 13; 14; 17; 18; 21; 32; 38; 39; 40; 42; 44; 47; 51; 53; 55; 60; 64; 71; 74; 81; 86; 87; 91; 102; 111; 113; 116; 117; 120; 122; 138; 146; 149; 150; 151; 161; 173; 178; 181; 184; 187; 188; 191; 192; 196; 202; 204; 210; 218; 219; 223; 226 (Definição: eventos igualmente prováveis); 230; 234; 238; 240. 6) Teoria de conjuntos: 228 (Definições: subconjunto, subconjunto próprio, complemento ou complementar de um conjunto) 7) Classificação de variáveis aleatórias: 167 Curso DSc Página 3 8) Variáveis aleatórias discretas: 22 (Definição: distribuição geométrica); 26 (Definição: distribuição binomial); 37; 43 (Definição: distribuição hipergeométrica); 48; 56; 72 (Definição: distribuição uniforme); 89; 96; 112 (Definição: distribuição de Poisson); 118; 124; 132; 154; 155; 165; 168; 172; 175; 183; 185; 193; 194 (Definição: função de distribuição acumulada); 214; 221; 229; 235; 242; 244; 249. 9) Variáveis aleatórias contínuas (exceto Distribuição normal): 25 (Definições: variável aleatória contínua, função de distribuição acumulada (FDA), função densidade (de probabilidade), média e variância de uma variável aleatória contínua), 46 (Definição: moda de uma variável aleatória contínua); 49 (Definição: distribuição uniforme); 80 (Definição: distribuição qui-quadrado, distribuição t-Student, distribuição F); 92; 94 (Definições: distribuição exponencial; falta de memória); 101 (Definição: média de uma função de variável aleatória); 106; 110; 114; 133; 233. 10) Distribuição normal: 8 (Definição: distribuição norma; propriedades); 24; 58; 93; 103; 126; 134; 227; 232; 241; 245. 11) Teste de hipóteses, nível de confiança, estatísticas, estimadores, Teorema Central do Limite (TCL): 52 (Definições: erro do tipo I, erro do tipo II, probabilidade do erro do tipo I ou nível de significância (α), probabilidade do erro do tipo II (β), região crítica ou de rejeição, região de aceitação, p-valor): 61; 76; 78; 79; 95; 97; 153 (Definição: Análise Exploratória de Dados (AED)), 158 (Definições: parâmetro, estimador, estimador não-viesado ou não tendencioso, estimativa); 160; 163 (Teorema Central do Limite (TCL)); 164; 169; 170 (Definição: estimador consistente), 176, 180, 203, 225, 243. 12) Intervalo de confiança1: 77 13) Distribuição conjunta de probabilidade2: 177 14) Estimadores de maximaverossimilhança3: 179 1 Este tópico não cai para as carreiras de administradores e engenheiros do BNDES. 2 Este tópico não cai para as carreiras de administradores, economistas e engenheiros do BNDES. 3 Este tópico não cai para as carreiras de administradores e engenheiros do BNDES. Curso DSc Página 4 Exercícios da Cesgranrio Empresa de Pesquisas Energéticas (EPE) - 2005 Área: Economia de Energia 1) O coeficiente de correlação toma valores no intervalo: (A) [0,1] (B) ]0,1] (C) [-1,1] (D) ]-1,1[ (E) [-10,10[ Resp.: Dados n pares de valores (x1, y1), (x2, y2), , (xn, yn), chamaremos de coeficiente de correlação ou coeficiente de correlação linear entre as variáveis aleatórias, ou variáveis de interesse, X e Y, denotado por ρXY ou corr(X, Y), a ou seja, a média dos produtos dos valores padronizados das variáveis. De modo equivalente, Não é difícil provar que o coeficiente de correlação satisfaz O numerador da expressão que define a correlação, que mede o total da concentração dos pontos pelos quatro quadrantes, dá origem a uma medida bastante usada e que definimos a seguir. Definição. Dados n pares de valores (x1, y1), (x2, y2), , (xn, yn), chamaremos de covariância entre as duas variáveis X e Y a ou seja, a média dos produtos dos valores centrados das variáveis. De modo equivalente, após algumas manipulações algébricas, temos que Com essa definição, o coeficiente de correlação pode ser visto como Curso DSc Página 5 Assim, cov(X,Y) = corr(X, Y) x DP(X) x DP(Y). O coeficiente de correlação ou coeficiente de correlação linear mede a relação linear entre duas variáveis ou quantidades de interesse. A interpretação gráfica é dada abaixo: (a)dependência linear direta: correlação e covariância positiva; (b) dependência linear inversa: correlação e covariância negativas; (c) ausência ou reduzida de relação linear: correlação e covariâncias iguais a zero ou com valores próximos de zero. O sinal da correlação linear ou, de modo equivalente, o sinal da covariância, determina a (inclinação da) reta de regressão, ou seja, a reta ajustada aos dados. 2) Sobre os conceitos de média, desvio padrão e variância, é correto afirmar que: (A) inexiste relação entre média e variância. (B) é impossível calcular o desvio padrão, dada a variância. (C) a variância é a raiz quadrada da média. (D) o desvio padrão é a raiz quadrada da variância. (E) o valor da variância é sempre maior que o valor do desvio padrão. Resp.: Se x1, x2, ..., xn são os n valores (distintos ou não) da variável X, a média aritmética, ou simplesmente média, de X, denotada por , pode ser escrita Agora, se tivermos n observações da variável X, das quais n1 são iguais a x1, n2 são iguais a x2, ..., nk são iguais a xk, então a média de X pode ser escrita Curso DSc Página 6 Se representar a freqüência relativada observação xi, então a equação acima pode ser escrita Quando X representa uma variável aleatória, sua média é indicada por Nota) População é o conjunto de todos os elementos (pessoas ou objetos) cujas propriedades o pesquisador está interessado em estudar. A variância ou variância populacional, denotada por var, é definida por A fórmula acima é equivalente à Em ambas as fórmulas acima, note a relação entre a variância e a média. Quando temos a variável aleatória X, a notação da variância é dada por Suponha que observemos n1 vezes o valor x1,..., nk vezes o valor xk da variável X. Então, A variância é uma medida dispersão, cuja dimensão é igual ao quadrado da dimensão dos dados (por exemplo, se os dados são expressos em cm, a variância será expressa em cm2). É comum a utilização do desvio padrão, Curso DSc Página 7 denotado por dp, que é uma medida de dispersão definida como a raiz quadrada da variância: Nota) Se uma população é infinita, ou finita, mas muito grande, torna-se impossível ou impraticável a realização do censo. Em tais casos, em vez disso, examina-se somente uma pequena parte da população que chamamos de amostra. Uma amostra é dita representativa da população se a partir de sua análise podem ser obtidas conclusões sobre a população. Para tanto é necessário que a amostra seja extraída de acordo com regras bem definidas. Dada uma amostra, a variância amostral é dada por Para quaisquer constantes “a” e “b”, temos que (aX + b) = a (X) + b; var(aX + b) = a2var(X); e dp(aX + b) = |a| dp(x), onde | | indica o módulo ou o valor absoluto de um número. Nota) Módulo ou valor absoluto de um número: Exemplos) e . 3) As observações de uma variável X são: (0,2,2,1,4,5,5,5,3). Os valores de moda, média e mediana, respectivamente, são: (A) 2, 2, 2 (B) 2, 3, 5 (C) 3, 3, 5 (D) 5, 3, 2 (E) 5, 3, 3 Resp.: A moda é definida como a realização mais freqüente do conjunto de valores observados. Em alguns casos, pode haver mais de uma moda, ou seja, a distribuição dos valores pode ser bimodal, trimodal, etc.., ou, de modo mais geral, multimodal. Quando tratar-se de uma variável aleatória discreta, a moda é o valor ao qual atribuímos a maior probabilidade; para variáveis aleatórias contínuas, é o valor ao qual está associado o maior valor assumido pela função densidade de probabilidade (FDP). Nesta questão, a moda de X é igual a 5, valor ao qual está associada a frequência absoluta igual a 3. A média de X, , é igual a Curso DSc Página 8 Considere, agora, as observações da variável X, x1, x2, ..., xn, ordenadas em ordem crescente. Vamos denotar a menor observação por x(1), a segunda por x(2), e assim por diante; obtém-se (*) Por exemplo, se x1=3, x2=-2, x3=6, x4=1, x5=3, então -2 ≤ 1 ≤ 3 ≤ 3 ≤ 6, de modo que x(1) = - 2, x(2) = 1, x(3) = 3, x(4) = 3 e x(5) = 6. As observações ordenadas como em (*) são chamadas estatísticas de ordem. Com esta notação, a mediana da variável X pode ser definida como Na questão em tela, tem-se: 0 ≤ 1 ≤ 2 ≤ 2 ≤ 3 ≤ 4 ≤ 5 ≤ 5 ≤ 5; como n = 9: Md(X) = = x(5) = 3. 4) Seja X uma variável discreta que representa o valor numérico de uma única jogada de um dado honesto de seis faces. Qual a probabilidade de X=4 ou X=5? (A) 5/6 (B) 2/3 (C) 1/2 (D) 1/3 (E) 1/6 Resp.: O espaço amostral de um experimento, Ω, consiste, no caso discreto, da enumeração (finita ou infinita) de todos os resultados possíveis do experimento em questão; cada elemento do espaço amostral é chamado de evento elementar ou ponto amostral. Como os dados são honestos (não viciados), a cada evento elementar associamos a probabilidade 1/36. Chamamos de evento a todo subconjunto (ou parte) do espaço amostral. A probabilidade de um evento é dada pela soma das probabilidades dos eventos elementares que o compõem; o espaço amostral é também chamado de evento certo e P(Ω) = 1; e o conjunto vazio, denotado por {} ou , é chamado de evento impossível e P( ) = 0. Dados os eventos A e B, podemos considerar dois novos eventos: i) A U B, chamado reunião (união) de A e B, quando pelo menos um dos eventos ocorre; Curso DSc Página 9 ii) A ∩ B, chamado interseção de A e B, quando A e B ocorrem simultaneamente. Os seguintes resultados são importantes: P(A U B) = P(A) + P(B) – P(A ∩ B) P(A U B U C) = P(A) + P(B) + P(C) – P(A ∩ B) - P(A ∩ C) – P(B ∩ C) – P(A ∩ B ∩ C) Quando a interseção de 2 (dois) eventos é vazia, os eventos são ditos disjuntos ou mutuamente exclusivos ou mutuamente excludentes. Nesse caso, os resultados acima tomam a seguinte forma: P(A U B) = P(A) + P(B) P(A U B U C) = P(A) + P(B) + P(C) A variável X assume os valores 1, 2, 3, 4, 5 e 6, os quais determinam o espaço amostral associado à variável X; a cada elemento amostral associa-se a mesma probabilidade 1/6, pois é um dado honesto de 6 faces. Consideremos os eventos A: evento {X = 4} e B: evento {X = 5}. Ao conectivo ou está associado o operador união (U); ao conectivo e está associado o operador interseção (∩). Sabe-se que P(A U B) = P(A) + P(B) – P(A ∩ B). Nesta questão, A ∩ B = Ø e, portanto, P(A ∩ B) = 0. Logo, P(A U B) = 1/6 + 1/6 = 1/3. Área: Finanças e orçamento 5) Dado o conjunto de valores {2,3,5,7,8}, substituindo o valor 8 por 50, é correto afirmar que a: (A) moda aumenta. (B) mediana se mantém. (C) mediana aumenta. (D) mediana diminui. (E) média diminui. Resp.: Dizemos que uma medida de localização ou dispersão é resistente quando for pouco afetada por mudanças de uma pequena porção dos dados. A mediana é uma medida resistente, ao passo que a média não é. As questões 2 e 3 trazem as definições de média, moda e mediana. Para o conjunto de valores {2, 3, 5, 7, 8, temos: média = 5 e mediana = 5; para o conjunto {2, 3, 5, 7, 50}, temos media = 13,4 e mediana = 5. Curso DSc Página 10 6) Se num diagrama de dispersão os pontos estiverem próximos de uma reta com declive negativo, isso significa que o coeficiente de correlação linear tem um valor: (A) 0 (B) positivo (C) negativo (D) quase nulo (E) 1 7) Para a seqüência de números (1,1,3,4), a variância é igual a: (A) 1 (B) 2 (C) 2,25 (D) 2,75 (E) 3 8) Se uma distribuição segue um padrão normal, é correto afirmar que: (A) 98% dos números estão a dois desvios padrão da média. (B) 95% dos números estão a 1,5 desvio padrão da média. (C) 95% dos números estão a um desvio padrão da média. (D) 86% dos números estão a um desvio padrão da média. (E) 68% dos números estão a um desvio padrão da média. Resp.: Dizemos que uma variável aleatória X tem distribuição normal com parâmetros μ e σ 2 , - ∞ < μ < + ∞ e 0 < σ 2 < ∞, se sua função densidade de probabilidade é dada por onde µ = Média(X) e σ2 = variância(X). Sempre que µ = 0 e σ2 = 1, a distribuição é dita normal padrão ou Gaussiana. Para quaisquer valores de média e variância, os valores das probabilidades abaixo são sempre verdadeiros: Exemplo) Seja X ~ N(2, 16); então: Curso DSc Página 11Um resultado largamente utilizado nos cálculos é a seguinte: . Exemplo) Se X ~ N(2, 16); então 9) A probabilidade de se obter a soma 7 ou a soma 3 na jogada de dois dados de seis lados não viciados é: (A) 6/8 (B) 2/9 (C) 4/9 (D) 2/18 (E) 6/36 Resp.: Quando elencamos todos os resultados possíveis para o lançamento de dois dados, obtemos: (1,1), (1,2), (1,3), (1,4), (1,5), (1,6) (2,1), (2,2), (2,3), (2,4), (2,5), (2,6) (3,1), (3,2), (3,3), (3,4), (3,5), (3,6) (4,1), (4,2), (4,3), (4,4), (4,5), (4,6) (5,1), (5,2), (5,3), (5,4), (5,5), (5,6) (6,1), (6,2), (6,3), (6,4), (6,5), (6,6) Do total dos 36 resultados possíveis: (1,6), (2,5), (3,4), (4,3), (5,2), (6,1) => somam 7 (1,2), (2,1) => somam 3 Logo, Probabilidade = 8/36 = 2/9. De modo mais formal, podemos definir os eventos: S3: soma dos resultados iguais a 3; portanto S3 = {(1,2), (2,1) e P(S3) = 2/36; S7: soma dos resultados iguais a 7; portanto S7 = {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)} e P(S7) = 6/36. Logo, P(S3 U S7) = P(S3) + P(S7) – P(S3 ∩ S7) = 6/36 + 2/36 – 0 = 8/36 = 2/9. Curso DSc Página 12 10) Uma moeda honesta foi jogada duas vezes no ar. Sabe-se que ao menos uma coroa apareceu. Qual a probabilidade de o resultado ter sido exatamente o de uma cara e uma coroa? (A) 1 (B) 1/2 (C) 1/3 (D) 1/4 (E) 2/3 Resp.: Para dois eventos quaisquer A e B, sendo P(B) > 0, definimos a probabilidade condicional de A dado B, P(A/B), como sendo Da definição de probabilidade condicional de A dado B, P(A/B), obtemos a chamada Regra do Produto de Probabilidades, Dizemos que A e B são independentes se, e somente se, é válida a relação Nesta questão, o espaço amostral deste experimento é dado por Ω = {(c,c), (c,k), (k,c), (k,k)}; como a moeda é honesta, a cada elemento amostral associamos a probabilidade 1/4. Vamos definir os eventos: A: ocorrência de uma cara e de uma coroa; portanto, A = {(c,k), (k,c)} e P(A) = 2/4; e B: ocorrência de ao menos uma coroa; portanto B = {(c,k), (k,c), (k,k)} e P(B) = 3/4. Queremos calcular P(A/B); como A ∩ B = {(c,k), (k,c)} = A e, portanto, P(A ∩ B) = 2/4, segue que P(A/B) = = . 11) Dada a lista de números {5,5,6,6,6,6,7,14}, a freqüência: (A) relativa do número 5 é 25% (B) relativa do número 5 é 75% (C) relativa do número 6 é 25% (D) relativa do número 7 é 10% (E) absoluta do número 6 é 40% Resp.: Por definição: Frequência absoluta de um valor (ou de um resultado de um experimento) ; e Curso DSc Página 13 Frequência relativa de um valor (ou de um resultado de um experimento) = De um total de 8 valores, 2 são iguais a 5. Assim, Frequência absoluta do valor 5: 2 Frequência relativa do valor 5: = 25%. 12) A probabilidade condicional Pr (A B), se A e B são eventos mutuamente excludentes, é: (A) 0 (B) 1 (C) Pr(A∩B) (D) Pr(AUB) (E) Pr(B∩A) Resp.: Dois eventos são ditos mutuamente excludentes ou mutuamente exclusivos ou disjuntos quando possuem interseção vazia, ou seja, . Da teoria da probabilidade, P( ) = 0. Da definição de probabilidade condicional entre eventos, dada na Questão 10, segue o gabarito. Tribunal de Contas do Estado de Rondônia (TCE Rondônia) - 2007 Função: Economista 13) Uma urna contém 6 bolas marcadas, respectivamente, com os números 1, 2, 3, 3, 4 e 5. Uma pessoa retira uma das bolas aleatoriamente da urna. A probabilidade de sair uma bola com o número 3 é: (A) 1/6 (B) 1/5 (C) 1/4 (D) 1/3 (E) 1/2 14) Dois dados comuns, “honestos”, são lançados simultaneamente. A probabilidade de que saia pelo menos um 6 é igual a: (A) 1/36 (B) 9/36 (C) 11/36 (D) 12/36 (E) 15/36 15) Considere a distribuição de probabilidades discreta apresentada a seguir. Eventos Elementares Probabilidades 1 1/6 2 1/6 3 2/6 4 1/6 5 1/6 Analisando-se esses dados, conclui-se que a: (A) moda desta distribuição é igual a 2. (B) média da distribuição é igual à moda. (C) mediana da distribuição é igual a 2. (D) distribuição é assimétrica. (E) probabilidade do evento “número ímpar” é igual a 50%. Curso DSc Página 14 Resp.: Para facilitar a notação, vamos chamar de X uma variável aleatória discreta que possui a distribuição acima. Temos: X = xi P(X = xi) 1 1/6 2 1/6 3 2/6 4 1/6 5 1/6 Da definição de moda de uma variável aleatória discreta (Questão de nº 3), segue que a moda é igual a 3, pois a este valor está associado o maior valor de probabilidade. Da Questão de nº 2, o cálculo da média é dado por (X) = 1 x 1/6 + 2 x 1/6 + 3 x 2/6 + 4 x 1/6 + 5 x 1/6 = 3. A mediana pode ser calculada associando a X o seguinte experimento aleatório: suponhamos uma urna, contendo 5 bolas, das quais, 2 numeradas com o 3 e as demais, com os números 1, 2, 4 e 5. Assim, o rol obtido para este experimento é dado por: 1 ≤ 2 ≤ 3 ≤ 3 ≤ 4 ≤ 5 e, então, a mediana é igual a 3. Para o estudo da simetria, temos: 1) Variável aleatória discreta simétrica: sua distribuição de frequência apresenta valores que são iguais à mediana ou eqüidistantes da mediana; neste último caso, a esses valores associamos igual probabilidade. 2) Variável aleatória contínua simétrica: sua função densidade de probabilidade (FDP) tem gráfico simétrico em relação à mediana da distribuição. Curso DSc Página 15 Os demais casos são definidos a partir das apresentações acima: No caso da análise gráfica de uma variável aleatória discreta, devemos comparar o “contorno” da sua distribuição de frequência às apresentações acima para concluir sobre a assimetria Na questão em tela, vamos adotar a seguinte representação onde vemos uma reflexão em relação à vertical que passa pelo ponto x = 3: os pontos x = 1 e x = 5 distam 2 unidades do ponto x = 3 e ambos possuem iguais probabilidades; os pontos x = 2 e x = 4 distam 1 unidade do pontos x = 3 e ambos possuem iguais probabilidades. Logo, a distribuição é simétrica. Ocorre o evento “número impar” quando a variável aleatória X assume um dos valores: 1, 3 e 5, ou seja, {X = 1, X = 2, X = 3}; como a probabilidade de um evento é dada pela soma das probabilidades dos pontos amostrais que o compõem, então tal probabilidade é dada por 1/6 + 2/6 + 1/6 = 4/6. Curso DSc Página 16 16) A variância de uma distribuição de probabilidades descreve o(a): (A) seu valor médio. (B) valor mais provável da distribuição. (C) correlação da variável aleatória com outras variáveis. (D) dispersão da distribuição em relação à origem. (E) dispersão da distribuição em relação à média. Função: Estatístico O enunciado a seguir refere-se às questões de nos 17 e 18. Em um jogo, apresentam-se ao participante 3 fichas voltadas para baixo, estando representadas em cada uma delas as letras T, C e E. As fichas encontram-se alinhadas em uma ordem qualquer. O participante deve ordenar as fichas, mantendo as letras voltadas para baixo, tentando obter a sigla TCE. Ao desvirá-las, para cada letra que esteja na posição correta, ganhará um prêmio de R$ 500,00. 17) A probabilidade de o participante não ganhar qualquer prêmio é igual a: (A) 0 (B) 1/6 (C) 1/4 (D) 1/3 (E) 1/2 18) A probabilidade de o participante ganhar exatamente o valor de R$ 1.000,00 é igual a: (A) 3/4 (B) 2/3 (C) 1/2 (D) 1/6 (E) 0 19) O Box plot ilustrado acima mostra a distribuição das idades, em anos completos, de um grande número de mulheres. Escolhida aleatoriamente uma dessas mulheres, a probabilidade de sua idade estar entre 49 e 54 anos é: (A) 0,15 (B) 0,25 (C) 0,35 (D) 0,50 (E) 0,75 Resp.: O esquema gráfico abaixo nos traz as definições dos 1º e 3º quartis. Curso DSc Página 17 A mediana, que é o 2º quartil, é o valor que objetivadividir os dados em 2 partes: 50% a sua esquerda e 50% a sua direita. O Box plot é uma diagrama que traz as seguintes informações: Os valores da amostra que são menores do que “1º Quartil – 1,5 x DIQ” ou maiores do que “3º quartil + 1,5 x DIQ” são ditos discrepantes ou outliers e são explicitamente indicados no Box plot através de “ * ”, “ +” ou “ º ”. Nota) O Box Plot é desenhado de forma que, para dados de uma distribuição Normal, aproximadamente 99,5% das observações caiam “dentro dos fios”. Para a distribuição de idades desta questão, o 1ª Quartil é igual a 49 anos, enquanto o 2º quartil (mediana), 54 anos. Logo, a probabilidade de estar entre 49 e 54 anos equivale a probabilidade de estar entre o 1º e o 2º quartis, ou seja, 25%. 20) Considerando-se 240 processos divididos em dois grupos de 120 processos cada, qual a probabilidade de dois desses processos ficarem no mesmo grupo? (A) 119/239 (B) 129/242 (C) 117/221 (D) 120/240 (E) 128/248 21) Sara tem três cartões magnéticos de Bancos diferentes, A, B e C. Na última semana ela usou os três cartões para retirar dinheiro em caixas eletrônicos (o mesmo valor e a mesma quantidade de notas), e descobriu que uma das notas sacadas durante esse período era falsa. O banco A diz que a probabilidade de uma nota ser falsa, dado que o dinheiro foi retirado de um de seus caixas eletrônicos, é 0,2%. Já os Bancos B e C afirmam que essas probabilidades para os seus caixas eletrônicos são, respectivamente, 0,1% e 0,05%. Sara recebeu uma nota falsa. Qual é a probabilidade dessa nota ter vindo do Banco A? (A) 0,47 (B) 0,57 (C) 0,67 (D) 0,77 (E) 0,87 Resp.: Nesta questão, o espaço amostral é formado por todas as notas sacadas pela Sara. Vamos definir os seguintes eventos: Curso DSc Página 18 A: evento “notas sacadas no Banco A”; B: evento “notas sacadas no Banco B” C: evento “notas sacadas no Banco C” F: evento “notas falsas” Na ilustração abaixo, os eventos acima, bem como o espaço amostral, Ω, são representados. Notemos que o evento F pode ser representado por 3 partes (eventos) disjuntas (os): F∩A, F∩B e F∩C. De fato, uma nota falsa não pode ter sido sacada ao mesmo tempo dos bancos A e B, por exemplo. Assim, F = (F∩A) U (F∩B) U (F∩C) e, portanto, P(F) = P(F∩A) + P(F∩B) + P(F∩C), ou seja, P(F) = P(F/A) x P(A) + P(F/B) x P(B) + P(F/C) x P(C) O enunciado nos dá: P(A) = P(B) = P(C) = 1/3, P(F/A) = 0,2%, P(F/B) = 0,1% e P(F/C) = 0,05%. O objetivo é calcular P(A/F). Assim, 22) Uma experiência com 0,4 de probabilidade de sucesso é repetida até que um sucesso seja alcançado. Se o custo de cada experiência é R$ 40,00, o custo esperado dessa série de experiências, em reais, é igual a: (A) 4,00 (B) 16,00 (C) 40,00 (D) 100,00 (E) 120,00 Resp.: A variável aleatória X, que assume apenas os valores 0 e 1, com função de probabilidade (x, p(x)) tal que Curso DSc Página 19 p(0) = P(X = 0) = 1-p, p(1) = P(X = 1) = p, é chamada variável aleatória de Bernoulli. O resultado 1 é chamado de sucesso e a probabilidade p, de probabilidade de sucesso. O resultado 0 é chamado de fracasso e a probabilidade 1-p, de probabilidade de fracasso. Da definição de média e variância de uma variável aleatória discreta, temos que E(X) = p e Var(X) = p – p2 = p x (1 – p). A variável aleatória Y que indica a ocorrência do primeiro sucesso em uma repetição de ensaios (idênticos e independentes) de Bernoulli tem distribuição geométrica de parâmetro p (p é a probabilidade de sucesso nos ensaios de Bernoulli). Assim, Y: número de repetições do experimento até que se obtenha sucesso pela primeira vez. P(Y = j) = (1 – p) j-1 x p, j = 1, 2, 3, ..., pois se Y = j, nas primeiras j – 1 repetições ocorrem fracassos, somente ocorrendo sucesso na j-ésima repetição. Temos que E(Y) = e Var(Y) = – . Para obter uma solução mais geral, vamos definir a variável aleatória G: G: gasto com a experiência. Vale notar a relação entre Y e G: G = 40Y Y = yi G = gi 1 40 2 80 3 120 ... ... Da Questão nº 2 e do fato que p = 0,4, segue que: (G) = 40 (Y) = 40 x = 100. 23) O retorno mensal de certo investimento de risco pode ser modelado pela variável aleatória W, com função de probabilidade dada a seguir. Curso DSc Página 20 W -5% 0% 5% 10% 15% P(W=w) 0,4 0,15 0,25 0,15 0,05 O retorno esperado é: (A) – 0,5% (B) 0,5% (C) 1,5% (D) 5% (E) 7,5% 24) O gasto médio dos clientes de um posto de gasolina é uma variável aleatória normal com média R$ 100,00 e desvio padrão R$ 25,00. Os 10% dos que mais consomem recebem um tratamento VIP, incluindo lavagem de carroceria, calibragem nos pneus e verificação do óleo e da água. Quanto você precisa gastar nesse posto de gasolina, em reais, para obter tratamento VIP? (A) 158,00 (B) 149,00 (C) 141,00 (D) 132,00 (E) 128,00 25) Considere a seguinte função de densidade de probabilidade: f(x)=2(1-x) para 0 ≤ x ≤ a. O valor da constante a é: (A) 1/2 (B) 1 (C) 3/2 (D) 2 (E) 5/2 Resp.: Uma função X, definida sobre um espaço amostral Ω e assumindo valores num intervalo de números reais, é dita uma variável aleatória contínua. A característica principal de uma v.a. contínua é que, sendo resultado de uma mensuração, o seu valor pode ser pensado como pertencendo a um intervalo ao redor do valor efetivamente observado. Exemplo) Medida da altura de uma pessoa. A Função de Distribuição Acumulada (FDA) de uma variável aleatória X, denotada por FX, é definida por , para todo valor . Nota) A definição de uma FDA, dada acima, é válida também para variáveis aleatórias discretas. Podemos construir modelos teóricos para variáveis aleatórias contínuas escolhendo adequadamente as funções densidade de probabilidade (f.d.p.). Nota) O índice X foi utilizado para indicar que a função FX foi definida a partir de X. Curso DSc Página 21 Definição) A função densidade de probabilidade (f.d.p.), fX, de uma v.a. contínua X é a função que satisfaz para todo x . Da definição acima, segue que Nota) O índice X foi utilizado para indicar que a função fX foi definida a partir da v.a. X. Se a e b forem dois números reais quaisquer, P(a < X < b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a ≤ X ≤ b) = FX(b) – FX(a). Nota) A f.d.p. é também chamada de densidade ou função densidade. Resultado) A função fX é a densidade de uma v.a. X se, e somente se, a) fX(x) ≥ 0, para todo valor x . b) = 1. Em outras palavras, teoricamente, qualquer função f, que seja não negativa e cuja área total sob a curva seja igual a 1, caracterizará uma v.a. contínua. Exemplo) Seja f(x) = 2x, para 0 ≤ x ≤ 1, e zero fora desse intervalo. Logo, a função f pode representar a função densidade de uma v.a. continua X. █ Curso DSc Página 22 Exemplo) Dizemos que a v.a. X tem Distribuição Uniforme Contínua em um intervalo [a, b] se sua densidade fX é definida por Nota) No caso de X ser uma variável aleatória contínua, sempre teremos P(X = x) = 0 para todo x Є . Definição) O valor esperado ou média de uma v.a. X, com f.d.p. fX, denotado por E(X), é dada por = . Resultado) , onde a e b são constantes. Definição) O variância de uma v.a. X, com f.d.p. fX, denotada por Var(X), é Var(X) = . Resultado) De modo equivalente, Var(X) = , onde Resultado) Var(aX + b) = a2Var(X), onde a e b são constantes. Nesta questão devemos ter = 1, ou seja, 26) Sacam-se, com reposição, 4 bolas de uma urna que contém 7 bolas brancase 3 bolas pretas. Qual é a probabilidade de serem sacadas 2 bolas de cada cor? (A) 0,1987 (B) 0,2067 (C) 0,2646 (D) 0,3476 (E) 0,4412 Resp.: Chama-se de experimento binomial ao experimento: (i) que consiste em n ensaios de Bernoulli; (ii) cujos ensaios são independentes; e Curso DSc Página 23 (iii) para o qual a probabilidade de sucesso em cada ensaio é sempre igual a p, 0 < p < 1. Definição. A variável aleatória X, correspondente ao número de sucessos num experimento binomial, tem distribuição binomial b(n, p) com função de probabilidade dada por P(X = k / n, p) = k = 0, 1, ..., n. Denotaremos uma v.a. X com distribuição binomial com parâmetros n e p por X ~ b(n, p). Como ocorre com qualquer variável aleatória discreta, a soma das probabilidades associadas a cada um dos valores assumidos pela variável é igual a 1 (= 100%). Logo, P(X =0) + P(X = 1) + ... + P(X = n) = 1. A média e a variância de uma v.a. binomial de parâmetros n e p são dadas, respectivamente, por E(X) = n x p, Var(X) = n x p x q. Exemplo) Dez peças são extraídas, ao acaso, com reposição, de um lote contendo 500 peças; qual é a probabilidade de que todas sejam defeituosas, sabendo-se que 10% das peças do lote são defeituosas? Temos n = 10 ensaios de Bernoulli, cada um com P(S) = P(peça defeituosa) = p = 0,1. Se X indicar o número de peças defeituosas na amostra, queremos calcular. Logo, P(X = 10) = Nesta questão, temos n = 4, k = 2, p = 7/10 e q = 1 – p = 3/10. Logo, O enunciado a seguir refere-se às questões de nos 27 a 31. Os dados abaixo representam a distribuição de 1200 domicílios residenciais, por classe de consumo de energia elétrica mensal, em uma área de concessão da CERON, medidos em 2006. Não existem observações coincidentes com os extremos das classes. Curso DSc Página 24 Faixas de Consumo Frequência Relativa 0-50 kWh 8% 50 -100 kWh 12% 100-150 kWh 32% 150-300 kWh 40% 300-500 kWh 8% 27) O consumo médio mensal, em kWh, pode ser estimado, aproximadamente, em: (A) 108 (B) 124 (C) 147 (D) 173 (E) 236 Resp.: Tabelas contendo faixas de variação para os valores assumidos são adequadas para representar o comportamento de variáveis contínuas. Em cada uma das faixas, utilizaremos o seu ponto médio para representar todos os dados nela contidos: Representante (kWh) Frequência Relativa (%) 25 8 75 12 125 32 225 40 400 8 Assim, “discretizamos” a variável consumo. Para o cálculo da média, usamos a definição de média de uma variável discreta: Consumo médio = 25 x 8% + 75 x 12% + 125 x 32% + 225 x 40% + 400 x 8% = 173 kwh. 28) O consumo mediano mensal, em kWh, pode ser estimado, aproximadamente, em: (A) 108 (B) 124 (C) 147 (D) 173 (E) 236 Resp.: Por definição, 50% da população (ou amostra) terá valores inferiores ou iguais à mediana e 50% da população (ou amostra) terá valores superiores ou iguais à mediana.Vamos usar Regra de Três para resolver a questão. Consideremos o esquema: Curso DSc Página 25 Notemos que a mediana ocorre na 3º Faixa, na qual uma amplitude de 50 kwh está associada a uma amplitude de frequência igual a 32%. Dada a relação direta entre as grandezas “Amplitude Consumo” e “Amplitude de Frequência”, temos que 32 x h = 30 x 50 h = 46,875 47 kwh. Logo, Mediana = 100 + h 147 kwh. 29) O primeiro quartil da distribuição, em kWh, pode ser estimado, aproximadamente, em: (A) 108 (B) 124 (C) 147 (D) 173 (E) 236 Resp.: Notemos que o primeiro quartil ocorre na 3º Faixa, na qual, como vimos, uma amplitude de 50 kwh está associada a uma amplitude de frequência igual a 32%. Curso DSc Página 26 32 x h = 5 x 50 h = 7,8125 8 kwh. Logo, Mediana = 100 + h 108 kwh. 30) O terceiro quartil da distribuição, em kWh, pode ser estimado, aproximadamente, em: (A) 108 (B) 124 (C) 147 (D) 173 (E) 236 Resp.: Notemos que o terceiro quartil ocorre na 4º Faixa, na qual uma amplitude de 150 kwh está associada a uma amplitude de frequência igual a 40%. Curso DSc Página 27 40 x h = 23 x 150 h = 86,25 86 kwh. Logo, 3º Quartil = 150 + h 236 kwh. 31) A distribuição de freqüência está representada no histograma a seguir. Essa distribuição: (A) é simétrica. (B) apresenta assimetria à esquerda. Curso DSc Página 28 (C) apresenta assimetria à direita. (D) tem média igual à mediana. (E) tem histograma de freqüência em forma de J. Resp.: Ver Questão de nº 15. REFAP S/A – Empresa do Sistema Petrobras – 2007 Área: Administração (Júnior) 32) A probabilidade de que o preço da farinha de trigo aumente em um determinado mês é estimada em 40%. Se isso ocorrer, a probabilidade de que o preço do pão francês também aumente é de 50%; caso contrário, a probabilidade de aumento do pão francês será de apenas 10%. Se o preço do pão francês subiu, a probabilidade de que o preço da farinha de trigo tenha sofrido majoração é igual a: (A) 1/13 (B) 2/10 (C) 6/13 (D) 6/11 (E) 10/13 33) O setor de recursos humanos de uma empresa tem o hábito de divulgar separadamente a média e a variância das notas das avaliações dos funcionários do sexo feminino e do masculino. Na última avaliação, os resultados obtidos foram: Feminino Masculino Número de funcionários 20 30 Média 6 7 Variância 3,4 4 A média e a variância das notas dos funcionários dessa empresa, respectivamente, valem: (A) 6,5 e 3,7 (B) 6,6 e 3,4 (C) 6,6 e 4,0 (D) 7,5 e 3,7 (E) 13,0 e 7,5 Resp.: Seja H e M as variáveis que indicam as notas dos homens e das mulheres que trabalham na empresa, respectivamente. Os valores assumidos por H e por M são indicados abaixo: H: h1, h2, ..., h30; e M: m1, m2, ..., m20. A questão pede o cálculo da variância (VAR) e da média (M) dos funcionários dessa empresa. Assim, M = Curso DSc Página 29 Do enunciado da questão, segue que: Assim, 34) O gráfico de setores abaixo representa a distribuição de freqüências relativas dos salários de uma empresa, em salários mínimos. Não existem observações coincidentes com os extremos das classes. Curso DSc Página 30 O primeiro e o terceiro quartis da distribuição, respectivamente, valem: (A) 2,25 e 4,00 (B) 2,25 e 5,75 (C) 4,00 e 2,25 (D) 4,00 e 5,75 (E) 5,75 e 12,00 Área: Economia (Júnior) 35) Considere a distribuição de probabilidades apresentada abaixo. Eventos Probabilidades Elementares 1 ........................1/12 2 ........................1/12 3 ........................2/3 4 ........................1/12 5 ........................1/12 Quanto a essa distribuição, é correto afirmar que: (A) é uma distribuição assimétrica em torno da média. (B) sua mediana é igual a 2. (C) seu desvio padrão é maior que 2. (D) a média da distribuição é igual à moda. (E) a probabilidade do evento “número par” é igual a 1/3. 36) O símbolo E ( ) indica o operador esperança ou expectativa matemática. Sendo X e Y variáveis aleatórias, a expressão abaixo nem sempre válida é: (A) E (X + 3) = E (X) + 3 (B) E (3 X) = 3 E (X) (C) E (XY) = E (X) E (Y) (D) E (X + Y) = E (X) + E (Y) (E) E (X – Y) = E (X) – E (Y) Empresa de Pesquisa Energética (EPE) - 2007 Área: Economia de Energia 37) Uma firma exploradora de petróleo acha que 95% dos poços que perfuranão acusam depósito de gás natural. Se ela perfurar 6 poços, a probabilidade de obter resultado positivo em pelo menos um deles é, aproximadamente, de: (A) 96,1% (B) 73,5% (C) 30,0% (D) 26,5% (E) 3,9% 38) No lançamento simultâneo de dois dados comuns, a diferença (em valor absoluto) entre os dois resultados é aleatória, tem uma distribuição de probabilidades. Se os dados forem honestos, qual é a moda dessa distribuição? (A) zero (B) cinco (C) 5/18 (D) um (E) 50% Resp.: Basta observar o esquema abaixo: Curso DSc Página 31 A diferença, em módulo, igual a 1 é a que ocorre com maior freqüência. TERMOAÇU – 2007 Área: Economia 39) Em determinada cidade, 80 pessoas foram entrevistadas sobre o meio de transporte utilizado para ir ao trabalho. Quarenta e duas responderam ônibus, 28 responderam carro e 30 responderam metrô. Doze utilizam ônibus e carro, 14, carro e metrô e 18, ônibus e metrô. Cinco utilizam ônibus, carro e metrô. Dentre as pessoas que responderam que utilizam pelo menos um desses três meios de transporte, a probabilidade de que uma pessoa selecionada ao acaso utilize somente um desses veículos é A) 27/56 (B) 56/61 (C) 56/80 (D) 27/61 (E) 27/80 40) Em certa turma, 40% dos homens e 20% das mulheres falam inglês fluentemente. 80% das pessoas são homens. A probabilidade de um aluno fluente na língua inglesa, selecionado ao acaso, ser homem é (A) 8/9 (B) 1/2 (C) 2/5 (D) 8/25 (E) 4/25 41) O Departamento de Recursos Humanos de uma empresa realizou um levantamento dos salários dos 120 funcionários do setor administrativo e obteve o seguinte resultado: Faixa Salarial (em salários mínimos) Frequência relativa 0 a 2 25% 2 a 4 40% 4 a 6 20% 6 a 10 15% Não existem observações coincidentes com os extremos das classes. A média, a mediana e o desvio padrão dos salários, em salários mínimos, são, aproximadamente, Média Mediana Desvio padrão (A) 3,65 3,00 1,50 Curso DSc Página 32 (B) 4,25 3,00 1,50 (C) 4,25 3,25 2,26 (D) 3,65 3,00 2,26 (E) 3,65 3,25 2,26 42) A tabela a seguir apresenta a distribuição dos 50 milhões de domicílios particulares por recebimento de dinheiro de programa social do governo federal, segundo as classes de rendimento mensal domiciliar per capita, em salários mínimos. Domicílios particulares, por recebimento de dinheiro de programa social do governo no mês de referência e classes de rendimento mensal domiciliar per capita (salários mínimos) Classe de Rendimento mensal domiciliar per capita Não receberam dinheiro de programa social do governo no mês de referência Receberam dinheiro de programa social do governo no mês de referência – somente de um programa Receberam dinheiro de programa social do governo no mês de referência – de mais de mais programa Total Até 1/4 3,8% 2,1% 1,9% 7,9% Mais de 1/4 a 1/2 10,0% 3,5% 2,6% 16,0% Mais de 1/2 a 2 22,6% 3,1% 1,5% 23,7% Mais de 1 a 2 23,8% 0,8% 0,3% 24,9% Mais de 2 23,8% 0,1% 0,0% 23,9% Total 84,0% 9,6% 6,3% 100,0% Fonte: IBGE/PNAD Um domicílio é selecionado aleatoriamente. Sabendo-se que esse domicílio recebe dinheiro de pelo menos um programa social do governo, a probabilidade de sua renda familiar ser inferior a ¼ do salário mínimo é, aproximadamente, (A) 0,04% (B) 4,00% (C) 15,90% (D) 25,16% (E) 50,63% Secretaria do Meio Ambiente do RJ (INEA) – 2007 Função: Economista 43) Uma urna tem cinco bolas pretas e quatro brancas. Sem ver o conteúdo da urna, uma pessoa extrai dela duas bolas seguidas (sem reposição). Qual é a probabilidade de as duas bolas serem brancas? Curso DSc Página 33 (A) 1/6 (B) 12/81 (C) 16/81 (D) 2/9 (E) 3/9 Resp.: A Distribuição Hipergeométrica é adequada quando consideramos extrações casuais feitas sem reposição de uma população dividida em dois atributos. Para ilustrar, considere uma população de N objetos, r dos quais têm atributo A e N-r têm atributo B. Um grupo de n elementos é escolhido ao acaso, sem reposição. Estamos interessados em calcular a probabilidade de que esse grupo contenha k elementos com atributo A. Pode-se ver facilmente, utilizando o princípio multiplicativo, que essa probabilidade é dada por: onde max (0, n – N + r) ≤ k ≤ min (r, n). Os pares (k, pk) constituem a distribuição hipergeométrica de probabilidades. Se definirmos a v.a. X como sendo o número de elementos da amostra que têm atributo A, então P(X = k) = pk. Com base nesta notação, P(X = 0) + P(X = 1) + P(X = 2) + ... + P(X = r) = 1 A média e a variância são dadas, respectivamente, por: . Nesta questão, sejam A: atributo cor branca; B: atributo cor preta; N = 9; r = 4; n = 2; e k = 2. Logo, . 44) Dois dados comuns, “honestos”, são lançados simultaneamente. A probabilidade de que a soma dos dois resultados seja igual a 9 ou 10 é (A) nula (B) 4/36 (C) 6/36 (D) 7/36 (E) 10/36 45) Considere a seguinte distribuição de probabilidades: Eventos Elementares Probabilidades 6 ...................................... 0.15 7 ...................................... 0.20 8 ...................................... 0.30 9 ...................................... 0.20 10 ...................................... 0.15 A distribuição de probabilidades apresentada acima (A) é unimodal. (B) é assimétrica. (C) tem desvio padrão igual a 2. (D) tem moda igual a 0,30. (E) tem mediana maior que a média. Curso DSc Página 34 Agência Nacional do Petróleo, Gás Natural e Biocombustíveis (ANP) - 2008 Especialidade: Economia 46) A figura mostra a distribuição de probabilidades de uma variável aleatória X. A distribuição apresentada acima NÃO (A) é bimodal. (B) é simétrica. (C) tem mediana igual a 2. (D) tem primeiro quartil igual a 1. (E) tem média igual à moda. Resp.: Dado que X é uma variável aleatória contínua, a moda será determinada pelo valor assumido por X ao qual associamos o maior valor da função densidade de probabilidade (FDP). Nesta questão, aos valores X = 1 e X = 3 associamos o valor 0,5 para a FDP, isto é, f(1) = 0,5 = f(3), e, portanto, a distribuição é bimodal e os valores 1 e 3 suas modas. Podem ser identificados 2 triângulos na figura dada; como suas áreas são iguais a 50%, então o valor X = 2 determina dois subintervalos, um à esquerda e outro à direita, aos quais associamos probabilidades iguais a 50%, ou seja, 2 é a mediana. Notemos, ainda, que, em relação à vertical que passa pelo ponto x = 2, o gráfico do FDP é simétrico. O 1º quartil é igual a 1, porque P(X < 1) = 25%. Por último, a média: vale notar que a FDP é definida por Curso DSc Página 35 47) Três dados comuns, honestos, são lançados seqüencialmente. Se o resultado S1 do primeiro dado for igual a 3, a distribuição de probabilidades da soma dos três resultados, condicional a S1 = 3, terá moda igual a (A) 11 (B) 10 (C) 9 (D) 7 (E) 1/6 Resp.: Quando elencamos todos os resultados possíveis para o lançamento dos 2 últimos dados, obtemos: (1,1), (1,2), (1,3), (1,4), (1,5), (1,6) (2,1), (2,2), (2,3), (2,4), (2,5), (2,6) (3,1), (3,2), (3,3), (3,4), (3,5), (3,6) (4,1), (4,2), (4,3), (4,4), (4,5), (4,6) (5,1), (5,2), (5,3), (5,4), (5,5), (5,6) (6,1), (6,2), (6,3), (6,4), (6,5), (6,6) Assim, quando tomamos os 2 últimos dados, o valor para a soma dos resultados que ocorre com maiorfrequência é o número 7, ou seja, 7 é a moda da variável soma dos valores obtidos no lançamento de 2 dados. Como tomamos o valor 3 para o resultado do 1º lançamento, então a moda (condicional a S1 = 3) será igual a 10 (= 3 + 7). 48) A tabela abaixo mostra a distribuição de freqüência dos vinte empregados de uma empresa, de acordo com as suas idades. Idade (em anos) Número de empregados 27 4 28 1 30 2 34 5 37 2 42 3 48 3 Curso DSc Página 36 Dois empregados diferentes são escolhidos em seqüência, aleatoriamente, para representar a empresa num determinado evento. Qual a probabilidade de que ambos tenham 34 anos? (A) 5/20 (B) 5/34 (C) 2/20 (D) 2/34 (E) 1/19 49) A variável aleatória X tem uma distribuição de probabilidade contínua e uniforme entre 0 e 2. A probabilidade de que uma realização de X ocorra entre 0.9 e 1.1 é (A) nula. (B) menor que 10%. (C) igual a 10%. (D) maior que 20%. (E) maior que um desvio padrão. Resp.: A v.a. X tem distribuição uniforme no intervalo (a, b) se sua f.d.p. é dada por Assim, para esta questão, e, portanto, P(0,9 < X < 1,1) = Especialidade: Geral I 50) Para estudar o desempenho dos preços da gasolina nas cinco regiões geográficas do país, selecionou-se uma amostra aleatória de postos de combustíveis em cada uma dessas regiões. Para cada posto selecionado computou-se o preço do litro da gasolina em um determinado período. Os resultados estatísticos, expressos em reais, encontram-se resumidos na tabela a seguir. R e g iã o g e o g rá fi c a N ú m e ro d e o b s e rv a ç õ e s M é d ia M e d ia n a D e s v io p a d rã o 1 º q u a rt il 3 º q u a rt il M e n o r p re ç o M a io r p re ç o Norte 38 2,69 2,79 0,54 2,52 2,84 2,33 2,89 Nordeste 34 2,62 2,62 0,52 2,35 2,66 2,35 2,89 Centro- oeste 36 2,66 2,58 0,65 2,34 2,69 2,34 2,88 Curso DSc Página 37 Sudeste 38 2,59 2,4 0,52 2,33 2,48 2,31 2,88 Sul 36 2,47 2,46 0,25 2,38 2,49 2,35 2,89 Com base nas informações e na análise da tabela acima, pode-se afirmar que: I - Os preços da região Sul são bem representados pelo preço médio, visto que a distribuição é homogênea, pois apresenta coeficiente de variação de aproximadamente 10%. II - Os preços da região Centro-Oeste são melhor representados pelo preço médio, pois esta região apresenta o maior desvio padrão entre todas as regiões. III - Nas regiões Sudeste e Sul existe, em cada uma, pelo menos um posto de combustível que adota um preço considerado outlier, utilizando-se como critério os limites inferiores e superiores obtidos em função dos quartis. Está(ão) correta(s) a(s) afirmação(ões) (A) I, apenas. (B) II, apenas. (C) I e III, apenas. (D) II e III, apenas. (E) I, II e III. Resp.: O coeficiente de variação (CV) de uma variável aleatória X, definido por: É uma medida de dispersão adimensional, ou seja, não possui unidade e, portanto, pode ser utilizada para comparar dispersões entre dados com unidades distintas (por exemplo, centímetros (cm) e quilograma (kg)). Como o valor do CV é sempre uma proporção da média (notem que o denominador da razão que o define é dado pela média), é uma medida relativa. Na questão em tela, o coeficiente de variação da Região Sul é aproximadamente igual a 10% (0,25/,247); parece razoável considerar, para esta pesquisa, 10% como um valor pequeno para o coeficiente de variação e, portanto, com base em tal consideração, um valor que representa uma pequena dispersão, o que nos permite elencar o preço médio (ou seja, a média) como um bom representante para a os preços de tal Região. Não há na literatura um intervalo de valores para os quais a distribuição é considerada homogênea; isso dependerá do problema em análise. A afirmação contida no item II não faz sentido, pois o maior desvio padrão representa a maior dispersão dos dados em relação à media. Com base na Questão de nº 19, são considerados outliers os pontos situados fora do intervalo definido por (1º quartil – 1,5 x DIQ, 3º quartil + 1,5 x DIQ), onde DIQ denota a distância interquartil. i) Região Sudeste 1º quartil: 2,33 3º quartil: 2,48 Curso DSc Página 38 DIQ: 0,15 (1,5 x DIQ = 0,225) Intervalo: (2,105; 2,705) Valor máximo: 2,88 (outlier) ii) Região Sul 1º quartil: 2,38 3º quartil: 2,49 DIQ: 0,11 (1,5 x DIQ = 0,165) Intervalo: (2,215; 2,655) Valor máximo: 2,89 (outlier) Como o item II está errado e o item III está certo, somos levados a optar pela opção C. 51) Em um determinado município, 20% de todos os postos de gasolina testados quanto à qualidade do combustível apontaram o uso de combustíveis adulterados. Ao serem testados, 99% de todos os postos desse município que adulteraram combustível foram reprovados, mas 15% dos que não adulteraram também foram reprovados, ou seja, apresentaram um resultado falso-positivo. A probabilidade de um posto reprovado ter efetivamente adulterado o combustível é, aproximadamente, (A) 0,62 (B) 0,50 (C) 0,32 (D) 0,20 (E) 0,12 52) Certo distribuidor, ao comercializar um novo aditivo, assegura que este faz reduzir o consumo de combustível. Com o objetivo de testar tal afirmação, selecionou-se uma amostra aleatória de 36 carros de diversos modelos, que fizeram o mesmo percurso, nas mesmas condições, com o combustível sem aditivo e depois, com aditivo. A média da diferença entre o consumo (sem aditivo menos com aditivo) fornecido pela amostra foi de 0,2 litros e desvio padrão amostral de 0,01 litros de combustível. Como o p-valor desse teste é aproximadamente 0,10%, nos níveis de 1%, 5% e 10% de significância, respectivamente, conclui-se que o novo aditivo (A) (B) (C) (D) (E) α=1% α=5% α=10% não reduz o consumo não reduz o consumo não reduz o consumo não reduz o consumo reduz o consumo reduz o consumo não reduz o consumo não reduz o consumo reduz o consumo reduz o consumo não reduz o consumo não reduz o consumo reduz o reduz o reduz o Curso DSc Página 39 consumo consumo consumo Resp.: A construção de um teste de hipóteses, para um parâmetro populacional, pode ser colocada do seguinte modo. Existe uma variável X associada a dada população e tem-se uma hipótese sobre determinado parâmetro θ dessa população. Por exemplo, afirmamos que o verdadeiro valor de θ é θ0. Colhe-se uma amostra aleatória de elementos dessa população, e com ela deseja-se comprovar ou não tal hipótese. Qualquer que seja a decisão tomada em um teste de hipóteses estamos sujeitos a cometer erros. Para facilitar a linguagem, introduzimos as definições: Erro de tipo I: rejeitar a hipótese nula quando essa é verdadeira. Chamamos de α a probabilidade de cometer esse erro, isto é, α = P(erro do Tipo I) = P (rejeitar H0 / H0 é verdadeira). Erro de tipo II: não rejeitar H0 quando H0 é falsa. A probabilidade de cometer esse erro é denotada por β, logo β = P(erro do Tipo II) = P (não rejeitar H0 / H0 é falsa). O objetivo do teste de hipóteses é dizer, usando uma estatística , se a hipótese H0 é ou não aceitável. Operacionalmente, essa decisão é tomada através da consideração de uma região crítica RC. Caso o valor observado da estatística pertença a essa região, rejeitamos H0; caso contrário, não rejeitamos H0. Esta região é construída de modo que P( RC / H0 é verdadeira) seja igual a α, fixado a priori. RC recebe o nome de região crítica ou região de rejeição do teste. Um fato importante a ressaltar é que a região crítica é sempre construída sob a hipótese de H0 ser verdadeira. A determinação do valor de β já é mais difícil, pois usualmente não especificamos valores fixos para o parâmetro sob a hipótesealternativa. A probabilidade α de se cometer um erro do tipo I (ou de primeira espécie) é um valor arbitrário e recebe o nome de nível de significância do teste. O resultado da amostra é tanto mais significante para rejeitar H0 quanto menor o esse nível α. Ou seja, quanto menor for α, menor é a probabilidade de se obter uma amostra com estatística pertencente à região crítica, sendo pouco verossímil a obtenção de uma amostra da população para a qual H0 seja verdadeira. Usualmente, o valor de α é fixado em 5%, 1% ou 0,1%. Devemos tomar como H0 aquela hipótese que, rejeitada, conduza a um erro de tipo I mais importante de evitar. Vejamos um exemplo. Suponha um experimento para se determinar se um produto A é ou não cancerígeno. Após realizado o teste, podemos concluir: (i) A é cancerígeno ou (ii) A não é cancerígeno. Cada uma dessas conclusões pode estar errada e temos os dois Curso DSc Página 40 tipos de erros já mencionados, dependendo de qual hipótese seja H0. Do ponto de vista do usuário do produto, a hipótese a ser testada deve ser H0: A é cancerígeno, pois a probabilidade de erro na rejeição dessa hipótese, se ela for verdadeira, deve ser um valor muito pequeno. Assim, vamos tomar a hipótese H0: o aditivo não reduz o consumo de combustível. Uma dos métodos de construção de um teste de hipóteses parte da fixação do nível de significância α. Pode-se argumentar que esse procedimento pode levar à rejeição da hipótese nula para um valor de α e à não-rejeição para um valor menor. Outra maneira de proceder consiste em apresentar a probabilidade de significância ou nível descritivo ou ainda p-valor do teste. A principal diferença está em não construir a região crítica. O que se faz é indicar a probabilidade de ocorrer valores da estatística mais extremos do que o observado, sob a hipótese de H0 ser verdadeira. Nesta questão, o p-valor é igual a 0,01% e somente considere níveis de significância (α) maiores do que este valor. Logo, para os 3 casos, H0 será rejeitada. Caixa Econômica Federal - 2008 Para responder às questões de nos 53 e 54, utilize os dados da tabela abaixo, que apresenta as freqüências acumuladas das idades de 20 jovens entre 14 e 20 anos. Idade (anos) Frequência acumulada 14 2 15 4 16 9 17 12 18 15 19 18 20 20 Curso DSc Página 41 53) Um desses jovens será escolhido ao acaso. Qual a probabilidade de que o jovem escolhido tenha menos de 18 anos, sabendo que esse jovem terá 16 anos ou mais? (A) 8/14 (B) 8/16 (C) 8/20 (D) 3/14 (E) 3/16 54) Uma das medidas de dispersão é a variância populacional, que é calculada por Sabendo-se que m é a média aritmética dessas idades, qual a variância das idades na população formada pelos 20 jovens? (A) 0,15 (B) 0,20 (C) 1,78 (D) 3,20 (E) 3,35 Petrobras – 2008 Área: Economia 55) Dois dados comuns, “honestos”, são lançados simultaneamente. A probabilidade do evento “a soma dos valores dos dados é ímpar e menor que 10” é igual a (A) 4/11 (B) 17/36 (C) 4/9 (D) 12/36 (E) 3/8 Área: Estatística (Júnior) 56) Um estudante marca, ao acaso, as respostas de um teste de 10 questões de múltipla escolha, com 4 alternativas por questão. O número mais provável de acertos é (A) 1,5 (B) 2,0 (C) 2,5 (D) 3,0 (E) 3,5 57) Os quartis das notas de um exame nacional foram calculados e estão apresentados a seguir. Q1 = 46 , Q2 = 50 e Q3 = 65 Um aluno que tirou a nota 46 está entre os (A) 15% dos melhores alunos. (B) 25% dos melhores alunos. (C) 35% dos melhores alunos. (D) 50% dos melhores alunos. (E) 75% dos melhores alunos. 58) Sejam X1 e X2 componentes de um vetor aleatório X, de dimensão 2 x 1, com distribuição normal multivariada. A condição necessária e suficiente para que X1 + X2 e X1-X2 sejam independentes é que (A) Var (X1) = 2 Var (X2) (B) Var (X1) = Var (X2) (C) Var (X1 + X2) = Var (X1 - X2) (D) Cov (X1, X2) = 0 (E) 2 Var (X1) = Var (X2) Resp.: Sejam as variáveis X e Y com distribuição normal, então uma nova variável formada a partir da combinação linear de X e Y, aX + bY + c, também Curso DSc Página 42 tem distribuição normal. Com base neste resultado e no enunciado do problema, as variáveis X1 + X2 e X1-X2 são normalmente distribuídas. Ver questão de nº 1. Sejam X1 e X2 duas variáveis aleatórias; caso sejam independentes, então podemos afirmar que a covariância (correlação) entre elas é igual a zero; a recíproca nem sempre é verdadeira, ou seja, a covariância (correlação) entre X1 e X2 pode ser igual a zero, mas essas variáveis podem ser dependentes. Quando temos uma distribuição normal multivariada, afirmar que duas variáveis aleatórias são independentes equivale a afirmar que possuem covariância (correlação) igual a zero. Vimos que para variáveis aleatórias quaisquer X e Y temos que: cov(X,Y) = Assim, do exposto acima, X1+X2 e X1-X2 são independentes se, e somente se, cov (X1 + X2, X1 - X2) = 0, ou seja, 0 = cov(X1 + X2, X1 - X2) = Var(X1) – Var(X2). Logo, X1+X2 e X1-X2 são independentes se, e somente se, Var(X1) = Var(X2). BNDES – 2008 Área: Engenharia 59) Para um estudo sobre a distribuição de salário mensal dos empregados de uma empresa foram coletados os salários de uma amostra aleatória de 50 empregados. Os resultados amostrais levaram à construção da distribuição de freqüência abaixo. Não existem observações coincidentes com os extremos das classes. Média Amostral (em salários mínimos) Frequência relativa acumulada 1 - 3 40 3 – 5 70 5 – 7 90 7 – 11 100 Curso DSc Página 43 A média aritmética e a variância amostral da distribuição valem, aproximadamente, (A) (B) (C) (D) (E) Média amostral (em salários mínimos) Variância amostral (em salários mínimos2) 2,6 2,2 2,6 2,9 4,1 2,9 4,1 5,0 7,2 12,1 60) O gráfico a seguir mostra, em percentuais, a distribuição do número de mulheres de 15 anos ou mais de idade, segundo o número de filhos, no Brasil. Selecionando-se aleatoriamente um filho dessa população, a probabilidade de que ele seja filho único é, aproximadamente, (A) 17/55 (B) 17/71 (C) 17/100 (D) 17/224 (E) 17/1000 61) Considere o seguinte teste de hipótese para a proporção populacional p: Para uma amostra de tamanho n=12, construiu-se a região crítica RC = {0, 1, 11, 12}. O poder do teste para p = 0,5 é (A) 26 . 0,512 (B) 13 . 0,512 (C) 12 . 0,512 (D) 2 . 0,512 (E) 0,512 Petrobras Distribuidora S.A. – 2008 Área: Administração Júnior Curso DSc Página 44 Considere as informações abaixo para responder às questões de nos 62, 63 e 64. A tabela abaixo apresenta os pesos de um grupo de pessoas e suas respectivas freqüências. Não há observações coincidentes com os extremos das classes. Classes (em kgf) Frequência 40 ├ 50 2 50 ├ 60 5 60 ├ 70 7 70 ├ 80 8 80 ├ 90 3 62) O peso médio do conjunto de pessoas, em kgf, é (A) 60 (B) 65 (C) 67 (D) 70 (E) 75 63) O valor aproximado, em kgf, do peso mediano do conjunto de pessoas é (A) 67 (B) 68 (C) 69 (D) 70 (E) 71 64) Uma pessoa com mais de 50 kgf será escolhida ao acaso. A probabilidade de que o peso dessa pessoa esteja entre 60 kgf e 80 kgf é, aproximadamente, (A) 65% (B) 63% (C) 60% (D) 58% (E) 55% 65) Um grupo é formado por 7 mulheres, dentre as quais está Maria, e 5 homens, dentre os quais está João. Deseja-se escolher 5 pessoas desse grupo, sendo 3 mulheres e 2 homens. De quantas maneiras essa escolha pode ser feita de modo que Maria seja escolhida e João, não? (A) 60 (B) 90 (C) 126 (D) 150 (E) 210 66) Em um grupo de 40 pessoas adultas, a idade média é 30 anos. A idade média doshomens desse grupo é 36 anos, enquanto a média das idades das mulheres é 26 anos. O número de homens nesse grupo é (A) 24 (B) 22 (C) 20 (D) 18 (E) 16 67) Do total de funcionários de uma empresa, foi retirada uma amostra de seis indivíduos. A tabela abaixo apresenta o tempo trabalhado na empresa, em anos completos, por cada um deles. 3 7 2 2 3 1 A variância dessa amostra é (A) 3,7 (B) 4,0 (C) 4,4 (D) 5,0 (E) 5,5 Curso DSc Página 45 Área: Economia 68) Suponha que os dez números abaixo (entre parênteses) foram retirados aleatoriamente de uma urna, sucessivamente, mas com reposição (1, 2, 3, 3, 5, 3, 4, 8, 4, 1) Nesta amostra, é correto afirmar que o(a) (A) desvio padrão é igual a 8. (B) mediana é 8. (C) média é igual à moda. (D) média é 1. (E) moda é 3. 69) Se X e Y são variáveis aleatórias não independentes e E( ) indicar o operador Esperança Matemática, a única expressão INCORRETA é (A) E(X) E(X) = (E (X))2 (B) E (3 + Y) = 3 + E (Y) (C) E (3X) = 3 E (X) (D) E (XY) = E (X) E (Y) (E) E (3 XY) = 3E (XY) 70) A figura abaixo mostra a distribuição de uma variável aleatória discreta X. Esta distribuição é (A) normal. (B) bimodal. (C) simétrica. (D) uniforme. (E) de desvio padrão igual a 4. Tribunal de Justiça do Estado de Rondônia (TJ-RO) – 2008 Área: Economia 71) Dois dados comuns, “honestos”, são lançados simultaneamente. A probabilidade de que a soma dos resultados seja igual ou maior que 11 é (A) 11/12 (B) 1/6 (C) 1/12 (D) 2/36 (E) 1/36 Resp.: Quando elencamos todos os resultados possíveis para o lançamento dos 2 últimos dados, obtemos: (1,1), (1,2), (1,3), (1,4), (1,5), (1,6) (2,1), (2,2), (2,3), (2,4), (2,5), (2,6) (3,1), (3,2), (3,3), (3,4), (3,5), (3,6) (4,1), (4,2), (4,3), (4,4), (4,5), (4,6) (5,1), (5,2), (5,3), (5,4), (5,5), (5,6) (6,1), (6,2), (6,3), (6,4), (6,5), (6,6) Curso DSc Página 46 Em negrito, seguem os resultados cuja soma é maior do que ou igual a 11. Logo, p = 3/36 = 1/12. 72) Uma urna contém dez bolas, cada uma gravada com um número diferente, de 1 a 10. Uma bola é retirada da urna aleatoriamente e X é o número marcado nesta bola. X é uma variável aleatória cujo (a) (A) desvio padrão é 10. (B) primeiro quartil é 0,25. (C) média é 5. (D) distribuição de probabilidades é uniforme. (E) distribuição de probabilidades é assimétrica. Resp.: A variável aleatória X assume os valores 1, 2, ..., 9, 10; a todos eles associamos probabilidade igual a 1/10. Logo, temos uma variável aleatória discreta uniformemente distribuída, que é simétrica, pois a todos os pontos eqüidistantes da média associamos igual probabilidade. Para exercitar, vamos aos cálculos: (X) = Variância (X) = (X2) – [ (X)]2 = + 5,52 = + 5,52 = 38,5 – 30,25 = 8,25 Desvio padrão (X) = = 2,87. Nota) Foram utilizados os seguintes resultados: 1 + 2 + ... + n = 12 + 22 + ... + n2 = 73) Sendo y um erro de medida expresso em milímetros, y é uma variável aleatória cuja variância (A) não pode ser calculada se a distribuição de y for contínua. (B) é a raiz quadrada do desvio padrão de y. (C) é uma grandeza sem unidades. (D) é o dobro da média de y. (E) mede a dispersão de y em torno de sua média. Ministério da Defesa – Comando da Aeronáutica – Departamento de Controle Aéreo (DECEA) - 2009 Área: Ciências Econômicas 74) A probabilidade de que, no lançamento de três dados comuns, honestos, a soma dos resultados seja igual a 18 é (A) 1/12 (B) 1/36 (C) 1/216 (D) 3/18 (E) 3/216 Curso DSc Página 47 75) Uma amostra dos pesos (em kg e sem casas decimais) dos bebês, nascidos em certa maternidade, é composta de 10 observações: 2, 2, 4, 3, 2, 4, 3, 5, 3, 2. Nesta amostra, o(a) (A) coeficiente de correlação é -0,5. (B) desvio padrão é 4. (C) moda é 2. (D) média é menor que a moda. (E) mediana é 5. Tribunal de Contas do Estado de Rondônia (TCE - RO) – 2007 Função: Estatística O enunciado a seguir refere-se às questões de nos 76 e 77. Recente pesquisa para avaliar o percentual de eleitores favoráveis a um candidato a senador foi realizada de acordo com um plano de amostragem aleatória simples, sendo a amostra extraída de uma população infinita. O resultado apontou uma intenção de votos no candidato na ordem de 45%. 76) Considerando que a margem de erro foi de 2 pontos percentuais, para mais ou para menos, quantos eleitores foram ouvidos, se o nível de confiança utilizado foi de 95%? (A) 1 247 (B) 1 684 (C) 1 820 (D) 2 377 (E) 2 642 77) Caso uma amostra de 100 eleitores fosse utilizada, o intervalo aproximado de 95% de confiança para a preferência dos eleitores nesse candidato seria: (A) 45% ± 6% (B) 45% ± 8% (C) 45% ± 10% (D) 45% ± 12% (E) 45% ± 14% Resp.: Vimos no texto que se P então ; como o papel de é desempenhado por , então o intervalo de confiança procurado é dado por ; como = 45% e = 0,05 então ]45% - 1,96 x 0,05, 45% + 1,96 x 0,05[ ]45% - 10%, 45% + 10%. O enunciado a seguir refere-se às questões de nos 78 e 79. Um pesquisador avaliou se a pressão sangüínea dos candidatos do último Concurso para um Tribunal de Contas se alterava no início da prova. Em condições normais, sem stress, os candidatos entre 18 e 32 anos apresentaram uma pressão sistólica média de 120 mm Hg. Após medir a pressão de 36 candidatos a cinco minutos do início da prova, foi encontrada a pressão sistólica média de 125,2 mm Hg com desvio padrão amostral de 12 mm Hg. Deve-se testar: 78) O valor calculado da estatística t é: (A) 2,60 (B) 0,43 (C) 0,01 (D) – 0,43 (E) – 2,60 79) Nos níveis de significância de 5% e 10%, é correto afirmar que a(o): Curso DSc Página 48 (A) hipótese nula é aceita em ambos os níveis. (B) hipótese nula é rejeitada em ambos os níveis. (C) hipótese nula é rejeitada em 5% e aceita em 10%. (D) hipótese nula é aceita em 5% e rejeitada em 10%. (E) teste é inconclusivo. 80) Se X1, X2, ..., Xn, Y1, Y2, ..., Yn são variáveis aleatórias independentes e com distribuição normal reduzida, então a variável aleatória tem distribuição: (A) normal. (B) qui-quadrado com n - 1 graus de liberdade. (C) t de Student com n graus de liberdade. (D) F com (n - 1, n - 1) graus de liberdade. (E) F com (n, n) graus de liberdade. Resp.: Uma variável aleatória X tem distribuição qui-quadrado com graus de liberdade, , quando sua função densidade de probabilidade (FDP) é dada por onde denota a função gama: Para , a função gama nos dá que em particular, para um inteiro positivo n, temos que = (n-1)! Se Z~N(0,1), então Z2 ~ . Se X1, ..., Xn são independentes e Xi ~ , então X1 + ... + Xn ~ , ou seja, a soma de variáveis independentes com distribuição qui-quadrado tem distribuição qui-quadrada. Curso DSc Página 49 Seja X1, ..., Xn uma amostra aleatória de uma distribuição normal N(μ, σ 2). A variável tem distribuição t-Student com n-1 graus de liberdade. Equivalentemente, uma variável aleatória T tem distribuição t-Student com graus de liberdade, T ~ , se tem FDP dada por: Sejam as variáveis aleatórias independentes X e Y, com X e Y ; então a variável tem distribuição F (F de Snedecor) com m e n graus de liberdade, Fm,n. Equivalentemente, uma variável aleatória F tem distribuição F com m e n graus de liberdade se sua FDP é dada por:Se X ~ Fm,n, então Fn,m. Se X ~ , então X 2 ~ Petroquímica SUAPE (Companhia Petroquímica de Pernambuco) – 2009 Função: Operador Júnior 81) Em um grupo de 20 pessoas, 15 tomaram suco e 12 comeram biscoitos. Sabendo-se que todas as pessoas do grupo realizaram, pelo menos, uma dessas ações, quantas pessoas tomaram suco e também comeram biscoitos? (A) 3 (B) 4 (C) 5 D) 6 (E) 7 Resp.: Vamos utilizar os Diagramas de Euller-Venn: Curso DSc Página 50 Como há um total de 20 pessoas, então: 20 = (15 – x) + x + (12 – x) x = 7. Função: Operador Pleno 82) Para calcular a média de Pedro, em Matemática, são consideradas três notas. A primeira tem peso 1, a segunda, peso 2 e a terceira, peso 3. Pedro obteve a mesma nota nas duas primeiras avaliações e a nota da terceira avaliação foi 0,8 ponto maior do que a da segunda. Se a média de Pedro foi 7,6, a sua nota na terceira avaliação foi (A) 7,2 (B) 7,5 (C) 7,8 (D) 8,0 (E) 8,3 IBGE – 2009 Área de conhecimento: Todos os cargos exceto Estatística e Letras Português - Inglês Leia o texto a seguir para responder às questões de nos 83 e 84. A tabela abaixo apresenta a distribuição de frequências das idades de um grupo de crianças. 83) A média das idades dessas crianças, em anos, é (A) 5,0 (B) 5,2 (C) 5,4 (D) 5,6 (E) 5,8 84) A mediana da distribuição de frequências apresentada é (A) 5,5 (B) 5,6 (C) 5,7 (D) 5,8 (E) 5,9 85) No último mês, Alípio fez apenas 8 ligações de seu telefone celular cujas durações, em minutos, estão apresentadas no rol abaixo. 5 2 11 8 3 8 7 4 Curso DSc Página 51 O valor aproximado do desvio padrão desse conjunto de tempos, em minutos, é (A) 3,1 (B) 2,8 (C) 2,5 (D) 2,2 (E) 2,0 86) Três dados comuns e honestos serão lançados. A probabilidade de que o número 6 seja obtido mais de uma vez é (A) 5/216 (B) 6/216 (C) 15/216 (D) 16/216 (E) 91/216 87) Lança-se uma moeda honesta três vezes. Sejam os eventos: A = {sair duas caras ou três caras} e B = {os dois primeiros resultados são iguais} Nessas condições, tem-se que (A) P(A) = 0,25; P(B) = 0,25; A e B não são independentes e não são mutuamente exclusivos. (B) P(A) = 0,25; P(B) = 0,25; A e B são independentes e não são mutuamente exclusivos. (C) P(A) = 0,5; P(B) = 0,25; A e B não são independentes e não são mutuamente exclusivos. (D) P(A) = 0,5; P(B) = 0,5; A e B são independentes e não são mutuamente exclusivos. (E) P(A) = 0,5; P(B) = 0,5; A e B não são independentes e não são mutuamente exclusivos. 88) Sejam X1, X2, X3 variáveis aleatórias independentes, todas com média 100 e variância 100. O valor esperado e a variância Z = são, respectivamente, (A) 100 e 100 (B) 100 e (C) 100 e (D) 0 e (E) 0 e Resp.: Sejam as variáveis aleatórias X, Y e Z e as constantes “a”, “b”, “c” e “d”. Temos os seguintes resultados para a média e para a variância: Var Assim, para esta questão, temos: Curso DSc Página 52 pois as covariâncias são iguais a zero dada a independência entre as variáveis. 89) Um comitê é formado por três pesquisadores escolhidos dentre quatro estatísticos e três economistas. A probabilidade de não haver nenhum estatístico é (A) 1/35 (B) 4/35 (C) 27/243 (D) 64/243 (E) 3/7 90) Sejam X e Y duas variáveis aleatórias independentes, correspondendo às medições realizadas por dois diferentes operadores. Essas variáveis aleatórias possuem a mesma média, mas as variâncias são diferentes, σ e σ , respectivamente. Deseja-se calcular uma média ponderada dessas duas medições, ou seja, Z = kX + (1-k)Y. O valor de k que torna mínima a variância de Z é (A) (B) (C) (D) (E) Resp.: Dada a função quadrática, f, da forma f(x) = ax2 + bx + c, temos que: 1) Para a > 0: o maior valor de f é alcançado quando x = , no qual temos f , onde ; e 2) Para a < 0: o menor valor de f é alcançado quando x = , no qual temos f , onde . (Ver Questão 88) Var(Z) = Var(kX + (1-k)Y) = k2Var(X) + (1-k)2Var(Y) = K2σ + (1-k)2σ = σ σ k2 - 2σ k + σ dada a independência entre as variáveis X e Y. Tomando Var(Z) como uma função quadrática na variável K, temos que o seu valor mínimo (supondo > 0) é alcançado quando k = σ σ σ σ σ σ 91) Em uma empresa, por experiências passadas, sabe-se que a probabilidade de um funcionário novo, o qual tenha feito o curso de capacitação, cumprir sua cota de produção é 0,85, e que essa probabilidade é 0,40 para os funcionários novos que não tenham feito o curso. Se 80% de todos os funcionários novos cursarem as aulas de capacitação, a probabilidade de um funcionário novo cumprir a cota de produção será (A) 0,48 (B) 0,50 (C) 0,68 (D) 0,76 (E) 0,80 92) Considere uma variável aleatória X com função de distribuição dada por F(x) = 0, x<0. = 1-e-2x, x ≥ 0. A função de densidade que representa esta variável é (A) f(x) = (B) f(x) = (C) f(x) = 0,5 (D) f(x) = (E) f(x) = Curso DSc Página 53 93) Suponha que as notas dos candidatos de um concurso público, em uma certa prova, sigam distribuição normal com média 7 e desvio padrão 1. A relação candidato/vaga é de 40 para 1. A nota mínima necessária para aprovação nessa prova é (A) 8,65 (B) 8,96 (C) 9,37 (D) 9,58 (E) 9,75 94) O intervalo de tempo entre a chegada de dois navios a um porto, em horas, segue distribuição exponencial com média 1. Se acaba de chegar um navio, qual a probabilidade aproximada de que leve mais de uma hora até a chegada do próximo? (A) 0,37 (B) 0,5 (C) 0,63 (D) 0,75 (E) 0,9 Resp.: Dizemos que uma variável aleatória X tem distribuição exponencial com parâmetro λ, X ~ Exp(λ), quando sua função densidade de probabilidade (FDP) é dada por Temos que , e P(X < x) = . A distribuição exponencial pode ser usada para modelar tempo de vida e possui a propriedade da “falta de memória”: se X ~ Exp(λ), então para s > t ≥ 0, P(X > s / X > t) = P(X > s - t), pois Na questão em tela, seja X a variável aleatória representativa do intervalo de tempo entre a chegada de dois navios a um porto, em horas: X ~ Exp(1). Dada a propriedade da falta de memória, temos que P(X>1) = 0,368. BNDES (2009) Área: Administração 95) O rótulo das garrafas de certo refrigerante indica que o seu conteúdo corresponde ao volume de 290 mL. A variável aleatória que representa o volume de líquido no interior dessas garrafas é X. A máquina que enche essas garrafas o faz segundo uma distribuição normal, com média μ e variância igual a 36 mL2, qualquer que seja o valor de μ. A máquina foi regulada para μ = 290 Curso DSc Página 54 mL. Semanalmente, uma amostra de 9 garrafas é colhida para verificar se a máquina está ou não desregulada para mais ou para menos. Para isso, constrói-se um teste de hipótese bilateral no qual X ~ N (μ , 36) H0 (Hipótese Nula): μ = 290 mL H1 (Hipótese Alternativa): μ ≠ 290 mL O nível de significância do teste foi fixado em α. A hipótese nula não será rejeitada se a média apresentada pela amostra estiver entre 285,66 mL e 294,34 mL. Logo, α é
Compartilhar