Baixe o app para aproveitar ainda mais
Prévia do material em texto
Probabilidade e estatística Entrevistas UFRJ - Departamento de Engenharia Industrial - 2011-1. EEI201 Probabilidade e Estatística. Turmas 3309 (Petróleo) e 4166 (Produção). Professor José Miguel. Monitores Marcelo e Ricardo Roteiro da Entrevista nº 1. 1) Texto-base Costa Neto, "Estatística", Capítulos 1 e 2 e Apêndice 2. 2) Tópicos e possíveis questões a) Universo, variável, população, amostra. a1) Que diferentes sentidos costumam ser atribuídos, no contexto da ciência Estatística, às expressões "população" e "universo"? Comente e dê exemplos. a2) O que é uma amostra? Para que serve? b) Tipos de variáveis; interpretação dos valores de uma variável conforme o tipo. b1) Que tipos de variáveis existem? Dê exemplos. b2) Uma variável cujos valores são expressos por números é necessariamente quantitativa? b3) Por que os valores de uma variável discreta não podem ser interpretados da mesma forma que os de uma variável contínua? c) Frequência, frequência relativa e frequência acumulada; distribuição de frequência. c1) O que é uma distribuição de frequência? c2) Variáveis qualitativas têm frequências acumuladas? Por que? E frequências relativas? d) Gráficos para frequências e frequências acumuladas. d1) O que deve ser levado em conta ao escolher o tipo de gráfico adequado a uma determinada variável? d2) Que vantagens e desvantagens comparativas têm o histograma e o polígono de frequências? e) Agrupamento em classes; limites aparentes e limites reais das classes. e1) Que critérios devem ser adotados ao agrupar valores em classes? e2) Para que servem os limites aparentes? E os reais? e3) Como identificar se os limites das classes são reais ou aparentes? f) Medidas de posição: média aritmética, mediana e moda. f1) A média aritmética é uma medida do centro da distribuição melhor do que a mediana? Por que? f2) Quais são as propriedades mais importantes da média aritmética? g) Codificação de dados. g1) O que é e para que serve a codificação de dados? h) Medidas de dispersão: amplitude, variância e desvio-padrão; correção de Sheppard. h1) A variância mede a dispersão de um conjunto de dados melhor do que a amplitude? Por que? h2) Quais são as propriedades mais importantes da variância? h3) Quando deve ser usada a correção de Sheppard? Por que? i) Momentos; medidas de assimetria e curtose. i1) O que são momentos absolutos e momentos centrais e para que servem? i2) O que são assimetria e curtose? i3) Qual é o efeito da codificação de dados nos coeficientes de assimetria e curtose? a) Universo, variável, população, amostra. a1) Que diferentes sentidos costumam ser atribuídos, no contexto da ciência Estatística, às expressões "população" e "universo"? Comente e dê exemplos. Na ciência estatística, o “universo” é um conjunto de objetos com alguma característica em comum, enquanto a “população” é o conjunto de valores de uma variável. Ex: Universo: a turma de 45 alunos de ProbEst EP1. População: Gama de valores das alturas dos alunos. a2) O que é uma amostra? Para que serve? Uma amostra é um subconjunto finito de uma população. Ela serve para, através do pensamento indutivo ou dedutivo descobrimos informações sobre toda a população, ou sobre a própria amostra, sem precisarmos analisar todas as informações. Indução: Amostra População. Dedução: População Amostra. b) Tipos de variáveis; interpretação dos valores de uma variável conforme o tipo. b1) Que tipos de variáveis existem? Dê exemplos. Variáveis Quantitativas (discretas (conjunto de valores é finito ou infinito enumerável) ou contínuas (conjunto de valores possíveis pertence a !R ou intervalo de !R) e Qualitativas. Ex: Quantitativas Alturas, ano de nascimento, renda familiar, quantidade de disciplinas na qual está inscrito. Qualitativas: Cor dos olhos e DRE. b2) Uma variável cujos valores são expressos por números é necessariamente quantitativa? Não. Como exemplo nós podemos citar o DRE. É um número, mas não é uma quantidade. b3) Por que os valores de uma variável discreta não podem ser interpretados da mesma forma que os de uma variável contínua? Porque as freqüências obtidas vão se associar a classes de freqüências e não a valores individuais. c) Freqüência, freqüência relativa e freqüência acumulada; distribuição de freqüência. c1) O que é uma distribuição de freqüência? Distribuição de freqüência é um método de se agrupar dados de acordo com certo critério (classes...) de modo a fornecer a quantidade (e/ou percentagem) de dados correspondentes a cada classe. c2) Variáveis qualitativas têm freqüências acumuladas? Por quê? E freqüências relativas? Possuem freqüências relativas. Não possuem acumuladas, pois a não faz sentido a análise dos valores, já que eles não envolvem um tipo de ordenação. Ex: Quando classificamos as pessoas quanto à religião, não faz sentido dizer: há n pessoas de religião menor ou igual ao catolicismo. d) Gráficos para freqüências e freqüências acumuladas. d1) O que deve ser levado em conta ao escolher o tipo de gráfico adequado a uma certa variável? Deve-se verificar a existência das freqüências, freqüências relativas e acumuladas dos diversos valores existentes da variável. O tipo da variável. d2) Que vantagens e desvantagens comparativas têm o histograma e o polígono de freqüências? No histograma, as classes são representadas por retângulos cujas áreas são proporcionais às suas freqüências (e não às suas alturas). Do ponto de vista numérico, o polígono de freqüências é menos rigoroso do que o histograma. A área abaixo do polígono é igual à área do histograma. 1 e) Agrupamento em classes; limites aparentes e limites reais das classes. e1) Que critérios devem ser adotados ao agrupar valores em classes? Estabelecer amplitudes iguais, os limites serem números redondos e compatíveis com os valores obtidos, entre 5 e 15 classes. e2) Para que servem os limites aparentes? E os reais? Limites aparentes são uma primeira divisão dos valores em categorias. Mas esses limites não correspondem ao significado real dos valores contidos nas classes. Então, é conveniente determinar os limites reais, não tendo possibilidade de dúvida quanto à classe a qual cada elemento pertence. e3) Como identificar se os limites das classes são reais ou aparentes? Através da forma como os valores aparecem e se os limites superior e inferior, respectivamente, de classes sucessivas coincidem. Se os valores forem os mesmos (mesmo número de casas decimais) e os limites não coincidirem, o limite é aparente. Caso contrário nas duas opções, ele é real. f) Medidas de posição: média aritmética, mediana e moda. f1) A média aritmética é uma medida do centro da distribuição melhor do que a mediana? Por quê? Ambas caracterizam o centro de distribuição de freqüências igualmente, mas sob critérios diferentes. A média é uma medida de posição (como se fosse o centro de gravidade da distribuição) e a mediana é calculada com base na ordem dos valores que formam o conjunto de dados. A mediana não sofre a influência de valores extremos (ex: distribuição de rendas). f2) Quais são as propriedades mais importantes da média aritmética? Multiplicando-se todos os valores de uma variável por uma constante, a média do conjunto fica multiplicada por essa constante e somando-se ou subtraindo-se uma constante a todos os valores de uma variável, a média do conjunto fica acrescida ou diminuída dessa constante. g) Codificação de dados. g1) O que é e para que serve a codificação de dados? A codificação de dados é uma transformação linear com três parâmetros (xi, xô e h) que introduz uma grande simplificação nos cálculos manuais para valores agrupados em classes de freqüências. h) Medidas de dispersão: amplitude, variância e desvio-padrão; correção de Sheppard.h1) A variância mede a dispersão de um conjunto de dados melhor do que a amplitude? Por que? Sim. A amplitude é a diferença entre o maior e o menor valores do conjunto de dados. É claro que esse valor está relacionado com a dispersão dos dados, mas depende somente de dois valores do conjunto de dados, logo, contém pouca informação. Já a variância leva em conta os todos os xi e o xbarra. h2) Quais são as propriedades mais importantes da variância? Multiplicando-se todos os valores de uma variável por uma constante, a variância do conjunto fica multiplicada pelo quadrado dessa constante e somando-se ou subtraindo-se uma constante a todos os valores de uma variável, a variância não se altera. h3) Quando deve ser usada a correção de Sheppard? Por que? Distribuições unimodais aproximadamente simétricas, pois a tendência real em cada classe é a de que os valores originais do conjunto de dados se situem com mais 2 freqüência na metade da classe mais próxima da moda da distribuição, a qual deve ser a próxima média. Ao substituir todos os valores originais da classe pelo seu ponto médio, iremos, em geral, majorar a soma dos quadrados das diferenças em relação à soma refente a essa classe. Devemos tirar, então, h²/12 da variância. i) Momentos; medidas de assimetria e curtose. i1) O que são momentos absolutos e momentos centrais e para que servem? Através dos momentos, podemos reescrever as expressões para variância e média, além dos coeficientes de assimetria e curtose. Mt = (Soma(xi^t))/n. Centrado em a: Mta = (Soma(xi – a)^t)/n. Momento centrado: mt = (Soma(xi – xbarra)^t)/n i2) O que são assimetria e curtose? A assimetria procura caracterizar como e quanto a distribuição de freqüências se afasta da condição de simetria. As distribuições alongadas a direita são ditas positivamente assimétricas, e as alongadas à esquerda, negativamente assimétricas. A curtose procura caracterizar a forma da distribuição quanto ao seu achatamento (pode ser platicúrtica, mesocúrtica ou letptocúrtica). i3) Qual é o efeito da codificação de dados nos coeficientes de assimetria e curtose? Os coeficientes a3 e a4 são exatamente os mesmos para os dados originais ou codificados, pois a codificação afeta o numerador e o denominador igualmente. Fórmula: a3 = m3(z)/S³z = m3(x)/S4x 3 1 UFRJ - Departamento de Engenharia Industrial - 2011-1. EEI201 Probabilidade e Estatística. Turmas 3309 (Petróleo) e 4166 (Produção). Professor José Miguel. Monitores Marcelo e Ricardo. Roteiro da Entrevista nº 2. 1) Texto-base: Paul L. Meyer, "Probabilidade - Aplicações à Estatística", Capítulos 1, 2 e 3. Bibliografia complementar: Boris Gnedenko, "The Theory of Probability", Capítulo 1. 2) Tópicos e possíveis questões: a) Modelos determinísticos e modelos probabilísticos. O conceito de probabilidade. a1) O que diferencia um modelo probabilístico de um modelo determinístico? a2) Em que situações o uso de um modelo probabilístico é mais indicado do que um modelo determinístico? a3) Explique as definições clássica, estatística e subjetiva de probabilidade, dando exemplos. b) Frequência relativa e probabilidade. b1) Que relação há entre frequência relativa e probabilidade? b2) Dê exemplos do uso da definição estatística nos exercícios. c) Experimento aleatório, espaço amostral e eventos aleatórios. c1) Que relação há entre o experimento aleatório (E) e o espaço amostral (S)? c2) Um evento aleatório pertence ao espaço amostral? c3) Por que o espaço amostral é o "evento certo" e o conjunto vazio é o "evento impossível"? c4) O que são eventos mutuamente excludentes? E eventos contrários? c5) O que é decomposição de eventos? E partição? d) A definição clássica. Probabilidade geométrica. d1) Explique porque a definição clássica de probabilidade é circular. d2) Dê exemplos do uso da definição clássica nos exercícios. d3) O que é probabilidade geométrica e para que serve? Dê um exemplo. e) Axiomas da probabilidade. Teoremas básicos. e1) Quais são os axiomas da probabilidade? Que relação eles têm com as propriedades da definição clássica e da definição estatística de probabilidade? e2) Dê exemplos de teoremas da probabilidade. e3) Um evento cuja probabilidade é nula é necessariamente impossível? Por que? f) Probabilidade condicionada. Teorema da multiplicação. Eventos independentes. f1) O que quer dizer P(A|B)? f2) Algumas probabilidades são condicionadas e outras não? f3) Por que definimos P(A|B) = P(AB)/P(B)? f4) Explique as semelhanças e diferenças entre P(AB), P(A|B) e P(B|A), dando exemplos. f5) P(ABC) = P(A) x P(B|A) x P(C|B)? Por que? f6) O que são eventos independentes? E eventos coletivamente independentes? f7) Eventos mutuamente excludentes podem ser independentes? Explique. f8) Por que muitas vezes supomos a independência de eventos que não o são? f9) O que são eventos condicionalmente independentes? Dê um exemplo baseado nos exercícios. g) Probabilidade total. Teorema de Bayes. g1) Para que serve a fórmula da probabilidade total? Dê exemplos. g2) Explique o teorema de Bayes. Dê exemplos de aplicação. g3) O que são probabilidades a priori e a posteriori? Que riscos se corre ao usar probabilidades a priori subjetivas? a) Modelos determinísticos e modelos probabilísticos. O conceito de probabilidade. a1) O que diferencia um modelo probabilístico de um modelo determinístico? Em um modelo determinístico, admite-se que o resultado efetivo seja determinado pelas condições sob as quais o experimento ou o procedimento seja executado. Em um modelo não-determinístico, no entanto, as condições da experimentação determinam somente o comportamento probabilístico do resultado observável. a2) Em que situações o uso de um modelo probabilístico é mais indicado do que um modelo determinístico? Um modelo probabilistico é mais indicado quando o experimento nos revelar uma distribuição de probabilidade. a3) Dê exemplos de pelo menos três significados diferentes das palavras "provável" ou "probabilidade". É provável que o Fluminense seja rebaixado. Não é provável que chova durante um mês consecutivo. É provável que faça frio no inverno. a4) Explique as definições clássica, estatística e subjetiva de probabilidade. Definição estatística: Probabilidade é o limite da freqüência relativa; Definição classica: Igual Probabilidade; Definição Subjetiva: A interpretação subjetiva é que a probabilidade representa o grau de ‘fé’ ou julgamento quantificado, de um indivíduo particular sobre a ocorrência de um evento incerto. b) Frequência relativa e probabilidade. b1) Que relação há entre frequência relativa e probabilidade? A freqüência relativa da ocorrência de algum evento A tenderá a variar cada vez menos à medida que o número de repetições for aumentada. b2) Dê exemplos do uso da definição estatística nos exercícios da lista. Exercício 4 – Perfuração e Petróleo. Exercício 2 – Moeda viciada. c) Experimento aleatório, espaço amostral e eventos aleatórios. c1) Que relação há entre o experimento aleatório (E) e o espaço amostral (S)? O espaço amostral representa todos os possíveis resultado do experimento. c2) Um evento aleatório pertence ao espaço amostral? Um evento é um subconjunto de um espaço amostral. c3) Por que o espaço amostral é o "evento certo" e o conjunto vazio é o "evento impossível"? Porque o espaço amostral representa todos os possíveis resultado do experimento, portanto, qualquer evento será “certo” de acontecer. Um evento impossível não pertenceria ao espaço amostral, justamente por não ser um resultado possível do experimento. Logo seria um conjunto vazio. c4) O que são eventos mutuamente excludentes? E eventos contrários? Dois eventos, A e B, são mutualmente excludentes se eles não puderem ocorrer juntos. c5) O que é decomposição de eventos? E partição? Se A = B1 + B2 + ... + Bn e os eventos Bisão mutuamente exclusivos em pares, isto é, BiBj = Æ para i ¹ j, diz-se que o evento A é decomponível nos eventos B1, B2, ..., Bn Partição é a alocação de objetos a um conjunto de mutuamente exclusivos. Objetos de mesma partição são semelhantes entre si e dessemelhantes em relação a outros. d) A definição clássica. Probabilidade geométrica. d1) Explique porque a definição clássica de probabilidade é circular A definição clássica é dúbia, já que a idéia de “igualmente provável” é a mesma de “com probabilidade igual”, isto é, a definição é circular, porque está definindo essencialmente a probabilidade com seus próprios termos. d2) Dê exemplos do uso da definição clássica nos exercícios da lista. Exercício 5 – Moeda equilibrada. Exercício 12 – Dados. d3) O que é probabilidade geométrica e para que serve? *** Dê um exemplo. É o uso da geometria para representar probabilidades. ? e) Axiomas da probabilidade. Teoremas básicos. e1) Quais são os axiomas da probabilidade? *** Que relação eles têm com as propriedades da definição clássica e da definição estatística de probabilidade? 1 * Axioma 1 – A probabilidade de qualquer acontecimento A é um número real não negativo. * Axioma 2 – A probabilidade do acontecimento certo é 1. * Axioma 3 – Se A e B são acontecimentos incompatíveis, a probabilidade de «A ou B» é a soma das probabilidades de A e de B. e2) Dê exemplos de teoremas da probabilidade. Teorema de Bayes. e3) Um evento cuja probabilidade é nula é necessariamente impossível? Por que? Sim. f) Probabilidade condicionada. Teorema da multiplicação. Eventos independentes. f1) O que quer dizer P(A|B)? Probabilidade de A quando B ocorre. f2) Algumas probabilidades são condicionadas e outras não? Sim.... As vezes a ocorrencia de A não interfere no evento B. f3) Por que definimos P(A|B) = P(AB)/P(B)? ? ***f4) Explique a diferença entre P(AB), P(A|B) e P(B|A), dando exemplos. ***f5) P(ABC) = P(A) x P(B|A) x P(C|B)? Por que? f6) O que são eventos independentes? E coletivamente independentes? A e B são eventos independentes se P(AB) = P(A).P(B) f7) Eventos mutuamente excludentes podem ser independentes? Explique. Não. São situações opostas. f8) Por que muitas vezes supomos a independência de eventos que não o são? Para facilitar os cálculos. g) Probabilidade total. Teorema de Bayes. ***g1) Para que serve a fórmula da probabilidade total? Exemplos? ***g2) Explique o teorema de Bayes. Dê exemplos de aplicação. ***g3) O que são probabilidades a priori e a posteriori? Que riscos se corre ao usar probabilidades a priori subjetivas? 2 UFRJ - Departamento de Engenharia Industrial - 2011-1. EEI201 Probabilidade e Estatística. Turmas 3309 (Petróleo) e 4166 (Produção). Professor José Miguel. Monitores Marcelo e Ricardo. Roteiro da Entrevista nº 3. 1) Texto-base: Paul L. Meyer, "Probabilidade - Aplicações à Estatística", Capítulos 4 (exceto 4.6), 5, 6 (até 6.3, inclusive) e 7 (até 7.8, inclusive, exceto 7.7) e seções 8.4, 9.5 e 9.6. 2) Tópicos e possíveis questões: a) Variáveis aleatórias (VA’s). Contradomínio. a1) O que é uma variável aleatória? Dê um exemplo. a2) O que é o contradomínio de uma VA? Mostre no exemplo anterior (a1). b) VA’s discretas. Função de probabilidade (fp). b1) O que é uma VA discreta? Dê um exemplo baseado num dos exercícios. b2) O que é uma fp? Que propriedades necessariamente possui? Mostre a fp do exemplo anterior (b1). c) VA’s contínuas. Função densidade de probabilidade (fdp). c1) O que é uma VA contínua? Dê um exemplo baseado num dos exercícios. c2) O que é uma fdp? Que propriedades necessariamente possui? Mostre a fdp do exemplo anterior (c1). d) Função de distribuição (fd). d1) O que é a fd de uma VA? Dê um exemplo de uso num dos exercícios. e) Funções de VA’s. e1) Explique por que uma função de uma VA também é uma VA. e2) Dê exemplos de funções de VA's, nos casos (e2i) contínua-contínua; (e2ii) discreta-discreta, e (e2iii) contínua-discreta. e3) Mostre como se obtêm as distribuições de probabilidade das funções de VA's, nos casos do item anterior (e2i, e2ii e e2iii). f) VA's bidimensionais. Distribuição conjunta. Distribuições marginais e condicionadas. f1) Explique o que são distribuições conjuntas, marginais e condicionadas. Que relação há entre elas? f2) É sempre possível obter as distribuições marginais e condicionadas a partir da distribuição conjunta? Como? f3) É sempre possível obter a distribuição conjunta a partir das distribuições marginais? Por que? g) VA's independentes. g1) O que são VA's independentes? g2) Que relação há entre eventos independentes e VAs independentes? h) Valor esperado, variância e suas propriedades. Desigualdade de Tchebycheff. h1) O que é o valor esperado de uma VA? Que interpretação física (mecânica) lhe pode ser dada? Dê exemplos dos exercícios. h2) Idem da variância. h3) O que é a covariância de X e Y? h4) Quais as principais propriedades do valor esperado? h5) Idem da variância. h6) O que é a desigualdade de Tchebycheff? i) Distribuições de Bernoulli, binomial, uniforme, exponencial e geométrica. i1) O que caracteriza cada uma das distribuições a seguir e qual é o significado do(s) seu(s) parâmetro(s)? Bernoulli, binomial, uniforme, exponencial, geométrica. Dê exemplos de aplicação de cada uma delas. i2) Explique, usando a definição estatística de probabilidade, porque o valor esperado de uma distribuição binomial com parâmetros n e p é igual a np. i3) Qual é o valor de p que maximiza a variância de uma VA binomial? Explique usando argumentos probabilísticos. i4) Que importante propriedade as distribuições exponencial e geométrica - e nenhuma outra - possuem em comum? a1) O que é uma variável aleatória? Dê um exemplo. A1) Sejam E um experimento e S um espaço associado ao experimento. Uma função X, que associe a cada elemento s ϵ S um número real, X(s), é denominada variável aleatória. a2) O que é o contradomínio de uma VA? Mostre no exemplo anterior (a1). A2) O espaço Rx, conjunto de todos os valores possíveis de X, é denominado contradomínio. De certo modo, poderemos considerar Rx como outro espaço amostral. b1) O que é uma VA discreta? Dê um exemplo baseado num dos exercícios. B1) Se o número de valores possíveis de X (isto é, Rx) for finito ou infinito numerável, denominaremos X de variável aleatória discreta. b2) O que é uma fp? Que propriedades necessariamente possui? Mostre a fp do exemplo anterior (b1). B2) A cada possível valor de X (xi) associaremos um numero p(xi) = P(X=xi), denominado probabilidade de xi . Os números p(xi) i =1, 2, 3... Devem satisfazer as seguintes condições: a) p(xi) ≥ 0, para todo i; b) Σ∞m p(xi) = 1 A função p, definida acima, é denominada função de probabilidade de variável aleatória X. c1) O que é uma VA contínua? Dê um exemplo baseado num dos exercícios. C1) X é uma varável aleatória continua se X puder tomar todos os valores em algum intervalo (c, d) onde c e d podem ser -∞ a +∞, respectivamente. c2) O que é uma fdp? Que propriedades necessariamente possui? Mostre a fdp do exemplo anterior (c1). C2) A fdp é uma substituição da função p definida somente para x1, x2, x3... Por uma função f definida para todos os valores de x. Propriedades: a) f(x) ≥ 0 para todo x; b) ∫ -∞ +∞ f(x)dx = 1 c) Para quaisquer a e b com -∞ < a < b < +∞, teremos P(a ≤ x ≤ b) = ∫ab f(x)dx. d1) O que é a fd de uma VA? Dê um exemplo de uso num dos exercícios. D1) Define-se a função F como a função distribuição acumulada da variável aleatória X como F(X) = P(X ≤ x) a) Se X for uma variável aleatória discreta, F(X) = Σnn=1 p(xn) b) Se X for uma variável aleatória con=nua, com fdp f, F(X) = ∫ -∞ x f(s)ds. e1) Explique por que uma função de uma VA também é uma VA E1) Porque é intuitivamente evidente que, uma vez que o valor de X é o resultadode um 1 experimento aleatório o valor de A(x) também o é e2) Dê exemplos de funções de VA's, nos casos (e2i) contínua-contínua; (e2ii) discreta- discreta, e (e2iii) contínua-discreta. E2) Não. Podem apresentar as seguintes relações: x y=H(x) Discreta Discreta Continua Discreta Continua Continua e3) Mostre como se obtêm as distribuições de probabilidade das funções de VA's, nos casos do item anterior (e2i, e2ii e e2iii). f1) Explique o que são distribuições conjuntas, marginais e condicionadas. Que relação há entre elas? F1) Se X e Y são duas variáveis aleatórias, a distribuição de probabilidades de sua ocorrência simultânea pode ser representada pela função com valores f(X,Y) para qualquer par de valores (X,Y). Costuma-se referir a esta função como Distribuição de Probabilidade Conjunta de X e Y. A distribuição de probabilidade de X isolado g(x) é obtida pela soma dos valores de f (X,Y) ao longo de Y e vice-versa. Definimos g(x) e h(y) como sendo as distribuições de probabilidades marginais de X e Y, respectivamente. A fdp de X condicionada a um dado Y = y é definida por: g(x|y) = f(x,y) / h(y), h(y) > 0. A fdp de Y condicionada a um dado X = x é definida por h(y|x) = f( x,y) / g(x), g(x) > 0 f2) É sempre possível obter as distribuições marginais e condicionadas a partir da distribuição conjunta? Como? F2) Como explicado no item anterior, as distribuições marginais são obtidas pela analise das distribuições isoladas de X e de Y. Já as distribuições condicionadas são obtidas pelo quociente das distribuições conjuntas pelas distribuições marginais. f3) É sempre possível obter a distribuição conjunta a partir das distribuições marginais? Por que? F3) Não. g1) O que são VA's independentes? G1) a) Seja (X,Y) uma variável aleatória discreta bidimensional. Diremos que X e Y são variáveis aleatórias independentes se, e somente se, p(xi, yi) = p(xi) . q(yi), isto é, P(X =xi, Y=yi) = P(X=xi) . P(Y=yi) 2 b) Diremos que X e Y são variáveis aleatórias independentes se, e somente se, f(x,y) = g(x) . h(y) para todo (x,y), onde f é a fdp conjunta e g e h são as fdp marginais de X e Y, respectivamente. g2) Que relação há entre eventos independentes e VAs independentes? G2) a) X e Y serão independentes se, e somente se, p(xi|yi) = p(xi) b) X e Y serão independentes se, e somente se, g(x|y) = g(x) h1) O que é o valor esperado de uma VA? Que interpretação física (mecânica) lhe pode ser dada? Dê exemplos dos exercícios. H1) O Valor esperado de X denotado por E(X) é definido como: E(X) = Σn=1∞ xi . P(xi). Devemos observar a analogia entre o valor esperado de uma variável aleatória e o conceito de “centro de gravidade” em Mecânica. h2) Idem da variância. H2) Definimos a variância de X, denotada por V(X) ou σx2, da maneira seguinte: V(X) = E [X – E(X)]2 , ou V(X) = E(X2) – [E(X)]2. Se interpretarmos E(X) como o centro de gravidade da unidade de massa distribuída sobre uma reta, poderemos interpretar V(X) como o momento de inércia dessa massa, em relação a um eixo perpendicular que passe pelo centro de gravidade da massa. h3) O que é a covariância de X e Y? H3) A covariância entre duas variáveis aleatórias X e Y é definida como uma medida de como duas variáveis aleatórias variam conjuntamente. Cov(X,Y) = E[(X – E(X) ). (Y – Y(Y))], ou cov(X,Y) = E(XY) – E(X).E(Y) h4) Quais as principais propriedades do valor esperado? H4) 1) Se X = C, onde C é uma constante, então E(X) = C 2) Suponha-se que C seja uma constante e X seja uma variável aleatória. Então E(CX) = CE(X). 3) Seja (X,y) uma variável aleatória bidimensional com uma distribuição de probabilidade conjunta. Seja Z = H1(X,Y) e W = H2(X,Y). Então E(Z+W) = E(Z) + E(W) 4) Sejam X e Y duas variáveis aleatórias quaisquer. Então E(X+Y) = E(X) + E(Y) 5) Sejam n variáveis aleatórias Xi,...,Xn. Então E(X1+...+Xn) = E(X1)+...+E(Xn) 6) Seja (X,Y) uma variável aleatória bidimensional e suponha-se que X e Y sejam independentes. Então, E(XY) = E(X).E(Y) h5) Idem da variância. 3 H5) 1) Se C for uma constante, V(X+C) = V(X) 2) Se C for uma constante, V(CX) = C2V(X) 3) Se (X,Y) for uma variável aleatória bidimensional, e se X e Y forem independentes, então: V(X+Y) = V(X) + V(Y) 4) Sejam Xi,...,Xn n variáveis aleatórias independentes. Então. V(Xi+...+Xn) = V(Xi)+... +V(Xn) 5) Seja X uma variável aleatória com variância finita. Então, para qualquer numero real α, V(X) = E[(x-α)2] - [E(X) - α]2 h6) O que é a desigualdade de Tchebycheff? H6) Seja X uma variável aleatória com E(X) = μ, e seja C um numero real qualquer. Então, se E(X-C)2 for finita e ε for qualquer numero positivo, teremos: P[|X-C| ≥ ε ] ≤ ε-1 . E(X-C)2 i1) O que caracteriza cada uma das distribuições a seguir e qual é o significado do(s) seu (s) parâmetro(s)? Bernoulli, binomial, uniforme, exponencial, geométrica. Dê exemplos de aplicação de cada uma delas I1) A distribuição de Bernoulli é a distribuição discreta do espaço amostral Rx = {0,1}, com probabilidades P(0) = 1 – p e P(1) = p. O parâmetro p representa a probabilidade de “sucesso” e P(X=1) = p. Seja X uma variável aleatória binomial, então: P(x=k) = (nk )pk (1-p) n-k . O parâmetro “n” significa o número de repetições do experimento e o parâmetro “p” significa a probabilidade de um evento A ocorrer. Sendo X uma variável aleatória e se a fdp de X for dada por f(X) = 1 / (b-a), a ≤ x ≤ b e f(X) = 0 para quaisquer outros valores diremos que X é uniformemente distribuída sobre o intervalo [a,b] Uma variável aleatória com distribuição de probabilidade P(X=K) = qk-1p, recebe a denominação de distribuição geométrica, sendo X = numero de repetições necessárias para obter a primeira ocorrência de A, P(A) = p, e P(Ā) = 1-p-q. O parâmetro p significa o inverso do valor esperado e sabemos que V(X) = q / p2 Uma variável aleatória continua X, que toma todos os valores não negativos, terá uma distribuição exponencial com parâmetro α ≥ 0, se sua fdp for dada por f(x) = α e-αx, x > 0 e f (x) = 0 para outros valores. O parâmetro α significa o inverso do valor esperado E(X) = 1 / α i2) Explique, usando a definição estatística de probabilidade, porque o valor esperado de uma distribuição binomial com parâmetros n e p é igual a np I2) E(X), sendo X uma variável binomialmente distribuída, E(X) = Σ xi . p(xi) = Σ xi . (nk )pk (1-p) 4 n-k = np i3) Qual é o valor de p que maximiza a variância de uma VA binomial? Explique usando argumentos probabilísticos. i4) Que importante propriedade as distribuições exponencial e geométrica - e nenhuma outra - possuem em comum 5 1 UFRJ - Departamento de Engenharia Industrial - 2011-1. EEI201 Probabilidade e Estatística. Turmas 3309 (Petróleo) e 4166 (Produção). Professor José Miguel. Monitores Marcelo e Ricardo. Roteiro da Entrevista nº 4. 1) Texto-base: Paul L. Meyer, "Probabilidade - Aplicações à Estatística", Capítulos 8 (exceto 8.4 e 8.8), 9 (até 9.10, inclusive, exceto 9.5, 9.6 e 9.9) e 12 (até 12.4, inclusive). 2) Tópicos e possíveis questões: a) A distribuição normal. Teorema central do limite. a1) Que propriedades da distribuição normal a fazem a mais importante da Estatística? a2) Qual é o significado dos parâmetros da distribuição normal? a3) O que é a distribuição normal padrão e qual é a sua importância? a4) Explique o que é o Teorema Central do Limite e dê um exemplo de aplicação. b) A distribuição de Poisson. Processo de Poisson. Distribuição gama. b1) Que condições devem ser verdadeiras para que uma sequência de ocorrências de determinado evento ao longo do tempo seja um processo de Poisson? b2) Por que a distribuição de Poisson é chamada por vezes de "distribuição dos eventosraros"? b3) Dê um exemplo de um processo de Poisson retirado de um dos exercícios. b4) Qual é o significado do parâmetro da distribuição de Poisson? b5) O que caracteriza a distribuição gama e qual é o significado dos seus parâmetros? Dê um exemplo de aplicação. b6) Qual é a relação entre as distribuições exponencial, gama e de Poisson? b7) Qual é a distribuição de probabilidade da soma de duas VA's independentes com distribuição de Poisson com parâmetros a1 e a2? c) Distribuições de Pascal e hipergeométrica. c1) O que caracteriza (cada uma delas) as distribuições de Pascal e hipergeométrica e qual é o significado do(s) seu(s) parâmetro(s)? Dê exemplos de aplicação de cada uma delas. c2) Qual é a relação entre as distribuições geométrica, binomial e de Pascal? d) Aproximação da hipergeométrica pela binomial, da binomial pela normal e por Poisson. Correção de continuidade. d1) Em que condições é adequado aproximar as distribuições: i) hipergeométrica pela binomial? ii) binomial pela de Poisson? iii) binomial pela normal? d2) O que é a correção de continuidade e quando deve ser aplicada? A1) A distribuiçao normal serve como uma excelente aproximação para uma grande classe de distribuições, que tem enorme importância prática. Além disso, esta distribuição apresenta algumas propriedades matemáticas muito desejáveis, que permitem concluir importantes resultados teóricos. A2) Os parâmetros são (mi) e (sigma²). O primeiro é o valor esperado e o segundo é a variância. A3)É a distribuição que tem média igual a 0 e desvio-padrão igual a 1. A sua função de distribuição é tabelada. A sua importância é que se uma VA tiver qualquer distribuição normal padrão, a função tabelada pode ser empregada para calcular probabilidades associadas a essa VA. A4)Se uma variável X puder ser representada pela soma de quaisquer n variáveis aleatórias independentes (que satisfazem a determinadas condições), então esta soma , para n suficientemente grande, terá distribuição aproximadamente normal. B1)O número de ocorrências em intervalos não sobrepostos são VA’s independentes ( porque o numero de fatores é muito grande ) A distribuição de probabilidade é igualmente distribuída para cada intervalo de tempo não sobreposto e de mesmo tamanho. Se o intervalo é suficientemente pequeno, a probabilidade de obter uma emissão durante o intervalo é proporcional ao tamanho do intervalo. Em um intervalo suficientemente pequeno, a probabilidade de obter mais de uma emissão é desprezível. É certo que em um intervalo nulo não ocorrerá nada ( intervalo igual a 0.), logo po(0)=1. B2)Porque Poisson geralmente é usado para aproximar probabilidades quando existe um grande número de repetições de um experimento, portanto, a distribuição de probabilidade de ocorrência de um evento é muito pequena ,por isso seria considerada um “evento raro”. B3) B4)O parâmetro é a intensidade da distribuição , ou seja, é o numero esperado de sucessos por unidade de tempo/espaço. B5)Seja X uma variável aleatória contínua, que tome somente valores não-negativos. Dizemos que X tem uma distribuição de probabilidade gama se sua fdp for dada por: F(x)=(lambda)^r. x^r-1.e^(lambda)/(aquele r estranho)(r) , x>0 =0 para outros valores. Os parâmetros são: r e lambda, onde r é um inteiro positivo, e é o parâmetro de forma , e lambda é a taxa de ocorrência de sucessos. B6)A distribuição exponencial é um caso particular da distribuição gama , para o caso onde r=1.A distribuição gama é usada em casos nos quais a distribuição é contínua ( a distribuição de tempo necessária para que se obtenha um numero específico de eventos ). Já a distribuição de Poisson trata-se do numero de ocorrências de algum evento durante um período de tempo fixado e a distribuição é discreta. B7)A soma de duas Va’s independentes cm distribuição de Poisson tem distribuição de Poisson. C1) A distribuição de Pascal é usada para medir a quantidade de repetições necessárias a fim de que um evento ocorra n vezes, ou seja, tenha n sucessos. Tem parâmetros r e p, onde r é o numero de sucessos atingidos e p é a probabilidade de ocorrer sucesso em 1 experimento. A distribuição hipergeométrica é usada quando temos uma amostra N com r peças normais e (N-r) 1 peças defeituosas, e queremos encontrar a probabilidade de ter k peças defeituosas entre n peças retiradas da amostra, quando a retirada é feita sem reposição. Os parâmetros N(quantidade total), e r ( peças normais) e n ( numero de peças retiradas). C2) A distribuição binomial é usada quando quer se analisar a ocorrência de sucessos e fracassos em um numero de repetições pré-determinado . A distribuição geométrica é usada para determinar quantas vezes devo realizar um experimento ate obter o primeiro sucesso. Já a distribuição de Pascal é usada para medir a quantidade de repetições necessárias a fim de que um evento ocorra n vezes, ou seja, obtenha n sucessos. D1)É adequado quando temos um número total de peças muito grande e a quantidade de peças retiradas é pequena em relação ao total. Podemos aproximar que, como n/N<=0,1, a retirada sem reposição equivale a retirada com reposição, podendo assim aproximar pela binomial. D2) é adequado aproximar Binomial por Poisson quando o número de repetiçÕes for muito grande e a probabilidade de cada evento ocorrer é muito pequena dentro de um intervalo. Podemos aproximar Binomial por Normal quando o número de repetições for grande e a probabilidade de sucsso (parâmetro p) for próximo de 0,5 ( parâmetro com valor alto) D3) Quando aproximamos a distribuição de uma VA discreta com a distribuição de uma VA contínua, devemos aplicar a correção de continuidade, que melhoram a aproximação entre as distribuições. 2 Exercícios UFRJ - Departamento de Engenharia Industrial - 2011-1. EEI201 Probabilidade e Estatística. Turma 4166 (EP1). Professor José Miguel. Monitores Marcelo e Ricardo. Exercício nº 1-1. Aluno: Alexandre Augusto Pamato Cardoso Anapurús (49) Registro: 109049670. O exercício a seguir deve ser resolvido a caneta (ou impresso a tinta), em papel tamanho A4. A resolução deve ser entregue até 5ª feira, 24 de março, às 12h. Justifique as suas resoluções e indique claramente as respostas aos itens. Em cada um dos itens, a) identifique o universo e a variável que descrevem a situação, indicando o tipo da variável (qualitativa, quantitativa discreta ou quantitativa contínua); b) apure as frequências e as frequências relativas dos dados e também, quando se tratar de variáveis quantitativas, as suas frequências acumuladas, agrupando previamente os dados em classes nos itens 1 e 2; nestes casos, indique claramente os limites aparentes e os limites reais das classes, e c) faça os gráficos que representam as frequências e as frequências acumuladas, quando couber. 1) Escolha uma atividade curta e repetitiva, executada por alguém do seu trabalho, da sua casa ou de qualquer outro lugar e cronometre pelo menos 25 execuções da atividade, com auxílio de um cronômetro digital e precisão de décimos de segundo. Depois ponha os valores obtidos num arquivo texto (formato "cartão", extensão .txt), um valor em cada linha, começando na primeira linha do arquivo, e envie-o por e-mail para zemig@poli.ufrj.br. Use vírgula decimal (e não ponto decimal). Não ponha mais nada no arquivo. 2) Combustível consumido por um veículo, em litros, em 48 viagens pelo mesmo trajeto. 9,88 9,41 9,09 11,04 10,37 8,95 10,48 9,28 10,83 11,76 10,11 9,41 11,74 10,61 11,38 10,69 9,72 10,36 11,50 10,61 9,62 9,15 8,10 10,37 11,59 10,87 10,31 9,95 10,96 10,58 8,71 8,86 10,40 9,97 9,38 9,73 9,41 7,82 10,27 10,48 9,77 9,65 10,36 10,37 7,94 11,07 10,38 9,31 3) Acidentes de trabalho por mês numa fábrica,ao longo de um período de 5 anos. 4 4 2 1 2 3 1 0 0 0 2 2 2 2 5 2 1 2 3 4 1 5 1 1 1 1 0 1 3 3 1 2 1 2 2 1 3 3 1 2 4 2 0 2 1 3 6 3 0 3 3 0 0 3 0 2 3 3 0 1 4) Tipos de 30 caminhões licenciados no Rio de Janeiro num determinado dia de janeiro de 2009. L SP P P L SP L M L L SL SP SP SL SL L SP SP SP SP M P M SP P SP P L P P (SL: Semi-Leve; L: Leve; M: Médio; SP: Semi-Pesado; P: Pesado) Fim do Exercício nº 1-1 de Alexandre Augusto Pamato Cardoso Anapurús (49). 1) Escolha uma atividade curta e repetitiva, executada por alguém do seu trabalho, da sua casa ou de qualquer outro lugar e cronometre pelo menos 25 execuções da atividade, com auxílio de um cronômetro digital e precisão de décimos de segundo. a) Ponha os valores obtidos numa planilha ou arquivo texto, um valor em cada linha, e envie o arquivo por e-mail para zemig@poli.ufrj.br. Atividade: calçar um sapato. Tempos obtidos (em segundos): 4,5; 4,4; 4,6; 5,1; 5,4; 4,9; 3,7; 7,0; 4,6; 4,8; 6,0; 3,5; 5,1; 4,0; 3,7; 3,9; 5,7; 4,8; 5,9; 5,4; 5,2; 5,6; 6,1; 5,0; 3,7. b) Calcule a média, a mediana e o desvio-padrão dos tempos medidos. Agrupando em classes de amplitude igual a 0,5s, e levando em conta que os valores foram obtidos com um cronômetro digital, obtemos a distribuição de frequência que está na tabela abaixo (coluna fi). De fato, quando a leitura de um cronômetro digital indica, por exemplo, 3,9s, isso significa, na verdade, que o tempo decorrido é algum valor entre 3,9s (inclusive) e 4,0s (exclusive). Esta interpretação dos valores resulta nos limites aparentes (tal como os valores aparecem no cronômetro) e nos limites reais indicados na tabela. Esta contém também (coluna zi) os resultados de uma codificação de dados com centro em 4,75s e amplitude igual a 0,5s, e os demais cálculos intermediários necessários para o cálculo da média, do desvio-padrão e da mediana (colunas ii zf ⋅ , 2 ii zf ⋅ e Fi). Classes Limites aparentes Limites reais xi fi zi ii zf ⋅ 2ii zf ⋅ Fi 3,0 3,4 3,0 3,5 3,25 1 -3 -3 9 1 3,5 3,9 3,5 4,0 3,75 4 -2 -8 16 5 4,0 4,4 4,0 4,5 4,25 2 -1 -2 2 7 4,5 4,9 4,5 5,0 4,75 6 0 0 0 13 5,0 5,4 5,0 5,5 5,25 6 1 6 6 19 5,5 5,9 5,5 6,0 5,75 3 2 6 12 22 6,0 6,4 6,0 6,5 6,25 2 3 6 18 24 6,5 6,9 6,5 7,0 6,75 0 4 0 0 24 7,0 7,4 7,0 7,5 7,25 1 5 5 25 25 Somas: 25 - 10 88 - Médias: - - 0,4 3,52 - Calculemos primeiro a média e a variância de Z. 4,025 10 f zfz i ii == ⋅ = ∑ ∑ . ( ) 36,325 251088 f fzfzf 2 i i 2 ii 2 ii2 z = − = ⋅−⋅ =σ ∑ ∑∑∑ . Como os valores estão agrupados em classes, é preciso fazer a correção de Sheppard: 2 zσ = 2 zσ (não corrigida) 28,3125,036,312h 22z =−=− . Para obter a média e a variância da variável original X, observemos que a codificação de dados efetuada é equivalente à transformação linear ( ) 5,075,4xz ii −= , ou, expressando X em função de Z, ii z5,075,4x ⋅+= . Assim, utilizando as propriedades da média aritmética e da variância, obtemos =⋅+=⋅+= 4,05,075,4z5,075,4x 4,95s, 22z22x s82,028,325,05,0 =⋅=σ⋅=σ e, portanto, o desvio-padrão de X é igual a ==σ 82,0x 0,91s. Para encontrar a mediana, primeiro encontremos a classe que a contém, percorrendo a coluna da frequência acumulada (Fi) até encontrar o primeiro valor igual ou superior à metade do tamanho do conjunto de dados, isto é, 25/2 = 12,5. Descobrimos assim que o limite inferior (real, claro) da classe que contém a mediana é igual a 4,5s e podemos então usar a fórmula para o cálculo da mediana com dados agrupados, a seguir. =× − +=× − += 5,06 75,125,4hf F2nLmd md md a i 4,96s. c) Esboce um gráfico que represente a distribuição dos tempos. O gráfico escolhido é o histograma, adequado a representar frequências de variáveis continuas, no qual as classes são representadas por retângulos cujas bases são os intervalos correspondentes às classes e cujas áreas são proporcionais às frequências das classes. Os valores indicados correspondem aos pontos médios das classes 0 1 2 3 4 5 6 7 3,25 3,75 4,25 4,75 5,25 5,75 6,25 6,75 7,25 Em cada um dos exercícios a seguir (2 e 3), a) identifique o universo e a variável que descrevem a situação, indicando o tipo da variável (qualitativa, quantitativa discreta ou quantitativa contínua); b) apure as frequências e as frequências relativas dos dados e também, quando se tratar de variáveis quantitativas, as suas frequências acumuladas, agrupando previamente os dados em classes no exercício 2; neste caso, indique claramente os limites aparentes e os limites reais das classes e resolva os próximos itens com base nas frequências das classes; c) esboce os gráficos que representam as frequências e as frequências acumuladas, quando couber, e d) quando se tratar de variáveis quantitativas, calcule, com o auxílio da codificação de dados no exercício 2, a média, a mediana, o 3º quartil, a variância, o desvio-padrão e os coeficientes de assimetria e curtose. 2) Combustível consumido por um veículo, em litros, em 48 viagens pelo mesmo trajeto. 10,22 9,90 10,62 10,51 9,61 9,91 10,51 9,52 10,09 9,28 11,31 12,64 10,16 9,45 9,49 11,16 9,45 9,51 11,05 10,15 8,03 9,94 10,64 8,71 11,15 9,71 10,00 10,72 8,22 9,97 9,31 8,69 10,96 11,53 9,85 9,32 11,27 7,86 9,77 11,59 8,80 10,55 9,61 11,21 10,87 10,16 11,33 7,96 a) Universo: O conjunto das 48 viagens. Variável: Combustível consumido, em litros. Tipo: Quantitativa contínua. b) Os valores foram agrupados em classes de amplitude igual a 0,5 litros. Os limites aparentes e reais, os pontos médios, as frequências, as frequências relativas e as frequências acumuladas das classes estão na tabela a seguir. Classes Limites aparentes Limites reais xi fi pi' Fi 7,50 7,99 7,495 7,995 7,745 2 0,0417 2 8,00 8,49 7,995 8,495 8,245 2 0,0417 4 8,50 8,99 8,495 8,995 8,745 3 0,0625 7 9,00 9,49 8,995 9,495 9,245 6 0,125 13 9,50 9,99 9,495 9,995 9,745 11 0,2292 24 10,00 10,49 9,995 10,495 10,245 6 0,125 30 10,50 10,99 10,495 10,995 10,745 8 0,1667 38 11,00 11,49 10,995 11,495 11,245 7 0,1458 45 11,50 11,99 11,495 11,995 11,745 2 0,0417 47 12,00 12,49 11,995 12,495 12,245 0 0 47 12,50 12,99 12,495 12,995 12,745 1 0,0208 48 c) Para representar as frequências, escolhemos o histograma. Estão indicados os pontos médios das classes. Histograma 0 2 4 6 8 10 12 7,745 8,245 8,745 9,245 9,745 10,245 10,745 11,245 11,745 12,245 12,745 Para representar as frequências acumuladas, usamos o polígono de frequências acumuladas. Estão indicados os limites reais das classes. d) Fazemos a codificação de dados com centro em 9,745 e amplitude igual a 0,5 e Polígono de frequências acumuladas 0 10 20 30 40 50 60 7,495 7,995 8,495 8,995 9,495 9,995 10,495 10,995 11,49511,99512,495 12,995 organizamos numa tabela os valores necessários para o cálculo das medidas solicitadas, como segue. xi fi zi ii zf ⋅ 2ii zf ⋅ 3ii zf ⋅ 4ii zf ⋅ 7,745 2 -4 -8 32 -128 512 8,245 2 -3 -6 18 -54 162 8,745 3 -2 -6 12 -24 48 9,245 6 -1 -6 6 -6 6 9,745 11 0 0 0 0 0 10,245 6 1 6 6 6 6 10,745 8 2 16 32 64 128 11,245 7 3 21 63 189 567 11,745 2 4 8 32 128 512 12,245 0 5 0 0 0 0 12,745 1 6 6 36 216 1296 Somas: 48 - 31 237 391 3237 Calculemos primeiro a média e a variância de Z. 645833,048 31 f zfz i ii == ⋅ = ∑ ∑ . ( ) 5204,448 4831237 f fzfzf 2 i i 2 ii 2 ii2 z = − = ⋅−⋅ =σ ∑ ∑∑∑ Como os valores estão agrupados em classes, é preciso fazer a correção de Sheppard: 2 zσ = 2zσ (não corrigida) 437,4125,05204,412h 22z =−=− . Para obter a média e a variância da variável original X, observemos que a codificação de dados efetuada é equivalente à transformação linear ( )5,0745,9xz ii −= , ou, expressando X em função de Z, ii z5,0745,9x ⋅+= . Assim, utilizando as propriedades da média aritmética e da variância, obtemos =⋅+=⋅+= 645833,05,0745,9z5,0745,9x 10,068l, =⋅=σ⋅=σ 437,425,05,0 2z22x 1,109s2, e, portanto, o desvio-padrão de X é igual a ==σ 109,1x 1,053l. Para encontrar a mediana, primeiro encontremos a classe que a contém, percorrendo a coluna da frequência acumulada (Fi) até encontrar o primeiro valor igual ou superior à metade do tamanho do conjunto de dados, isto é, 48/2 = 24. Descobrimos assim que o limite real inferior da classe que contém a mediana é igual a 9,495l e podemos então usar a fórmula para o cálculo da mediana com dados agrupados, a seguir. =× − +=× − += 5,011 1324495,9hf F2nLmd md md a i 9,995l. 1 O 3º quartil é obtido de forma semelhante. Primeiro encontramos a classe que o contém, percorrendo a coluna da frequência acumulada (Fi) até encontrar o primeiro valor igual ou superior a três quartos do tamanho do conjunto de dados, isto é, 3.48/4 = 36. Assim, o limite real inferior da classe que contém o 3º quartil é igual a 10,495l e teremos: =× − +=× −⋅ += 5,08 3036495,10hf F4n3LQ 75,0 75,0 a i3 10,87l. Para encontrar os coeficientes de assimetria e curtose da variável Z, precisamos calcular 1 Neste caso a mediana é facilmente calculável e é exatamente igual ao limite entre duas classes (9,995), porque, por coincidência, a frequência acumulada ao final da classe cujo limite superior é este valor é exatamente igual à metade do tamanho do conjunto de dados (24). Expusemos aqui o cálculo feito pela fórmula apenas para mostrar o método. primeiro os seus momentos centrais de 3ª e 4ª ordem, que podem ser obtidos a partir dos momentos absolutos, pelas fórmulas que seguem. 3 3 12133 48 312 48 237 48 313 48 391M2MM3Mm ⋅+⋅⋅−=⋅+⋅⋅−= 8818,05388,05664,91458,8m3 −=+−= . 42 4 12 2 13144 48 31348 237 48 31648 391 48 31448 3237M3MM6MM4Mm ⋅−⋅ ⋅+⋅⋅−=⋅−⋅⋅+⋅⋅−= 2288,585219,03566,120434,214375,67m4 =−+−= . Os coeficientes de assimetria e de curtose de Z são dado por 094,0437,48818,0ma 233z33 −=−=σ= e 958,2437,42288,58ma 24z44 ==σ= A codificação de dados, tal como qualquer outra transformação linear, não modifica estes coeficientes. Portanto, finalmente, a3 (x) = -0,094 e a4 (x) = 2,958. 3) Acidentes de trabalho por mês numa fábrica, ao longo de um período de 5 anos. 2 0 1 0 2 1 4 2 0 1 3 1 1 4 1 1 4 0 0 0 1 3 0 0 1 1 2 3 4 0 0 1 6 3 5 0 1 3 0 1 2 1 3 4 0 1 5 2 1 1 2 1 3 0 1 3 2 2 0 4 a) Universo: O conjunto dos 60 meses de funcionamento da fábrica. Variável: Quantidade de acidentes. Tipo: Quantitativa discreta. b) xi fi pi' Fi 0 15 0,25 15 1 19 0,32 34 2 9 0,15 43 3 8 0,13 51 4 6 0,1 57 5 2 0,03 59 6 1 0,02 60 c) Para representar as frequências, usamos o diagrama de barras: 0 2 4 6 8 10 12 14 16 18 20 0 1 2 3 4 5 6 7 8 As frequências acumuladas são convenientemente representadas pelo gráfico de frequências acumuladas [não apresentado aqui]. d) Organizemos os cálculos intermediários numa tabela e em seguida, calculemos as medidas solicitadas. A utilização das fórmulas dispensa, neste caso, maiores explicações, observando que, por tratar-se de uma variável discreta e não haver necessidade de agrupar os dados, não haverá classes nem limites ou pontos médios de classes e não deverá ser feita a correção de Sheppard. Além disso, não se aplicam as fórmulas para o cálculo da mediana e do 3º quartil utilizadas nos exercícios 1 e 2, próprias para estimar estas medidas no caso de dados agrupados. Neste exercício, md e Q3 serão obtidos a partir das respectivas definições. xi fi fi xi fi xi2 fi xi3 fi xi4 0 15 0 0 0 0 1 19 19 19 19 19 2 9 18 36 72 144 3 8 24 72 216 648 4 6 24 96 384 1536 5 2 10 50 250 1250 6 1 6 36 216 1296 Somas: 60 101 309 1157 4893 == ⋅ = ∑ ∑ 60 101 f xfx i ii 1,7 ( ) = − = ⋅−⋅ =σ ∑ ∑∑∑ 60 60101309 f fxfxf 2 i i 2 ii 2 ii2 x 2,32. Portanto, ==σ 32,2x 1,52. 3 3 12133 60 1012 60 309 60 1013 60 1157M2MM3Mm ⋅+⋅⋅−=⋅+⋅⋅−= ==⇒=+−= 333 52,18156,2a8156,25398,90075,262833,19m 0,80. 42 4 12 2 13144 60 101360 309 60 101660 1157 60 101460 4893M3MM6MM4Mm ⋅−⋅ ⋅+⋅⋅−=⋅−⋅⋅+⋅⋅−= ==⇒=−+−= 444 52,118,15a18,1509,2456,8784,12955,81m 2,83. A mediana é algum valor entre o 30º e o 31º valores do conjunto de dados, ordenados. A coluna de frequências acumuladas indica que esses valores são ambos iguais a 1. Portanto, md = 1. O 3º quartil é algum valor entre o 45º e o 46º valores, ordenados do menor para o maior. A coluna de frequências acumuladas indica que esses valores são ambos iguais a 3. Portanto, Q3 = 1. UFRJ - Departamento de Engenharia Industrial - 2011-1. EEI201 Probabilidade e Estatística. Turma 4166 (EP1). Professor José Miguel. Monitores Marcelo e Ricardo. Exercício nº 1-2. Aluno: Alexandre Augusto Pamato Cardoso Anapurús (49) Registro: 109049670. O exercício a seguir deve ser resolvido a caneta (ou impresso a tinta), em papel tamanho A4. A resolução deve ser entregue até 4ª feira, 30 de março, às 12h. Justifique as suas resoluções e indique claramente as respostas aos itens. Para cada conjunto de dados definido nos itens 1, 2 e 3 abaixo (os mesmos dos itens 1, 2 e 3 do exercício nº 1-1), calcule: a) a média; b) a mediana; c) o 3º quartil; d) a variância; e) o desvio-padrão; f) o coeficiente de assimetria, e g) o coeficiente de curtose. Utilize a codificação de dados no item 1, se achar conveniente, e obrigatoriamente no item 2. Nos itens 1 e 2 faça os cálculos a partir dos dados agrupados em classes, e não dos dados originais (ver itens correspondentes do exercício nº 1-1). 1) Tempos, colhidos pelo próprio aluno, para a realização de 25 execuções de determinada atividade. 2) Combustível consumido por um veículo, em litros, em 48 viagens pelo mesmo trajeto. 9,88 9,41 9,09 11,04 10,37 8,95 10,48 9,28 10,83 11,76 10,11 9,41 11,74 10,61 11,38 10,69 9,72 10,36 11,50 10,61 9,62 9,15 8,10 10,37 11,59 10,87 10,31 9,95 10,96 10,58 8,71 8,86 10,40 9,97 9,38 9,73 9,41 7,82 10,27 10,48 9,77 9,65 10,36 10,37 7,94 11,07 10,38 9,31 3) Acidentes de trabalho por mês numa fábrica, ao longo de um período de 5 anos. 4 4 2 1 2 3 1 0 0 0 2 2 2 2 5 2 1 2 3 4 1 5 1 1 1 1 0 1 3 3 1 2 1 2 2 1 3 3 1 2 4 2 0 2 1 3 6 3 0 3 3 0 0 3 0 2 3 3 0 1 Fim do Exercício nº 1-2 de Alexandre Augusto Pamato Cardoso Anapurús (49). 1 UFRJ - Departamento de Engenharia Industrial - 2011-1. EEI201 Probabilidade e Estatística - Turmas 3309 (EPT) e 4166 (EP1). Professor: José Miguel. Monitores: Marcelo e Ricardo. Exercício nº 2-1. Entrega até 5ª feira, 14 de abril de 2011 às 13h. Para cada um dos problemas apresentados a seguir, defina o experimento aleatório (ou experimentos) e os eventos aleatórios relevantes que representam o problema. Utilize letras maiúsculas para representar os eventos, com ou sem uso de índices. Não calcule as probabilidades pedidas nos problemas, pois isso será assunto dos próximos exercícios. As perguntas sobre as probabilidades estão nos enunciados apenas para ajudar a avaliar a relevância dos eventos. Veja o exemplo de resolução do problema 0. Evite, em especial, os seguintes erros e incorreções: 1) Confundir o experimento aleatório com o enunciado do problema. Às vezes, o próprio enunciado já é a descrição do experimento, mas é preciso cuidado, pois o experimento é o conjunto de condições que pode ser repetido indefinidamente, sempre da mesma forma, em relação ao qual a possibilidade da ocorrência de cadaevento aleatório é quantificada pela sua probabilidade. Ele é sempre uma idealização formal, um modelo abstrato da realidade, sendo esta descrita muitas vezes de maneira informal e imprecisa no enunciado do problema. 2) Representar eventos aleatórios distintos pelo mesmo símbolo. Ao jogar duas moedas, os eventos "primeira moeda dá coroa" e "segunda moeda dá coroa", por exemplo, são distintos (pois quando o experimento - jogar duas moedas - se realiza, pode um deles ocorrer e o outro não) e, portanto, não podem ser ambos representados pela letra C. Poderiam ser chamados, por exemplo, C1 e C2 (o uso de índices associados às letras pode ajudar bastante em certos problemas). 3) Escolher letras confusas, enganadoras ou desnecessárias para representar os eventos. Escolher letras que facilmente evoquem os eventos representados (e as relações - lógicas e/ou numéricas - entre eles) ajuda o pensamento a fluir, ou pelo menos não o atrapalha. Por exemplo, ao escolher uma carta ao acaso num baralho, ela pode ser preta ou vermelha. Se o evento "carta vermelha" for representado pela letra V, é melhor representar "carta preta" por V , que evidencia a relação ( ) ( )VP1VP −= , do que pela letra P. Pior ainda seria representar estes dois eventos por CV e CP, por exemplo... 4) Definir "eventos compostos". Por exemplo, em vez de fazer X = "1ª carta vermelha e 2ª preta", em geral é melhor definir A = "1ª carta vermelha" e B = "2ª carta preta" e depois referir-se ao evento "1ª carta vermelha e 2ª preta" como AB (ou A∩B). 5) Definir "eventos condicionados". Não existem "eventos condicionados", e sim probabilidades condicionadas1. Em vez de, por exemplo, P(FB) = "probabilidade de o rádio funcionar quando ambas as suas duas baterias estão carregadas", é melhor fazer R = "rádio funciona", B1 = "bateria 1 carregada", B2 = "bateria 2 carregada" e, portanto, P ("rádio funcionar quando ambas as baterias estão carregadas") = P(R|B1B2). 1 Este assunto (probabilidade condicionada) ainda não foi tratado nas aulas, a orientação refere-se apenas à definição dos eventos. 2 Problema 0 (exemplo) Uma moeda viciada, cuja coroa ocorre, em média, 80% das vezes em que é lançada, é colocada num saco onde já havia três moedas perfeitamente equilibradas. Em seguida, uma moeda é escolhida do saco ao acaso e lançada três vezes. a) Se o resultado do primeiro lançamento for coroa, qual é a probabilidade do resultado do segundo lançamento também ser coroa? a) Calcule a probabilidade de serem obtidas três coroas. b) Obtendo-se três coroas, qual é a probabilidade da moeda lançada ser a viciada? Resolução: Experimento: Observar os resultados de três lançamentos de uma moeda escolhida ao acaso num saco onde há três moedas equilibradas e uma moeda viciada, cujo resultado é coroa 80% das vezes. Eventos: V= "a moeda escolhida é viciada"; Ci = "o resultado do i-ésimo lançamento é coroa", para i = 1, 2 ou 3. Comentários: O evento "são obtidas três coroas" será representado por C1C2C3 e o evento "a moeda escolhida é equilibrada" por V . Problema 1 A urna A contém 8 bolas vermelhas e 2 azuis e a urna B contém 6 bolas vermelhas e 3 brancas. Uma bola é retirada ao acaso da urna A e colocada na urna B. Em seguida, uma bola é retirada ao acaso da urna B. a) Calcule a probabilidade desta bola ser vermelha. b) Se esta bola for vermelha, qual é a probabilidade dela ser originária da urna A? Problema 2 Um sistema compõe-se de dois subsistemas, A e B. Suponha que: (1) a probabilidade dos subsistemas falharem simultaneamente é igual a 1%; (2) a probabilidade de A falhar quando B falha é igual a 25%, e (3) a probabilidade de B falhar quando A falha é igual a 20%. Calcule as probabilidades de: a) o subsistema B falhar, e b) nenhum dos subsistemas falhar. Problema 3 Uma barra é quebrada ao acaso em dois pontos. Qual é a probabilidade de ser possível construir um triângulo com os três pedaços resultantes da quebra? (Suponha que os pontos onde a barra é quebrada são escolhidos ao acaso ao longo de toda a extensão da barra, independentemente um do outro) Problema 4 Suponha que entre 17h e 18h de um determinado dia 40% dos passageiros que embarcam na estação Carioca do Metrô nos trens da linha 1 (Ipanema - Saens Peña) que vão em direção à Zona Norte, desembarcarão na estação Estácio. No mesmo horário, esta proporção (de passageiros que se dirigem à estação Estácio) é igual a 30% na estação Uruguaiana e 20% nas demais estações. Suponha ainda que num trem de seis vagões, que chega à plataforma da estação Estácio às 17h 50min, há 25% de passageiros provenientes da estação Carioca e 40% oriundos da estação Uruguaiana. a) Qual é a probabilidade de um passageiro, escolhido ao acaso dentro deste trem, desembarcar na estação Estácio? b) Se um passageiro desembarca deste trem na estação Estácio, qual é a probabilidade dele ter embarcado na estação Carioca? 3 Problema 5 A figura representa as ligações existentes entre quatro localidades de certa região e as probabilidades delas permanecerem transitáveis após uma chuva forte. Qual é a probabilidade de ser possível transitar de A até C após uma chuva forte? E de A até B? Problema 6 Um equipamento eletro-mecânico de uso externo apresenta defeitos elétricos em 10% das vezes em que é utilizado. Os defeitos mecânicos ocorrem em 8% das vezes e há defeitos de ambos os tipos em 4% dos casos. No local onde o equipamento é usado, chove a quarta parte do tempo, mas apenas em 1% das vezes chove e ocorrem defeitos de ambos os tipos. Há registros ainda de 60% dos defeitos elétricos e 75% dos defeitos mecânicos surgirem na ausência de chuva. Qual é a probabilidade de ocorrer algum tipo de defeito quando chove? Problema 7 A Meteorologia avaliou que a probabilidade de chover hoje na Ilha do Fundão é igual a 60%. No entanto, um velho pescador da região, que acerta 90% das suas previsões quando chove e 80% quando não chove, afirma que hoje vai chover. Com base nas previsões da Meteorologia e do pescador, qual é a probabilidade de chover hoje? Problema 8 Dois dados são lançados e observa-se que o resultado de um deles é igual a 6. Qual é a probabilidade do resultado do outro dado também ser igual a 6? Problema 9 A probabilidade de haver petróleo em certa região foi avaliada pelos geólogos, com base nas características do solo, em 80%. Havendo petróleo, a probabilidade de encontrá-lo numa perfuração é igual a 50%. Calcule a probabilidade de haver petróleo na região se este não for encontrado a) na primeira perfuração, e b) nas primeiras n perfurações. Problema 10 Um jogador recebe duas cartas escolhidas ao acaso de um baralho de 15 cartas no qual há 4 cartas vermelhas. O objetivo do jogador é obter duas cartas vermelhas e ele troca, duas vezes, as cartas recebidas que não forem vermelhas (uma ou duas cartas de cada vez), por cartas escolhidas ao acaso dentre as restantes. As cartas trocadas não retornam ao baralho. Qual é a probabilidade do jogador obter, até o final do processo, as duas cartas vermelhas pretendidas? 1 FRJ - Departamento de Engenharia Industrial - 2011-1. EEI201 Probabilidade e Estatística - Turmas 3309 (EPT) e 4166 (EP1). Professor José Miguel. Resolução do exercício nº 2-1. Problema 1 A urna A contém 8 bolas vermelhas e 2 azuis e a urna B contém 6 bolas vermelhas e 3 brancas. Uma bola é retirada ao acaso da urna A e colocada na urna B. Em seguida, uma bola é retirada ao acaso da urna B. a) Calcule a probabilidade desta bola ser vermelha. b) Se esta bola for vermelha, qual é a probabilidade dela ser originária da urna A? Experimento: Retirar ao acaso uma bola da urna A, que contém 8 bolas vermelhas e 2 azuis, colocá-la na urna B, que continha 6 bolas vermelhas e 3 brancas, e em seguida retirar ao acaso uma bola da urna B, observando as cores das bolas movimentadas. ou Experimento:Retirar ao acaso uma bola da urna A, colocá-la na urna B, e em seguida retirar ao acaso uma bola da urna B, observando as cores das bolas movimentadas. A urna A contém inicialmente 8 bolas vermelhas e 2 azuis e a urna B 6 bolas vermelhas e 3 brancas. Eventos: A = "bola retirada da urna A (e colocada na urna B) é vermelha"; B = "bola retirada da urna B é vermelha"; M = "bola retirada da urna B é originária da urna A". Problema 2 Um sistema compõe-se de dois subsistemas, A e B. Suponha que: (1) a probabilidade dos subsistemas falharem simultaneamente é igual a 1%; (2) a probabilidade de A falhar quando B falha é igual a 25%, e (3) a probabilidade de B falhar quando A falha é igual a 20%. Calcule as probabilidades de: a) o subsistema B falhar, e b) nenhum dos subsistemas falhar. Experimento: Observar, num instante escolhido ao acaso, o funcionamento de um sistema e seus dois subsistemas A e B, cujas falhas ocorrem aleatoriamente ao longo do tempo, com frequências relativas que tendem para as probabilidades P(AB) = 1%, P(A|B) = 25% e P(B|A) = 20%. (*) Eventos: A = "subsistema A falha"; B = "subsistema B falha". (*) Como o enunciado é vago em relação ao que seja o tal "sistema", o experimento poderia, alternativamente, ser definido como, por exemplo, "observar uma determinada utilização de um sistema e seus dois subsistemas, etc". Problema 3 Uma barra é quebrada ao acaso em dois pontos. Qual é a probabilidade de ser possível construir um triângulo com os três pedaços resultantes da quebra? (Suponha que os pontos onde a barra é quebrada são escolhidos ao acaso ao longo de toda a extensão da barra, independentemente um do outro) Experimento: Quebrar uma barra em dois pontos escolhidos aleatoriamente ao longo de toda a sua extensão e medir os comprimentos a, b e c dos três pedaços resultantes da quebra. Eventos: A = "a < b + c"; B = "b < a + c"; C = "c < a + b"; T = "é possível construir um triângulo com os pedaços" (= ABC). Problema 4 Suponha que entre 17h e 18h de um determinado dia 40% dos passageiros que embarcam na estação Carioca do Metrô nos trens da linha 1 (Ipanema - Saens Peña) que vão em direção à Zona Norte, desembarcarão na estação Estácio. No mesmo 2 horário, esta proporção (de passageiros que se dirigem à estação Estácio) é igual a 30% na estação Uruguaiana e 20% nas demais estações. Suponha ainda que num trem de seis vagões, que chega à plataforma da estação Estácio às 17h 50min, há 25% de passageiros provenientes da estação Carioca e 40% oriundos da estação Uruguaiana. a) Qual é a probabilidade de um passageiro, escolhido ao acaso dentro deste trem, desembarcar na estação Estácio? b) Se um passageiro desembarca deste trem na estação Estácio, qual é a probabilidade dele ter embarcado na estação Carioca? Experimento: Escolher um passageiro ao acaso num trem de seis vagões, que chega à plataforma da estação Estácio às 17h 50min, no qual há 25% de passageiros provenientes da estação Carioca e 40% oriundos da estação Uruguaiana, num dia em que 40% dos passageiros que embarcam na estação Carioca, 30% dos que embarcam na estação Uruguaiana e 20% dos que embarcam nas demais estações, em direção à Zona Norte, desembarcam na estação Estácio. ou Experimento: Escolher um passageiro ao acaso num trem de seis vagões que chega à plataforma da estação Estácio às 17h 50min. No trem há 25% de passageiros provenientes da estação Carioca e 40% oriundos da estação Uruguaiana. Neste dia e horário, 40% dos passageiros que embarcam na estação Carioca, 30% dos que embarcam na estação Uruguaiana e 20% dos que embarcam nas demais estações, em direção à Zona Norte, desembarcam na estação Estácio. Eventos: E = "passageiro desembarca na estação Estácio"; U = "passageiro embarca na estação Uruguaiana"; C = "passageiro embarca na estação Carioca"; O = "passageiro embarca em outra estação". Problema 5 A figura representa as ligações existentes entre quatro localidades de certa região e as probabilidades delas permanecerem transitáveis após uma chuva forte. Qual é a probabilidade de ser possível transitar de A até C após uma chuva forte? E de A até B? Experimento: bservar, após uma chuva forte, as condições de tráfego das estradas que unem as localidades A e B, B e C, C e D, e D e A, que permanecem transitáveis após chuvas fortes de forma aleatória, com frequências relativas que tendem, respectivamente, para as probabilidades 60%, 50%, 50% e 80%. ou Experimento: Observar, após uma chuva forte, as condições de tráfego das estradas que unem as localidades A, B, C e D. Após chuvas fortes, as ligações permanecem transitáveis de forma aleatória, com frequências relativas que tendem para as probabilidades indicadas na figura. Eventos: X = "trecho AB está transitável"; Y = "trecho BC está transitável"; Z = "trecho AD está transitável"; W = "trecho CD está transitável"; A = "é possível ir de A até C" (= XY + ZW); B = "é possível ir de A até B" (= X + YZW). 3 Problema 6 Um equipamento eletro-mecânico de uso externo apresenta defeitos elétricos em 10% das vezes em que é utilizado. Os defeitos mecânicos ocorrem em 8% das vezes e há defeitos de ambos os tipos em 4% dos casos. No local onde o equipamento é usado, chove a quarta parte do tempo, mas apenas em 1% das vezes chove e ocorrem defeitos de ambos os tipos. Há registros ainda de 60% dos defeitos elétricos e 75% dos defeitos mecânicos surgirem na ausência de chuva. Qual é a probabilidade de ocorrer algum tipo de defeito quando chove? Experimento: Utilizar uma vez, num local onde chove de forma aleatória de tal forma que a frequência relativa de chuva tende para 25%, um equipamento eletro-mecânico que apresenta defeitos de forma aleatória, de tal forma que as frequências relativas de defeitos elétricos e mecânicos tendem respectivamente para 10% e 8%, a frequência relativa de defeitos de ambos os tipos tende para 4%, as frequências relativas de defeitos elétricos e mecânicos que surgem na ausência de chuva tendem, respectivamente, para 60% e 75%, e a frequência relativa da ocorrência de chuva em conjunto com defeitos de ambos os tipos tende para 1%, observando a ocorrência de chuva e de defeitos. ou Experimento: Utilizar um equipamento eletro-mecânico e observar a ocorrência de chuva e de defeitos. Os defeitos elétricos e mecânicos e a chuva ocorrem de forma aleatória, com frequências relativas que tendem, respectivamente, para 10%, 8% e 25%. A frequência relativa de defeitos de ambos os tipos tende para 4%, as frequências relativas de defeitos elétricos e mecânicos que surgem na ausência de chuva tendem, respectivamente, para 60% e 75%, e a frequência relativa da ocorrência de chuva em conjunto com defeitos de ambos os tipos tende para 1%. Eventos: E = defeito elétrico; M = defeito mecânico; C = chuva. Problema 7 A Meteorologia avaliou que a probabilidade de chover hoje na Ilha do Fundão é igual a 60%. No entanto, um velho pescador da região, que acerta 90% das suas previsões quando chove e 80% quando não chove, afirma que hoje vai chover. Com base nas previsões da Meteorologia e do pescador, qual é a probabilidade de chover hoje? Experimento: Observar qual é a previsão do pescador e se chove hoje na Ilha do Fundão. Nas condições observadas hoje pela Meteorologia, a chuva ocorre de forma aleatória, de tal forma que a sua frequência relativa tende para 60%. O pescador acerta as suas previsões aleatoriamente, de tal forma que a frequência relativa de acertos tende para 90% quando chove e para 80% quando não chove. Eventos: C = chove; H = pescador prevê chuva. Problema 8 Dois dados são lançados e observa-se que o resultado de um deles é igual a 6. Qual é a probabilidade do resultado do outro dado também ser igual a 6? Experimento: Lançar dois dados equilibrados e observaro resultado de cada um deles. Eventos: A1 = "resultado do primeiro dado é igual a 6"; A2 = "resultado do segundo dado é igual a 6"; X = "o resultado de um deles é igual a 6" (= A1 + A2); Y = "o resultado do outro também é igual a 6" (= A1A2). Observação: A interpretação dos eventos X (ocorrido) e Y (cuja probabilidade se quer calcular) é dada pelo contexto. "O resultado de um deles é igual a 6" só pode ser o "resultado de pelo menos um deles é igual a 6", e "o resultado do outro dado ser igual a 6" só pode ser 4 "o resultado de ambos os dados é igual a 6". Problema 9 A probabilidade de haver petróleo em certa região foi avaliada pelos geólogos, com base nas características do solo, em 80%. Havendo petróleo, a probabilidade de encontrá-lo numa perfuração é igual a 50%. Calcule a probabilidade de haver petróleo na região se este não for encontrado a) na primeira perfuração, e Experimento: Fazer uma perfuração num ponto escolhido ao acaso numa região escolhida ao acaso num conjunto de regiões com características geológicas semelhantes, e observar se se encontra petróleo. Há petróleo em 80% das regiões. Nas regiões onde há petróleo, este está distribuído de forma aleatória dentro da região, de tal forma que é encontrado com frequência relativa tendendo a 50%. Eventos: H = "há petróleo na região" E = "encontra-se petróleo na perfuração" b) nas primeiras n perfurações. Experimento: Fazer perfurações consecutivas em pontos escolhidos ao acaso numa região escolhida ao acaso num conjunto de regiões com características geológicas semelhantes, e observar se se encontra petróleo em cada uma das perfurações. Há petróleo em 80% das regiões. Nas regiões onde há petróleo, este está distribuído de forma aleatória dentro da região, de tal forma que é encontrado com frequência relativa tendendo a 50%. Eventos: H = "há petróleo na região"; Ei = "encontra-se petróleo na i-ésima perfuração", onde i = 1, 2, 3, ..., n. Observação: O enunciado é omisso em relação à continuidade das perfurações no caso de encontrar-se petróleo em alguma delas. Por exemplo, se é encontrado petróleo na 2ª perfuração e então não se perfura mais, diremos que se encontrou ou não se encontrou petróleo na 5ª perfuração? Para superar esse problema "lógico", podemos manter os eventos definidos em qualquer alternativa, desde que se explicite o que significa o evento Ei quando a i-ésima perfuração não é realizada. O mais simples parece ser afirmar que neste caso Ei não ocorre, ou seja, ocorre iE . No exemplo anterior diríamos então que, ao ocorrer o evento E2, ocorrem necessariamente os eventos 3E , 4E , 5E etc. Problema 10 Um jogador recebe duas cartas escolhidas ao acaso de um baralho de 15 cartas no qual há 4 cartas vermelhas. O objetivo do jogador é obter duas cartas vermelhas e ele troca, duas vezes, as cartas recebidas que não forem vermelhas (uma ou duas cartas de cada vez), por cartas escolhidas ao acaso dentre as restantes. As cartas trocadas não retornam ao baralho. Qual é a probabilidade do jogador obter, até o final do processo, as duas cartas vermelhas pretendidas? Experimento: Escolher duas cartas ao acaso de um baralho de 15 cartas das quais 5 são vermelhas. Caso uma ou duas das cartas escolhidas não sejam vermelhas, trocá-las, isto é, descartá-las e escolher, respectivamente, uma ou duas cartas das que restaram do baralho, ao acaso, e juntá-la(s) à(s) carta(s) não descartada(s), se houver. Caso ainda haja, nas cartas escolhidas e não descartadas, cartas que não sejam vermelhas, trocá-las por igual número de cartas escolhidas ao acaso dentre as restantes. Eventos: Ai = "i cartas vermelhas obtidas inicialmente", onde i = 0, 1, 2; Bj = "j cartas vermelhas obtidas no total após a 1ª troca", onde j = 1, 2, 3; Ck = "k cartas vermelhas obtidas no total após a 2ª troca", onde k = 1, 2, 3; X = "2 cartas vermelhas obtidas ao final do processo" (= A2 + B2 + C2). Observação: Uma alternativa é definir Bj como "j cartas vermelhas obtidas na 1ª troca" e Ck de forma semelhante. Neste caso, os valores possíveis de j dependeriam de qual dos eventos Ai tivesse ocorrido, assim como os valores possíveis de k dependeriam das ocorrências dos Ai's e dos Bj's. 1 UFRJ - Departamento de Engenharia Industrial - 2011-1. EEI201 Probabilidade e Estatística - Turmas 3309 (EPT) e 4166 (EP1). Professor: José Miguel. Monitores: Marcelo e Ricardo. Exercício nº 2-2. Entrega até 3ª feira, 26 de abril de 2011 às 13h. Atenção: Em cada um dos problemas apresentados a seguir, a) defina o(s) experimento(s) aleatório(s) que representa(m) o problema; b) defina os eventos aleatórios relevantes para a resolução do problema; c) estabeleça as relações entre os eventos definidos, e d) utilize as propriedades da probabilidade (axiomas, teoremas, definições) para encontrar as respostas às questões formuladas. Tome o cuidado de sempre a) justificar as resoluções e explicitar as hipóteses, suposições e simplificações adotadas, e b) indicar claramente as respostas às perguntas dos enunciados dos problemas. Evite, em especial, os erros e incorreções já mencionados no enunciado do exercício 2-1 e também os que seguem. 1) Resolver as questões sem levar em conta os eventos definidos. Isto é, os eventos não devem ser definidos "só para constar". A definição clara dos eventos não pode ser um problema a mais e sim aproveitada como parte do caminho para a solução! 2) Efetuar operações não justificadas entre probabilidades (por exemplo, multiplicar probabilidades sem base no teorema da multiplicação, ou somá-las em desacordo com o axioma da adição). Qualquer operação envolvendo probabilidades de um ou mais eventos, com o objetivo de encontrar probabilidades de outros eventos, só estará correta se corresponder à aplicação de propriedades (definições, axiomas ou teoremas) da probabilidade à situação em questão. 3) Calcular probabilidades envolvendo vários eventos sem definir anteriormente que relações há entre eles. Uma das etapas mais importantes, talvez a mais importante, da resolução de problemas de probabilidade é o estabelecimento das relações lógicas entre os eventos envolvidos. Relações numéricas entre probabilidades dependem completamente das relações lógicas (somas, produtos, implicações, equivalências etc) entre os eventos respectivos, elas não têm "existência autônoma". Por exemplo, P(X) só será igual a P(A)+P(B)+P(C) (exceto por alguma coincidência numérica) se X for equivalente a pelo menos A, B ou C, e se os três eventos A, B e C forem mutuamente excludentes dois a dois. 4) Supor (às vezes implicitamente) mutuamente excludentes ou independentes eventos que não o são. É o que se faz quando se somam as probabilidades de A e de B para encontrar a probabilidade de pelo menos A ou B (isto é, do evento A+B), "esquecendo-se" de subtrair P(AB). Ou quando se multiplicam as probabilidades de A e B (em vez de B dado A) para encontrar P(AB). 5) Não indicar as suposições adicionais necessárias à resolução das questões (especialmente independência). Nem sempre o enunciado do problema contém explicitamente todas as condições necessárias para o cálculo das probabilidades pedidas, para o que é preciso fazer suposições simplificadoras, em geral relativas a independência, regularidade, possibilidade de repetição etc. 2 Problema 1 Um sistema compõe-se de dois subsistemas, A e B. Suponha que: (1) a probabilidade dos subsistemas falharem simultaneamente é igual a 1%; (2) a probabilidade de A falhar quando B falha é igual a 25%, e (3) a probabilidade de B falhar quando A falha é igual a 20%. Calcule as probabilidades de: a) o subsistema B falhar, e b) nenhum dos subsistemas falhar. Problema 2 Uma barra é quebrada ao acaso em dois pontos. Qual é a probabilidade de ser possível construir um triângulo com os três pedaços resultantes da quebra? (Suponha que os pontos onde a barra é quebrada
Compartilhar