Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Universidade Federal do Piauí Campus Universitário “Profa. Cinobelina Elvas” – Bom Jesus, PI Profa. Gisele V - VARIÁVEIS ALEATÓRIAS 1. INTRODUÇÃO Ao descrever o espaço amostral de um experimento aleatório, o resultado individual não necessariamente é um número. Por exemplo: no lançamento de duas moedas consecutivas podemos obter: S = {cara-cara, cara-coroa, coroa-cara, coroa-coroa}. Contudo, em muitas situações experimentais, estaremos interessados na mensuração de alguma coisa e no seu registro como um número. Ou seja, desejamos atribuir um número real x a todo elemento a do espaço amostral S. Portanto, no caso do lançamento consecutivo de duas moedas, podemos transformar os resultados de S em números, atribuindo-se de acordo com a contagem do NÚMERO DE COROAS obtidas, ou seja, S ={0, 1, 2}, ou de acordo com o NÚMERO DE CARAS obtidas, ou seja, S ={2, 1, 0}. A este procedimento de obter uma função X, que associe aos elementos a pertencentes a S um número real, X(a), é denominada VARIÁVEL ALEATÓRIA. 2. CONCEITOS DE VARIÁVEL ALEATÓRIA Definição simplificada: Uma vez que os valores da variável estão relacionados a um experimento aleatório ou probabilístico, VARIÁVEL ALEATÓRIA é toda variável cujos resultados estão associados a uma probabilidade. Experimentos aleatórios são aqueles que, repetidos em idênticas condições, podem produzir resultados diferentes. Embora não se saiba qual o resultado que irá ocorrer num experimento, em geral, consegue-se descrever o conjunto de todos os resultados possíveis que podem ocorrer. As variações de resultados, de experimento para experimento, são devidas a uma multiplicidade de causas que não podemos controlar, as quais denominam acasoacasoacasoacaso. 2 Definição estatística: Seja E um experimento aleatório e S o espaço amostral associado a este experimento. Uma função X, que associe a cada elemento a pertencente a S um número real, X(a), é denominada VARIÁVEL ALEATÓRIA. Ex: Considere o experimento probabilístico ou aleatório: lançamento de duas moedas consecutivas, logo: S = {cara-cara; cara-coroa; coroa-cara; coroa-coroa} Considere agora que X é a variável aleatória definida como o NÚMERO DE COROAS obtidas, ou seja: X = {0, 1, 2}, Portanto, X(cara-cara) = 0 (NENHUMA COROA NO LANÇAMENTO DE DUAS MOEDAS) X(cara-coroa) = X(coroa-cara) = 1 (UMA COROA NO LANÇAMENTO DE DUAS MOEDAS) X(coroa-coroa) = 2 (DUAS COROA NO LANÇAMENTO DE DUAS MOEDAS) Em que, S = espaço amostral original correspondente a todos os possíveis resultados do experimento (numérico ou não); R = novo espaço amostral associado à variável aleatória X, representando todos os valores numéricos de interesse (todos os valores possíveis e definidos de X(a) de a em S). Cara-cara Cara-coroa Coroa-cara Coroa-coroa 0 1 2 S R a X(a) S R v.a.X 3 Observações: a) Apesar da terminologia “variável aleatória”, ela é uma função cujo domínio é o conjunto S e o contradomínio é o conjunto R; b) O uso de variáveis aleatórias equivale a descrever os resultados de um experimento aleatório por meio de números ao invés de palavras, o que apresenta a vantagem de possibilitar melhor tratamento estatístico; c) Nem toda função é uma variável aleatória, pois uma vez que ao mesmo s forem atribuídos diferentes X(a), a relação não poderá se caracterizar uma relação funcional ou função. Lembrete: Uma quantidade é uma função de outra quando, para cada quantidade da variável independente (x), corresponde a um único valor denominado f(x) (variável dependente). O conjunto em que os valores de x podem ser tomados é chamado de domínio da função, e o conjunto dos valores que f assume para cada x é denominado imagem da função. As variáveis aleatórias serão sempre representadas por letras maiúsculas (X, Y, Z, W, etc.). As realizações (ou variações) dessas variáveis em um dado elemento da população serão sempre representadas por letras minúsculas (x, y, z, w, etc.). Quando o resultado do experimento probabilístico for registrado como um único número x ter-se-á uma VARIÁVEL ALEATÓRIA UNIDIMENSIONAL, que poderá ser discreta ou contínua. Porém, quando para um determinado experimento, cada resultado é proveniente da avaliação simultânea de dois caracteres, como por exemplo, estudar a estatura X e o peso Y, de alguma pessoa escolhida ao acaso, o resultado será (x,y), e ter-se-á uma VARIÁVEL ALEATÓRIA BIDIMENSIONAL. Nota-se, nesse caso, que cada resultado é identificado por cada um dos valores que as variáveis aleatórias unidimensionais assumem. a X(a) Y(a) S v.a.X v.a.Y 4 3. VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS 3.1. Variável Aleatória Discreta 3.1.1. Definição: Seja X uma variável aleatória (v.a.). Se o número de valores possíveis de X(a) (isto é o seu contradomínio) for finito ou infinito enumerável, denominaremos X de variável aleatória discreta, assim, os valores possíveis de X são x1, x2,....,xn. No caso finito a lista de valores de x acaba e no caso infinito enumerável, a lista continua indefinidamente. Em geral uma variável aleatória é obtida mediante alguma forma de contagem. 3.1.2. Função de probabilidade (f.p.) Utilizando o conceito de função em que uma quantidade é uma função de outra quando, para cada quantidade da variável independente (x), corresponde a um único valor denominado f(x) (variável dependente), chama-se FUNÇÃO DE PROBABILIDADE (f.p.) da variável aleatória discreta X, a função: F(x) = P (X = xi) = P (xi) Pois a cada valor de xi associa-se sua probabilidade de ocorrência. A função P (xi) será uma f. p. se satisfizer às seguintes condições: * P(xi) ≥ 0, para todo xi, e, * )(1)( SPxP i ==∑ OBS.: Mesmo que a variável assuma um número infinito enumerável de valores não há nenhum problema em comprovar que cada xi contribui com uma quantidade f(xi) ao total, de modo que, ∑ ∑∑ ∞ = ∞ = ∞ = ==== 1 11 1)()()( i i i i ii xXPxpxf À coleção de pares [xi, P(xi)], i = 1, 2,..., n, denominamos DISTRIBUIÇÃO DE PROBABILIDADE da v. a. d. X, que pode ser representada por meio de tabelas e gráficos. 3.1.2.1. Representação tabular da DISTRIBUIÇÃO DE PROBABILIDADE de variável aleatória discreta É dada por: 5 xi x1 x2 … xn ∑ P(X=xi) P(x1) P(x2) ... P(xn) 1,0 3.1.2.1. Representação gráfica da DISTRIBUIÇÃO DE PROBABILIDADE de variável aleatória discreta É obtida alocando-se no eixo das abscissas os valores de x e no eixo das coordenadas os valores de suas respectivas probabilidades. Uma linha horizontal é feita em cada valor de x na altura de sua respectiva probabilidade. Exemplo 1: Considere o experimento probabilístico ou aleatório: lançamento de duas moedas consecutivas, logo: S = {cara-cara; cara-coroa; coroa-cara; coroa-coroa} Considere agora que X é a variável aleatória definida como o NÚMERO DE COROAS obtidas, ou seja: X = {0, 1, 2}, Portanto, X(cara-cara) = 0, X(cara-coroa) = X(coroa-cara) = 1, X(coroa-coroa) = 2. Cujas probabilidades de ocorrência são: P (0) = 1/4, P (1) = 2/4 e P (2) = 1/4. Logo, a representação tabular da DISTRIBUIÇÃO DE PROBABILIDADE de X é: xi 0 1 2 ∑ P(X=xi) 1/4 2/4 1/4 1,0 Em que, P (xi) ≥ 0 e ∑ = == k i ixXP 1 1][ Nota-se que para uma variável aleatória discreta as probabilidades de cada valor x correspondem à própria função, por isso esta é chamada de FUNÇÃO DE PROBABILIDADE. 6 E a representação gráfica da DISTRIBUIÇÃO DE PROBABILIDADE de X é: Exemplo 2: Tem-se 5 animais: 2 animais de uma raça bovina A (A1 e A2) e 3 animais de uma raça bovina B (B1, B2 e B3). Deseja-se obter uma amostra de 2 animais da raça A, escolhidos ao acaso dentre os 5 animais. a) Obter o espaço amostral desse experimento aleatório S: {A1A2, A1B1, A1B2, A1B3, A2B1, A2B2, A2B3, B1B2, B1B3, B2B3} b) Obter a variável aleatória X “número de animais da raçaA” na amostra. {B1B2, B1B3, B2B3}, ou seja, nenhum animal da raça A. {A1B1, A1B2, A1B3, A2B1, A2B2, A2B3}, ou seja, um animal da raça A. {A1A2}, ou seja, dois animais da raça A. No entanto, na estatística, é mais fácil utilizar valores numéricos do que trabalhar diretamente com elementos de um espaço como o anterior. Assim, se X se for a variável aleatória NÚMERO DE ANIMAIS DA RAÇA A, os valores assumidos por X são x = 0, 1, 2. Como essa associação de números aos pontos do espaço amostral, define-se uma função sobre cada elemento desse espaço. Essas funções sobre os elementos do espaço são as variáveis aleatórias. No caso, tem-se uma variável aleatória discreta, em que se atribui um único número real a cada elemento do espaço amostral S. c) Obter a tabela da DISTRIBUIÇÃO DE PROBABILIDADE de X. Seja a v. a d. X o NÚMERO DE ANIMAIS DA RAÇA A, a representação tabular da função de probabilidade da variável número de animais da raça A é dada por: xi 0 1 2 ∑ P(X=xi) 10 3 10 6 10 1 1,0 0 1 2 x 2/4 1/4 7 Em que, P (xi) ≥ 0 e ∑ = == k i ixXP 1 1][ d) Obter o gráfico da DISTRIBUIÇÃO DE PROBABILIDADE de X. A representação gráfica da função de probabilidade da variável número de animais da raça A é dada por: 3.1.3. Variável aleatória discreta uniformemente distribuída Este é o caso mais simples de variável aleatória discreta, em que cada possível valor ocorre com a mesma probabilidade. Definição: A variável aleatória discreta X, assumindo os valores x1, x2, ..., xn, tem distribuição uniforme, se e se somente se: f(x) = P (X = xi) = P (xi) = p = n 1 , para todo i = 1, 2, …, n Exemplo: Considere o experimento aleatório o lançamento de um dado não-viciado. S = {1, 2, 3, 4, 5, 6} Considere a variável aleatória discreta X dada pelo NÚMERO DE PONTOS OBTIDOS. Essa variável assume obviamente os valores de 1 a 6, e a cada valor é possível associar um único número real, ou seja, um valor de probabilidade, que no caso, para todos é igual a 1/6. 1 2 0 3/10 6/10 1/10 x Figura 1. Função de probabilidade da variável NÚMERO DE ANIMAIS DA RAÇA A. 8 Portanto, a representação tabular da função de probabilidade F(x) = P (X = xi) = P (xi), ou seja, a DISTRIBUIÇÃO DE PROBABILIDADE de X: xi 1 2 3 4 5 6 ∑ P(X=xi) 1/6 1/6 1/6 1/6 1/6 1/6 1,0 3.1.3.1. Representação gráfica da DISTRIBUIÇÃO DE PROBABILIDADE de X. 3.2. Variável aleatória contínua 3.2.1. Definição: Seja X uma variável aleatória (v.a.). Se o número de valores possíveis de X(a) (isto é o seu contradomínio) for infinito não-enumerável como, por exemplo, um intervalo, X será denominada de variável aleatória contínua. Consideremos por exemplo o experimento que consiste em selecionar, ao acaso, um fruto de tomate de uma área de produção e determinar o valor do peso do fruto em gramas. Nesse caso, dentro de um determinado grau de precisão decorrente da limitação do equipamento de mensuração, a variável aleatória X = PESO DO FRUTO pode assumir um valor qualquer em um determinado intervalo da reta real, sendo, portanto, uma variável aleatória contínua. Como uma variável aleatória contínua pode assumir uma infinidade de valores em um intervalo real, ou seja, o conjunto de valores que a variável pode assumir é infinito não- enumerável, a cada um dos infinitos valores da reta real é atribuída probabilidade nula. Portanto, não faz sentido fazer uma soma das probabilidades de cada um dos valores como no 1 2 3 4 5 6 1/6 Figura 1. Função de probabilidade da variável NÚMERO DE PONTOS OBTIDOS no lançamento de um dado. 9 caso das variáveis aleatórias discretas, mas sim fazer a soma das probabilidades dos valores em intervalos da reta real. Nesse caso, o que generaliza o conceito de ∑ é o de integral ( ∫ ) , ou seja, calcular a integral significa “integrar” ou somar os valores da função. 3.2.2. Função de densidade probabilidade (f.d.p.) Como para variável aleatória contínua a probabilidade de cada um dos infinitos valores na reta real é igual a zero, não se tem uma função de probabilidade F(x) = P (X = xi) = P (xi) como para variável aleatória discreta. Nesse caso, as probabilidades de ocorrência de cada um dos possíveis resultados do experimento aleatório são determinadas por uma função contínua f(x) denominada FUNÇÃO DENSIDADE PROBABILIDADE (f.d.p.), que satisfaça as seguintes condições: a) xtodoparaxf 0)( ≥ As probabilidades não podem ser negativas. b) ∫ +∞ ∞− =1dx)x(f A probabilidade do espaço amostral é 1, isto é, a probabilidade de ocorrência dos resultados dentro do intervalo é sempre 100% possível. c) P(a ≤ X ≤ b) = ∫ b a dx)x(f A probabilidade de que a variável aleatória assuma valores em um intervalo é a área sob a curva da função densidade probabilidade no intervalo entre a e b. É importante ressaltar que, no cálculo da probabilidade de um intervalo, este pode ser fechado ou aberto, pois a inclusão ou não dos extremos a e b do intervalo não altera o valor desse cálculo, visto que a probabilidade de um ponto é nula. IMPORTANTE: A f(x) de uma v. a c., função de densidade probabilidade, não é probabilidade. Somente quando a função for integrada entre dois limites, ela produzirá uma probabilidade, que será a área sob a curva da função X = a e X = b, a < b, ou seja, a probabilidade de x em intervalo entre a e b da reta real. Exemplo 1: Seja X a variável diâmetro (em mm) de frutos de mamão colhidos no estado inicial, cuja função de x [f(x)] é dada por: 10 Dada a função desta variável, calcule k de modo que f (x) seja uma f.d.p. Resposta: Para isto, a f (x) deve atender as duas condições xtodoparaxf 0)( ≥ e ∫ +∞ ∞− =1dx)x(f . Assim, ∫ +∞ ∞− =1)( dxxf 1)( 20 10 =∫ dxkx 1) 2 (. 20 10 2 = xk 150 1)1020( 2 1 . 22 =−k Logo, k = 1/150 também atende a primeira condição de xxf ∀≥ 0)( . Portanto qualquer fruto com diâmetro entre 10 e 20 terá a mesma probabilidade de ocorrência, ou seja, será igual a 1 ou 100%, e fora desse intervalo a probabilidade será sempre igual a zero. Porém, se desejarmos saber a probabilidade de encontrarmos um fruto com diâmetro entre 10 e 12, a forma de obtenção da mesma será pela resolução da integral considerando esse intervalo, qual seja: ?) 150 1()1210( 12 10 ==≤≤ ∫ dxxxP 12 10 2 ) 2 (. 150 1)1210( xxP =≤≤ %15ou 15,0)1012( 300 1)1210( 22 =−=≤≤ xP kx, se 10 ≤ x ≤ 20 f(x) = 0, outros valores de x. 11 Exemplo 2: Considerando que a demanda diária, em quilogramas, de determinado produto em um supermercado é uma variável aleatória, dada pela seguinte função densidade probabilidade (f. d. p.): a) Determinar o valor de k. Para isto, a f (x) ser f.d.p deve atender as duas condições xtodoparaxf 0)( ≥ e ∫ +∞ ∞− =1dx)x(f . Assim, ∫ +∞ ∞− =1)( dxxf 1)]1([)( 1 2/1 2/1 0 =−+ ∫∫ dxxkdxkx 1) 2 (.) 1 (.) 2 (. 1 2/1 21 2/1 2/1 0 2 =−+ xkxkxk 1])2/1()1[( 2 1 .])2/1()1.[()]0)2/1[( 2 1 . 222222 =−−−+− kkk 4=k Logo, k = 4 Portanto, b) Calcular a probabilidade de que a demanda diária do produto esteja entre 250 e 750g. Sabe-se que para a demanda diária entre 0 e 500 g (ou 0 e 1/2) a função é 4x, e que para a demanda entre 500g e 1000g (ou 1/2 e 1) a função é 4(x – 1). Logo, para saber a demanda diária entre 250 e 750 deve-se integrar e somar nos intervalos de 250 a 500g (ou 1/4 e 1/2) e de 500 a 750g (ou 1/2 e 3/4). Ou seja: f(x) = kx, se 0 ≤ x ≤ 1/2 k(1 - x), se 1/2 ≤ x ≤ 1 0, outros valores de x. f(x) = 4x, se 0 ≤ x ≤ 1/2 4(1 - x), se 1/2 ≤ x ≤ 1 0, outros valores de x. 12 dxxfdxxfdxxf )()()( 4/3 2/1 2/1 4/1 750 250 ∫∫∫ += dxxdxxdxxf ∫∫∫ −+= 4/3 2/1 2/1 4/1 750 250 )]1(4[)4()( dxxdxxdxxf ∫∫∫ −+= 4/3 2/1 2/1 4/1 750 250 )44()4()( dxxdxdxxdxxf ∫∫∫∫ −+= 4/3 2/1 4/32/1 2/1 4/1 750 250 )4()4()4()( 4/3 2/1 24/3 2/1 2/1 4/1 2750 250 ) 2 (.4) 1 (.4) 2 (.4)( xxxdxxf −+=∫ ])2/1()4/3.[( 2 4)2/14/3.(4])4/1()2/1.[( 2 4)( 2222 750 250 −−−++=∫ dxxf 75,0)( 750 250 =∫ dxxf ou 75% Logo, a probabilidade de que a demanda diária do produto esteja entre 250 e 750 é 75%. 3.2.3. Variável aleatória contínua uniformemente distribuída É o caso mais simples de variável aleatória contínua. Definição: A v.a. contínua tem distribuição uniforme no intervalo [a,b], sendo a e b finitos, se a sua função densidade de probabilidade (f. d. p.) for dada por: ≤≤ − = xde valoresoutros para ,0 a para ,1)( bxabxf 4. VARIÁVEIS ALEATÓRIAS BIDIMENSIONAIS Seja E um experimento aleatório e S um espaço amostral associado a E. Seja X uma variável aleatória e Y outra variável aleatória e X(a) e Y(a) são duas funções, cada uma associando um número real a cada resultado de a ∈ S, então determinaremos (X,Y) uma variável aleatória bidimensional. Na prática, significa que para um determinado experimento aleatório, cada resultado é proveniente da avaliação simultânea de duas variáveis. Do mesmo modo que no caso unidimensional (X,Y) deve ter associada a cada valor que pode assumir uma probabilidade de sua ocorrência. Assim, são definidas as funções e 13 distribuições de probabilidades da v.a. bidimensional (X,Y). Para o nosso estudo consideraremos que X e Y são ambas discretas ou ambas contínuas. 4.1. Quando (X,Y) é variável aleatória discreta bidimensional Se os valores possíveis da variável (X,Y) forem finitos ou infinitos enumeráveis, esta será uma v.a. discreta bidimensional. Assim, os valores possíveis de (X,Y) podem ser representados por (xi, yj) i = 1, 2, ..., n j = 1, 2, ..., m 4.1.1. Função de probabilidade conjunta de X e Y É dada por: ),(),( jiji yxPyYxXP === Em que a cada valor de (xi, yi) associa-se a sua probabilidade de ocorrência. Para que P(xi, yi) seja uma função de probabilidade conjunta é necessário que satisfaça às seguintes condições: i) P(xi, yi) ≥ 0, ∀ (xi,yj) ii) 1),( 1 1 =∑∑ = = m j n i ji yxP ,0 4.1.2. Distribuição de probabilidade conjunta de X e Y É o conjunto {(xi,yj), P(xi,yj)} ∀ i = 1, 2, ..., n j = 1, 2, ..., m Y X y1 y2 K ym Total x1 P(x1, y1) P(x1, y2) K P(x1, ym) P(X = x1) = P(x1) =∑ = m j jyxP 1 1 ),( X2 P(x2, y1) P(x2, y2) K P(x2, ym) P(X = x2) = P(x2) =∑ = m j jyxP 1 2 ),( M M M M M M xn P(xn, y1) P(xn, y2) K P(xn, ym) P(X = xn) = P(xn) =∑ = m j jn yxP 1 ),( Total P(Y = y1) = P(y1) =∑ = n i i yxP 1 1 ),( P(Y = y2) = P(y2) =∑ = n i i yxP 1 2 ),( K P(Y = ym) = P(ym) =∑ = n i mi yxP 1 ),( 1,0 14 A partir da distribuição conjunta das duas variáveis aleatórias X e Y podemos determinar a distribuição de X sem considerar Y e a de Y sem considerar X. São as chamadas DISTRIBUIÇÕES MARGINAIS. A distribuição marginal é constituída pelos valores da variável aleatória e suas respectivas probabilidades marginais. A probabilidade marginal para cada valor é obtida da seguinte forma: � Para X: P(X = xi) = P (xi) = ∑ = m j ji yxP 1 ),( � Para Y: P(Y = yi) = P (yi) = ∑ = n i ji yxP 1 ),( Ou seja, a marginal de X é a função de probabilidade da v.a. X sem considerar a v.a.Y, e a marginal de Y é a função de probabilidade da v. a.X sem considerar a v.a.X. Com as probabilidades marginais para cada valor, podemos construir a distribuição marginal para a variável aleatória: � Para X: xi x1 x2 … xn P(X=xi) P(x1) P(x2) ... P(xn) � Para Y: yi y1 y2 … ym P(Y=yi) P(y1) P(y2) ... P(ym) 15 Exemplo: Seja a variável discreta bidimensional (X, Y), cuja distribuição de probabilidade conjunta é dada pela tabela: Y X -3 0 1 -2 1/9 0 2/9 0 0 2/9 2/9 1 1/9 1/9 0 a) Obter as probabilidades marginais de X e Y. � Para X: P(X = xi) = P (xi) = ∑ = m j ji yxP 1 ),( P(X = -2) = P (-2) = 1/9 + 0 + 2/9 = 3/9 P(X = 0) = P (0) = 0 + 2/9 + 2/9 = 4/9 P(X = 1) = P (1) = 1/9 + 1/9 + 0 = 2/9 Logo, ∑ = m j ji yxP 1 ),( = 3/9 + 4/9 + 2/9 = 1,0 Ou seja, xi -2 0 1 ∑ P(X = xi) 3/9 4/9 2/9 1,0 � Para Y: P(Y = yi) = P (yi) = ∑ = n i ji yxP 1 ),( P(Y = -3) = P (-3) = 1/9 + 0 + 1/9 = 2/9 P(Y = 0) = P (0) = 0 + 2/9 + 1/9 = 3/9 P(Y = 1) = P (1) = 2/9 + 2/9 + 0 = 4/9 Logo, ∑ = n i ji yxP 1 ),( = 2/9 + 3/9 + 4/9 = 1,0 Ou seja, yi -2 0 1 ∑ P(Y = yi) 2/9 3/9 4/9 1,0 16 4.2. Quando (X,Y) é variável aleatória contínua bidimensional Se a variável (X,Y) puder assumir todos os valores em algum conjunto infinito não- enumerável, esta será uma v.a. contínua bidimensional. 4.2.1. Função de densidade probabilidade conjunta de X e Y Seja (X,Y) uma v.a.c. bidimensional. Diz-se que f(x,y) é uma função de densidade probabilidade conjunta de X e Y, se satisfazer as seguintes condições. i) f(x,y) ≥ 0, ∀ todo (x,y) ii) ∫ ∫ = = = m j n i dydxyxf 1 1 1.),( Em que, f(x,y) = 0 para (x,y) ∉ aos intervalos de x e y. 4.2.2. Distribuição de probabilidade conjunta de X e Y A partir da distribuição conjunta das duas variáveis aleatórias X e Y podemos determinar a distribuição de X sem considerar Y e a de Y sem considerar X. São as chamadas DISTRIBUIÇÕES MARGINAIS. Porém, para (X,Y) variável aleatória contínua, as funções de densidade probabilidade marginais de X e Y são dadas por: ∫ +∞ ∞− = dyyxfxf ),()( ∫ +∞ ∞− = dxyxfyf ),()( Exemplo: Sejam X e Y variáveis aleatórias contínuas com f.d.p. conjunta dada por: a) Calcular o valor de k 0,1),(6 2 5 0 =∫ ∫ dxdyyxf 0,1)2(6 2 5 0 =+∫ ∫ dxdyyxk 0,1)()2( 6 2 5 0 6 2 5 0 =+ ∫ ∫∫ ∫ dxdykydxdyxk 0,1)()2( 6 2 5 0 6 2 5 0 =+ ∫ ∫∫ ∫ dxdykydxdyxk k (2x +y), se 2 ≤ x ≤ 6 0 ≤ y ≤ 5 f(x,y) = 0, para outros valores de x e y 17 ∫∫ =+ 5 2 6 2 15 0 6 2 2 0,1) 1 (.) 2 (.2 dyxkydyxk ∫∫ =−+− 5 2 5 0 22 0,1)26(.)26(. dykydyk ∫∫ =+ 5 2 5 0 0,1.4.32 dykydyk 0,1) 2 (4) 1 (32 5 0 25 0 1 =+ ykyk 0,1)05(2)05(32 22 =−+− kk 0,150160 =+k 0,1210 =k 210 1 =k b) Obter as funções marginais de X e Y Função marginal de X: dyyxxf ∫ += 5 0 )2( 210 1)( dyydyxxf ∫∫ += 5 0 5 0 210210 2)( 5 0 2 5 0 2 . 210 1 210 2)( yyxxf += ( )05 420 1)05( 105 )( 2 −+−= xxf 84 5 21 )( += xxf 84 54)( += xxf Função marginal de Y: dxyxyf ∫ += 6 2 )2( 210 1)( dxydxxxf ∫∫ += 6 2 6 2 210210 2)( 18 6 2 6 2 2 . 2102210 2)( xyxyf += 6 2 6 2 2 . 210210 1)( xyxyf += ( )26 210 )26( 210 1)( 33 −+−= yyf 4 210 )8216( 210 1)( yyf +−= 210 4 210 208)( yyf += 105 2 105 16)( yyf += 105 216)( yyf += 5. MEDIDAS DE POSIÇÃO E DISPERSÃO DE VARIÁVEIS ALEATÓRIAS 5.1. Medidas de posição 5.1.1. Esperança matemática (média ou valor esperado de uma v. a.) - E(X) A ESPERANÇA MATEMÁTICA é a média ou valor esperado de uma variável aleatória. A esperança matemática de uma distribuição é também denominada uma medida de tendência central. Do ponto de vista científico, a esperança matemática corresponde ao que se espera que aconteça em média. � Se X for uma variável aleatória discreta Definição. Dado uma v.a. X discreta, assumindo os valores x1, x2,...,xn, chamamos valor médio ou esperança matemática de X o valor: E(X) = ∑ − = n i ii xXPx 1 )(. Exemplo: Considerando o experimento probabilístico ou aleatório: lançamento de duas moedas consecutivas, em que X é a variável aleatória definida como o NÚMERO DE COROAS obtidas, ou seja: X = {0, 1, 2}, cujas probabilidades de ocorrência são: P (0) = 1/4, P (1) = 2/4 e P (2) = 1/4. 19 E(X) = ∑ − = n i ii xXPx 1 )(. = 0,1 4 12 4 2 .1 4 1 .0 =++ Interpretação: Se esse experimento aleatório constituído pelo lançamento de duas moedas for realizado n vezes, espera-se, em média, obter 1,0 coroa. � Se X foruma variável aleatória contínua Definição. Dado uma v. a. X contínua, assumindo os valores x1, x2,...,xn, chamamos valor médio ou esperança matemática de X o valor: E(X)= ∫ +∞ ∞− dxxfx )(. Exemplo: Seja X a variável diâmetro (em mm) de frutos de mamão colhidos no estado inicial, cuja função de x [f(x)] é dada por: dxxxXE ) 150 1()( 20 10 ∫= 20 10 3 ) 3 (. 150 1)( xXE = mmXE 56,15)1020( 3 1 . 150 1)( 33 =−= Interpretação: Se esse experimento aleatório constituído pela colheita ao acaso de fruto de mamão for realizado n vezes, espera-se, em média, obter fruto de 15,56 mm de diâmetro. As propriedades da Esperança Matemática são: 1º) E (K) = K, sendo K uma constante. 2º) E (X + K) = E (X) + K 3º) E (K.X) = K. E (X) 4º) E (X + Y) = E (X) + E (Y) 5º) E (XY) = E(X).E (Y), se X e Y são independentes (Cov (X,Y) = 0) 150 1 x, se 10 ≤ x ≤ 20 f(x) = 0, outros valores de x. 20 3.2. Medidas de dispersão 3.2.1. Variância - V(X) ou 2σ Definição. A variância quantifica a dispersão dos dados em torno da média. É dada por: V(X) = E[X - µX]2 V(X) = E[X2 – 2.X.µX + µX2] V(X) = E(X2) – 2.E(X.µX) + E(µX2) V(X) = E(X2) – 2. µX.E(X) + µX2 V(X) = E(X2) – 2. E(X).E(X) + [E(X)]2 V (X) = E(X2) – 2.[E(X)]2 +[E(X)]2 V (X) = E(X2) – [E(X)]2 A obtenção da variância depende se X é variável aleatória discreta ou contínua. � Se X for uma variável aleatória discreta Definição. A variância de uma variável aleatória discreta quantifica a dispersão dos dados em torno da média esperada. É definida por: V (X) = E(X2) – [E(X)]2 Em que, )(.)( 22 i n ni i xPxXE ∑ = = Exemplo: Considerando o experimento probabilístico ou aleatório: lançamento de duas moedas consecutivas, em que X é a variável aleatória definida como o NÚMERO DE COROAS obtidas, ou seja: X = {0, 1, 2}, cujas probabilidades de ocorrência são: P (0) = 1/4, P (1) = 2/4 e P (2) = 1/4. E(X) = ∑ − = n i ii xXPx 1 )(. = 0,1 e )(.)( 22 i n ni i xPxXE ∑ = = = =++ 4 12 4 2 .1 4 11.0 222 V (X) = E(X2) – [E(X)]2 V (X) =1,5 – 1,02 V(X) = 0,5 � Se X for uma variável aleatória contínua Definição. A variância de uma variável aleatória contínua quantifica a dispersão dos dados em torno da média esperada. É definida por: 21 V (X) = E(X2) – [E(X)]2 Em que dxxfxXE )(.)( 22 ∫ ∞ ∞− = Exemplo: Seja X a variável diâmetro (em mm) de frutos de mamão colhidos no estado inicial, cuja função de x [f(x)] é dada por: 2 20 10 2 ]56,15[) 150 1()( −= ∫ dxxxXV 2 20 10 2 ]56,15[) 150 1()( −= ∫ dxxxXV 20 10 4 ) 4 (. 150 1)( xXV = - [242,1136] =−= [242,1136] - )1020( 4 1 . 150 1)( 44XV 7,8864 mm2 As propriedades da Variância são: 1º) V (K) = 0, sendo k uma constante. 2º) V (X + K) = V (X) + V(K) = V(X) 3º) V (K.X) = K2. V (X) 4º) V (XY) = V(X).V (Y) 5º) V (X + Y) = V (X) + V (Y) + 2Cov (X, Y), se X e Y são dependentes (Cov (X,Y) ≠ 0) 6º) V (X + Y) = V (X) + V (Y), se X e Y são independentes (Cov (X,Y) = 0) 4.2.2. Desvio padrão -σ O desvio padrão de X, DP(X), é definido como a raiz quadrada positiva da variância. É mais usada como medida de dispersão que a variância por estar na mesma unidade dos dados. 4.2.3. Covariância - Cov (X,Y) É uma medida de associação entre variáveis aleatórias. É necessário que se tenha pelo menos duas variáveis para que se obtenha a covariância. 150 1 x, se 10 ≤ x ≤ 20 f(x) = 0, outros valores de x. 22 A covariância entre duas v. a. X e Y é o produto dos desvios das variáveis (medida de discrepância), qual seja: Cov (X,Y) = E[(X - µX).(Y - µY)] Desenvolvendo a expressão acima, temos: Cov (X, Y) = E [(XY – X. µY –YµX + µXµY] Cov (X, Y) = E [(XY – X.E(X) –YE(X) + E(X)E(Y)] Cov (X, Y) = E (XY) – E(X)E(Y) –E(Y)E(X) + E(Y)E(X)] Cov (X,Y) = E(XY) – E(X).E(Y) Em que, ∑ − == n i ii xXPxXE 1 )(.)( e ∑∑ = − = m j n i jiji yxPyxXYE 1 1 ),(.)( ⇒ para (X,Y) discreta ∫ +∞ ∞− = dxxfxXE )(.)( e dydxyxfxyXYE ∫ ∫ +∞ ∞− +∞ ∞− = ),(.)( ⇒ para (X,Y) contínua Como a covariância é, por definição, a média dos produtos dos desvios (X - µx) por (Y - µy), a covariância será positiva se ocorrerem desvios do mesmo sinal com maior probabilidade, e negativa se correrem, com maior probabilidade, desvios com sinais contrários. Ou seja, - ∞∞∞∞ <<<< Cov (X,Y) <<<< + ∞∞∞∞ Assim, o sinal da covariância indica a relação entre as variáveis: - Se Cov (X,Y) = 0, as variáveis X e Y não possuem dependência linear, ou seja, são independentes; - Se Cov (X,Y) > 0, as variáveis X e Y possuem uma relação linear de dependência, cuja variação ocorre no mesmo sentido, ou seja, à medida que uma variável aumenta a outra também aumenta, ou à medida que uma variável diminui a outra também diminui; - Se Cov (X,Y) < 0, as variáveis X e Y possuem uma relação linear de dependência, cuja variação ocorre no sentido contrário, ou seja, à medida que uma variável aumenta a outra diminui e vice-versa. As propriedades da Covariância são: 1º) Cov (X, K) = 0, sendo k uma constante. 2º) Cov (X,Y) = Cov (Y,X) 23 3º) Cov (X,X) = V(X) 4º) Cov (aX, bY) = ab.Cov(X,Y) 4º) Cov (X + Z, Y) = Cov (X,Y) + Cov (Z,Y) 5º) Cov (X,Y) = 0, se X e Y são independentes 6º) Cov (X,Y) ≠ 0, se X e Y são dependentes Exemplo 1: Sabendo-se que Y = 3X – 5 e que E(X) = 2 e V(X) = 1, calcular: a) E(Y) E(3X – 5) = E (3X) – E (5) E(3X – 5) = 3.E (X) – E (5) E(3X – 5) = 3.2 – 5 E(3X – 5) = 1,0 b) V(Y) V(3X – 5) = 32.V(X) – V(5) = 9.1 – 0 = 9 c) Cov (X,Y) Cov (X, 3X – 5) = Cov (X, 3X) - Cov (X, 5) = 3. Cov (X,X) – 0 = 3. V(X) = 3. 1 = 3 d) V(X/3 – Y) V(X/3) – V(Y) = (1/3)2.V(X) + V(Y) – 2.Cov (X/3,Y) = 1/9.V(X) + V(Y) – 2.1/3.Cov (X,Y) V(X/3 – Y) = 1/9.1 + 9 – 2/3.(3) = 64/9 Exemplo 2: Seja a variável aleatória bidimensional DISCRETA (X,Y), cuja distribuição de probabilidade conjunta é dada pela tabela: Verificar se as variáveis possuem dependência linear, ou seja, se Cov (X,Y) ≠ 0. Cov (X,Y) = E(XY) – E(X). E(Y) X Y -1 0 2 P (yi) 1 1/9 2/9 0 3/9 3 3/9 1/9 2/9 6/9 P(xi) 4/9 3/9 2/9 1,0 24 E(X) = 9 2 .2 9 3 .0 9 4 .1)(. 1 ++−=∑ − n i ii xPx = 0 E(Y) = 9 6 .3 9 3 .1)(. 1 +=∑ − m j jj yPy = 2,33 E(XY) = 9 2 .2.3 9 1 .0.3 9 3).1.(30.2.1 9 2 .0.1 9 1).1.(1),(.. 1 1 ++−+++−=∑∑ = − m j n i jiji yxPyx = 0,22 Logo, Cov (X,Y) = 0,22 – 0. 2,33 Cov (X,Y) = 0,22 Interpretação: Como a Cov (X,Y) ≠ 0, X e Y são dependentes, havendo uma relação linear positiva entre as duas variáveis, ou seja, à medida que ocorre aumento em X ocorre aumento em Y, ou à medida que ocorre decréscimo em X ocorre decréscimo em Y. Exemplo 3: Sejam X e Y variáveis aleatórias CONTÍNUAS com f.d.p. conjunta dada por: E funções de densidade probabilidade marginais: Verificar se as variáveis possuem dependência linear, ou seja, se Cov (X,Y) ≠ 0. Cov (X,Y) = E(XY) – E(X). E(Y) dydxyxfxyXYE ∫ ∫ +∞ ∞− +∞ ∞− = ),(.)( ( ) dydxyxxyXYE ∫ ∫ += 5 0 6 2 2 210 1 .)( 210 1 (2x +y), se 2 ≤ x ≤ 6 0 ≤ y ≤ 5 f(x,y) = 0, para outros valores de x e y 84 54)( += xxf se 2 ≤ x ≤ 6 f(x) = 0, para outros valores de x 105 216)( yyf += se 0 ≤ y ≤ 5 f(y) = 0, para outros valores de y 25 dydxxyyxXYE ∫ ∫ += 5 0 6 2 22 210210 2)( dyxdxydxxyXYE ∫ ∫ ∫ += 5 0 6 2 6 2 2 2 210210 2)( dyxyxyXYE ∫ += 5 0 6 2 226 2 3 22103210 2)( [ ]dyyyXYE ∫ −+−= 50 22233 )26(00238,0)26(00317,0)( [ ]dyyyXYE ∫ += 50 207616,065936,0)( ∫ ∫+= 5 0 5 0 207616,065936,0)( dyyydyXYE ∫ ∫+= 5 0 5 0 207616,065936,0)( dyyydyXYE 5 0 35 0 2 3 07616,0 2 65936,0)( yyXYE += )05(0254,0)05(32968,0)( 3322 −+−=XYE 4153,11)( =XYE 2540,4 84 54)(.)( 6 2 = + ==∫∫ +∞ ∞− dxxxdxxfxXE 1429,2 105 216)(.)( 5 0 = + == ∫∫ +∞ ∞− dyyydyyfyYE Logo, Cov (X,Y) = 11,4153 – 4,2540.2,1429 Cov (X,Y) = 2,2996 Interpretação: Como a Cov (X,Y) ≠ 0, X e Y são dependentes, havendo uma relação linear positiva entre as duas variáveis, ou seja, à medida que ocorre aumento em X ocorre aumento em Y, ou à medida que ocorre decréscimo em X ocorre decréscimo em Y. 4.2.4. Coeficiente de correlação (ρρρρXY) Uma vez que a covariância varia de - ∞ a + ∞, é difícil determinar a intensidade da relação linear entre as duas variáveis observando simplesmente a partir do valor da covariância, pois a mesma apenas indica o sentido da relação. Para contornar essa dificuldade, Karl Pearson propôs uma versão padronizada da covariância (caracterizada pela divisão da 26 covariância pelos desvios-padrão de X e Y), que é o coeficiente de correlação linear populacional de Pearson, representado por ρρρρXY. O parâmetro é definido por: )().( )().()( )().( ),( YVXV YEXEXYE YVXV YXCov XY − ==ρ ⇒⇒⇒⇒ É fácil notar que o coeficiente de correlação linear é uma medida mais eficiente de associação entre variáveis que a covariância, por possibilitar a quantificação da associação. Em outras palavras, a covariância apenas indica a existência ou não de relação linear entre as variáveis e, se existir, se essa é positiva ou negativa. O coeficiente de correlação por sua vez, além de fazer as mesmas indicações que a covariância sobre a relação linear entre as variáveis, ainda a quantifica! O intervalo de variação do coeficiente de correlação é - 1 <<<< ρρρρXY <<<< 1. Isso é facilmente demonstrado pelo seguinte teorema: Se X e Y são duas variáveis aleatórias, tem-se: 0 2 ≥ − ± − Y Y X X YX σ µ σ µ OU 0 2 ≥ − ± − Y Y X X YXE σ µ σ µ 0)()(2)()( 22 ≥ − − ± − + − Y Y X X Y Y X X YXYXE σ µ σ µ σ µ σ µ [ ] 0))((12)(1)(1 2222 ≥−−±−+− YX YX Y Y X X YXYEXE µµ σσ µ σ µ σ Como, 22)( XXX σµ =−E 22)( YYY σµ =−E [ ] ρ σσ µµ = −− YX YX YXE ))((( , tem-se, 022 2 2 2 ≥±+ ρ σ σ σ σ Y Y X X 2 ± 2 ρ > 0 ou 27 ρ > 1 e ρ < -1 , logo, - 1 <<<< ρρρρXY <<<< 1 OBS.: O estimador não viesado para o parâmetro ρXY é denominado rxy. O coeficiente de correlação é um número puro, sem unidade ou dimensão. É usado para expressar o quanto os pontos se aproximam de uma reta imaginária. Um coeficiente próximo da unidade positiva ou negativa significa uma grande concentração dos pontos em torno da reta, enquanto que um coeficiente menor significa maior dispersão em relação a esta reta. Valores positivos indicam a tendência de uma variável aumentar quando a outra aumenta, ou diminuir quando a outra diminui. Quando o coeficiente de correlação é negativo significa que a tendência de uma variável aumentar enquanto a outra diminui e vice-versa. Na figura 1, cada eixo representa uma variável, X e Y e, são apresentadas graficamente a associação entre duas variáveis. Na letra (a) as variáveis não são correlacionadas (r = 0), então os pontos se encontram dispersos por todo o quadrante. Na letra (b) a correlação é alta e negativa (r = - 0,95), evidenciada por uma dispersão inversa entre X e Y. Os maiores valores de X correspondem aos menores valores de Y, concentrados em torno de uma diagonal fictícia. Na letra (c), X e Y estão correlacionadas positiva e perfeitamente (r = 1,0), logo os pontos estão alinhados em uma mesma direção ascendente. Por fim, na letra (d), X e Y estão levemente correlacionados, então a dispersão dos pontos não é tão abrangente no quadrante nem tão estreita em torno de uma linha. Figura 1. Representação gráfica de duas variáveis X e Y com diversos graus de correlação. 28 3. DISTRIBUIÇÕES E FUNÇÕES DE PROBABILIDADES DISCRETAS E CONTÍNUAS Foi visto nos assuntos anteriores como os dados de uma investigação científica são representados e como parâmetros da forma da distribuição, valores mais freqüentes e medidas de posição e variabilidade, são estimados. Foram vistas, também, formas para lidar e apresentar dados em função de seus tipos. Todavia, além da descrição amostral dos dados, a estatística como parte integrante do método científico, lida também com aspectos que envolvem a modelagem teórica das realizações das variáveis aleatórias nos fenômenos estudados. Essa modelagem envolve os modelos probabilísticos, cujo conhecimento auxilia o investigador científico na escolha do modelo mais adequado para estudar um determinado fenômeno e daquele que mais se aproxima de uma situação real. Aqui, iremos estudar os modelos probabilísticos de algumas variáveis aleatórias discretas e contínuas. As distribuições de probabilidade (discretas e contínuas) ficam completamente definidas conhecendo-se os diversos valores que a variável aleatória pode assumir, dentro do seu intervalo de definição, e as respectivas probabilidades. O conhecimento da distribuição de uma variável aleatória é importante na descrição dos fenômenos, na especificação dos testes dos processos da teoria de decisão estatística e na teoria da estimação. Pode-se afirmar que, de forma geral, os modelos probabilísticos formam a base da teoria estatística, e a linguagem aplicada representa o fundamento da linguagem científica empreendida nos processos de decisão e estimação. 3.1. DISTRIBUIÇÕES DE PROBABILIDADE DISCRETAS 3.1.1. Distribuição de Bernoulli Consideremos experimentos aleatórios que possuem apenas dois resultados possíveis, como por exemplo, uma peça selecionada de um lote, a qual pode ser boa ou defeituosa, um aluno que é submetido a um exame que pode ser aprovado ou não, um animal em um rebanho que pode ser sadio ou doente, etc. São experimentos cujos resultados pertencem a uma de duas categorias possíveis, conforme possuam, ou não, uma determinada característica. O resultado será chamado de sucesso S se possuir a citada característica, ou de fracasso F, se não possuir. Esses experimentos são conhecidos como experimentos de Bernoulli ou ensaios de Bernoulli. A probabilidade de ocorrência de sucesso será indicada por p, e a de fracasso por q, em que q = 1 – p. Qualquer um dos dois resultados possíveis do experimento poderá ser 29 chamado de sucesso, bastando somente que a probabilidade de ocorrência seja denominada por p. A distribuição de probabilidade para uma variável aleatória X que assume dois valores: o valor 1 se ocorrer sucesso, e o valor 0 se ocorrer fracasso, é dada por: xi P(xi) 1 p 0 1 - p Média e Variância de uma v. a. com distribuição de Bernoulii E(X) = px =µ V (X) = qp =−1 Quando uma variável aleatória X tem distribuição de Bernoullii representamos simbolicamente por X ~ B (p; q). Lê-se: X tende para uma distribuição de Bernoulii cujos parâmetros são p e q. 3.1.2. Distribuição Binomial A distribuição binomial consiste na realização de n ensaios de independentes de Bernoulii, cada um com probabilidade de sucesso constante igual a p (e consequentemente de fracasso constante a q). Desse modo, pode-se definir a variável aleatória X pelo número de sucessos observados. São exemplos de variáveis binomiais: florescimentos de plantas de uma espécie em uma amostra de tamanho n; nascimento de fêmeas em uma amostra de tamanho n; etc. A distribuição binomial é a mais importante das distribuições de v. a. discretas. Se p é a probabilidade de sucesso de um evento ocorrer em uma única tentativa e q = 1- p é a probabilidade do fracasso, então, a probabilidade de que nos k primeiros ensaios de Bernoulii ocorram sucessos e nos n-k restantes ocorram fracassos, considerando-se a independência dos ensaios é dada por: knk knk ppFFFFSSSSP − − −= )1.(),...,,,,,...,,,( 443442143421 Como os k sucessos podem ocorrer em qualquer uma das ordens possíveisnos n experimentos de Bernoulii, que é igual a ao número de combinações de n elementos k a k 30 dada por )!(! ! knk nC nk − = , a probabilidade de obtenção de k sucessos nas n realizações do experimento é calculada por: f (x) = P (X=x) = knk pp k n − − )1.(. = knknk qpC −.. OBS: a denominação binomial decorre do fato de os coeficientes nxC serem os coeficientes binomiais das n potências (a + b). Por exemplo: O binômio elevado à potência três: (a + b)3 = a3 + 3a2b + 3ab2 + b3 corresponde a 33C a3 + 32C a2b + 31C ab2 + 30C b3 Suposições do modelo binomial: 1. Existe n repetições ou provas idênticas do experimento. Exemplo: número de plantas sadias colhidas em parcelas de 20 m2 (foram plantadas 27 plantas em cada parcela), X = 0, 1, 2, ....,27, então, n é o número total de casos possíveis da variável que estamos estudando. 2. Só há dois tipos de resultados possíveis (Ex.: plantas sadias ou doentes). 3. As probabilidades p de sucesso e 1 – p = q de fracasso permanecem constantes em todas as repetições. 4. Todos os resultados das repetições são independentes um do outro. Média e Variância de uma v. a. com distribuição Binomial E(X) = npx =µ V (X) = npqpnpnpq =−= )1( Quando uma variável aleatória X tem distribuição binomial representamos simbolicamente por X ~ Bin (n; p). Lê-se: X tende para uma distribuição Binomial cujos parâmetros são n e p. Exemplo: No rebanho bovino 30% dos animais estão atacados por febre aftosa. Retira-se por acaso uma amostra de 10 animais. a) Verifique se a variável “número de animais doentes” pode ser estudada pelo modelo binomial. Justifique sua resposta. b) Estruturar a função de probabilidade. c) Qual a probabilidade de se encontrar 6 animais doentes. d) Qual a probabilidade de se encontrar pelo menos 6 animais doentes. 31 e) Qual a probabilidade de se encontrar no máximo 6 animais doentes 3.1.3. Distribuição de Poisson A distribuição de Poisson é um caso limite da distribuição binomial, quando n → ∞, p → 0 e µ = np permanece constante, e se aplica no caso em que, em vez de se observar o número de sucessos em n realizações independentes de um experimento de Bernoulli, o interesse é o número de sucessos em um intervalo contínuo de observação t (∆∆∆∆t). Esse intervalo contínuo de observação pode ser um intervalo qualquer em que se vai observar a ocorrência de sucessos. Nas ciências agrárias e biológicas a distribuição de Poisson é largamente utilizada para contagens de indivíduos, plantas, colônias de bactérias, itens, objetos, dados num intervalo de tempo, numa área, num volume, num comprimento. A unidade de medida deve ser definida de tal modo que as contagens sejam baixas. Considere-se um número baixo com sendo menor que 10. Um aplicação importante dessa distribuição diz respeito ao estudo do padrão de dispersão de certa espécie animal ou vegetal num campo ou floresta, então numa determinada área. É muito utilizada, portanto, em estudos de dinâmica de população e entomológicos. São exemplos de variáveis com distribuição de Poisson: número de colônias de bactérias por quadrante de 1m2; número de colônias de bactérias de uma dada cultura por 0,01 mm2 numa plaqueta de microscópio; número de defeitos por 100 m de tecido; número de acidentes numa esquina movimentada e bem sinalizada por dia; número de chamadas telefônicas numa central de PABX num intervalo de tempo de ½ minuto; número de partículas radioativas emitidas numa unidade de tempo; número de micronúcleos/1000 células, etc. Para que uma variável aleatória X tenha distribuição de Poisson, deve satisfazer às seguintes condições: i) Para intervalos de observação ∆t muito pequenos, a probabilidade de ocorrência de mais de um sucesso é desprezível; ii) Para intervalos de observação ∆t muito pequenos, a probabilidade de ocorrência de um sucesso é proporcional ao tamanho do intervalo e igual a λλλλ.∆∆∆∆t, onde λ > 0 é a taxa de sucesso por unidade de observação; iii) As ocorrências de sucessos em intervalos disjuntos (não sobrepostos) são independentes. 32 Então, se uma variável aleatória X, igual ao número de sucessos em um intervalo t de observação tem distribuição de Poisson, pode-se demonstrar que a sua distribuição de probabilidade é dada por: ,...3,2,1,0, ! )()( === − k k tekXP kt λλ Sendo µ = λt o número médio de ocorrências no intervalo t, a expressão acima pode ser escrita na forma: ! )()( k ekXP kt µλ− == Média e Variância de uma v.a. com distribuição de Poisson E(X) = µ V(X) = µ Exemplo: Sabendo-se que na fabricação de determinadas chapas aparecem defeitos à taxa média de 0,5 defeito por m2, calcule a probabilidade de que: a) uma chapa de 5 m2 seja perfeita; b) uma chapa de 15 m2 apresente no mínimo três defeitos. a) Seja X = número de defeitos por chapa de 5 m2, temos: λ = 0,5 defeito por m2 t = 5 m2 µ = λt = 0,5.5 = 2,5 !0 5,2.)0( 05,2− == eXP =0,082 ou 8,2% b) Seja X = número de defeitos por chapa de 15 m2, temos: λ = 0,5 defeito por m2 t = 15 m2 µ = λt = 0,5.15 = 7,5 )3(1)3( <−=≥ XPXP )]2()1()0([1)3( ++=+=−=≥ XPXPXPXP 33 ++−=≥ −−− !2 5,7. !1 5,7. !0 5,7.1)3( 25,715,705,7 eeeXP = 1 – 0,020256 = 0,9797 ou 97,97% 3.2. DISTRIBUIÇÕES DE PROBABILIDADE CONTÍNUAS 3.2.1. Distribuição Normal ou Gaussiana A distribuição gaussiana também é denominada de distribuição normal, uma vez que uma grande maioria das variáveis aleatórias contínuas (inclusive variáveis aleatórias discretas podem ser aproximadas pela lei gaussiana) da natureza segue esta distribuição. Diz-se que uma variável aleatória segue distribuição normal de parâmetros µ e 2σ , que representamos do modo X ~ N ( µ , 2σ ), se sua função densidade probabilidade for: ( ) 2 2 2 22 1 σ µ− − × σpi = x e)x(f Em que µ e 2σ são os parâmetros dessa distribuição, os quais são respectivamente a média e variância dessa distribuição. O parâmetro µ indica o centro e σ a dispersão. A distância do centro as pontos de inflexão é precisamente σ . A forma da função densidade probabilidade é chamada sino de Gauss e o gráfico da função normal é: Figura 1. Distribuição normal com média µ e ponto de inflexão σµ ± O suporte da distribuição é todo conjunto dos números reais, de modo que a maior parte da massa de probabilidade (área compreendida entre a curva e o eixo de abscissa) se encontra concentrado ao redor da média e as ramificações da curva se estendem 34 assintoticamente aos eixos, de modo que qualquer valor “muito distante” da média é possível mesmo que pouco provável. A forma do sino de Gauss depende dos parâmetros µ e σ . O parâmetro µ indica a posição do sino de Gauss (parâmetro de centralização) e 2σ (ou equivalente, σ ) será o parâmetro de dispersão. Quanto menor for, maior será a quantidade de massa de probabilidade concentrada ao redor da média (gráfico de f muito pontiagudo em torno de µ ) e, quanto maior for, “mais achatado” será. · Figura 2. Distribuições gaussianas com diferentes médias e igual dispersão. Figura 3. Distribuições gaussianas com média igual, mas com variâncias diferentes. Propriedades da curva de distribuição Normal: (i) simétrica em relação a µ; (ii) tem forma de sino; (iii) fica completamente definido conhecendo a sua média e variância; 35 (iv) área total sob a curva é igual a 1. Quando µ = 0 e 2σ = 1, temos uma distribuição padrão ou reduzida, ou X ~ N (0,1), cuja função densidade probabilidade reduz-se a: 2 z2 e 2 1)z( − = pi φ Logo, se X ~ N ( µ , 2σ ), então a variável aleatória definida por σ µ− = x z , terá distribuição normal padronizada, com média 0 e variância 1. Sabe-se que a probabilidade de X estar entre dois valores quaisquer (a, b) é dado pela área sob a curva normal entre estes valores: Figura 4. A probabilidade de x estarentre o ponto a e b corresponde a área hachurada da figura. a(P <X<b)= ∫ b a dx)x(f Como a cálculo dessa integral não é trivial, usam-se as tabelas obtidas a partir da curva normal padronizada. Vejamos, então, como obter probabilidades a partir da Tabela (ANEXO 1). Essa tábua dá as probabilidades sob uma curva normal padrão, que nada mais são do que as correspondentes áreas sob a curva. P ( czZ ≤≤0 ) onde, Z ~ N (0,1) 36 Figura 5. Probabilidade de P(0≤ Z≤ Zc ) Exemplo: Calculemos algumas probabilidades. (a) P (0 )73,1Z ≤≤ = (b) P (-1,73 )0Z ≤≤ = (c) P (Z≥ 1,73) = (d) P (Z≥ 0) = (e) P (0,47 )73,1Z ≤≤ = Suponha, agora, que X seja uma v. a. N ( µ , 2σ ), com µ = 3 e 2σ = 16, e queiramos calcular P(2≤ X ≤ 5). Temos: P(2 ≤ X≤ 5)= −≤ − ≤ − σ µ σ µ σ µ 5X2P = −≤ − ≤− 4 35X 4 32P σ µ Exemplo. A quantidade de kg de leite produzidos por um animal diariamente, considerando uma determinada raça e rebanho segue a distribuição normal e possui média 9,87kg/dia/animal e variância 8,87(kg/dia/animal)2. Calcule: a probabilidade de um animal produzir menos de 3kg/dia, a probabilidade de um animal produzir mais de 8kg/dia e a probabilidade de um animal produzir entre 10kg/dia e 12kg/dia. 2.2.2. Distribuição Qui-quadrado (χχχχ2) A distribuição de Qui-quadrado é a distribuição amostral relacionada a 2σˆ obtida de uma população normal. Se considerarmos uma variável aleatória Z com uma distribuição normal padrão [Z ~ N (0, 1)], então a variável X = Z2 distribui-se conforme uma lei de probabilidade de distribuição χχχχ2 com grau de liberdade, o que representa como: X ~ 2χ . 37 Se temos n variáveis aleatórias independentes Zi ~ N (0, 1), a soma de seus quadrados respectivos é uma distribuição que denominaremos de LEI DE DISTRIBUIÇÃO DE χ2 com n graus de liberdade, 2nχ . Ou seja: ∑ = =+++= n i inn ZZZZ 1 222 2 2 1 2 ...χ Se temos X1, X2, ..., Xn variáveis aleatórias independentes, onde cada Xi ~ N ( µ , 2σ ), então, a variável : ~ )( 2 n 1 2 2 1 2 1 2 χ σ µχ ∑∑∑ === − === n i i n i i n i i X ZX , com n graus de liberdade. Uma variável aleatória X que segue uma distribuição de Qui-quadrado tem densidade dada por: x n exxf 2 112 2 1 )2/1( 2/1)( − − Γ = em que x > 0 Figura 4. Função densidade probabilidade de χn2 para valores pequenos de n. A média e a variância dessa variável são: E(X) = n e V(X) = 2n, respectivamente. Sejam X1, X2, ..., Xn variáveis aleatórias independentes de uma distribuição normal com média µ e variância 2σ [Xi ~ N ( µ , 2σ )], então, a variável : 2 n n 1i 2 i 1 2 2 2 ~ )(Z )( χ σ χ ∑∑ == −= − = ZXX n i i , com n - 1 graus de liberdade, sendo que Zi ~ N (0,1) Se, 1 )( ˆ 2 2 − − = n XX iσ é obtido de uma amostra aleatória de uma distribuição normal com média µ e variância 2σ , então a variável: 2 2 2 ˆ).1( σ σχ −= n , com n - 1 graus de liberdade. 38 A distribuição de Qui-quadrado possui várias aplicações em estatística. Uma delas é a de propiciar mecanismos para a realização de inferências sobre o parâmetro 2σ de uma população normal. Outra aplicação refere-se aos testes de falta de ajuste de um modelo teórico aos dados observados em um experimento ou levantamento amostral. 2.3.3. Distribuição t de Student É importante no que se refere a inferência sobre médias populacionais. A distribuição t de Student constitui-se como um quociente entre a normal e a raiz de uma χ2 independentes. De modo preciso, chamamos distribuição t de Student com n graus de liberdade, tn, a distribuição de uma variável aleatória T. 21 n n ZT χ = Em que Z ∼ N (0, 1) χn2 ∼∼∼∼ χn2 . Esse tipo de distribuição aparece quando temos n + 1 variáveis aleatórias independentes. A distribuição de probabilidade de t é dada por: ∑ = − − = n i i iiX n X T 1 2 1 σ µ σ µ A distribuição de t tem propriedades parecidas com a Normal, quais sejam: * É centrada na média igual a zero e simétrica com relação à mesma; * É um pouco mais dispersa que a normal, mas a variância decresce até um quando o número de graus de liberdade aumenta; * Quando o número de graus de liberdade tende ao infinito, a distribuição de t tende à Normal (os valores de ambas são satisfatoriamente próximos a partir do grau de liberdade igual a 30). OBS.: grau de liberdade = n - 1 39 3.2.4. Distribuição F de Snedecor A distribuição de F se define como o quociente de distribuições χ2 independentes. Sejam X ∼ χ2 e Y ∼ χ2 variáveis aleatórias independentes. Dizemos então que a variável Y X n m Y m X nF == 1 1 ∼ Fn,m segue distribuição de probabilidade de Snedecor, com (n, m) graus de liberdade. OBS.:Observa-se que Fn,m ≠ Fm,n A distribuição de probabilidade de F é dada por: ∑ ∑ = = − − = m j j jj n i i ii mY m X n F 1 2 1 2 ˆ 1 1 σ σ µ ∼ Fn,m A forma mais habitual na qual se encontra essa distribuição é quando se tem n + m variáveis aleatórias independentes. Uma das aplicações da distribuição de F é na análise de variância, em que as avaliações se baseiam em estimativas da variância populacional. 4. LITERATURA CONSULTADA ARA, A. B.; MUSETTI, A. V.; SHNEIDERMAN, B. Introdução à estatística. São Paulo: Egard Blucher: Instituto Mauá de Tecnologia, 2003.152p. CARVALHO, S. Estatística básica. Rio de Janeiro: Campus/Elsevier, 2006. 464p. FERREIRA, D. F. Estatística básica. Lavras: UFLA, 2005. 664p. REGAZZI, A. Curso de iniciação à estatística (Apostila). Universidade Federal de Viçosa, Viçosa – MG, 1997. 136p. TRIOLA, M. F. Introdução à estatística. Rio de Janeiro: LTC, 2005. 656p. Este conteúdo é resultado de pesquisa em vários livros e apostilas de estatística e bioestatística, portanto, ainda deve ser revisado. Qualquer crítica, erro de digitação (ou outro qualquer), etc., por favor, me comunique. Obrigada, Profa. Gisele 40 ANEXO 1: Tabela I - Distribuição Normal Padrão Z~N(0,1) P(0<Z<Zc) Segunda decimal de Zc Parte inteira da primeira decimal de Zc 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,00 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,50 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,60 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,70 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,80 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,90 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,00 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,10 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,20 0,48610,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,30 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,40 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,50 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,60 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,70 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,80 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,90 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,00 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 3,10 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993 3,20 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995 3,30 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997 3,40 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 3,50 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 3,60 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,70 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,80 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,90 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 4,00 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 41 UNIVERSIDADE FEDERAL DO PIAUÍ Campus Universitário “Profa. Cinobelina Elvas” – Bom Jesus, PI Lista de exercícios: Variáveis aleatórias 1. Cite pelo menos 5 exemplos de variáveis aleatórias discretas e 5 exemplos de variáveis aleatórias contínuas na área de seu curso. Conceitualmente, como você diferenciaria essas variáveis das quantitativas discretas e contínuas? 2. Seja X uma variável aleatória discreta com a seguinte distribuição de probabilidade: xi -2 -1 2 4 Total P(X=xi) 1/4 1/8 1/2 1/8 1,0 a) Traçar o gráfico da distribuição de probabilidade b) Calcular E(X) c) Calcular V(X) d) Calcular E(X – 2)2 e) Calcular V(3X – 4) Resposta: a) 2,625 b) 4,625 c) 38,106 3. Dado X,Y é uma variável aleatória discreta bidimensional com a seguinte distribuição conjunta: Y X -3 2 4 1 0,1 0,2 0,2 3 0,3 0,1 0,1 Calcular: a) E (X), V (X) e DP (X) b) E (Y), V (Y) e DP (Y) c) E (X + Y), Cov (X,Y) e rxy d) X e Y são independentes? Justifique. Resposta: a) 2; 1 e 1 b) 0,6; 9,24 e 3,04 c) 2,6; -1,2 e -0,395 d) não 42 4. Dado X,Y é uma variável aleatória discreta bidimensional com a seguinte distribuição conjunta: Y X -3 -2 -1 -2 1/15 1/15 3/30 0 8/30 4/30 2/15 1 2/30 1/30 4/30 Calcular: a) E (X), V (X) e DP (X) b) E (Y), V (Y) e DP (Y) c) E −− 10 5 2 3 2 YX , d) Cov (X,Y), rxy. X e Y são independentes? Justifique. Resposta: a) -7/30 ; 1,112 e 1,055 b) -61/30; 0,766 e 0,875 c) -8,798 d) não 5. Seja a variável discreta bidimensional (X, Y), cuja distribuição de probabilidade conjunta é dada pela tabela: Y X -3 0 1 -2 1/9 0 2/9 0 0 2/9 2/9 1 1/9 1/9 0 Calcular: a) E (X) b) E (Y) c) V (X) d) V (Y) e) E (XY) f) Cov (X,Y). Interprete. g) rxy Interprete Resposta: a) -0,45 b) -0,22 c) 1,353 d) 0 e) 0 43 6. Dada a funçao de densidade probabilidade (f.d.p.) abaixo: Calcular: a) E(X) b) V (X) c) V(12X – 8) d) P (0,5 ≤ x ≤ 1,5) Resposta: a) 1,083 b) 1,667 c) 240,048 d) 0,469 7. Dada a função: a) Determinar o valor de k para que f(x) seja f. d.p. b) E(X) c) E(X – 2) d) V(X) e) V(10X – 2) f) P(1/2 ≤ x < 3/2) g) P(X = 1) h) P(1/2 ≤ x < 1,0) Resposta: a) 2/5 b) 0,867 c) -1,267 d) 1,1 e) 110 f) 0,45 g) 0 h) 3/5 8. Dada função de densidade probabilidade conjunta da variável X,Y bidimensional contínua: 1/2, se 0 ≤ x ≤ 1 -1/4(x – 3), se 1 ≤ x ≤ 3 f(x) = 0, para outros valores de x. k(2 – x), se 0 ≤ x < 1 k, se 1 ≤ x ≤ 2 f(x) = 0, para outros valores de x. 16 3 y− , se 0 ≤ x < 4 se 0 ≤ y < 2 f(x,y) = 0, para outros valores de x e y. 44 E as funções de densidade probabilidade marginais são: Calcular: a) E (X) b) E (Y) c) V (X) d) V (Y) e) E (XY) f) Cov (X,Y). Interprete. g) rxy Interprete Resposta: a) 2,0 b) 0,83 c) 5,33 d) 1,0 e) -0,33 f) -1,996 g) -0,86 9. Suponha que as dimensões, X e Y, de uma chapa retangular de metal possam ser consideradas variáveis aleatórias contínuas com a seguinte função de densidade probabilidade conjunta: E funções de densidade probabilidade marginais: 4 1 , se 0 ≤ x < 4 f(x) = 0, para outros valores de x. )3( 4 1 y− , se 0 ≤ y < 2 f(y) = 0, para outros valores de y. 2 1−x , se 1 < x ≤ 2 2 < y < 4 f(x,y) = 2 3+− x se 2 < x < 3 2 < y < 4 0, para outros valores de x e y. (x – 1) se 1 < x ≤ 2 f(x) = (- x + 3) se 2 < x < 3 0, para outros valores de x. 2 1 , se 2 < y < 4 f(y) = 0, para outros valores de y. 45 Calcular: a) E (X) b) E (Y) c) V (X) d) V (Y) e) E (XY) f) Cov (X,Y). Interprete. g) rxy Interprete Resposta: a) 1,83 b) 3,0 c) 4,17 d) 9,33 e) 6,0 f) 0,51 g) 0,082 10. Numa família de 4 filhos, seja X = número de meninos e Y = número de variações na seqüência de mesmo sexo. Relacionar o espaço amostral e, então: a) Construir a distribuição de probabilidade conjunta de X e Y; a) X e Y são independentes? 11. Demonstre, com base nas fórmulas gerais de média e variância de uma variável aleatória discreta que, a média ou valor médio e a variância de uma variável aleatória binomial X [X ∼ Bin (n; p)] correspondem a E(X) = np e V(X) = npq, respectivamente. Calcule a média e a variância de uma v. A. X ∼ Bin (10; 0,3)]. Resposta: E(X) = 3 V(X) = 2,1 12. Entre 2000 famílias com 4 crianças cada uma, quantas se esperaria que tivessem: a) Pelo menos um menino? b) Exatamente dois meninos? Resposta: a) 1875 b) 750 13. Supondo que o número de sementes que germine (Y) de uma espécie forrageira siga distribuição binomial, e a probabilidade de uma semente germinar é 70%. Pede-se: a) Qual a probabilidade, em um experimento com um vaso com n = 5 sementes, de pelo menos 4 germinarem? b) Sabe-se que X representa o número de vasos que tem pelo menos 4 sementes germinadas dessa espécie (originadas do item a), então qual é o número (tamanho da amostra) de vasos, semeados com 5 sementes, necessário para que um experimento venha a ser realizado com um número não inferior a 200 plantas. Resposta: a) 0,528 ou 52,8% 46 14. Suponha que a peste suína siga a distribuição binomial, ocorrendo, em média em 1 a cada 50 animais em uma população de suínos de certa região. Qual é a probabilidade de que em uma amostra aleatória de n = 100 suínos, seja encontrado, pelo menos, um com a doença? Resposta: 0,87 ou 87% 15. Um fabricante de certo tipo de peças garante que uma caixa de suas peças conterá, no máximo, duas defeituosas. Se a caixa contém 20 peças e a experiência tem demonstrado que o processo de fabricação produz 5% de peças defeituosas. a) Calcule a probabilidade de que uma caixa satisfaça a garantia; b) Considerando que a caixa vendida determina um lucro de R$ 120,00, caso esteja conforme a garantia, e um prejuízo de R$ 50,00, se não corresponder à garantia, indique qual será o lucro médio por caixa vendida. Resposta: a) 0,924 ou 9,24% b) R$ 107,08 16. Sementes certificadas de feijão são vendidas em um saco de 15 kg ao preço de R$ 20,00 cada. É característica de produção que 20% das sementes apresentem poder germinativo abaixo do especificado. Um comprador fez a seguinte proposta ao produtor de sementes: de cada saco escolhe 25 sementes, ao acaso, e paga por saco: - R$ 25,00 se todas as sementes germinarem; - R$ 17,00 se uma ou duassementes não germinarem; - R$ 10,00 se três ou mais sementes não germinarem. O que é melhor para o produtor, manter o seu preço de 20,00 u.m. por saco ou aceitar a proposta do comprador? Sugestão: encontrar o preço médio esperado pelo produtor. Resposta: O vendedor não deve aceitar a proposta do comprador [E(X) = 19,51)] 17. Suponhamos que a porcentagem de germinação de sementes de feijão seja de 70%. Vão ser semeadas 4 sementes por cova, as quais serão espaçadas de 0,40m entre linhas e 0,20m entre covas. Supondo-se que cada canteiro a ser semeado conste de 6 linhas de 5m de comprimento, qual o número médio esperado de covas falhadas (nem uma semente germinou, das quatro semeadas) por canteiro? Resposta: 0,9919 ou 99,19% 18. Um contador eletrônico de bactérias registra em média 5 bactérias por cm3 de um líquido. Admitindo-se que esta variável tenha distribuição de Poisson: a) qual é o desvio padrão do número de bactérias por cm3? b) Encontre a probabilidade de que pelo menos duas bactérias ocorram num volume de líquido de 1cm3. 47 Resposta: a) V(X) = 5 b) 95,96% 19. Numa área dividida em quadrantes de 0,50m2, foram encontrados em média 2,5 espécimes. Considerando que o modelo de Poisson é adequado, e seja X o número de espécimes por 0,5m2. a) Qual é a probabilidade de se encontrar num quadrante exatamente 4 espécimes? b) Qual é a probabilidade de encontrar no máximo 1 espécime por quadrante? Resposta: a) 13,36% b) 28,7% 20. Numa placa de microscópio, dividida em quadrantes de 1mm2, encontra-se em média 5 colônias por mm2. Considerando que a distribuição de Poisson é adequada, ou seja: as colônias distribuem-se aleatoriamente na placa e, o número médio de colônias por mm2 permanece constante e é baixo. a) Qual a probabilidade de um quadrante ter exatamente uma colônia? b) Qual a probabilidade de encontrar duas colônias por mm2? c) Qual a probabilidade de encontrar oito colônias em 2 mm2? Resposta: a) 3,37% b) 8,42% c) 11,26% 21. Supondo que o peso de animais da raça Charolês, com dois meses de idade, obedeça a uma distribuição normal com média igual a 75kg e desvio padrão de 10kg. Calcule a probabilidade de que, um bovino dessa raça e dessa idade, escolhido ao acaso, pese: a) mais de 69,8kg b) menos de 97,2kg c) entre 77,7kg e 82,2kg d) menos de 77,7kg e mais de 82,2kg Resposta: a) 69,85% b) 98,68% c) 15,78% c) 84,22% 22. Uma raça de coelhos híbrida, Norfolk, possui peso ao abate aos 90 dias X com distribuição N (2,60; 0,04). Obter: a) P (X > 2,70) b) P (X < 2,45) c) P (2,55 < X < 2,65) d) P (X > x) = 0,80 e) P (-x < X < x) = 0,95 f) P (-x < X < x) = 0,90 48 23. Um agricultor usa uma máquina automática para encher sacos de trigo, cada um com um peso nominal de 112 lb de grão. No entanto, devido a flutuações aleatórias do mecanismo de pesagem, o peso de cada saco é uma V.A. Normal de média 112,375 lb e desvio padrão 0,226 lb; a) Calcule a probabilidade de um saco escolhido ao acaso conter menos do que o peso nominal; b) O agricultor fornece o trigo a um moleiro com a condição de que não mais do que 5% dos sacos são sub-pesados. Determine o valor mais baixo do peso médio de cada saco que satisfaça a esta condição. Resposta: a) 4,85% b) 112,0021 24. Num povoamento florestal temos uma distribuição aproximadamente normal dos Diâmetros na altura do peito (D.A.P.) das árvores, com média de 12,6 cm e variância de 3,1 cm. Se cortarmos todas as árvores de menos de 15 cm de diâmetro, qual a porcentagem de árvores que restarão de pé? Resposta: 8,69% 25. As vendas de sementes de milho têm distribuição normal com média igual a 500 sacos e desvio padrão 50 sacos. Se a empresa decide produzir 600 sacos no mês em estudo, qual é a probabilidade de que não possa atender a todos os pedidos do mês, por estar com a produção esgotada? Resposta: 22,28% 26. Sabe-se que o comprimento de pétalas de uma população de plantas da espécie X é normalmente distribuída com média µ = 3,2 cm e σ = 1,8 cm. Qual proporção na população é ter um comprimento de pétalas: a) Maior do que 4,5 cm? b) Entre 2,9 e 3,6 cm? c) Determinar o valor do comprimento de pétalas que é superado por 65% das plantas. Resposta: a) 23,89% b) 15,46% c) 4,874 cm
Compartilhar