Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Variáveis aleatórias bidimensionais Função de probabilidade de uma única variável aleatória →→→→ função univariada � peso e altura de crianças � quantidade de água na irrigação do trigo e o tamanho da planta � espaço destinado para o produto na prateleira e sua venda mensal Duas variáveis conjuntamente (X, Y) →→→→ variável bidimensional Função de probabilidade →→→→ conjunta ou bivariada Consideração simultânea ou conjunta de duas variáveis aleatórias: Profª Lisiane Selau 2 •[X(s),Y(s)] •X(s) •Y(s) (X,Y)• s X Y S SX SY SXY Na maioria das vezes, ao se descrever os resultados de um experimento, se atribui a um mesmo ponto amostral os valores de duas ou mais variáveis aleatórias. Olharemos aqui somente o caso de variáveis aleatórias discretas Variáveis aleatórias discretas bidimensionais Profª Lisiane Selau 3 O espaço amostral SXY é formado pelo produto cartesiano de todos os elementos de SX e de SY. SXY = SX ×××× SY SX = {0, 1} e SY = {0, 1, 2} Exemplo: Cada par (x, y) corresponde a uma ocorrência da variável (X,Y) SXY = {(0,0), (0,1), (0,2), (1,0), (1,1), (1,2)} p(X=0,Y=0) p(X=1,Y=0) Profª Lisiane Selau 4 Exemplo 1: Estamos estudando a composição de famílias com 3 filhos, quanto ao sexo. Então definimos as seguintes variáveis de interesse: X = número de meninos Z = número de vezes que houver variação do sexo entre um nascimento e outro, dentro de uma mesma família. 1, se o primeiro filho for menino Y = 0, se o primeiro filho for menina Profª Lisiane Selau 5 Com estas informações, e supondo que os sexos ocorram com mesma probabilidade, obtém-se a Tabela 1, onde, por exemplo, o evento MFM indica que o primeiro filho é menino, o segundo é menina e o terceiro é menino. Tabela 1 Eventos Prob. X Y Z MMM 1/8 3 1 0 MM F 1/8 2 1 1 M FM 1/8 2 1 2 F MM 1/8 2 0 1 M F F 1/8 1 1 1 F M F 1/8 1 0 2 F F M 1/8 1 0 1 F F F 1/8 0 0 0 Profª Lisiane Selau 6 Para cada uma das variáveis X, Y, Z, têm-se as respectivas distribuições de probabilidade, também chamadas de distribuições marginais. Eventos Prob. X Y Z MMM 1/8 3 1 0 MM F 1/8 2 1 1 M FM 1/8 2 1 2 F MM 1/8 2 0 1 M F F 1/8 1 1 1 F M F 1/8 1 0 2 F F M 1/8 1 0 1 F F F 1/8 0 0 0 y 0 1 p(y) 4/8 4/8 x 0 1 2 3 p(x) 1/8 3/8 3/8 1/8 z 0 1 2 p(z) 2/8 4/8 2/8 Distribuições marginais e conjuntas Profª Lisiane Selau 7 A Tabela 2 apresenta as probabilidades associadas aos pares de valores das variáveis aleatórias X e Y. Nesta tabela, p(x, y) = P(X = x , Y = y) denota a probabilidade do evento (X = x e Y = y). A Tabela 2 é denominada distribuição conjunta de X e Y, que é uma distribuição bidimensional, isto é, de duas variáveis. Tabela 2 (x,y) (0,0) (1,0) (1,1) (2,0) (2,1) (3,1) p(x,y) 1/8 2/8 1/8 1/8 2/8 1/8 Eventos Prob. X Y Z MMM 1/8 3 1 0 MM F 1/8 2 1 1 M FM 1/8 2 1 2 F MM 1/8 2 0 1 M F F 1/8 1 1 1 F M F 1/8 1 0 2 F F M 1/8 1 0 1 F F F 1/8 0 0 0 Profª Lisiane Selau 8 Uma maneira mais cômoda de representar a distribuição conjunta é através de uma tabela de duas entradas (Tabela 3). Eventos Prob. X Y Z MMM 1/8 3 1 0 MM F 1/8 2 1 1 M FM 1/8 2 1 2 F MM 1/8 2 0 1 M F F 1/8 1 1 1 F M F 1/8 1 0 2 F F M 1/8 1 0 1 F F F 1/8 0 0 0 Tabela 3 Y X p(y)0 1 2 3 0 1/8 2/8 1/8 0 1/2 1 0 1/8 2/8 1/8 1/2 p(x) 1/8 3/8 3/8 1/8 1 A primeira e a última colunas dão a distribuição de Y, enquanto que a primeira e a última linhas dão a distribuição de X. Estas distribuições são chamadas distribuições marginais. Observa-se, pelo exemplo, que: P(X = 1) = P(X = 1, Y = 0) + P(X = 1, Y = 1) = 2/8 + 1/8 = 3/8 Profª Lisiane Selau 9 As distribuições marginais referem-se às probabilidades individuais de ocorrência de cada variável. A distribuição marginal de X expressa as probabilidades de ocorrência dos valores de X, independente dos valores Y. A distribuição marginal de Y expressa as probabilidades de ocorrência dos valores de Y, independente dos valores de X. As distribuições marginais são importantes quando as variáveis são independentes entre si. Quando as variáveis são dependentes, devemos considerar a distribuição conjunta das duas variáveis, pois elas não podem ser estudadas separadamente Profª Lisiane Selau 10 Variáveis aleatórias independentes Exemplo 2: Consideremos agora a distribuição conjunta das variáveis Y e Z, definidas no exemplo 1. Da Tabela 1, obtém-se: Eventos Prob. X Y Z MMM 1/8 3 1 0 MM F 1/8 2 1 1 M FM 1/8 2 1 2 F MM 1/8 2 0 1 M F F 1/8 1 1 1 F M F 1/8 1 0 2 F F M 1/8 1 0 1 F F F 1/8 0 0 0 Tabela 4 Y Z p(y) 0 1 2 0 1/8 2/8 1/8 1/2 1 1/8 2/8 1/8 1/2 P(x) 1/4 2/4 1/4 1 Para a Tabela 4, observa-se que: para quaisquer z = 0, 1, 2 e y = 0, 1. O que mostra que P(Z = z, Y = y) = P(Z = z) . P(Y = y), isto é, a probabilidade de cada casela é igual ao produto das respectivas probabilidades marginais. z)P(Z y)P(Y y)Y, zP(Zy)z/YP(Z == = == === Profª Lisiane Selau 11 Por exemplo: P(Z = 1, Y = 1) = P(Z = 1) . P(Y = 1) = 2/4 . 1/2 = 1/4 Também é verdade que P(Y = y / Z = z) = P(Y = y) para todos os valores de Y e Z. Logo, Y e Z são independentes. Definição: Duas variáveis aleatórias discretas X e Y são independentes quando a ocorrência de uma não altera a probabilidade de ocorrência da outra. Exemplo: X e Y são independentes X e Y são independentes ⇔ y),P(Y x) P(X y) Y x, P(X =×==== ∀∀∀∀ (x, y) ∈∈∈∈ SXY =×==== ==== 1)P(Y 0) P(X 1) Y 0, P(X 0) P(X 1) / Y 0 P(X ou Profª Lisiane Selau 12 Retomemos à Tabela 3 (distribuição conjunta de X e Y). Vamos considerar as variáveis aleatórias (X+Y) e (XY), construindo a Tabela 5. Funções de variáveis aleatórias Tabela 3 Y X p(y) 0 1 2 3 0 1/8 2/8 1/8 0 1/2 1 0 1/8 2/8 1/8 1/2 p(x) 1/8 3/8 3/8 1/8 1 Tabela 5 (x, y) x + y xy p(x, y) (0, 0) 0 0 1/8 (0, 1) 1 0 0 (1, 0) 1 0 2/8 (1, 1) 2 1 1/8 (2, 0) 2 0 1/8 (2, 1) 3 2 2/8 (3, 0) 3 0 0 (3, 1) 4 3 1/8 Tabela 6 x + y 0 1 2 3 4 p(x+y) 1/8 2/8 2/8 2/8 1/8 Tabela 7 xy 0 1 2 3 p(xy) 4/8 1/8 2/8 1/8 Profª Lisiane Selau 13 Calculando as esperanças das variáveis X e Y da Tabela 3, obtém-se: Tabela 3 Y X p(y) 0 1 2 3 0 1/8 2/8 1/8 0 1/2 1 0 1/8 2/8 1/8 1/2 p(x) 1/8 3/8 3/8 1/8 1 = 0.1/8 + 1.3/8 + 2.3/8 + 3.1/8 = 12/8 = 3/2 = 1,5 = 0.1/2 + 1.1/2 = 1/2 = 0,5 ∑ ∈ = XSx p(x)xE(X) ∑ ∈ = YSy p(y)yE(Y) Profª Lisiane Selau 14 Da Tabela 6, obtém-se: Tabela 6 x + y 0 1 2 3 4 p(x+y) 1/8 2/8 2/8 2/8 1/8 ∑∑ ++=+ x y y)y).p(x(xY)E(X E(X + Y) = 0.1/8 + 1.2/8 + 2.2/8 + 3.2/8 + 4.1/8 = 16/8 = 2 Nota-se que E(X + Y) = E(X) + (Y) = 1,5 + 0,5 Teorema 1: Se X e Y, duas variáveis aleatórias, então: E(X + Y) = E(X) + E(Y) Isto é sempre verdade, quer seja X e Y independentes ou não. Profª Lisiane Selau 15 Da Tabela 7, obtém-se: ∑∑= x y (xy).p(xy)E(XY) E(XY) = 0.4/8 + 1.1/8 + 2.2/8 + 3.1/8 = 8/8 = 1,0 Neste caso, observa-se que: E(XY) = 1,0 ≠ E(X) . E(Y) = 1,5 . 0,5 ou seja, de um modo geral, a esperança de um produto não é o produto das esperanças. Teorema 2: Se X e Y são variáveis aleatórias independentes, então: E(XY) = E(X) . E(Y) Tabela 7 xy 0 1 2 3 p(xy) 4/8 1/8 2/8 1/8 Profª Lisiane Selau 16 Isto pode ser mostrado a partir do exemplo 2 da Tabela 4, onde as variáveis aleatórias Y e Z são independentes. Sendo Tabela 4 Y Z p(y) 0 1 2 0 1/8 2/8 1/8 1/2 1 1/8 2/8 1/8 1/2 P(x) 1/4 2/4 1/4 1E(Z) = 0.1/4 + 1.2/4 + 2.1/4 = 1 E(Y) = 0.1/2 + 1.1/2 = 1/2 E(ZY) = 0.1/8 + 0.2/8 + 0.1/8 + 0.1/8 + 1.2/8 + 2.1/8 = 2/8 + 2/8 = 4/8 = 1/2 então, E(ZY) = E(Z) . E(Y) A recíproca do Teorema 2 não éverdadeira, ou seja, E(XY) = E(X) . E(Y) pode ser válida e X e Y não serem independentes. Teorema 2: Se X e Y são variáveis aleatórias independentes, então: E(XY) = E(X) . E(Y) Profª Lisiane Selau 17 Exemplo 3: Sejam X e Y variáveis aleatórias com a seguinte distribuição conjunta: Y X p(y)0 1 2 1 3/20 3/20 2/20 8/20 2 1/20 1/20 2/20 4/20 3 4/20 1/20 3/20 8/20 p(x) 8/20 5/20 7/20 1 Observe que X e Y não são independentes, pois: P(X = 0, Y = 1) = 3/20 ≠ P(X = 0) . P(Y = 1) = 8/20 . 8/20 = 4/25 No entanto, têm-se que: E(X) = 0 . 8/20 + 1 . 5/20 + 2 . 7/20 = 0,95 E(Y) = 1 . 8/20 + 2 . 4/20 + 3 . 8/20 = 2,00 E(XY) = 0 . 3/20 + 1 . 3/20 + 2 . 2/20 + 0 . 1/20 + 2 . 1/20 + 4 . 2/20 + 0 . 4/20 + 3 . 1/20 + 6 . 3/20 = 38/20 = 1,9 logo, E(XY) = E(X) . E(Y) 1,9 = 2,00 . 0,95 = 1,9 A recíproca do Teorema 2 não é verdadeira Tabela 8 Profª Lisiane Selau 18 Medida numérica da variação conjunta de duas variáveis aleatórias. Definição: Se X e Y são duas variáveis aleatórias, a covariância é definida pela média dos produtos dos desvios de X e Y O sinal e a magnitude da covariância refletem, respectivamente, a direção e a intensidade da relação linear entre X e Y, de modo que a covariância pode ser positiva ou negativa e teoricamente pode variar de -∞ a +∞. Covariância de duas variáveis aleatórias [ ])μ).(Y μ (XE Y), Cov(X YX −−= Fórmula de definição E(X).E(Y)E(X.Y) Y), Cov(X −= Fórmula prática Profª Lisiane Selau 19 E(X).E(Y)E(X.Y) Y), Cov(X −= onde: ∑∑= x y y)(x.y).p(x,E(X.Y) = ∑∑ ∈∈ yX SySx p(y)y.p(x)xE(X).E(Y) Média do produto Produto das médias Fórmula prática A covariância pode assumir valores positivos (indicando relação positiva entre X e Y) ou negativos (indicando relação negativa). Profª Lisiane Selau 20 Exemplo 4: Para as variáveis X e Y da Tabela 3, obteve-se: Tabela 3 Y X p(y)0 1 2 3 0 1/8 2/8 1/8 0 1/2 1 0 1/8 2/8 1/8 1/2 p(x) 1/8 3/8 3/8 1/8 1 Cov(X,Y) = E(XY) – E(X) . E(Y) Cov(X,Y) = 1,0 – (1,5)(0,5) = 0,25 Definição: Quando Cov(X,Y) = 0, diz-se que X e Y são não- correlacionadas linearmente. E(X) = 1,5 E(Y) = 0,5 E(XY) = 1,0 Profª Lisiane Selau 21 Exemplo 5: Retornemos à Tabela 4, onde foi verificado que as variáveis aleatórias Y e Z são independentes. Tabela 4 Y Z p(y)0 1 2 0 1/8 2/8 1/8 1/2 1 1/8 2/8 1/8 1/2 P(x) 1/4 2/4 1/4 1 E(Z) = 1 E(Y) = 1/2 E(YZ) = E(Z).E(Y) = 1/2 Cov(Y, Z) = E(YZ) – E(Y) . E(Z) = 1/2 – 1 . 1/2 = 0 Proposição 1: Se X e X Y são duas variáveis aleatórias independentes, então E(X.Y) = E(X).E(Y) e Cov(X,Y) = 0. Profª Lisiane Selau 22 Exemplo 6: Considerando a distribuição conjunta de X e Y dada no exemplo 3 (Tabela 8): Cov(X,Y) = E(XY) – E(X) . E(Y) Cov(X,Y) = 1,90 – (0,95)(2,00) = 0 Y X p(y) 0 1 2 1 3/20 3/20 2/20 8/20 2 1/20 1/20 2/20 4/20 3 4/20 1/20 3/20 8/20 p(x) 8/20 5/20 7/20 1 Tabela 8 E(X) = 0,95 E(Y) = 2,00 E(XY) = 1,90 Conclusão: se X e Y são independentes, isto implica X e Y não- correlacionadas. A recíproca não é verdadeira, isto é, Cov(X,Y) = 0 não implica X e Y independentes. De fato, para as variáveis aleatórias X e Y do exemplo 3 (Tabela 8), Cov(X,Y) = 0, mas como foi verificado, X e Y não são independentes. Profª Lisiane Selau 23 Resultados: Para as duas variáveis aleatórias X e Y, � Se Z = X + Y, vale que µZ = µX + µY , e V(Z) = V(X+Y) = V(X) + V(Y) + 2Cov(X,Y) � Se Z = X - Y, vale que µZ = µX - µY , e V(Z) = V(X+Y) = V(X) + V(Y) - 2Cov(X,Y) � Se X e Y são independentes, então: V(X ± Y) = V(X) + V(Y) Profª Lisiane Selau 24 Outras propriedades da covariância Considerando X, Y e Z variáveis aleatórias e a, b, c e d constantes, têm-se as seguintes propriedades: Cov (X, a) = 0 Cov (X, -Y) = - Cov (X, Y) Cov (aX, Y) = a Cov (X, Y) Cov (aX+b, cY+d) = ac Cov (X, Y) Cov (X+Y, Z) = Cov (X, Z) + Cov (Y, Z) Profª Lisiane Selau 25 � A covariância isoladamente não é conveniente como uma medida da relação entre duas variáveis, pois depende da unidade na qual X e Y são medidos. � Se estivermos estudando a dependência entre as variáveis X: peso do pai em kg e Y: peso do filho em kg, ao calcularmos a covariância, teremos uma medida ao quadrado (kg2). � Além disso, o campo de variação é muito amplo, isto é, -∞ < Cov (X, Y) < + ∞ , o que dificulta a interpretação. Definição: O coeficiente de correlação de X e Y é definido por: Coeficiente de Correlação V(Y). V(X) Y), Cov(X ρ = , sendo -1 ≤≤≤≤ ρ ≤≤≤≤ 1 Profª Lisiane Selau 26 Exemplo 7: (a) Para as variáveis X e Y do exemplo 3 (Tabela 8) Cov (X, Y) = 0 ⇒ ρ(X, Y) = 0. (b) Para as variáveis X e Y do exemplo 1 (Tabela 3), têm-se: Tabela 3 Y X p(y)0 1 2 3 0 1/8 2/8 1/8 0 1/2 1 0 1/8 2/8 1/8 1/2 p(x) 1/8 3/8 3/8 1/8 1 V(X) = (0 – 3/2)2.1/8 + (1– 3/2)2.3/8 + (2 – 3/2)2.3/8 + (3 – 3/2)2 .1/8 = 0,75 V(Y) = ( 0 – 1/2 )2 .1/2 + ( 1 – 1/2 )2 .1/2 = 0,25 Cov (X,Y) = 0,25 E(X) = 3/2 E(Y) = 1/2 ∑ ∈ = XSx 2 p(x)E(X)]-[xV(X) V(Y). V(X) Y), Cov(X ρ =logo, 0,58 5)(0,75)(0,2 0,25 == Profª Lisiane Selau 27 Propriedades do coeficiente de correlação O coeficiente de correlação é uma quantidade adimensional e tem as seguintes propriedades: � -1 ≤ ρ (X,Y) ≤ 1 � ρ (X, Y) = ρ (Y, X) � ρ (X, X) = 1 ρ (X,-X) = -1 Quando ρ (X,Y) = ±1, existe uma correlação perfeita entre X e Y, isto é, Y = a + bX; se ρ (X,Y) = 1, b > 0, e se ρ (X,Y) = -1, b < 0. O grau de associação linear entre X e Y varia à medida que ρ (X,Y) varia entre –1 e +1. Profª Lisiane Selau 28 três bolas, (com reposição)Experimento: Numa urna existem quatro bolas verdes, três azuis e três pretas. Retiram-se, com reposição, três bolas. As variáveis X e Y indicam, respectivamente, o número de bolas verdes e o número de bolas azuis retiradas. Como as retiradas são com reposição, são todas independentes entre si. # S = 103 = 1000 S = {(V1V1V1), (V1V1V2), (V1V2V1), (V2V1V1), (V1V1V3), ..., (P3P3P3)} X = número de bolas verdes retiradas SX = { 0, 1, 2, 3} Y = número de bolas azuis retiradas SY = { 0, 1, 2, 3} O espaço amostral da variável bidimensional (X,Y): SXY = {(0,0), (0,1), (0,2), (0,3) (1,0), (1,1), (1,2), (2,0), (2,1), (3,0)} Profª Lisiane Selau 29 O par (X =0, Y =1) corresponde ao seguinte evento: 0 bola verde, 1 bola azul e, consequentemente, 2 bolas pretas retiradas independentes ⇒ probabilidades as mesmas nas 3 retiradas P(verde) = 0,4 P(azul) = 0,3 P(preta) = 0,3 Como o evento (APP), um dos que correspondem ao par (X =0, Y =1), consiste da intersecção de três eventos independentes: bola azul na primeira retirada, bola preta na segunda retirada e bola preta na terceira retirada, sua probabilidade pode ser obtida por: P(APP) = P(azul) × P(preta) × P(preta) P(APP) = 0,3 × 0,3 × 0,3 = 0,027 Y X 0 1 2 3 Σ 0 1 2 3 Σ 1 três bolas, (com reposição) Profª Lisiane Selau 30 Devemos considerar que existem três maneiras de se obter o evento desejado: 0 bola verde, 1 bola azul e 2 bolas pretas. (APP) (PAP) (PPA) Deste modo, o probabilidade P(X =0, Y =1) será a soma das probabilidades destes três eventos, ou seja, P(X = 0, Y =1) = P(APP) + P(PAP) + P(PPA). Como as probabilidades dos três eventos são iguais P(APP) = P(PAP) = P(PPA) = 0,3 × 0,3 × 0,3 = 0,027 temos P(X =0, Y =1) = 3 × 0,027 = 0,081 Y X 0 1 2 3 Σ 0 1 2 3 Σ 1 três bolas, (com reposição) Profª Lisiane Selau 31 Esses três eventos (APP, PAP, PPA) são grupos que diferem apenaspela ordem e que podem estar repetidos, uma vez que as retiradas são feitas com reposição. Sendo assim, o número de diferentes maneiras de ocorrência do par (X =0, Y =1) pode ser obtido calculando-se : 3 2! 1! 0! 3!P0,1,23 = ×× = 0,0810,30,30,4P 1) Y 0, P(X 2102 1, 0,3 =×××=== y-x-3yxy-x-3 y,x, 3 0,30,30,4P y) Y x, P(X ×××=== Generalizando... Y X 0 1 2 3 Σ 0 1 2 3 Σ 1 três bolas, (com reposição) Profª Lisiane Selau 32 Y X 0 1 2 3 Σ 0 0,027 0,081 0,081 0,027 0,216 1 0,108 0,216 0,108 0 0,432 2 0,144 0,144 0 0 0,288 3 0,064 0 0 0 0,064 Σ 0,343 0,441 0,189 0,027 1 Marginal de XP(X=1,Y=1) P(X=1,Y=2) Marginal de Y Distribuição conjunta P(X=2) P(Y=1) yx3yxyxy,3x, 3 0,30,30,4Py)Yx,P(X −−−−=== Profª Lisiane Selau 33 X e Y são independentes? P(X = 0, Y = 0) P(X = 0) ×××× (Y = 0) = = 0,027 0,216 ×××× 0,343 = 0,074 0,740,27 0)P(Y 0) P(X 0) Y 0, P(X ≠ =×=≠== Concluímos que o número de bolas verdes retiradas (X) depende do número de bolas azuis (Y). Para provar a independência entre X e Y é necessário que o produto das probabilidades individuais seja igual à probabilidade conjunta para todos os pares (x, y). Y X 0 1 2 3 Σ 0 0,027 0,081 0,081 0,027 0,216 1 0,108 0,216 0,108 0 0,432 2 0,144 0,144 0 0 0,288 3 0,064 0 0 0 0,064 Σ 0,343 0,441 0,189 0,027 1 Profª Lisiane Selau 34 a) E(X) b) E(Y) c) E(X+Y) d) E(X-Y) e) E(XY) f) V(X) g) V(Y) h) Cov(X,Y) i) V(X+Y) j) V(X-Y) k) O coeficiente de correlação linear Exercício proposto: Para o experimento da retirada de três bolas, determine: Profª Lisiane Selau 35 Respostas: a) E(X) 1,20 b) E(Y) 0,90 c) E(X+Y) 2,1 d) E(X-Y) 0,3 e) E(XY) 0,7 f) V(X) 0,72 E(X2) = 2,16 g) V(Y) 0,63 E(Y2) = 1,44 h) Cov(X,Y) -0,36 i) V(X+Y) 0,63 E((X+Y)2) = 5,04 j) V(X-Y) 2,07 E((X-Y)2) = 2,16 k) O coeficiente de correlação linear. -0,5345 Profª Lisiane Selau 36 Exercício proposto: Para o exemplo da composição das famílias com 3 filhos, utiliza as variáveis X e Z criadas e: X = número de meninos Z = número de vezes que houver variação do sexo entre um nascimento e outro, dentro de uma mesma família. Eventos Prob. X Y Z MMM 1/8 3 1 0 MM F 1/8 2 1 1 M FM 1/8 2 1 2 F MM 1/8 2 0 1 M F F 1/8 1 1 1 F M F 1/8 1 0 2 F F M 1/8 1 0 1 F F F 1/8 0 0 0 a) Obtenha a distribuição conjunta e marginais. b) Verifique se X e Z são variáveis independentes. c) Calcule o coeficiente de correlação entre X e Z. Profª Lisiane Selau
Compartilhar