Prévia do material em texto
Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Estatística Aplicada à Engenharia Ambiental Aula 12 Prof. Carlos Henrique Ribeiro Lima Departamento de Engenharia Civil e Ambiental Universidade de Brasília 22 Setembro 2014 Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Agenda 3 Distribuições de Probabilidades Conjuntas Covariância e Correlação. Independência. 4 Distribuição Normal Bivariada Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Covariância Objetivo: Obter um sumário da distribuição conjunta de duas variáveis aleatórias, ou seja, ter um resumo da dependência linear entre duas variáveis aleatórias. Definição: Seja X e Y duas variáveis aleatórias com uma dada distribuição conjunta e seja E (X ) = µX , E (Y ) = µY , Var(X ) = σ2X e Var(Y ) = σ2Y . A covariância entre X e Y é definida por: Cov(X ,Y ) = σXY = E [(X − µX )(Y − µY )] . Resultado: Se σ2X <∞ e σ2Y <∞, então Cov(X ,Y ) <∞. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Covariância Objetivo: Obter um sumário da distribuição conjunta de duas variáveis aleatórias, ou seja, ter um resumo da dependência linear entre duas variáveis aleatórias. Definição: Seja X e Y duas variáveis aleatórias com uma dada distribuição conjunta e seja E (X ) = µX , E (Y ) = µY , Var(X ) = σ2X e Var(Y ) = σ2Y . A covariância entre X e Y é definida por: Cov(X ,Y ) = σXY = E [(X − µX )(Y − µY )] . Resultado: Se σ2X <∞ e σ2Y <∞, então Cov(X ,Y ) <∞. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Covariância Objetivo: Obter um sumário da distribuição conjunta de duas variáveis aleatórias, ou seja, ter um resumo da dependência linear entre duas variáveis aleatórias. Definição: Seja X e Y duas variáveis aleatórias com uma dada distribuição conjunta e seja E (X ) = µX , E (Y ) = µY , Var(X ) = σ2X e Var(Y ) = σ2Y . A covariância entre X e Y é definida por: Cov(X ,Y ) = σXY = E [(X − µX )(Y − µY )] . Resultado: Se σ2X <∞ e σ2Y <∞, então Cov(X ,Y ) <∞. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Covariância - Observações 1) O valor de Cov(X ,Y ) pode ser positivo, negativo ou zero. 2) Se a covariância for zero, não existe dependência linear entre as variáveis, mas pode haver outro tipo de relação entre elas e, portanto, não podemos afirmar que as variáveis aleatórias são independentes. 3) Para variáveis independentes, a covariância zerá zero. Resultado: Cov(X ,Y ) = σXY = E [(X − µX )(Y − µY )] = E (XY )− µXµY . Se as variáveis forem independentes, então: E (XY ) = E (X )E (Y ) = µXµY → Cov(X ,Y ) = 0. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Covariância - Observações 1) O valor de Cov(X ,Y ) pode ser positivo, negativo ou zero. 2) Se a covariância for zero, não existe dependência linear entre as variáveis, mas pode haver outro tipo de relação entre elas e, portanto, não podemos afirmar que as variáveis aleatórias são independentes. 3) Para variáveis independentes, a covariância zerá zero. Resultado: Cov(X ,Y ) = σXY = E [(X − µX )(Y − µY )] = E (XY )− µXµY . Se as variáveis forem independentes, então: E (XY ) = E (X )E (Y ) = µXµY → Cov(X ,Y ) = 0. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Covariância - Observações 1) O valor de Cov(X ,Y ) pode ser positivo, negativo ou zero. 2) Se a covariância for zero, não existe dependência linear entre as variáveis, mas pode haver outro tipo de relação entre elas e, portanto, não podemos afirmar que as variáveis aleatórias são independentes. 3) Para variáveis independentes, a covariância zerá zero. Resultado: Cov(X ,Y ) = σXY = E [(X − µX )(Y − µY )] = E (XY )− µXµY . Se as variáveis forem independentes, então: E (XY ) = E (X )E (Y ) = µXµY → Cov(X ,Y ) = 0. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Covariância - Observações 1) O valor de Cov(X ,Y ) pode ser positivo, negativo ou zero. 2) Se a covariância for zero, não existe dependência linear entre as variáveis, mas pode haver outro tipo de relação entre elas e, portanto, não podemos afirmar que as variáveis aleatórias são independentes. 3) Para variáveis independentes, a covariância zerá zero. Resultado: Cov(X ,Y ) = σXY = E [(X − µX )(Y − µY )] = E (XY )− µXµY . Se as variáveis forem independentes, então: E (XY ) = E (X )E (Y ) = µXµY → Cov(X ,Y ) = 0. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Covariância - Observações 1) O valor de Cov(X ,Y ) pode ser positivo, negativo ou zero. 2) Se a covariância for zero, não existe dependência linear entre as variáveis, mas pode haver outro tipo de relação entre elas e, portanto, não podemos afirmar que as variáveis aleatórias são independentes. 3) Para variáveis independentes, a covariância zerá zero. Resultado: Cov(X ,Y ) = σXY = E [(X − µX )(Y − µY )] = E (XY )− µXµY . Se as variáveis forem independentes, então: E (XY ) = E (X )E (Y ) = µXµY → Cov(X ,Y ) = 0. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Covariância - Observações 1) O valor de Cov(X ,Y ) pode ser positivo, negativo ou zero. 2) Se a covariância for zero, não existe dependência linear entre as variáveis, mas pode haver outro tipo de relação entre elas e, portanto, não podemos afirmar que as variáveis aleatórias são independentes. 3) Para variáveis independentes, a covariância zerá zero. Resultado: Cov(X ,Y ) = σXY = E [(X − µX )(Y − µY )] = E (XY )− µXµY . Se as variáveis forem independentes, então: E (XY ) = E (X )E (Y ) = µXµY → Cov(X ,Y ) = 0. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Covariância e Independência Dessa forma, temos que: Independência → Cov(X ,Y ) = 0, mas Independência 8 Cov(X ,Y ) = 0. Observação: E (XY ) = ∑∑ xy fXY (x , y), X e Y discretos; E (XY ) = ∫ ∫ xyfXY (x , y)dxdy , X e Y contínuos. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Covariância e Independência Dessa forma, temos que: Independência → Cov(X ,Y ) = 0, mas Independência 8 Cov(X ,Y ) = 0. Observação: E (XY ) = ∑∑ xy fXY (x , y), X e Y discretos; E (XY ) = ∫ ∫ xyfXY (x , y)dxdy , X e Y contínuos. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação.Independência. Covariância e Independência Dessa forma, temos que: Independência → Cov(X ,Y ) = 0, mas Independência 8 Cov(X ,Y ) = 0. Observação: E (XY ) = ∑∑ xy fXY (x , y), X e Y discretos; E (XY ) = ∫ ∫ xyfXY (x , y)dxdy , X e Y contínuos. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Exemplo Seja X e Y duas variáveis aleatórias contínuas com função densidade de probabilidade (fdp): f (x , y) = { x + y , para 0 < x < 1 e 0 < y < 1, 0, para outros valores. Determine Cov(X ,Y ). Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Exemplo Seja X e Y duas variáveis aleatórias contínuas com função densidade de probabilidade (fdp): f (x , y) = { x + y , para 0 < x < 1 e 0 < y < 1, 0, para outros valores. Determine Cov(X ,Y ). Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Correlação Qual o principal problema quando utilizamos a covariância para medir a dependência linear entre duas variáveis aleatórias? → A escala das variáveis! Definição: Se 0 < σ2X <∞ e 0 < σ2Y <∞, então a correlação de X e Y , denotada por ρXY , é definida como: ρXY = Cov(X ,Y ) σX · σY = σXY σX · σY . Resultado: Seja X e Y duas v.a.s com 0 < σ2X <∞ e 0 < σ2Y <∞. Então |ρXY | ≤ 1 . |ρXY | = 1, se, e somente se, uma variável aleatória for função linear da outra variável. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Correlação Qual o principal problema quando utilizamos a covariância para medir a dependência linear entre duas variáveis aleatórias? → A escala das variáveis! Definição: Se 0 < σ2X <∞ e 0 < σ2Y <∞, então a correlação de X e Y , denotada por ρXY , é definida como: ρXY = Cov(X ,Y ) σX · σY = σXY σX · σY . Resultado: Seja X e Y duas v.a.s com 0 < σ2X <∞ e 0 < σ2Y <∞. Então |ρXY | ≤ 1 . |ρXY | = 1, se, e somente se, uma variável aleatória for função linear da outra variável. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Correlação Qual o principal problema quando utilizamos a covariância para medir a dependência linear entre duas variáveis aleatórias? → A escala das variáveis! Definição: Se 0 < σ2X <∞ e 0 < σ2Y <∞, então a correlação de X e Y , denotada por ρXY , é definida como: ρXY = Cov(X ,Y ) σX · σY = σXY σX · σY . Resultado: Seja X e Y duas v.a.s com 0 < σ2X <∞ e 0 < σ2Y <∞. Então |ρXY | ≤ 1 . |ρXY | = 1, se, e somente se, uma variável aleatória for função linear da outra variável. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Correlação Qual o principal problema quando utilizamos a covariância para medir a dependência linear entre duas variáveis aleatórias? → A escala das variáveis! Definição: Se 0 < σ2X <∞ e 0 < σ2Y <∞, então a correlação de X e Y , denotada por ρXY , é definida como: ρXY = Cov(X ,Y ) σX · σY = σXY σX · σY . Resultado: Seja X e Y duas v.a.s com 0 < σ2X <∞ e 0 < σ2Y <∞. Então |ρXY | ≤ 1 . |ρXY | = 1, se, e somente se, uma variável aleatória for função linear da outra variável. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Exemplo Para o exemplo anterior, determine ρXY . Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Independência Se X e Y forem duas variáveis aleatórias independentes, então: i) fXY (x , y) = fX (x) · fY (y); ii) fY |x (y) = fY (y); iii) fX |y (x) = fX (x); iv) E (XY ) = E (X ) · E (Y ); v) σXY = ρXY = 0. Observação importante: As condições i) a iii) implicam independência, enquanto as condições iv) e v) não implicam. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Independência Se X e Y forem duas variáveis aleatórias independentes, então: i) fXY (x , y) = fX (x) · fY (y); ii) fY |x (y) = fY (y); iii) fX |y (x) = fX (x); iv) E (XY ) = E (X ) · E (Y ); v) σXY = ρXY = 0. Observação importante: As condições i) a iii) implicam independência, enquanto as condições iv) e v) não implicam. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Independência Se X e Y forem duas variáveis aleatórias independentes, então: i) fXY (x , y) = fX (x) · fY (y); ii) fY |x (y) = fY (y); iii) fX |y (x) = fX (x); iv) E (XY ) = E (X ) · E (Y ); v) σXY = ρXY = 0. Observação importante: As condições i) a iii) implicam independência, enquanto as condições iv) e v) não implicam. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Independência Se X e Y forem duas variáveis aleatórias independentes, então: i) fXY (x , y) = fX (x) · fY (y); ii) fY |x (y) = fY (y); iii) fX |y (x) = fX (x); iv) E (XY ) = E (X ) · E (Y ); v) σXY = ρXY = 0. Observação importante: As condições i) a iii) implicam independência, enquanto as condições iv) e v) não implicam. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Independência Se X e Y forem duas variáveis aleatórias independentes, então: i) fXY (x , y) = fX (x) · fY (y); ii) fY |x (y) = fY (y); iii) fX |y (x) = fX (x); iv) E (XY ) = E (X ) · E (Y ); v) σXY = ρXY = 0. Observação importante: As condições i) a iii) implicam independência, enquanto as condições iv) e v) não implicam. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Covariância e Correlação. Independência. Independência Se X e Y forem duas variáveis aleatórias independentes, então: i) fXY (x , y) = fX (x) · fY (y); ii) fY |x (y) = fY (y); iii) fX |y (x) = fX (x); iv) E (XY ) = E (X ) · E (Y ); v) σXY = ρXY = 0. Observação importante: As condições i) a iii) implicam independência, enquanto as condições iv) e v) não implicam. Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Distribuição Normal Bivariada A função densidade de probabilidade de uma distribuição normal bivariada é dada por: fXY (x ,y)= 12piσXσY √ 1−ρ2 exp { − 12(1−ρ2) [( X−µX σX )2 − 2ρ(X−µX )(Y−µY ) σXσY + ( Y−µY σY )2]} com parâmetros σX > 0, σY > 0, µX , µY e −1 < ρ < 1. 178 CHAPTER 5 JOINT PROBABILITY DISTRIBUTIONS The result that fXY (x, y; �X, �Y, �X, �Y, �) integrates to 1 is left as an exercise. Also, the bivari- ate normal probability density function is positive over the entire plane of real numbers. Two examples of bivariatenormal distributions are illustrated in Fig. 5-17 along with corresponding contour plots. Each curve on the contour plots is a set of points for which the probability density function is constant. As seen in the contour plots, the bivariate normal probability density function is constant on ellipses in the (x, y) plane. (We can consider a circle to be a special case of an ellipse.) The center of each ellipse is at the point (�X, �Y). If � � 0 (� � 0), the major axis of each ellipse has positive (negative) slope, respectively. If � � 0, the major axis of the ellipse is aligned with either the x or y coordinate axis. EXAMPLE 5-28 The joint probability density function is a special case of a bivariate normal distribution with �X � 1, �Y � 1, �X � 0, �Y � 0, and � � 0. 1 12� e�0.51x 2 y22 fXY 1x, y2 � This probability density function is illustrated in Fig. 5-18. Notice that the contour plot consists of concentric circles about the origin. Figure 5-17 Examples of bivariate normal distributions. x y fXY(x, y) fXY(x, y) y x 0 x y y x �X �X �X�X �Y �Y �Y �Y fXY(x, y) Figure 5-18 Bivariate normal probability density function with �X � 1, �Y � 1, � � 0, �X � 0, and �Y � 0. 0 0 x y fXY(x, y) x 0 y 0 x z y Figure 5-19 Marginal probability density functions of a bivariate normal distribution. The following results can be shown for a bivariate normal distribution. The details are left as an exercise. If X and Y have a bivariate normal distribution with joint probability density fXY (x, y; �X, �Y, �X, �Y, �), the marginal probability distributions of X and Y are normal with means �X and �Y and standard deviations �X and �Y, respectively. (5-21) Marginal Distributions of Bivariate Normal Random Variables Figure 5-19 illustrates that the marginal probability distributions of X and Y are normal. JWCL232_c05_152-190.qxd 1/7/10 2:33 PM Page 178 Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Distribuição Normal Bivariada A função densidade de probabilidade de uma distribuição normal bivariada é dada por: fXY (x ,y)= 12piσXσY √ 1−ρ2 exp { − 12(1−ρ2) [( X−µX σX )2 − 2ρ(X−µX )(Y−µY ) σXσY + ( Y−µY σY )2]} com parâmetros σX > 0, σY > 0, µX , µY e −1 < ρ < 1. 178 CHAPTER 5 JOINT PROBABILITY DISTRIBUTIONS The result that fXY (x, y; �X, �Y, �X, �Y, �) integrates to 1 is left as an exercise. Also, the bivari- ate normal probability density function is positive over the entire plane of real numbers. Two examples of bivariate normal distributions are illustrated in Fig. 5-17 along with corresponding contour plots. Each curve on the contour plots is a set of points for which the probability density function is constant. As seen in the contour plots, the bivariate normal probability density function is constant on ellipses in the (x, y) plane. (We can consider a circle to be a special case of an ellipse.) The center of each ellipse is at the point (�X, �Y). If � � 0 (� � 0), the major axis of each ellipse has positive (negative) slope, respectively. If � � 0, the major axis of the ellipse is aligned with either the x or y coordinate axis. EXAMPLE 5-28 The joint probability density function is a special case of a bivariate normal distribution with �X � 1, �Y � 1, �X � 0, �Y � 0, and � � 0. 1 12� e�0.51x 2 y22 fXY 1x, y2 � This probability density function is illustrated in Fig. 5-18. Notice that the contour plot consists of concentric circles about the origin. Figure 5-17 Examples of bivariate normal distributions. x y fXY(x, y) fXY(x, y) y x 0 x y y x �X �X �X�X �Y �Y �Y �Y fXY(x, y) Figure 5-18 Bivariate normal probability density function with �X � 1, �Y � 1, � � 0, �X � 0, and �Y � 0. 0 0 x y fXY(x, y) x 0 y 0 x z y Figure 5-19 Marginal probability density functions of a bivariate normal distribution. The following results can be shown for a bivariate normal distribution. The details are left as an exercise. If X and Y have a bivariate normal distribution with joint probability density fXY (x, y; �X, �Y, �X, �Y, �), the marginal probability distributions of X and Y are normal with means �X and �Y and standard deviations �X and �Y, respectively. (5-21) Marginal Distributions of Bivariate Normal Random Variables Figure 5-19 illustrates that the marginal probability distributions of X and Y are normal. JWCL232_c05_152-190.qxd 1/7/10 2:33 PM Page 178 Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Distribuição Normal Bivariada A função densidade de probabilidade de uma distribuição normal bivariada é dada por: fXY (x ,y)= 12piσXσY √ 1−ρ2 exp { − 12(1−ρ2) [( X−µX σX )2 − 2ρ(X−µX )(Y−µY ) σXσY + ( Y−µY σY )2]} com parâmetros σX > 0, σY > 0, µX , µY e −1 < ρ < 1. 178 CHAPTER 5 JOINT PROBABILITY DISTRIBUTIONS The result that fXY (x, y; �X, �Y, �X, �Y, �) integrates to 1 is left as an exercise. Also, the bivari- ate normal probability density function is positive over the entire plane of real numbers. Two examples of bivariate normal distributions are illustrated in Fig. 5-17 along with corresponding contour plots. Each curve on the contour plots is a set of points for which the probability density function is constant. As seen in the contour plots, the bivariate normal probability density function is constant on ellipses in the (x, y) plane. (We can consider a circle to be a special case of an ellipse.) The center of each ellipse is at the point (�X, �Y). If � � 0 (� � 0), the major axis of each ellipse has positive (negative) slope, respectively. If � � 0, the major axis of the ellipse is aligned with either the x or y coordinate axis. EXAMPLE 5-28 The joint probability density function is a special case of a bivariate normal distribution with �X � 1, �Y � 1, �X � 0, �Y � 0, and � � 0. 1 12� e�0.51x 2 y22 fXY 1x, y2 � This probability density function is illustrated in Fig. 5-18. Notice that the contour plot consists of concentric circles about the origin. Figure 5-17 Examples of bivariate normal distributions. x y fXY(x, y) fXY(x, y) y x 0 x y y x �X �X �X�X �Y �Y �Y �Y fXY(x, y) Figure 5-18 Bivariate normal probability density function with �X � 1, �Y � 1, � � 0, �X � 0, and �Y � 0. 0 0 x y fXY(x, y) x 0 y 0 x z y Figure 5-19 Marginal probability density functions of a bivariate normal distribution. The following results can be shown for a bivariate normal distribution. The details are left as an exercise. If X and Y have a bivariate normal distribution with joint probability density fXY (x, y; �X, �Y, �X, �Y, �), the marginal probability distributions of X and Y are normal with means �X and �Y and standard deviations �X and �Y, respectively. (5-21) Marginal Distributions of Bivariate Normal Random Variables Figure 5-19 illustrates that the marginal probability distributions of X and Y are normal. JWCL232_c05_152-190.qxd 1/7/10 2:33 PM Page 178 Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Distribuições Marginais e Condicionais Distribuições Marginais X ∼ N(µX , σ2X ) Y ∼ N(µY , σ2Y ). Distribuições Condicionais A distribuição condicional de Y , dado que X = x , é normal com média µY |x = µY − µX · ρ · σY σX + σY σX · ρ · x e variância: σ2Y |x = σ 2 Y (1− ρ2). Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de ProbabilidadesConjuntas Distribuição Normal Bivariada Distribuições Marginais e Condicionais Distribuições Marginais X ∼ N(µX , σ2X ) Y ∼ N(µY , σ2Y ). Distribuições Condicionais A distribuição condicional de Y , dado que X = x , é normal com média µY |x = µY − µX · ρ · σY σX + σY σX · ρ · x e variância: σ2Y |x = σ 2 Y (1− ρ2). Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Distribuições Marginais e Condicionais Distribuições Marginais X ∼ N(µX , σ2X ) Y ∼ N(µY , σ2Y ). Distribuições Condicionais A distribuição condicional de Y , dado que X = x , é normal com média µY |x = µY − µX · ρ · σY σX + σY σX · ρ · x e variância: σ2Y |x = σ 2 Y (1− ρ2). Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Distribuições Marginais e Condicionais Distribuições Marginais X ∼ N(µX , σ2X ) Y ∼ N(µY , σ2Y ). Distribuições Condicionais A distribuição condicional de Y , dado que X = x , é normal com média µY |x = µY − µX · ρ · σY σX + σY σX · ρ · x e variância: σ2Y |x = σ 2 Y (1− ρ2). Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Distribuições Marginais e Condicionais Distribuições Marginais X ∼ N(µX , σ2X ) Y ∼ N(µY , σ2Y ). Distribuições Condicionais A distribuição condicional de Y , dado que X = x , é normal com média µY |x = µY − µX · ρ · σY σX + σY σX · ρ · x e variância: σ2Y |x = σ 2 Y (1− ρ2). Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Distribuições Marginais e Condicionais Distribuições Marginais X ∼ N(µX , σ2X ) Y ∼ N(µY , σ2Y ). Distribuições Condicionais A distribuição condicional de Y , dado que X = x , é normal com média µY |x = µY − µX · ρ · σY σX + σY σX · ρ · x e variância: σ2Y |x = σ 2 Y (1− ρ2). Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Distribuição Condicional distributed (or, f(x|y = y0) ∼ N (µx|y=y0, σ2x|y=y0)). The conditional mean and variance of x, given that y = y0 is: µx|y=y0 = µx + ρσx (y − µy) σy (6) σx|y=y0 = σx √ 1− ρ2 (7) From these parameters, we can determine the probability that x will fall in a given range x0 ≤ x ≤ x1 from the normal distribution. This point is illustrated in Figure 3. −3 −2 −1 0 1 2 3 −3 −2 −1 0 1 2 3 x y −3 −2 −1 0 1 2 3 0 0.1 0.2 0.3 0.4 0.5 x f(x) f(x|y=1.5) Figure 3: Conditional Probability from the Bivariate Normal Distribution. Top: bivariate normal distribution based on a correlation of 0.4. Bottom: conditional distribution for variable x, given that variable y = 1.5. The shading indicates the probability that x will exceed 1.5 standard deviations if nothing is known about y (dark shading for lower curve), and if it is known that y = 1.5 (light shading for upper curve). Note the large difference in probabilities, though the correlation is not exceptionally high. 3 Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Independência Fato: Se X e Y tiverem uma distribuição normal bivariada com ρ = 0, então X e Y são independentes. Nesse caso, a função densidade de probabilidade conjunta fXY (x , y) é dada por: fXY (x ,y)=fX (x)·gY (y)= 12piσXσY ·exp { − 12 [( x−µX σX )2 + ( y−µY σY )2]} . Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Independência Fato: Se X e Y tiverem uma distribuição normal bivariada com ρ = 0, então X e Y são independentes. Nesse caso, a função densidade de probabilidade conjunta fXY (x , y) é dada por: fXY (x ,y)=fX (x)·gY (y)= 12piσXσY ·exp { − 12 [( x−µX σX )2 + ( y−µY σY )2]} . Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Independência Fato: Se X e Y tiverem uma distribuição normal bivariada com ρ = 0, então X e Y são independentes. Nesse caso, a função densidade de probabilidade conjunta fXY (x , y) é dada por: fXY (x ,y)=fX (x)·gY (y)= 12piσXσY ·exp { − 12 [( x−µX σX )2 + ( y−µY σY )2]} . Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Exemplo −4 −3 −2 −1 0 1 2 3 4 −4 −3 −2 −1 0 1 2 3 4 SOI vs CTI. ρ = −0.8 CTI SO I Figure 2: Scatterplot of the standardized Cold Tongue Index (x axis) and the standardized Southern Oscillation Index (y-axis). and y1 (or, P{y0 ≤ y ≤ y1 ∩ x0 ≤ x ≤ x1}) is just the volume integral under the surface f(x, y): P{y0 ≤ y ≤ y1 ∩ x0 ≤ x ≤ x1} = ∫ y2 y1 ∫ x2 x1 f(x, y)dxdy (4) This integration is typically done numerically. For normalized variables zx = (x−µx)/σx and zy = (y−µy)/σy , the bivariate normal PDF becomes: f(zx, zy) = 1 2pi √ 1− ρ2 exp [ −z 2 x + z 2 y − 2ρzxzy 2(1− ρ2) ] (5) The bivariate standard normal distribution has a maximum at the origin. Note that the only parameter in the bivariate standard normal distribution is the correlation ρ between x and y. If x and y are independent (ρ = 0) then the surfaces of constant f(x, y) are concentric circles around the origin. As ρ increases, the distribution is stretched diagonally, forming elliptical isopleths with positive sloped major axes. For negative ρ, the major axes have a negative slope. Figure 1 depicts the bivariate standard normal distribution based on a correlation ρ = −0.8 between the Cold Tongue Index (CTI; SST averaged along the equator) and the Southern Oscillation Index (SOI; SLP at Tahiti minus SLP at Darwin, or equivalent). Figure 2 depicts the scatterplot of the CTI and the SOI, which graphically serves the same purpose as a histogram would for a univariate distribution. A powerful feature of the bivariate normal distribution is that the conditional probability distri- bution function for one of the variables, given a known value for the other variable, is normally 2 The Bivariate Normal Distribution Most of the following discussion is taken from Wilks, Statistical Methods in the Atmospheric Sci- ences, section 4.5. First, lets define the bivariate normal distribution for two related, normally distributed variables x ∼ N (µx, σ2x), and x ∼ N (µy, σ2y). Then, the bivariate normal distribution is defined by the following probability density function: f(x, y) = 1 2piσxσy √ 1− ρ2 exp [ − 1 2(1− ρ2) [( x− µx σx )2 + ( y − µy σy )2 − 2ρ ( x− µx σx )( x− µy σy )]] (1) The bivariate normal PDF difines a surface in the x−y plane (see Figure 1). Like its one dimensional counterpart, the bivariate normal distribution has the following properties:∫ y ∫ x f(x, y)dxdy = 1 (2) f(x, y) >= 0 (3) As might be inferred, the probability of observing a value x between x0andx1, and y between y0 −10 −8 −6 −4 −2 0 2 4 6 8 10 −10 −5 0 5 10 0 0.05 0.1 0.15 0.2 0.25 0.3 CTI Bivariate PDF based on CTI and SOI SOI Figure 1: Bivariate Normal PDF calculated for parameters based on the Cold Tongue Index (x axis) and the Southern Oscillation Index (y-axis). 1 Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuiçõesde Probabilidades Conjuntas Distribuição Normal Bivariada Exemplo 5-48 Em uma titulação ácido-base, uma base ou um ácido é gradualmente adicionada(o) ao outro até que eles estejam completamente neutralizados. Sejam X e Y os mililitros de ácido e de base necessários para a equivalência, respectivamente. Considere que X e Y tenham uma distribuição normal bivariada, com σX = 5 mL, σY = 2 mL, µX = 120 mL, µY = 100 mL e ρ = 0, 6. Determine o seguinte: a) Covariância entre X e Y ; b) Distribuição de probabilidades marginal de X ; c) P(X < 116); d) Distribuição de probabilidades condicionais de X , dado que Y = 102; e) P(X < 116|Y = 102). Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Exemplo 5-48 Em uma titulação ácido-base, uma base ou um ácido é gradualmente adicionada(o) ao outro até que eles estejam completamente neutralizados. Sejam X e Y os mililitros de ácido e de base necessários para a equivalência, respectivamente. Considere que X e Y tenham uma distribuição normal bivariada, com σX = 5 mL, σY = 2 mL, µX = 120 mL, µY = 100 mL e ρ = 0, 6. Determine o seguinte: a) Covariância entre X e Y ; b) Distribuição de probabilidades marginal de X ; c) P(X < 116); d) Distribuição de probabilidades condicionais de X , dado que Y = 102; e) P(X < 116|Y = 102). Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Exemplo 5-48 Em uma titulação ácido-base, uma base ou um ácido é gradualmente adicionada(o) ao outro até que eles estejam completamente neutralizados. Sejam X e Y os mililitros de ácido e de base necessários para a equivalência, respectivamente. Considere que X e Y tenham uma distribuição normal bivariada, com σX = 5 mL, σY = 2 mL, µX = 120 mL, µY = 100 mL e ρ = 0, 6. Determine o seguinte: a) Covariância entre X e Y ; b) Distribuição de probabilidades marginal de X ; c) P(X < 116); d) Distribuição de probabilidades condicionais de X , dado que Y = 102; e) P(X < 116|Y = 102). Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Exemplo 5-48 Em uma titulação ácido-base, uma base ou um ácido é gradualmente adicionada(o) ao outro até que eles estejam completamente neutralizados. Sejam X e Y os mililitros de ácido e de base necessários para a equivalência, respectivamente. Considere que X e Y tenham uma distribuição normal bivariada, com σX = 5 mL, σY = 2 mL, µX = 120 mL, µY = 100 mL e ρ = 0, 6. Determine o seguinte: a) Covariância entre X e Y ; b) Distribuição de probabilidades marginal de X ; c) P(X < 116); d) Distribuição de probabilidades condicionais de X , dado que Y = 102; e) P(X < 116|Y = 102). Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Exemplo 5-48 Em uma titulação ácido-base, uma base ou um ácido é gradualmente adicionada(o) ao outro até que eles estejam completamente neutralizados. Sejam X e Y os mililitros de ácido e de base necessários para a equivalência, respectivamente. Considere que X e Y tenham uma distribuição normal bivariada, com σX = 5 mL, σY = 2 mL, µX = 120 mL, µY = 100 mL e ρ = 0, 6. Determine o seguinte: a) Covariância entre X e Y ; b) Distribuição de probabilidades marginal de X ; c) P(X < 116); d) Distribuição de probabilidades condicionais de X , dado que Y = 102; e) P(X < 116|Y = 102). Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Exemplo 5-48 Em uma titulação ácido-base, uma base ou um ácido é gradualmente adicionada(o) ao outro até que eles estejam completamente neutralizados. Sejam X e Y os mililitros de ácido e de base necessários para a equivalência, respectivamente. Considere que X e Y tenham uma distribuição normal bivariada, com σX = 5 mL, σY = 2 mL, µX = 120 mL, µY = 100 mL e ρ = 0, 6. Determine o seguinte: a) Covariância entre X e Y ; b) Distribuição de probabilidades marginal de X ; c) P(X < 116); d) Distribuição de probabilidades condicionais de X , dado que Y = 102; e) P(X < 116|Y = 102). Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Distribuição Normal Bivariada Exemplo 5-48 Em uma titulação ácido-base, uma base ou um ácido é gradualmente adicionada(o) ao outro até que eles estejam completamente neutralizados. Sejam X e Y os mililitros de ácido e de base necessários para a equivalência, respectivamente. Considere que X e Y tenham uma distribuição normal bivariada, com σX = 5 mL, σY = 2 mL, µX = 120 mL, µY = 100 mL e ρ = 0, 6. Determine o seguinte: a) Covariância entre X e Y ; b) Distribuição de probabilidades marginal de X ; c) P(X < 116); d) Distribuição de probabilidades condicionais de X , dado que Y = 102; e) P(X < 116|Y = 102). Carlos H. R. Lima Estatística Aplicada à Engenharia Ambiental-2014/2 Distribuições de Probabilidades Conjuntas Covariância e Correlação. Independência. Distribuição Normal Bivariada