Baixe o app para aproveitar ainda mais
Prévia do material em texto
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 1 Raciocínio Lógico-Quantitativo para Traumatizados Aula 17 Variável Aleatória Bivariada, Correlação, Regressão e Função Geratriz de Momentos 17. Variável Aleatória Bivariada, Correlação, Regressão e Função Geratriz de Momentos ......................................................................................................................................... 4 17.1 Funções de Probabilidade Conjunta ...................................................................... 4 17.2 Funções de Probabilidade Marginal ....................................................................... 8 17.3 Funções de Probabilidade Condicional ............................................................... 11 17.4 Variáveis Aleatórias Independentes.................................................................... 18 17.5 Esperanças Envolvendo Duas ou Mais Variáveis Aleatórias ...................... 19 17.5.1 Correlação e Covariância ............................................................................................. 19 17.5.2 Média e Variância de Uma Combinação Linear de Variáveis Aleatórias ................... 29 17.6 Regressão ...................................................................................................................... 30 17.6.1 A Natureza da Análise de Regressão ........................................................................... 30 17.6.2 Regressão Linear Simples ............................................................................................ 33 17.6.3 Coeficiente de Determinação ....................................................................................... 43 17.7 Momentos e Função Geratriz de Momentos .................................................... 49 17.7.1 Momentos de Uma Variável Aleatória ........................................................................ 49 17.7.2 Função Geratriz de Momentos ..................................................................................... 50 17.8 Memorize para a prova ............................................................................................ 55 17.9 Exercícios de Fixação ................................................................................................ 59 17.10 Gabarito ....................................................................................................................... 67 17.11 Resolução dos Exercícios de Fixação ............................................................... 67 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 2 Olá, tudo bem? Estudou a aula passada? Dúvidas? Use (e abuse) o forum! Prezado(a) aluno(a), você constatará que “não fugimos da raia” nesta aula. Os tópicos variável aleatória bivariada, correlação, regressão linear e função geratriz de momentos são realmente ensinados. Infelizmente, não há como evitar, em uma exposição teórica razoavelmente séria de tais assuntos, símbolos de integrais simples e duplas, somatórios, etc. Precisamos enfrentar a realidade. Você observará que um mínimo de embasamento conceitual é necessário para resolver questões de provas anteriores. É claro que tópicos como função geratriz de momentos raramente caem em concursos (cai na SUSEP, por exemplo). Entretanto, lembre-se que a nossa proposta é cobrir, se possível, 100% do “espaço amostral” da matéria de estatística que poderá cair na sua prova. Nós não temos como adivinhar, neste momento, como virá o edital de raciocínio lógico-quantitativo do seu concurso. Portanto, não custa nada ampliar um pouco o nosso leque da matéria e construir a base. Depois a gente “ajusta os ponteiros” na reta final do concurso, conforme o programa do edital. Antes de começarmos a exposição dos tópicos previstos para aula de hoje, gostaríamos de complementar/detalhar dois assuntos vistos na aula 14: box plots e coeficiente de assimetria. Essa complementação foi motivada por algumas dúvidas que nos foram enviadas por e-mails recentemente. Re-examinando os Conceitos de Box Plot e Coeficiente de Assimetria Diagrama de Caixa (pág. 29 da Aula 14) Um diagrama de caixa ou box plot ou “caixa-de-bigodes” é um retângulo que representa o desvio interquartílico (IQR) (é a estatística dQ definida por (18)). Para construir esse diagrama (veja a próxima figura), consideramos um retângulo onde estão representados a mediana, o primeiro quartil (Q1) e o terceiro quartil (Q3). A partir do retângulo, para cima, segue uma linha até o ponto mais remoto que não pode exceder LS = Q3 + 1,5.IQR, chamado limite superior. De modo análogo, a partir do retângulo, para baixo, segue uma linha até o ponto mais remoto que não seja menor que LS = Q1 –1,5.IQR, chamado limite inferior. Os valores compreendidos entre esses dois limites são chamandos valores adjacentes. As observações que estiverem acima do limite superior ou abaixo do limite inferior serão denominadas pontos exteriores. Essas observações são destoantes das demais e podem ou não ser o que chamamos de outliers ou valores atípicos. Um outlier pode ser produto de um erro de observação ou de arredondamento. Contudo, as denominações pontos exteriores e outliers são frequentemente usadas com o mesmo significado por alguns autores: observações fora de lugar, discrepantes ou atípicas. N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 3 O box plot nos dá uma noção da posição, dispersão, assimetria, caudas e dados discrepantes da distribuição. A posição central é dada pela mediana e a dispersão por IQR. As posições relativas de Q1, Q2 e Q3 nos dão uma idéia da assimetria da distribuição. Os comprimentos das caudas são dados pelas linhas que vão do retângulo aos valores remotos e pelos valores atípicos. Os comprimentos das caudas são dados pelas linhas que vão do retângulo aos valores remotos e pelos valores atípicos. Coeficiente de Assimetria (pág. 33 da Aula 14) O momento centrado de terceira ordem pode ser usado como medida da assimetria de uma distribuição. Entretanto, uma medida mais conveniente de assimetria, por ser adimensional, é dada pelo coeficiente de assimetria (A), definido como a razão entre o momento centrado de terceira ordem e o cubo do desvio padrão:(28) . 3 3 xs m A = O coeficiente de assimetria (28) indica o sentido da assimetria e pode ser usado para comparar vários casos porque é adimensional. O sinal do coeficiente de assimetria será positivo ou negativo se a distribuição for assimétrica à direita ou à esquerda, respectivamente. N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 4 17. Variável Aleatória Bivariada, Correlação, Regressão e Função Geratriz de Momentos 17.1 Funções de Probabilidade Conjunta Na aula anterior, estudamos as distribuições de probabilidade para uma única variável aleatória. Entretanto, em muitas situações práticas, atribuímos a um mesmo ponto amostral os valores de duas ou mais variáveis aleatórias ao descrevermos os resultados de um experimento. Nesta aula, nos concentraremos no caso de um par de variáveis aleatórias. Exemplo. Considere o lançamento simultâneo de duas moedas não viciadas. Os resultados desse experimento aleatório são cara-cara (CC), cara-coroa (CK), coroa-cara (KC) e coroa-coroa (KK). Logo, o espaço amostral é Ω = {CC, CK, KC, KK}. Defina as variáveis aleatórias X=0 se pelo menos uma das moedas der cara (X=1 para os demais casos) e Y=-1 se der uma cara e uma coroa (Y=+1 para os demais casos). Então P[X=0] = P[CC] + P[CK] + P[KC] = 1/4 + 1/4 + 1/4 = 3/4, P[X=1] = P[KK] = 1/4 = 1 - P[X=0], P[Y=-1] = P[CK] + P[KC] = 1/2 e P[Y=+1] = P[CC] + P[KK] = 1/2 = 1 - P[Y=-1]. Considere o evento resultante da interseção dos eventos obter pelo menos uma cara e não obter uma cara e uma coroa, ou seja, {(CC ∪ CK ∪ KC) ∩ (CC ∪ KK)} = {CC}. Esse evento pode ser representado pela notação compacta (X=0,Y=+1). Como P(CC) = 1/4, temos que P(X=0,Y=+1) = 1/4. O evento (X=0,Y=+1) é dito conjunto porque envolve as variáveis X e Y. Os demais eventos conjuntos são: (X=0,Y=-1), (X=1,Y=+1) e (X=1,Y=-1). Diz-se que o par (X,Y) é uma variável aleatória bivariada ou bidimensional. Exemplo. A variável aleatória contínua X representa o comprimento de uma dimensão de uma peça moldada por injeção, enquanto a variável aleatória contínua Y denota o comprimento de outra dimensão. Estamos interessados em probabilidades que possam ser escritas em termos de X e Y. Suponha que as especificações para X e Y sejam (3,95 a 4,05) e (8,10 a 8,20) milímetros, respectivamente. Então podemos estar interessados na probabilidade de uma peça satisfazer as duas especificações simultaneamente, ou seja, P[(3,95 < X < 4,05) e (8,10 < Y < 8,20)]. N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 5 Variáveis Discretas Sejam X e Y variáveis aleatórias discretas, como no primeiro exemplo da página anterior. Então a função discreta de probabilidade conjunta (ou distribuição conjunta) de X e Y, denotada por f(x,y), satisfaz (1) f(x,y) ≥ 0 (2) Σx Σy f(x,y) = 1. (3) f(x,y) = P(X = x, Y = y) Exemplo. Um total de 15.064.859 alunos estão matriculados no ensino superior, divididos entre cursos com duração de 4 anos, de 2 anos e de menos de 2 anos. A matrícula, separada por sexo, é mostrada na tabela a seguir. 4 anos 2 anos Menos de 2 anos Homens 4.076.416 2.437.905 172.874 Mulheres 4.755.790 3.310.086 311.788 Fonte: Digest of Educational Statistics 1997, Tabela 170. Nessa população, as probabilidades aproximadas de matrícula em um dos tipos de instituição de ensino superior, por sexo, são 4 anos 2 anos Menos de 2 anos Homens 0,27 0,16 0,01 Mulheres 0,32 0,22 0,02 Considere o experimento de extrair aleatoriamente um estudante matriculado dessa população. Defina a variável aleatória X = 0, se um homem é selecionado, e X = 1, se uma mulher é selecionada. Defina a variável aleatória Y = 1, se o estudante escolhido é de um curso de 4 anos, Y = 2, se o estudante escolhido é de um curso de 2 anos e Y = 3, se é de um curso de menos de 2 anos. Seja f(x,y) a função discreta de probabilidade conjunta da população de homens e mulheres da questão. Sendo assim, temos as seguintes probabilidades conjuntas: 27,0)1,0( === yxf = P(homens matriculados em cursos de 4 anos) 16,0)2,0( === yxf = P(homens matriculados em cursos de 2 anos) 01,0)3,0( === yxf = P(homens matriculados em cursos < 2 anos) 32,0)1,1( === yxf = P(mulheres matriculadas em cursos de 4 anos) 22,0)2,1( === yxf = P(mulheres matriculadas em cursos de 2 anos) 02,0)3,1( === yxf = P(mulheres matriculadas em cursos < 2 anos) N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 6 Note que ∑∑ = = =+++++= 2 1 3 1 102,022,032,001,016,027,0),( i k ki yxf é a probabilidade do evento certo. _______________________________________________________ Já caiu em prova! (Analista da SUSEP/Atuária/2001/ESAF) Uma loja vende lavadoras e secadoras de roupa. A distribuic ̧ão conjunta do número N1 de secadoras e do número N2 de lavadoras vendidas num mesmo dia é dada na tabela abaixo. Assinale a opc ̧ão que dá a probabilidade de que a venda, num mesmo dia, de lavadoras seja igual à de secadoras. N1|N2 0 1 2 3 0 0,25 0,13 0,04 0,02 1 0,15 0,11 0,02 0,01 2 0,08 0,06 0,05 0,02 3 0,01 0,01 0,01 0,03 A) 0,54 B) 0,50 C) 0,49 D) 0,44 E) 0,19 Resolução P(N1=N2) = f(N1=0;N2=0) + f(N1=1;N2=1) + f(N1=2;N2=2) + f(N1=3;N2=3) = 0,25 + 0,11 + 0,05 + 0,03 = 0,44 GABARITO: D Variáveis Contínuas Sejam X e Y duas variáveis aleatórias contínuas. Neste caso, a distribuição conjunta das duas variáveis é caracterizada por uma função f(x,y) chamada função de densidade conjunta de X e Y, que satisfaz (4) f(x,y) ≥ 0; (5) ∫ ∫ ∞ ∞− ∞ ∞− = 1),( dxdyyxf ; N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 7 (6) ∫ ∫=≤≤≤≤ ba d c dydxyxfdYcbXaP ),(),( . A relação (5) nos diz que o volume sob a superfície representada por f(x,y) é igual a 1. A figura abaixo mostra uma função de densidade conjunta. -3 -2 -1 0 1 2 3 -2 0 2 0 0.05 0.1 0.15 xy A equação (6) dá a probabilidade do par (x,y) estar num retângulo de lados b- a e d-c. Exemplo. Seja f(x,y) = 4xy, 0 ≤ x ≤ 1, 0 ≤ y ≤ 1. Então 4xydxdy = 4 xdx 0 1 ∫ ydy = 4 x 2 /2[ ] 0 1 y 2 /2[ ] 0 1 = 4(1/2 − 0)(1/2 − 0) =1 0 1 ∫ 0 1 ∫ 0 1 ∫ e a probabilidade P(X ≤ 1/2, Y ≤ 1/2) é dada por 4xydxdy = 4 xdx 0 0,5 ∫ ydy = 4 x 2 /2[ ] 0 0,5 y 2 /2[ ] 0 0,5 = 4(1/8 − 0)(1/8 − 0) = 4 /64 =1/16 0 0,5 ∫ 0 0,5 ∫ 0 0,5 ∫ . Exemplo. Suponha que a variável aleatória (X,Y) esteja uniformemente distribuída no quadrado da figura abaixo. N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 8 0 1 1 x y Então f(x,y) = K para 0≤x≤1 e 0≤y≤1 (K é uma constante) e f(x,y) = 0 caso contrário. A figura a seguir ilustra a densidade conjunta uniforme (é a superfície delimitada pelo perímetro azul). Sabemos que o volume do cubo deve ser 1 x 1 x K = 1, pois o volume delimitado por uma densidade de probabilidade conjunta é igual a 1 por definição. Logo K =1 é a altura do cubo. 1 1 1 (1,1) x y f(x,y) 0 17.2 Funções de Probabilidade Marginal Dada uma função densidade de probabilidade conjunta, pode-se obter a função densidade de probabilidade de cada uma das variáveis aleatórias individuais. N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 9 Sejam X e Y variáveis aleatórias contínuas com densidade conjunta f(x,y). Então fX(x) e fY(y) são denominadas densidades marginais de X e Y, respectivamente, se são obtidas de f(x,y) por meio das expressões (7) ∫ ∞ ∞− = dyyxfxf X ),()( (8) ∫ ∞ ∞− = dxyxfyfY ),()( Note que as funções de densidade de probabilidade marginal fX(x) e fY(y) correspondem às funções de densidade de probabilidade individuais de X e Y, respectivamente. Exemplo. Seja a função densidade conjunta de X e Y dada por f(x,y) = e-x-y, x>0, y>0. Então, fX (x) = e −x−ydy = 0 ∞ ∫ e−x e−ydy = 0 ∞ ∫ e−x −e−y[ ] 0 ∞ = e−x[−e−∞ + e0] = e−x[0 +1] = e−x , para x>0. Note que foi usado o seguinte limite acima: 0 111 limlim = ∞ === ∞∞→ − ∞→ ee e yy y y . E fY (y) = e −x−ydx = 0 ∞ ∫ e−y e−xdx = 0 ∞ ∫ e−y −e−x[ ] 0 ∞ = e−y[−e−∞ + e0] = e−y[0 +1] = e−y , para y>0. _______________________________________________________ Podemos obter resultados similares para variáveis aleatórias discretas. Dada a função discreta de probabilidade conjunta f(xi,yk), as funções discretas de probabilidade marginal são dadas por (9) fX (x i) = f (x i,yk ) k ∑ (10) fY (yk ) = f (x i,yk ) i ∑ Exemplo. Considere o terceiro exemplo do item anterior, cuja tabela está reproduzida abaixo. 4 anos (Y=1) 2 anos (Y=2) Menos de 2 anos (Y=3) Homens (X=0) 0,27 0,16 0,01 Mulheres (X=1) 0,32 0,22 0,02 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 10 A probabilidade ]0[ =XP (probabilidade de o estudante escolhido aleatoriamente ser homem) é igual à probabilidade marginal )(xfX no ponto x =0. Vimos que ∑= k kiiX yxfxf ),()( . Logo, )3,0()2,0()1,0(),0()0(]0[ 3 1 ==+==+======== ∑ = yxfyxfyxfyxfxfXP k kX 44,001,016,027,0]0[ =++==XP ⇒ soma da 1ª linha da tabela. A probabilidade ]1[ =XP , probabilidade de o estudante selecionado aleatoriamente ser mulher, é igual à probabilidade marginal )(xfX no ponto x =1. Então )3,1()2,1()1,1(),1()1(]1[ 3 1 ==+==+======== ∑ = yxfyxfyxfyxfxfXP k kX 56,002,022,032,0]1[ =++==XP ⇒ soma da 2ª linha da tabela. Note que fX(x=0) + fX(x=1) = 0,44 + 0,56 = 1, e isto acontece porque a soma das probabilidades de uma função discreta de probabilidades é unitária, por definição. A probabilidade ]1[ =YP , que representa a probabilidade de o estudante escolhido ao acaso estar matriculado em um curso de 4 anos, é igual à probabilidade marginal )(yfY no ponto y =1, dada por P[Y =1] = fY (y =1) = f (x i,y =1) i=1 2 ∑ = f (x = 0,y =1) + f (x =1,y =1) 59,032,027,0]0[ =+==YP ⇒ soma da 1ª coluna da tabela. A probabilidade ]2[ =YP é a probabilidade de o estudante estar matriculado em um curso de 2 anos e é igual à probabilidade marginal )(yfY no ponto y =2: P[Y = 2] = fY (y = 2) = f (x i,y = 2) i=1 2 ∑ = f (x = 0,y = 2) + f (x =1,y = 2) 38,022,016,0]2[ =+==YP ⇒ soma da 2ª coluna da tabela. Finalmente, a probabilidade ]3[ =YP denota a probabilidade de o estudante estar matriculado em um curso com duração menor que 2 anos e corresponde à probabilidade marginal )(yfY no ponto y =3: N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 11 P[Y = 3] = fY (y = 3) = f (x i,y = 3) i=1 2 ∑ = f (x = 0,y = 3) + f (x =1,y = 3) 03,002,001,0]3[ =+==YP ⇒ soma da 3ª coluna da tabela. Não por acaso, temos que fY(y=1) + fY(y=2) + fY(y=3) = 0,59 + 0,38 = 0,03 = 1. Y=1 Y=2 Y=3 fX(x) X=0 0,27 0,16 0,01 0,44 X=1 0,32 0,22 0,02 0,56 fY(y) 0,59 0,38 0,03 1 A tabela acima mostra que as probabilidades marginais fX(x) e fY(y) são obtidas somando as linhas e colunas, respectivamente (memorize para a prova!). _______________________________________________________ 17.3 Funções de Probabilidade Condicional Exemplo. Considere os dados do exemplo anterior, em especial a última tabela. Qual seria a distribuição das matrículasno ensino superior, sabendo-se que o curso tem 4 anos de duração? Em outras palavras, queremos calcular as probabilidades P(X=x|Y=1). Da definição de probabilidade condicional, obtemos )1( )1,( )1|( = == === YP YxXP YxXP . Assim, P(X=0|Y=1) = P(X=0,Y=1)/P(Y=1) = 0,27/0,59 = 0,458 e P(X=1|Y=1) = P(X=1,Y=1)/P(Y=1) = 0,32/0,59 = 0,542. Note que P(X=0|Y=1) + P(X=1|Y=1) = 0,458 + 0,542 = 1. A função discreta de probabilidade condicional (ou simplesmente distribuição condicional) de X, dado que Y=1, denotada por fX|Y(x|y=1), está na tabela a seguir. x 0 1 fX|Y(x|y=1) 0,458 0,542 Podemos calcular a média da distribuição condicional de X, dado que Y=1, a saber E(X|Y=1) = (0 x 0,458) + (1 x 0,542) = 0,542. N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 12 Qual seria a distribuição das matrículas no ensino superior, sabendo-se que os alunos são do sexo feminino? Ou seja, quais são as probabilidades P(Y=y|X=1)? Aplicando a probabilidade condicional, obtemos P(Y=1|X=1) = P(Y=1,X=1)/P(X=1) = 0,32/0,56 = 0,571, P(Y=2|X=1) = P(Y=2,X=1)/P(X=1) = 0,22/0,56 = 0,393, P(Y=3|X=1) = P(Y=3,X=1)/P(X=1) = 0,02/0,56 = 0,036. A distribuição condicional de Y, dado que X=1, denotada por fY|X(y|x=1), está na tabela abaixo. y 1 2 3 fY|X(y|x=1) 0,571 0,393 0,036 A média da distribuição condicional de Y, dado que X=1, é igual a E(Y|X=1) = (1 x 0,571) + (2 x 0,393) + (3 x 0,036) = 1,465. Vamos formalizar o que foi visto no exemplo acima? Sejam X e Y variáveis aleatórias discretas com função de probabilidade conjunta f(xi,yk). Então as funções discretas de probabilidade condicional (ou distribuições condicionais) P[X=xi|Y=yk] = fX|Y(xi|yk) e P[Y=yk|X=xi] = fY|X(yk|xi) são definidas como (11) fX |Y (x i | yk ) = f (x i,yk ) fY (yk ) , 0)( >kY yf (12) fY |X (yk | x i) = f (x i,yk ) fX (x i) , 0)( >iX xf De (11) e (12) resulta que (13) f (x i,yk ) = fX |Y (x i | yk ) fY (yk ) = fY |X (yk | x i) fX (x i). A esperança condicional de X, dado que Y = yj, é dada por (14) E(X |Y = y j ) = x iP(X = x i |Y = y j ) i=1 n ∑ . N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 13 Uma definição análoga vale para E(Y|X=xi). Podemos definir as densidades condicionais associadas a duas variáveis aleatórias contínuas X e Y (com densidade conjunta fXY(x,y) e densidades marginais fX(x) e fY(y)) de forma similar. A densidade condicional de Y dado o resultado X = x é definida por (15) fY /X (y | x) = fXY (x,y) fX (x) , fX (x) > 0 e a densidade condicional de X dado o resultado Y = y como (16) fX /Y (x | y) = fXY (x,y) fY (y) , 0)( >yfY . A fórmula (13) também é válida para o caso de variáveis contínuas. A interpretação de (15) e (16) é a seguinte. Seja a densidade conjunta f(x,y) = z = 1 para 0≤x≤1 e 0≤y≤1 e f(x,y) = 0 caso contrário representada na figura abaixo. Considere o plano paralelo ao plano xz que passa por y=1/2. Esse plano determina na superfície f(x,y) a densidade condicional fX|Y(x|y=1/2). Por exemplo, suponha que X denote o salário de uma população e que Y represente o consumo da mesma população. Então, fixado o consumo y=y0, a densidade condicional fX|Y(x|y0) representa a densidade dos salários para o nível y0 de consumo. f X|Y (x|y=1/2) 1 1 1 (1,1) x y z=f(x,y) 0 1/2 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 14 As densidades condicionais fX|Y(x|y) e fY|X(y|x) também podem ser caracterizadas por meio de suas médias, variâncias, etc. Exemplo. Seja a densidade de (X,Y) dada por f(x,y) = 6(1-x-y), 0<x<1, 0<y<1-x. A região de variação dos pares (x,y) é o triângulo delimitado pelos eixos x e y e pela reta y = 1-x (vide a próxima figura). 0 1 1 x y y = 1-x Sabemos que a densidade marginal fX(x) é resultante da integração da densidade conjunta na variável y. Neste caso, os limites inferior e superior da integral em y são y=0 e y=1-x, respectivamente, pois o triângulo da figura acima é percorrido no sentido vertical (de baixo para cima). Então a densidade marginal fX(x) é dada por: fX (x) = 6(1− x − y)dy = 6 y − xy − y 2 /2[ ] 0 1−x = 3(x −1)2, 0 1−x ∫ 10 << x . A densidade marginal fY(y) é calculada pela integração da densidade conjunta na variável x. Os limites inferior e superior da integral em x são x=0 e x=1-y, respectivamente, pois o triângulo da figura acima é percorrido no sentido horizontal (da esquerda para a direita). Então a densidade marginal fY(y) é dada por: fY (y) = 6(1− x − y)dx = 3(y −1) 2, 0 1−y ∫ 10 << y . Por conseguinte, as densidades condicionais são fX |Y (x | y) = 2(1− x − y) (y −1)2 , yx −<< 10 , N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 15 fY |X (y | x) = 2(1− x − y) (x −1)2 , 0 < y <1− x. Vale a pena conferir se fX|Y(x|y) é uma densidade de probabilidade válida, para y fixado. Temos que fX |Y (x | y)dx = f (x,y) / fY (y)dx = −∞ ∞ ∫ 1/ fY (y) f (x,y)dx = −∞ ∞ ∫ −∞ ∞ ∫ fY (y) / fY (y) =1 ⇒ Portanto, fX|Y(x|y) é uma densidade de probabilidade válida. _______________________________________________________ Exemplo (Estatística/ANPEC/2009/Adaptada) Considere duas variáveis aleatórias X e Y. Suponha que X seja distribuída de acordo com a seguinte função de densidade: fX (x) = 1, 0 < x <1 0, c.c. em que c.c. significa “caso contrário” e suponha ainda que fY |X (y | x) = 1/ x, 0 < y < x 0, c.c. Calcule E(Y). Multiplique o resultado por 100. Resolução Pede-se a média não condicionalE(Y), dada por ∫ ∞ ∞− = dyyfYE Y )()( . Logo, precisamos determinar a densidade marginal fY(y). Vimos que )()|()()|(),( || xfxyfyfyxfyxf XXYYYX == O enunciado forneceu as densidades fX(x) e fY|X(y|x). Portanto, x xfxyfyxf XXY 1 )()|(),( | == , 10 << x , xy <<0 . O domínio de f(x,y) é o triângulo hachurado da figura a seguir. N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 16 0 1 1 x y y = x A figura abaixo ilustra a densidade conjunta xyxfz /1),( == , 10 << x , xy <<0 . 0 0.2 0.4 0.6 0.8 1 0 0.5 1 0 10 20 30 40 50 60 70 xy z A densidade marginal fY(y) é obtida através de fY (y) = 1 x dx y 1 ∫ = ln x[ ]y 1 = 0 − ln y = −ln y , 0<y<1. N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 17 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 1 2 3 4 5 6 7 y -l n y Densidade Marginal de Y Finalmente, a esperança de Y é dada por E(Y) = y(−ln y)dy 0 1 ∫ = − y ln ydy 0 1 ∫ Aplicaremos a fórmula da integração por partes: f (y)g'(y)dy =∫ f (y)g(y) − g(y) f '(y)dy∫ com yyf ln)( = e g'(y) = y ⇒ f '(y) =1/ y e 2/)( 2yyg = . Assim, E(Y) = − ln y × y 2 2 − y 2 2 × 1 y dy∫ 0 1 = − ln y × y 2 2 − y 2 dy∫ 0 1 E(Y) = − 1 2 y 2 ln y − ydy∫[ ] 0 1 = − 1 2 y 2 ln y − y 2 2 0 1 = 1 2 y 2 2 − y 2 ln y 0 1 Observação: o limite de y2lny quando y tende a zero pela direita (y→0+) é uma indeterminação do tipo 0.∞, ou seja, lim y→ 0+ y 2 ln y = 0 × ∞ Pela regra de L´Hôpital (derivar o numerador e o denominador da razão): lim y→ 0+ y 2 ln y = lim y→ 0+ ln y y−2 = lim y→ 0+ 1/ y −2y−3 = lim y→0+ − y 2 2 = 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 18 Então, 25,0 4 1 001ln1 2 1 2 1 )( == +−×−=YE Resposta: 100.E(Y) = 25 ______________________________________________________ A esperança condicional de Y, dado que X=x, é dada por (17) E(Y | x) = yfY |X (y | x)dy −∞ ∞ ∫ . Definição análoga pode ser dada para E(X|y). Observe que E(Y|x) é uma função de x, isto é, E(Y|x) = f(x), sendo denominada curva de regressão de Y sobre x (memorize para a prova!). A regressão será vista em detalhes mais adiante. Exemplo. Seja a densidade condicional fY|X(y|x) = 1/x, 0<y<x. A esperança condicional E(Y|x) é dada por E(Y | x) = y 1 x dy = 1 x ydy = 0 x ∫ 1 x y 2 2 0 x = 0 x ∫ 1 x x 2 2 − 0 = x 2 . Note que E(Y|x) é, de fato, uma função de x. 17.4 Variáveis Aleatórias Independentes Quando X e Y são variáveis aleatórias independentes a função de probabilidade conjunta é igual ao produto das funções marginais de probabilidade, ou seja (18) )()(),( yfxfyxf YX= . Exemplo. Vimos que as densidades marginais da densidade conjunta f(x,y) = e-x-y, x>0, y>0 são dadas por x X exf −=)( , para x>0 e N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 19 y Y eyf −=)( , para y>0. Como f(x,y) = fX(x)fY(y) = e-x.e-y = e-x-y, concluímos que X e Y são independentes. _______________________________________________________ Podemos generalizar a fórmula (18). Sejam X1, X2, ..., Xn variáveis aleatórias independentes com função de probabilidade conjunta f(x1, x2, ..., xn) e funções marginais de probabilidade fX1 (x1), fX 2 (x2),..., fX n (xn ). Então é válida a expressão (19) f (x1,x2,...,xn ) = fX1 (x1) fX 2 (x2)... fX n (xn ). Se X e Y são independentes, então a densidade condicional de X, dado que Y = y é, (20) fX |Y (x | y) = f (x,y) fY (y) = fX (x) fY (y) fY (y) = fX (x). e a densidade condicional de Y, dado que X = x é, (21) fY |X (y | x) = f (x,y) fX (x) = fX (x) fY (y) fX (x) = fY (y). 17.5 Esperanças Envolvendo Duas ou Mais Variáveis Aleatórias Conforme já visto nesta aula, é muito comum estarmos interessados no comportamento conjunto de duas ou mais variáveis aleatórias. Apresentamos para você os conceitos de funções de probabilidade conjunta, marginal e condicional para variáveis discretas e contínuas. Também estudamos a noção de independência entre variáveis aleatórias. Nesta seção, daremos continuidade ao estudo da associação entre variáveis. Frequentemente, estamos interessados em saber se existe uma associação entre duas variáveis. Considere, por exemplo, a Economia. Em geral, estamos interessados em investigar as relações que possam existir entre variáveis econômicas. Por exemplo: quão estreitamente caminham duas variáveis preço? Veremos que os conceitos de covariância e correlação nos ajudam a responder a essa pergunta. 17.5.1 Correlação e Covariância Seja uma amostra de dez pessoas adultas, do sexo masculino, e sejam a altura (cm) e o peso (kg) dessas pessoas denotadas por X e Y, respectivamente. Para cada elemento da amostra, temos um par ordenado (x, N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratoresà responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 20 y). Teremos então n = 10 pares de valores das duas variáveis, que poderão ser representadas em um diagrama cartesiano bidimensional denominado diagrama de dispersão. Tabela Pessoa Altura (cm) Peso (kg) 1 174 74 2 161 68 3 171 63 4 181 92 5 182 80 6 165 73 7 155 61 8 168 64 9 176 90 10 175 81 Suponha que tenham sido obtidos os valores apresentados na tabela acima. O diagrama de dispersão correspondente é o da próxima figura. A vantagem do diagrama de dispersão está em que, muitas vezes, sua simples observação já nos dá uma boa idéia de como as duas variáveis se correlacionam, isto é, qual a tendência de variação conjunta que apresentam. 150 155 160 165 170 175 180 185 55 60 65 70 75 80 85 90 95 Observando o diagrama de dispersão acima com atenção, constatamos que existe, para maiores valores de X (altura), uma tendência a obtermos maiores valores de Y (peso) e vice-versa. Quando isso ocorre, diz-se que há correlação linear positiva entre X e Y. N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 21 Entretanto, também podemos ter casos em que o diagrama de dispersão apresenta o aspecto da figura que se segue, indicando que, para maiores valores de X, a tendência é observarem-se menores valores de Y e vice-versa. Diz-se que nesse caso a correlação é negativa. Por exemplo, a renda per capita de países e o índice de analfabetismo são variáveis negativamente correlacionadas. É claro que também pode ocorrer o caso em que as variáveis são não correlacionadas. Neste caso, o aspecto do diagrama de dispersão é o da próxima figura. N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 22 -4 -3 -2 -1 0 1 2 3 4 -3 -2 -1 0 1 2 3 4 Vimos que o sinal da correlação indica a tendência da variação conjunta das duas variáveis. Além disso, devemos considerar também a intensidade ou o grau da correlação. A correlação linear (em valor absoluto) entre X e Y na figura em que a correlação é negativa é mais intensa do que a da figura em que a correlação é positiva, pois os pontos da primeira apresentam uma tendência mais acentuada de se colocarem segundo uma reta do que os da última. Sejam X e Y variáveis aleatórias. Então a covariância de X e Y é definida por (22) Cov(X,Y ) = E[(X − X )(Y −Y )] = E[XY ] − X Y . em que ][XEX = e ][YEY = . Se X e Y são variáveis aleatórias discretas e f (xi,yj) é sua função de probabilidade conjunta, a covariância entre X e Y é dada por (23) Cov(X,Y ) = E[(X − X )(Y −Y )] = [x i − X ][y j −Y ] f (x i,y j ) j ∑ i ∑ . Caso X e Y sejam variáveis aleatórias contínuas com função densidade de probabilidade conjunta f(x,y), a covariância é calculada pela integral (24) Cov(X,Y ) = x − X ( ) y −Y ( )f (x,y)dxdy −∞ ∞ ∫ −∞ ∞ ∫ . N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 23 A covariância é uma medida da intensidade e do sinal da correlação linear entre duas variáveis. Suponha que tenhamos uma amostra de n pares ordenados (x,y). Neste caso, a covariância pode ser estimada pela estatística (25) sxy ≈ (x i − x )(y i − y ) i=1 n ∑ n . em que x é a média amostral de X (estimativa de X ), y é a média amostral de Y (estimativa de Y ) e n é suficientemente grande (n>30, por exemplo). Observe que a covariância depende das unidades de medida das variáveis X e Y. Percebe-se mais claramente o significado da covariação dividindo-se a covariância entre X e Y por seus respectivos desvios-padrão. Define-se a razão resultante como a correlação entre as variáveis aleatórias X e Y, denotada pela letra grega ρ (rô) (26) ρ(X,Y ) = cov(X,Y ) σXσY em que Xσ e Yσ denotam os desvios-padrão de X e Y, respectivamente. A correlação é estimada pelo coeficiente de correlação linear de Pearson, ou, simplesmente, coeficiente de correlação, definido por (27) yx xy ss s R = em que xys é a covariância amostral de X e Y (25), sx é o desvio-padrão amostral de X (28) sx ≈ (x i − x ) 2 i=1 n ∑ n e sY é o desvio-padrão amostral de Y (29) sy = (y i − y ) 2 i=1 n ∑ n . Substituindo (25), (28) e (29) em (27), obtemos N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 24 (30) R = (x i − x )(y i − y ) i=1 n ∑ (x i − x ) 2 i=1 n ∑ (y i − y )2 i=1 n ∑ = Sxy SxxSyy . em que Sxy = (x i − x )(y i − y ) i=1 n ∑ , Sxx = (x i − x )2 i=1 n ∑ e Syy = (y i − y )2 i=1 n ∑ . A representação abreviada dos somatórios de (30) por meio de xyS , xxS e yyS é útil. Não é difícil mostrar que (31) Sxy = x iy i − x i i ∑ × y i i ∑ n i ∑ . (32) Sxx = x i 2 − x i i ∑ 2 n i ∑ . (33) Syy = y i 2 − y i i ∑ 2 n i ∑ . As fórmulas (31), (32) e (33) devem ser memorizadas porque são importantes para a prova. Combinando as expressões anteriores, podemos também chegar à fórmula abaixo, para o cálculo direto do coeficiente de correlação linear de Pearson: (34) R = n x iy i − x i i ∑ × y i i ∑ i ∑ n x i 2 − x i i ∑ 2 i ∑ × n y i 2− y i i ∑ 2 i ∑ . O coeficiente de correlação tem as importantes propriedades de ser adimensional e de variar entre -1 e +1, o que não ocorre com a covariância. A vantagem de ser adimensional está no fato de seu valor não ser afetado pelas unidades adotadas. Por outro lado, o fato de termos 11 ≤≤− R faz com que um dado valor de R seja facilmente interpretado. Note que R = -1 corresponde ao caso de correlação linear negativa perfeita e R = +1 corresponde ao caso de correlação linear positiva perfeita. N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 25 O coeficiente de correlação para os dados da tabela de alturas e pesos é de aproximadamente 0,771 (você pode conferir este resultado com uma calculadora ou com algum programa de computador). O coeficiente de correlação para os dados da figura em que a correlação é negativa é igual a - 0,9854. O coeficiente de correlação para os dados da figura em que aparentemente não há correlação entre X e Y é igual a 0,0164. Este último resultado indica que não há qualquer associação linear entre as variáveis X e Y (neste caso a covariância amostral também dará próxima de zero). Quanto maior é o valor absoluto (ou módulo) |ρ|, melhor é a associação linear entre os valores. Deve-se frisar que um alto valor do coeficiente de correlação, embora estatisticamente significativo, pode não implicar qualquer relação de causa e efeito, mas simplesmente a tendência de variação conjunta das variáveis em questão. Ressaltamos que a correlação nula, isto é, ρ = 0, significa que não há associação linear entre X e Y. Mesmo que X e Y tenham covariância zero, elas podem ter uma associação não linear, como em 122 =+YX (equação de uma circunferência centrada em (0,0) e de raio 1). Uma importante conseqüência da independência estatística é a seguinte: - se X e Y são variáveis aleatórias independentes, então a covariância e a correlação entre elas é nula (memorize para a prova!). Exemplo. Admita que X e Y sejam variáveis aleatórias independentes. Então é válida a expressão A) ][][][ 22 YEXEXYE = B) ][][][ YEXEXYE = C) ][/][][ YEXEXYE = D) ),(][ YXCovXYE = E) 2])[][(][ YEXEXYE = Resolução Provaremos que ][][][ YEXEXYE = supondo que X e Y sejam variáveis contínuas. Prova similar pode ser dada para o caso das variáveis serem discretas (tente você mesmo fazer após estudar a nossa solução para variáveis contínuas). Primeiramente, lembre que )()(),( yfxfyxf YX ×= , pois X e Y são independentes. Aplicando esse conceito na integral de E[XY], obtemos N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 26 E[XY ] = xyfXY (x,y)dxdy −∞ ∞ ∫ −∞ ∞ ∫ = xfX (x)dx −∞ ∞ ∫ × yfY (y)dy −∞ ∞ ∫ = E[X]E[Y ] Note que variáveis independentes são não correlacionadas, pois 0][),( =−= YXXYEYXCov . GABARITO: B Distribuição Normal Bidimensional A distribuição normal bivariada ou bidimensional é um modelo importante para variáveis aleatórias contínuas bidimensionais. A variável (X,Y) tem distribuição normal bidimensional se sua densidade conjunta for dada por (35) f (x,y) = 1 2πσ xσ y 1− ρ 2 exp − 1 2(1− ρ2) x − µx σ x 2 − 2ρ (x − µx )(y − µy ) σ xσ y + y − µy σ y 2 para −∞ < x < ∞ , −∞ < y < ∞ (foi usada a notação exp(x) = ex). Observe que a densidade normal conjunta depende de cinco parâmetros: µX e µY (médias), σX e σY (desvios padrões) e ρ (coeficiente de correlação entre Y e X). A figura abaixo mostra a superfície normal obtida para os seguintes parâmetros: µX = µY = 0, σX = σY = 1 e ρ = 0,3. -3 -2 -1 0 1 2 3 -2 0 2 0 0.05 0.1 0.15 xy z = f (x ,y ) N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 27 A normal bidimensional possui as seguintes propriedades: (a) As distribuições marginais de X e Y são normais unidimensionais: X ~ N(µx,σ2x) e Y ~ N(µy,σ2y). (b) As distribuições condicionais são normais, com fY |X (y | x) ~ N µy + ρ σ y σ x (x − µx ),σ y 2(1− ρ2) e fX |Y (x | y) ~ N µx + ρ σ x σ y (y − µy ),σ x 2(1− ρ2) . Logo E(Y | x) = µy + ρ σ y σ x (x − µx ) e E(X | y) = µx + ρ σ x σ y (y − µy ). Se X e Y são conjuntamente normais e não correlacionadas (ρ=0), podemos escrever a densidade (35) como (36) f (x,y) = 1 σx 2π e − 1 2 x−µx σ x 2 × 1 σy 2π e − 1 2 y−µy σ y 2 , ou seja, a densidade conjunta é o produto das duas marginais, que são normais. Isto quer dizer que X e Y são independentes no caso em que X e Y tiverem densidade conjunta normal com ρρρρ=0 (memorize para a prova!) Atenção! A não correlação entre X e Y implica independência estatística somente quando X e Y são variáveis aleatórias conjuntamente normais. Isto não é verdade quando X e Y tem distribuição conjunta diferente da normal bidimensional. Já caiu em prova! (Fiscal de Rendas-MS/2006/FGV) Analise as afirmativas a seguir, a respeito de duas variáveis aleatórias X e Y: I. se X e Y são independentes, então Cov(X,Y) = 0; II. se Cov(X,Y) = 0, então X e Y são independentes; III. se X e Y são independentes, então E(XY) = E(X).E(Y); IV. se E(XY) = E(X).E(Y), então X e Y são independentes. Assinale: A) se nenhuma afirmativa estiver correta. B) se somente as afirmativas I e III estiverem corretas. N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - RaciocínioLógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 28 C) se somente as afirmativas I e IV estiverem corretas. D) se somente as afirmativas II e IV estiverem corretas. E) se todas as afirmativas estiverem corretas. Resolução Sejam X e Y variáveis aleatórias. Então a covariância de X e Y é definida como Cov(X,Y) = E[(X-µX) (Y-µY)] = E(XY) - µXµY em que µX = E(X) e µY = E(Y). Se X e Y são variáveis aleatórias independentes, então a covariância entre elas é nula (o que indica que não há associação linear entre elas!), ou seja, Cov(X,Y) = 0 (p/ X e Y independentes) ⇒ E(XY) = µXµY. Diz-se que X e Y são não correlacionadas quando Cov(X,Y) = 0. A relação recíproca não é verdadeira: se X e Y são não correlacionadas não podemos afirmar que X e Y sejam independentes. Porém, a não correlação entre X e Y implica independência estatística quando X e Y são variáveis aleatórias conjuntamente normais (e somente neste único caso!). Análise das afirmativas: I. “se X e Y são independentes, então Cov(X,Y) = 0” ⇒ Verdadeira, por definição. II. “se Cov(X,Y) = 0, então X e Y são independentes” ⇒ Falsa, pois a relação recíproca não é verdadeira: se X e Y são não correlacionadas não podemos afirmar que X e Y sejam independentes. III. “se X e Y são independentes, então E(XY) = E(X).E(Y)” ⇒ Verdadeira, pois Cov(X,Y) = 0 implica E(XY) = E(X).E(Y). IV. “se E(XY) = E(X).E(Y), então X e Y são independentes” ⇒ Falsa, pois a não correlação não implica independência. GABARITO: B Já caiu em prova! (Analista da SUSEP/Atuária/2010/ESAF). Y e X são variáveis aleatórias com distribuição normal conjunta com E(Y) = µY, E(X) = µX, e Cov(Y,X) = ρσYσX, onde σY e σX são os desvios padrões de Y e X, respectivamente, e ρ o coeficiente de correlação entre Y e X. Qual a expressão da regressão de X em Y, E(X|Y=y)? A) µY + ρσY(x – µX)/σX. N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 29 B) µY + ρσX(x – µX)/σY. C) µY + ρσY(y – µY)/σX. D) µX + ρσX(y – µY)/σY. E) µX + ρσY(y – µY)/σX. Resolução A média condicional )()|( y y x x yyXE µσ σ ρµ −+= é uma função linear de y, ou seja E(X|y) = g(y). Desta forma, E(X|Y=y) é a regressão de X em Y e isso implica que as opções A e B poderiam ser descartadas logo de início, pois ambas são funções da variável x. A opção D contém a expressão correta. GABARITO: D 17.5.2 Média e Variância de Uma Combinação Linear de Variáveis Aleatórias Sejam X e Y variáveis aleatórias e Z=g(X,Y) uma função dessas variáveis. Vamos admitir que essa função tenha a forma (37) bYaXZ += em que a e b são constantes. Essa expressão é uma combinação linear (ou soma ponderada). A esperança de (37) é dada por (38) ][][][ YbEXaEZE += . A Eq. (38) nos diz que o valor esperado de uma combinação linear de duas variáveis aleatórias é a combinação linear de seus respectivos valores esperados. Essa regra pode ser generalizada para um número arbitrário de variáveis aleatórias, quer elas sejam discretas ou contínuas. As seguintes regras relativas à variância são válidas: 1. Se X, Y e Z são variáveis aleatórias e a, b e c são constantes, então (39) +++=++ ]var[]var[]var[]var[ 222 ZcYbXacZbYaX ),cov(2),cov(2),cov(2 ZYbcZXacYXab ++ N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 30 Note que ).,cov(2)var()var()var( 22 YXabYbXabYaX ++=+ 2. Se X, Y e Z são independentes ou não correlacionadas (40) ]var[]var[]var[]var[ 222 ZcYbXacZbYaX ++=++ Se fizermos a = b= c =1 em (40), obtemos (41) ]var[]var[]var[]var[ ZYXZYX ++=++ . A expressão (41) nos diz que a variância da soma de variáveis aleatórias independentes é igual à soma das variâncias (memorize para a prova!). As regras sobre a variância de três variáveis aleatórias podem ser generalizadas para n variáveis aleatórias. 17.6 Regressão 17.6.1 A Natureza da Análise de Regressão Na análise de regressão simples, estamos interessados na dependência estatística entre as variáveis X e Y. Não podemos confundir a dependência estatística com o conceito de dependência determinista ou funcional. Por exemplo, a Segunda Lei de Newton da Física clássica (lei determinista) afirma que “A resultante das forças que agem num corpo é igual ao produto de sua massa pela aceleração adquirida.” Ou seja, Newton postulou que há uma dependência determinista entre força e aceleração, dada pela fórmula amF i i � � ×=∑ em que iF � denota a i-ésima força que age num corpo, m é a massa e a � é a aceleração. Repare que a fórmula acima NÃO contém um termo de perturbação ou erro aleatório, sendo, portanto, de caráter não probabilístico, isto é, determinista. Outros exemplos de relações físicas deterministas são as duas leis de Kirchhoff dos circuitos elétricos (lei das malhas e lei dos nós), as quatro equações de Maxwell do eletromagnetismo e a lei do gás de Boyle. N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 31 Regressão versus Causação A análise de regressão ocupa-se do estudo da dependência de uma variável, a variável dependente, em relação a uma ou mais variáveis, as variáveis explicativas (ou independentes), com o objetivo de estimar e/ou prever a média (da população) ou o valor médio da dependente em termos dos valores conhecidos ou fixos (em amostragem repetitiva) das explicativas. Considere o experimento aleatório hipotético ilustrado pela próxima figura, em que a variável explicativa é a estatura do pai (em metros) e a variável dependente é a estatura do filho (em metros). Essa figura mostra três distribuições da estatura do filho correspondentes a valores fixos de estatura do pai (1,70 m, 1,80 m e 1,90 m). Note que a uma dada altura do pai corresponde uma população (distribuição) com cinco possíveis estaturas para o filho. A reta de regressão na figura (linha tracejada) sugere que a estatura média do filho tende a aumentar quando aumenta a estatura do pai. Portanto, a regressão linear permite que o valor médio da variável dependente (estatura do filho) seja estimado por meio dos valores observados das estaturasdos pais (variável explicativa). 1.6 1.65 1.7 1.75 1.8 1.85 1.9 1.95 2 1.75 1.8 1.85 1.9 1.95 2 2.05 2.1 2.15 2.2 A regressão não implica necessariamente causalidade ou causação. Uma relação estatística, por mais forte que seja, não pode estabelecer uma relação de causa e efeito; a causação deve vir de fora da estatística, de outra teoria. Por exemplo, considere um agrônomo que esteja interessado em estudar a dependência da colheita de soja em relação à chuva. Consideramos que a colheita de soja é dependente da precipitação de chuva por uma questão de N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 32 bom senso (e esta consideração é não estatística!). Mas a estatística não teria nada contra o fato do agrônomo estabelecer que a relação de dependência é inversa, ou seja, que a precipitação de chuva depende do rendimento da colheita de soja, apesar disso ser um evidente absurdo. Uma relação estatística, por si só, não pode logicamente implicar causalidade. Para atribuir causalidade, deve-se recorrer a considerações teóricas. Deste modo, podemos afirmar que o consumo depende da renda real com base na teoria econômica. Ideias Fundamentais Aprendemos que a análise de correlação tem como objetivo medir a intensidade ou grau de associação linear entre duas variáveis aleatórias. Por exemplo, podemos estar interessados em determinar a correlação existente entre o hábito de fumar e a incidência de câncer no pulmão, entre as notas das provas de física e matemática do exame vestibular, etc. Por outro lado, na análise de regressão estamos interessados em estimar ou prever o valor médio de uma variável aleatória com base nos valores fixos de outra variável (variável explanatória). Repare, portanto, que na análise de regressão há uma assimetria na maneira como as variáveis dependente e explanatória são tratadas. Supõe-se que a variável dependente seja estocástica (ou aleatória) e que as variáveis explicativas tenham valores fixados, isto é, sejam não estocásticas. O problema da regressão consiste em determinar a relação funcional entre as variáveis dependente e explicativa. Assim, se os pares ordenados (x,y) se apresentarem como na figura a seguir, admitiremos existir um relacionamento funcional entre os valores de y e x, responsável pelo aspecto do diagrama e que explica grande parte da variação de y com x. Esse relacionamento funcional corresponderia à linha existente na figura, que seria a linha de regressão, que pode não ser uma reta, como no caso indicado pela figura. N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 33 2000 2500 3000 3500 4000 4500 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Uma parcela da variação, contudo, permanece em geral sem ser explicada, e será atribuída ao acaso. Repare, na figura acima, que os valores de y flutuam aleatoriamente em torna da linha de regressão estimada (essa linha deve ser calculada por meio de algum método estatístico). Essa flutuação ou variação em torno da linha de regressão é devida à existência de uma variação aleatória adicional, que chamaremos de variação residual. A função de regressão, portanto, nos dá o valor médio de uma das variáveis em função do valor observado da outra, isto é, E[Y/x] = yˆ . O problema da regressão é simplificado quando sabemos de antemão qual é a relação funcional ou modelo entre as variáveis. Um problema bastante estudado em Estatística é a questão da seleção ou identificação do modelo (é uma reta? é um polinômio de grau 2?). Mas este estudo está fora do escopo deste curso. No estudo que se segue, admitiremos que a forma da linha de regressão seja uma reta. Teremos então o problema da regressão linear simples. O termo “simples” significa que apenas duas variáveis estão envolvidas. 17.6.2 Regressão Linear Simples Seja Y a variável dependente e X a variável suposta sem erro, ou seja, não aleatória. A regressão linear simples pressupõe que seja adotado o modelo (42) εβα ++= XY , em que α é o intercepto, β é a declividade e ε denota a componente aleatória da variação de Y (ε é uma variável aleatória). N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 34 É razoável supor que a variável aleatória ε tenha média nula, a fim de que toda a variação explicada de Y fique em torno da reta de regressão. Isso implica que a reta de regressão fornece a média de Y para cada valor de x considerado, como já mencionamos. Uma outra suposição básica que pode ser adotada é a de que a variação residual da variável Y seja independente de x. Ou seja, usualmente admite-se que a variação de Y em torno da linha teórica de regressão pode ser descrita por um desvio-padrão residual que independe do ponto em consideração. Por fim, admitiremos que a variação de Y em torno da linha teórica de regressão se dê segundo distribuições normais independentes, para qualquer valor de x; o que implica dizer que as variações residuais em relação à reta de regressão são independentes e normalmente distribuídas (vide figura a seguir). x y x 1 x 2 Nota: Os autores estão cientes do fato de que os resíduos do modelo ajustado nem sempre seguem uma distribuição normal. Contudo, o importante é ter em mente que as variações residuais em relação à reta de regressão são independentes e normalmente distribuídas por hipótese. Isto não implica dizer que os resíduos, de fato, sejam normalmente distribuídos. Acredite: há muitos dados empíricos que violam a hipótese de normalidade! Suponhamos que a reta estimativa de (42) seja (43) bxay +=ˆ N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 35 em que yˆ denota os valores dados pelareta estimativa, a é a estimativa do parâmetro α, e b , também denominado coeficiente de regressão linear, é a estimativa do parâmetro β. Existem diversos métodos de estimação da reta de regressão. Podemos até mesmo estimar a reta visualmente. O método de ajuste visual consiste em traçar diretamente a reta, com auxílio de uma régua, no diagrama de dispersão, procurando fazer, da melhor forma possível, com que essa reta passe por entre os pontos. Esse procedimento, por ser subjetivo, somente será razoável se a correlação linear for muito forte, caso contrário levará a resultados pobres. Por outro lado, o ajuste pode ser feito pelo método dos mínimos quadrados, segundo o qual a reta a ser adotada deverá ser aquela que torna mínima a soma dos quadrados das distâncias da reta aos pontos experimentais (em que a distância é igual ao erro aleatório no ponto em consideração como ilustrado pela próxima figura). Ou seja, devemos procurar a reta para a qual se consiga minimizar ∑ = n i ie 1 2 . A idéia central desse procedimento é simplesmente a de minimizar a variação residual em torno da reta estimativa. Tendo em vista a expressão (43), devemos, portanto, impor a condição (44) ∑ ∑∑ −−=−= i i iiii i i bxayyye 222 )(min)ˆ(minmin . N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 36 De acordo com o Cálculo (você lembra daquelas aulas “chatas” sobre derivada e integral nos dois primeiros anos da faculdade?!), os parâmetros a e b que minimizam (44) serão aqueles que anulam as derivadas parciais de (44) (45) ∑ =∂ ∂ i ie a 02 e ∑ =∂ ∂ i ie b 02 . Não é difícil chegar às expressões (46) 0)(2 =−−− ∑ i ii bxay , (47) 0)(2 =−−− ∑ i iii bxayx as quais fornecem o seguinte sistema de duas equações a duas incógnitas: (48) += += ∑ ∑ ∑ ∑ ∑ = = = = = n i n i n i iiii n i n i ii xbxayx xbnay 1 1 1 2 1 1 Os pontos (x,y) fornecem os elementos para a montagem de (48), cuja solução forneceria os coeficientes a e b. Entretanto, é mais fácil considerar de uma vez a solução analítica do sistema, segundo a qual (49) −= = xbya S S b xx xy Exemplo. Determine a equação da reta para os pontos x 1 2 3 4 5 6 7 8 Y 0,5 0,6 0,9 0,8 1,2 1,5 1,7 2,0 utilizando o método dos mínimos quadrados. Trace a reta no diagrama de dispersão e calcule o coeficiente de correlação linear. A Tabela abaixo contém os valores necessários para a determinação dos parâmetros da reta. ix iy ii yx 2 i x 2 i y 1 0,5 0,5 1 0,25 2 0,6 1,2 4 0,36 3 0,9 2,7 9 0,81 4 0,8 3,2 16 0,64 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 37 5 1,2 6,0 25 1,44 6 1,5 9,0 36 2,25 7 1,7 11,9 49 2,89 8 2,0 16,0 64 4,00 36=∑ ix 2,9=∑ iy 5,50=∑ ii yx 2042 =∑ ix 64,122 =∑ iy Vimos que Sxy = x iy i − x i i ∑ × y i i ∑ n i ∑ , Sxx = x i 2 − x i i ∑ 2 n i ∑ −= = xbya S S b xx xy Fazendo os cálculos, temos que 1,9 8 2,936 5,50 = × −=xyS 42 8 36 204 2 =−=xxS Logo, =×−=−= ≈= 174,0 8 36 217,0 8 2,9 217,0 42 1,9 xbya b A equação da reta de mínimos quadrados, ilustrada na figura a seguir, é xy 217,0174,0ˆ += . Para o cálculo do coeficiente de correlação, é necessário usar os valores da coluna 2iy da Tabela dada: N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 38 Syy = y i 2 − y i i ∑ 2 n i ∑ 06,2 8 2,9 64,12 2 ≈−=yyS 98,0 06,242 1,9 ≈ × == yyxx xy SS S R 0 1 2 3 4 5 6 7 8 9 0 0.5 1 1.5 2 x y O alto valor do coeficiente de correlação linear de Pearson justifica o traçado da reta de regressão. Pressupostos do Modelo de Regressão Linear Simples Comentamos anteriormente alguns dos pressupostos (ou hipóteses básicas) do modelo de regressão: I. o erro aleatório ε tem média nula; II. a reta de regressão fornece a média de Y para cada valor de x considerado; III. a variação residual de Y é constante com x e IV. a variação de Y em torno da linha teórica de regressão se dá segundo distribuições normais independentes, para qualquer valor de x, o que implica dizer que as variações residuais em relação à reta de regressão são independentes e normalmente distribuídas. N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0 O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à responsabilização civil e criminal. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior 39 É usual formular as hipóteses do modelo de regressão em termos do erro aleatório ε : 1. o valor de y para cada valor de x, é εβα ++= XY . 2. o valor médio do erro aleatório é 0)( =εE pois admitimos que xYE βα +=)( 3. a variância do erro aleatório é )var()var( 2 Y==σε 4. a covariância entre qualquer par de erros aleatórios iε e jε é 0),cov(),cov( == jiji YYεε 5. a variável x não é aleatória. 6. A variável ε têm distribuição normal ε ~ ),0( 2σN se Y tem distribuição normal e vice-versa. Já caiu em prova! (Analista da SUSEP/Atuária/2010/ESAF) A partir de uma amostra aleatória (X1,Y1), (X2,Y2),..., (X20,Y20) foram obtidas as estastísticas: médias X = 12,5 e Y = 19, variâncias amostrais sx 2 = 30 e sy 2 = 54 e covariância Sxy = 36. Qual a reta de regressão estimada de Y em X? A) ˆ Y i =19 + 0,667X i
Compartilhar