Buscar

Curso de Raciocínio Lógico-Quantitativo

Prévia do material em texto

N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 1 
 
Raciocínio Lógico-Quantitativo para Traumatizados 
Aula 17 
Variável Aleatória Bivariada, Correlação, Regressão e Função 
Geratriz de Momentos 
 
17. Variável Aleatória Bivariada, Correlação, Regressão e Função Geratriz de 
Momentos ......................................................................................................................................... 4 
17.1 Funções de Probabilidade Conjunta ...................................................................... 4 
17.2 Funções de Probabilidade Marginal ....................................................................... 8 
17.3 Funções de Probabilidade Condicional ............................................................... 11 
17.4 Variáveis Aleatórias Independentes.................................................................... 18 
17.5 Esperanças Envolvendo Duas ou Mais Variáveis Aleatórias ...................... 19 
17.5.1 Correlação e Covariância ............................................................................................. 19 
17.5.2 Média e Variância de Uma Combinação Linear de Variáveis Aleatórias ................... 29 
17.6 Regressão ...................................................................................................................... 30 
17.6.1 A Natureza da Análise de Regressão ........................................................................... 30 
17.6.2 Regressão Linear Simples ............................................................................................ 33 
17.6.3 Coeficiente de Determinação ....................................................................................... 43 
17.7 Momentos e Função Geratriz de Momentos .................................................... 49 
17.7.1 Momentos de Uma Variável Aleatória ........................................................................ 49 
17.7.2 Função Geratriz de Momentos ..................................................................................... 50 
17.8 Memorize para a prova ............................................................................................ 55 
17.9 Exercícios de Fixação ................................................................................................ 59 
17.10 Gabarito ....................................................................................................................... 67 
17.11 Resolução dos Exercícios de Fixação ............................................................... 67 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
2 
 
 
Olá, tudo bem? Estudou a aula passada? Dúvidas? Use (e abuse) o forum! 
 
Prezado(a) aluno(a), você constatará que “não fugimos da raia” nesta aula. Os 
tópicos variável aleatória bivariada, correlação, regressão linear e função 
geratriz de momentos são realmente ensinados. Infelizmente, não há como 
evitar, em uma exposição teórica razoavelmente séria de tais assuntos, 
símbolos de integrais simples e duplas, somatórios, etc. Precisamos enfrentar 
a realidade. Você observará que um mínimo de embasamento conceitual é 
necessário para resolver questões de provas anteriores. É claro que tópicos 
como função geratriz de momentos raramente caem em concursos (cai na 
SUSEP, por exemplo). Entretanto, lembre-se que a nossa proposta é cobrir, se 
possível, 100% do “espaço amostral” da matéria de estatística que poderá cair 
na sua prova. Nós não temos como adivinhar, neste momento, como virá o 
edital de raciocínio lógico-quantitativo do seu concurso. Portanto, não custa 
nada ampliar um pouco o nosso leque da matéria e construir a base. Depois a 
gente “ajusta os ponteiros” na reta final do concurso, conforme o programa do 
edital. 
 
Antes de começarmos a exposição dos tópicos previstos para aula de hoje, 
gostaríamos de complementar/detalhar dois assuntos vistos na aula 14: box 
plots e coeficiente de assimetria. Essa complementação foi motivada por 
algumas dúvidas que nos foram enviadas por e-mails recentemente. 
 
Re-examinando os Conceitos de Box Plot e Coeficiente de 
Assimetria 
 
Diagrama de Caixa (pág. 29 da Aula 14) 
 
Um diagrama de caixa ou box plot ou “caixa-de-bigodes” é um retângulo 
que representa o desvio interquartílico (IQR) (é a estatística dQ definida 
por (18)). Para construir esse diagrama (veja a próxima figura), consideramos 
um retângulo onde estão representados a mediana, o primeiro quartil (Q1) e o 
terceiro quartil (Q3). A partir do retângulo, para cima, segue uma linha até o 
ponto mais remoto que não pode exceder LS = Q3 + 1,5.IQR, chamado limite 
superior. De modo análogo, a partir do retângulo, para baixo, segue uma 
linha até o ponto mais remoto que não seja menor que LS = Q1 –1,5.IQR, 
chamado limite inferior. Os valores compreendidos entre esses dois limites 
são chamandos valores adjacentes. As observações que estiverem acima do 
limite superior ou abaixo do limite inferior serão denominadas pontos 
exteriores. Essas observações são destoantes das demais e podem ou não 
ser o que chamamos de outliers ou valores atípicos. Um outlier pode ser 
produto de um erro de observação ou de arredondamento. Contudo, as 
denominações pontos exteriores e outliers são frequentemente usadas com o 
mesmo significado por alguns autores: observações fora de lugar, discrepantes 
ou atípicas. 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
3 
 
O box plot nos dá uma noção da posição, dispersão, assimetria, caudas e 
dados discrepantes da distribuição. A posição central é dada pela mediana e a 
dispersão por IQR. As posições relativas de Q1, Q2 e Q3 nos dão uma idéia da 
assimetria da distribuição. Os comprimentos das caudas são dados pelas linhas 
que vão do retângulo aos valores remotos e pelos valores atípicos. Os 
comprimentos das caudas são dados pelas linhas que vão do retângulo aos 
valores remotos e pelos valores atípicos. 
 
 
 
 
 
Coeficiente de Assimetria (pág. 33 da Aula 14) 
 
O momento centrado de terceira ordem pode ser usado como medida da 
assimetria de uma distribuição. Entretanto, uma medida mais conveniente de 
assimetria, por ser adimensional, é dada pelo coeficiente de assimetria (A), 
definido como a razão entre o momento centrado de terceira ordem e o 
cubo do desvio padrão:(28) .
3
3
xs
m
A = 
O coeficiente de assimetria (28) indica o sentido da assimetria e pode ser 
usado para comparar vários casos porque é adimensional. O sinal do 
coeficiente de assimetria será positivo ou negativo se a distribuição for 
assimétrica à direita ou à esquerda, respectivamente. 
 
 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
4 
 
17. Variável Aleatória Bivariada, Correlação, Regressão e 
Função Geratriz de Momentos 
 
17.1 Funções de Probabilidade Conjunta 
 
Na aula anterior, estudamos as distribuições de probabilidade para uma única 
variável aleatória. Entretanto, em muitas situações práticas, atribuímos a um 
mesmo ponto amostral os valores de duas ou mais variáveis aleatórias ao 
descrevermos os resultados de um experimento. Nesta aula, nos 
concentraremos no caso de um par de variáveis aleatórias. 
 
Exemplo. Considere o lançamento simultâneo de duas moedas não viciadas. 
Os resultados desse experimento aleatório são cara-cara (CC), cara-coroa 
(CK), coroa-cara (KC) e coroa-coroa (KK). Logo, o espaço amostral é Ω = {CC, 
CK, KC, KK}. Defina as variáveis aleatórias X=0 se pelo menos uma das 
moedas der cara (X=1 para os demais casos) e Y=-1 se der uma cara e uma 
coroa (Y=+1 para os demais casos). Então 
 
P[X=0] = P[CC] + P[CK] + P[KC] = 1/4 + 1/4 + 1/4 = 3/4, 
 
P[X=1] = P[KK] = 1/4 = 1 - P[X=0], 
 
P[Y=-1] = P[CK] + P[KC] = 1/2 e 
 
P[Y=+1] = P[CC] + P[KK] = 1/2 = 1 - P[Y=-1]. 
 
Considere o evento resultante da interseção dos eventos obter pelo menos 
uma cara e não obter uma cara e uma coroa, ou seja, {(CC ∪ CK ∪ KC) ∩ (CC 
∪ KK)} = {CC}. Esse evento pode ser representado pela notação compacta 
(X=0,Y=+1). Como P(CC) = 1/4, temos que 
P(X=0,Y=+1) = 1/4. O evento (X=0,Y=+1) é dito conjunto porque envolve 
as variáveis X e Y. 
 
Os demais eventos conjuntos são: (X=0,Y=-1), (X=1,Y=+1) e (X=1,Y=-1). 
Diz-se que o par (X,Y) é uma variável aleatória bivariada ou 
bidimensional. 
 
Exemplo. A variável aleatória contínua X representa o comprimento de uma 
dimensão de uma peça moldada por injeção, enquanto a variável aleatória 
contínua Y denota o comprimento de outra dimensão. Estamos interessados 
em probabilidades que possam ser escritas em termos de X e Y. Suponha que 
as especificações para X e Y sejam (3,95 a 4,05) e (8,10 a 8,20) milímetros, 
respectivamente. Então podemos estar interessados na probabilidade de uma 
peça satisfazer as duas especificações simultaneamente, ou seja, P[(3,95 < X 
< 4,05) e (8,10 < Y < 8,20)]. 
 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
5 
 
Variáveis Discretas 
 
Sejam X e Y variáveis aleatórias discretas, como no primeiro exemplo da 
página anterior. Então a função discreta de probabilidade conjunta (ou 
distribuição conjunta) de X e Y, denotada por f(x,y), satisfaz 
 
(1) f(x,y) ≥ 0 
 
(2) Σx Σy f(x,y) = 1. 
 
(3) f(x,y) = P(X = x, Y = y) 
 
Exemplo. Um total de 15.064.859 alunos estão matriculados no ensino 
superior, divididos entre cursos com duração de 4 anos, de 2 anos e de menos 
de 2 anos. A matrícula, separada por sexo, é mostrada na tabela a seguir. 
 
 4 anos 2 anos Menos de 2 anos 
Homens 4.076.416 2.437.905 172.874 
Mulheres 4.755.790 3.310.086 311.788 
Fonte: Digest of Educational Statistics 1997, Tabela 170. 
 
Nessa população, as probabilidades aproximadas de matrícula em um dos tipos 
de instituição de ensino superior, por sexo, são 
 
 4 anos 2 anos Menos de 2 anos 
Homens 0,27 0,16 0,01 
Mulheres 0,32 0,22 0,02 
 
Considere o experimento de extrair aleatoriamente um estudante matriculado 
dessa população. Defina a variável aleatória X = 0, se um homem é 
selecionado, e X = 1, se uma mulher é selecionada. Defina a variável aleatória 
Y = 1, se o estudante escolhido é de um curso de 4 anos, Y = 2, se o 
estudante escolhido é de um curso de 2 anos e Y = 3, se é de um curso de 
menos de 2 anos. 
 
Seja f(x,y) a função discreta de probabilidade conjunta da população de 
homens e mulheres da questão. Sendo assim, temos as seguintes 
probabilidades conjuntas: 
 
27,0)1,0( === yxf = P(homens matriculados em cursos de 4 anos) 
16,0)2,0( === yxf = P(homens matriculados em cursos de 2 anos) 
01,0)3,0( === yxf = P(homens matriculados em cursos < 2 anos) 
32,0)1,1( === yxf = P(mulheres matriculadas em cursos de 4 anos) 
22,0)2,1( === yxf = P(mulheres matriculadas em cursos de 2 anos) 
02,0)3,1( === yxf = P(mulheres matriculadas em cursos < 2 anos) 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
6 
 
Note que 
 
∑∑
= =
=+++++=
2
1
3
1
102,022,032,001,016,027,0),(
i k
ki yxf 
 
é a probabilidade do evento certo. 
_______________________________________________________ 
 
Já caiu em prova! (Analista da SUSEP/Atuária/2001/ESAF) Uma loja 
vende lavadoras e secadoras de roupa. A distribuic ̧ão conjunta do número N1 
de secadoras e do número N2 de lavadoras vendidas num mesmo dia é dada 
na tabela abaixo. Assinale a opc ̧ão que dá a probabilidade de que a venda, 
num mesmo dia, de lavadoras seja igual à de secadoras. 
 
N1|N2 0 1 2 3 
0 0,25 0,13 0,04 0,02 
1 0,15 0,11 0,02 0,01 
2 0,08 0,06 0,05 0,02 
3 0,01 0,01 0,01 0,03 
 
A) 0,54 
B) 0,50 
C) 0,49 
D) 0,44 
E) 0,19 
 
Resolução 
 
P(N1=N2) = f(N1=0;N2=0) + f(N1=1;N2=1) + f(N1=2;N2=2) + f(N1=3;N2=3) = 
0,25 + 0,11 + 0,05 + 0,03 = 0,44 
 
GABARITO: D 
 
 
Variáveis Contínuas 
 
Sejam X e Y duas variáveis aleatórias contínuas. Neste caso, a distribuição 
conjunta das duas variáveis é caracterizada por uma função f(x,y) chamada 
função de densidade conjunta de X e Y, que satisfaz 
 
(4) f(x,y) ≥ 0; 
 
(5) ∫ ∫
∞
∞−
∞
∞−
= 1),( dxdyyxf ; 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
7 
 
 
(6) ∫ ∫=≤≤≤≤
ba
d
c
dydxyxfdYcbXaP ),(),( . 
 
A relação (5) nos diz que o volume sob a superfície representada por f(x,y) é 
igual a 1. A figura abaixo mostra uma função de densidade conjunta. 
 
 
-3
-2
-1
0
1
2
3
-2
0
2
0
0.05
0.1
0.15
xy
 
 
 
A equação (6) dá a probabilidade do par (x,y) estar num retângulo de lados b-
a e d-c. 
 
Exemplo. Seja f(x,y) = 4xy, 0 ≤ x ≤ 1, 0 ≤ y ≤ 1. Então 
 
4xydxdy = 4 xdx
0
1
∫ ydy = 4 x 2 /2[ ]
0
1
y 2 /2[ ]
0
1
= 4(1/2 − 0)(1/2 − 0) =1
0
1
∫
0
1
∫
0
1
∫ 
 
e a probabilidade P(X ≤ 1/2, Y ≤ 1/2) é dada por 
 
4xydxdy = 4 xdx
0
0,5
∫ ydy = 4 x 2 /2[ ]
0
0,5
y 2 /2[ ]
0
0,5
= 4(1/8 − 0)(1/8 − 0) = 4 /64 =1/16
0
0,5
∫
0
0,5
∫
0
0,5
∫ . 
 
Exemplo. Suponha que a variável aleatória (X,Y) esteja uniformemente 
distribuída no quadrado da figura abaixo. 
 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
8 
 
0
1
1 x
y
 
 
 
Então f(x,y) = K para 0≤x≤1 e 0≤y≤1 (K é uma constante) e f(x,y) = 0 caso 
contrário. A figura a seguir ilustra a densidade conjunta uniforme (é a 
superfície delimitada pelo perímetro azul). Sabemos que o volume do cubo 
deve ser 1 x 1 x K = 1, pois o volume delimitado por uma densidade de 
probabilidade conjunta é igual a 1 por definição. Logo K =1 é a altura do cubo. 
 
 
1
1
1 (1,1)
x
y
f(x,y)
0
 
 
 
17.2 Funções de Probabilidade Marginal 
 
Dada uma função densidade de probabilidade conjunta, pode-se obter a função 
densidade de probabilidade de cada uma das variáveis aleatórias individuais. 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
9 
 
Sejam X e Y variáveis aleatórias contínuas com densidade conjunta f(x,y). 
Então fX(x) e fY(y) são denominadas densidades marginais de X e Y, 
respectivamente, se são obtidas de f(x,y) por meio das expressões 
 
(7) ∫
∞
∞−
= dyyxfxf X ),()( 
(8) ∫
∞
∞−
= dxyxfyfY ),()( 
 
Note que as funções de densidade de probabilidade marginal fX(x) e fY(y) 
correspondem às funções de densidade de probabilidade individuais de X e Y, 
respectivamente. 
 
Exemplo. Seja a função densidade conjunta de X e Y dada por 
 
f(x,y) = e-x-y, x>0, y>0. 
 
Então, 
 
fX (x) = e
−x−ydy =
0
∞
∫ e−x e−ydy =
0
∞
∫ e−x −e−y[ ]
0
∞
= e−x[−e−∞ + e0] = e−x[0 +1] = e−x , para x>0. 
 
Note que foi usado o seguinte limite acima: 0
111
limlim =
∞
===
∞∞→
−
∞→ ee
e
yy
y
y
. E 
 
fY (y) = e
−x−ydx =
0
∞
∫ e−y e−xdx =
0
∞
∫ e−y −e−x[ ]
0
∞
= e−y[−e−∞ + e0] = e−y[0 +1] = e−y , para y>0. 
_______________________________________________________ 
 
Podemos obter resultados similares para variáveis aleatórias discretas. Dada a 
função discreta de probabilidade conjunta f(xi,yk), as funções discretas de 
probabilidade marginal são dadas por 
 
(9) fX (x i) = f (x i,yk )
k
∑ 
(10) fY (yk ) = f (x i,yk )
i
∑ 
 
Exemplo. Considere o terceiro exemplo do item anterior, cuja tabela está 
reproduzida abaixo. 
 4 anos 
(Y=1) 
2 anos 
(Y=2) 
Menos de 2 anos 
(Y=3) 
Homens (X=0) 0,27 0,16 0,01 
Mulheres (X=1) 0,32 0,22 0,02 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
10 
 
 
A probabilidade ]0[ =XP (probabilidade de o estudante escolhido 
aleatoriamente ser homem) é igual à probabilidade marginal )(xfX no ponto x 
=0. Vimos que ∑=
k
kiiX yxfxf ),()( . Logo, 
 
)3,0()2,0()1,0(),0()0(]0[
3
1
==+==+======== ∑
=
yxfyxfyxfyxfxfXP
k
kX 
44,001,016,027,0]0[ =++==XP ⇒ soma da 1ª linha da tabela. 
 
A probabilidade ]1[ =XP , probabilidade de o estudante selecionado 
aleatoriamente ser mulher, é igual à probabilidade marginal )(xfX no ponto x 
=1. Então 
 
)3,1()2,1()1,1(),1()1(]1[
3
1
==+==+======== ∑
=
yxfyxfyxfyxfxfXP
k
kX 
 
56,002,022,032,0]1[ =++==XP ⇒ soma da 2ª linha da tabela. 
 
Note que fX(x=0) + fX(x=1) = 0,44 + 0,56 = 1, e isto acontece porque a soma 
das probabilidades de uma função discreta de probabilidades é unitária, por 
definição. 
 
A probabilidade ]1[ =YP , que representa a probabilidade de o estudante 
escolhido ao acaso estar matriculado em um curso de 4 anos, é igual à 
probabilidade marginal )(yfY no ponto y =1, dada por 
 
P[Y =1] = fY (y =1) = f (x i,y =1)
i=1
2
∑ = f (x = 0,y =1) + f (x =1,y =1) 
 
59,032,027,0]0[ =+==YP ⇒ soma da 1ª coluna da tabela. 
 
A probabilidade ]2[ =YP é a probabilidade de o estudante estar matriculado em 
um curso de 2 anos e é igual à probabilidade marginal )(yfY no ponto y =2: 
 
P[Y = 2] = fY (y = 2) = f (x i,y = 2)
i=1
2
∑ = f (x = 0,y = 2) + f (x =1,y = 2) 
 
38,022,016,0]2[ =+==YP ⇒ soma da 2ª coluna da tabela. 
 
Finalmente, a probabilidade ]3[ =YP denota a probabilidade de o estudante 
estar matriculado em um curso com duração menor que 2 anos e corresponde 
à probabilidade marginal )(yfY no ponto y =3: 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
11 
 
 
P[Y = 3] = fY (y = 3) = f (x i,y = 3)
i=1
2
∑ = f (x = 0,y = 3) + f (x =1,y = 3) 
 
03,002,001,0]3[ =+==YP ⇒ soma da 3ª coluna da tabela. 
 
Não por acaso, temos que fY(y=1) + fY(y=2) + fY(y=3) = 0,59 + 0,38 = 0,03 
= 1. 
 
 Y=1 Y=2 Y=3 fX(x) 
X=0 0,27 0,16 0,01 0,44 
X=1 0,32 0,22 0,02 0,56 
fY(y) 0,59 0,38 0,03 1 
 
A tabela acima mostra que as probabilidades marginais fX(x) e fY(y) são 
obtidas somando as linhas e colunas, respectivamente (memorize para a 
prova!). 
_______________________________________________________ 
 
17.3 Funções de Probabilidade Condicional 
 
Exemplo. Considere os dados do exemplo anterior, em especial a última 
tabela. Qual seria a distribuição das matrículasno ensino superior, sabendo-se 
que o curso tem 4 anos de duração? Em outras palavras, queremos calcular as 
probabilidades P(X=x|Y=1). Da definição de probabilidade condicional, 
obtemos 
 
)1(
)1,(
)1|(
=
==
===
YP
YxXP
YxXP . 
 
Assim, P(X=0|Y=1) = P(X=0,Y=1)/P(Y=1) = 0,27/0,59 = 0,458 e P(X=1|Y=1) 
= P(X=1,Y=1)/P(Y=1) = 0,32/0,59 = 0,542. Note que P(X=0|Y=1) + 
P(X=1|Y=1) = 0,458 + 0,542 = 1. 
 
A função discreta de probabilidade condicional (ou simplesmente 
distribuição condicional) de X, dado que Y=1, denotada por fX|Y(x|y=1), 
está na tabela a seguir. 
 
x 0 1 
fX|Y(x|y=1) 0,458 0,542 
 
Podemos calcular a média da distribuição condicional de X, dado que Y=1, a 
saber 
 
E(X|Y=1) = (0 x 0,458) + (1 x 0,542) = 0,542. 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
12 
 
Qual seria a distribuição das matrículas no ensino superior, sabendo-se que os 
alunos são do sexo feminino? Ou seja, quais são as probabilidades 
P(Y=y|X=1)? Aplicando a probabilidade condicional, obtemos 
 
P(Y=1|X=1) = P(Y=1,X=1)/P(X=1) = 0,32/0,56 = 0,571, 
 
P(Y=2|X=1) = P(Y=2,X=1)/P(X=1) = 0,22/0,56 = 0,393, 
 
P(Y=3|X=1) = P(Y=3,X=1)/P(X=1) = 0,02/0,56 = 0,036. 
 
A distribuição condicional de Y, dado que X=1, denotada por fY|X(y|x=1), 
está na tabela abaixo. 
 
y 1 2 3 
fY|X(y|x=1) 0,571 0,393 0,036 
 
A média da distribuição condicional de Y, dado que X=1, é igual a 
 
E(Y|X=1) = (1 x 0,571) + (2 x 0,393) + (3 x 0,036) = 1,465. 
 
 
Vamos formalizar o que foi visto no exemplo acima? Sejam X e Y variáveis 
aleatórias discretas com função de probabilidade conjunta f(xi,yk). Então as 
funções discretas de probabilidade condicional (ou distribuições 
condicionais) 
 
P[X=xi|Y=yk] = fX|Y(xi|yk) e 
 
P[Y=yk|X=xi] = fY|X(yk|xi) são definidas como 
 
(11) fX |Y (x i | yk ) =
f (x i,yk )
fY (yk )
, 0)( >kY yf 
 
(12) fY |X (yk | x i) =
f (x i,yk )
fX (x i)
, 0)( >iX xf 
 
De (11) e (12) resulta que 
 
(13) f (x i,yk ) = fX |Y (x i | yk ) fY (yk ) = fY |X (yk | x i) fX (x i). 
 
A esperança condicional de X, dado que Y = yj, é dada por 
 
(14) E(X |Y = y j ) = x iP(X = x i |Y = y j )
i=1
n
∑ . 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
13 
 
Uma definição análoga vale para E(Y|X=xi). 
 
Podemos definir as densidades condicionais associadas a duas variáveis 
aleatórias contínuas X e Y (com densidade conjunta fXY(x,y) e densidades 
marginais fX(x) e fY(y)) de forma similar. A densidade condicional de Y dado o 
resultado X = x é definida por 
 
(15) fY /X (y | x) =
fXY (x,y)
fX (x)
, fX (x) > 0 
 
e a densidade condicional de X dado o resultado Y = y como 
 
(16) fX /Y (x | y) =
fXY (x,y)
fY (y)
, 0)( >yfY . 
 
A fórmula (13) também é válida para o caso de variáveis contínuas. 
 
A interpretação de (15) e (16) é a seguinte. Seja a densidade conjunta f(x,y) 
= z = 1 para 0≤x≤1 e 0≤y≤1 e f(x,y) = 0 caso contrário representada na 
figura abaixo. Considere o plano paralelo ao plano xz que passa por y=1/2. 
Esse plano determina na superfície f(x,y) a densidade condicional 
fX|Y(x|y=1/2). Por exemplo, suponha que X denote o salário de uma população 
e que Y represente o consumo da mesma população. Então, fixado o consumo 
y=y0, a densidade condicional fX|Y(x|y0) representa a densidade dos salários 
para o nível y0 de consumo. 
 
f
X|Y
(x|y=1/2)
1
1
1 (1,1)
x
y
z=f(x,y)
0 1/2
 
 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
14 
 
As densidades condicionais fX|Y(x|y) e fY|X(y|x) também podem ser 
caracterizadas por meio de suas médias, variâncias, etc. 
 
Exemplo. Seja a densidade de (X,Y) dada por 
 
f(x,y) = 6(1-x-y), 0<x<1, 0<y<1-x. 
 
A região de variação dos pares (x,y) é o triângulo delimitado pelos eixos x e y 
e pela reta y = 1-x (vide a próxima figura). 
 
 
0
1
1 x
y
y = 1-x
 
 
 
Sabemos que a densidade marginal fX(x) é resultante da integração da 
densidade conjunta na variável y. Neste caso, os limites inferior e superior da 
integral em y são y=0 e y=1-x, respectivamente, pois o triângulo da figura 
acima é percorrido no sentido vertical (de baixo para cima). Então a densidade 
marginal fX(x) é dada por: 
 
fX (x) = 6(1− x − y)dy = 6 y − xy − y
2 /2[ ]
0
1−x
= 3(x −1)2,
0
1−x
∫ 10 << x . 
 
A densidade marginal fY(y) é calculada pela integração da densidade conjunta 
na variável x. Os limites inferior e superior da integral em x são x=0 e x=1-y, 
respectivamente, pois o triângulo da figura acima é percorrido no sentido 
horizontal (da esquerda para a direita). Então a densidade marginal fY(y) é 
dada por: 
 
fY (y) = 6(1− x − y)dx = 3(y −1)
2,
0
1−y
∫ 10 << y . 
 
Por conseguinte, as densidades condicionais são 
 
fX |Y (x | y) =
2(1− x − y)
(y −1)2
, yx −<< 10 , 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
15 
 
 
fY |X (y | x) =
2(1− x − y)
(x −1)2
, 0 < y <1− x. 
 
Vale a pena conferir se fX|Y(x|y) é uma densidade de probabilidade válida, para 
y fixado. Temos que 
 
fX |Y (x | y)dx = f (x,y) / fY (y)dx =
−∞
∞
∫ 1/ fY (y) f (x,y)dx =
−∞
∞
∫
−∞
∞
∫ fY (y) / fY (y) =1 
 
⇒ Portanto, fX|Y(x|y) é uma densidade de probabilidade válida. 
_______________________________________________________ 
 
Exemplo (Estatística/ANPEC/2009/Adaptada) Considere duas variáveis 
aleatórias X e Y. Suponha que X seja distribuída de acordo com a seguinte 
função de densidade: 
 
fX (x) =
1, 0 < x <1
0, c.c.
 
 
 
 
 
em que c.c. significa “caso contrário” e suponha ainda que 
 
fY |X (y | x) =
1/ x, 0 < y < x
0, c.c.
 
 
 
 
 
Calcule E(Y). Multiplique o resultado por 100. 
 
Resolução 
 
Pede-se a média não condicionalE(Y), dada por 
 
∫
∞
∞−
= dyyfYE Y )()( . 
 
Logo, precisamos determinar a densidade marginal fY(y). Vimos que 
 
)()|()()|(),( || xfxyfyfyxfyxf XXYYYX == 
 
O enunciado forneceu as densidades fX(x) e fY|X(y|x). Portanto, 
 
x
xfxyfyxf XXY
1
)()|(),( | == , 10 << x , xy <<0 . 
 
O domínio de f(x,y) é o triângulo hachurado da figura a seguir. 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
16 
 
0
1
1 x
y
y = x
 
 
 
A figura abaixo ilustra a densidade conjunta xyxfz /1),( == , 10 << x , xy <<0 . 
 
 
0
0.2
0.4
0.6
0.8
1
0
0.5
1
0
10
20
30
40
50
60
70
xy
z
 
 
 
A densidade marginal fY(y) é obtida através de 
 
fY (y) =
1
x
dx
y
1
∫ = ln x[ ]y
1
= 0 − ln y = −ln y , 0<y<1. 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
17 
 
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
0
1
2
3
4
5
6
7
y
-l
n
y
Densidade Marginal de Y
 
 
 
Finalmente, a esperança de Y é dada por 
 
E(Y) = y(−ln y)dy
0
1
∫ = − y ln ydy
0
1
∫ 
 
Aplicaremos a fórmula da integração por partes: 
 
f (y)g'(y)dy =∫ f (y)g(y) − g(y) f '(y)dy∫ 
 
com yyf ln)( = e g'(y) = y ⇒ f '(y) =1/ y e 2/)( 2yyg = . 
 
Assim, 
 
E(Y) = − ln y ×
y 2
2
−
y 2
2
×
1
y
dy∫
 
 
 
 
 
 
0
1
= − ln y ×
y 2
2
−
y
2
dy∫
 
 
 
 
 
 
0
1
 
 
E(Y) = −
1
2
y 2 ln y − ydy∫[ ]
0
1
= −
1
2
y 2 ln y −
y 2
2
 
 
 
 
 
 
0
1
=
1
2
y 2
2
− y 2 ln y
 
 
 
 
 
 
0
1
 
 
Observação: o limite de y2lny quando y tende a zero pela direita (y→0+) é uma 
indeterminação do tipo 0.∞, ou seja, 
 
lim
y→ 0+
y 2 ln y = 0 × ∞ 
 
Pela regra de L´Hôpital (derivar o numerador e o denominador da razão): 
 
lim
y→ 0+
y 2 ln y = lim
y→ 0+
ln y
y−2
= lim
y→ 0+
1/ y
−2y−3
= lim
y→0+
−
y 2
2
 
 
 
 
 
 = 0 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
18 
 
 
Então, 
 
25,0
4
1
001ln1
2
1
2
1
)( ==


 +−×−=YE 
 
Resposta: 100.E(Y) = 25 
______________________________________________________ 
 
A esperança condicional de Y, dado que X=x, é dada por 
 
(17) E(Y | x) = yfY |X (y | x)dy
−∞
∞
∫ . 
 
Definição análoga pode ser dada para E(X|y). Observe que E(Y|x) é uma 
função de x, isto é, E(Y|x) = f(x), sendo denominada curva de regressão 
de Y sobre x (memorize para a prova!). A regressão será vista em detalhes 
mais adiante. 
 
Exemplo. Seja a densidade condicional 
 
fY|X(y|x) = 1/x, 0<y<x. 
 
A esperança condicional E(Y|x) é dada por 
 
E(Y | x) = y
1
x
dy =
1
x
ydy =
0
x
∫ 1
x
y 2
2
 
 
 
 
 
 
0
x
=
0
x
∫ 1
x
x 2
2
− 0
 
 
 
 
 
 =
x
2
. 
 
Note que E(Y|x) é, de fato, uma função de x. 
 
17.4 Variáveis Aleatórias Independentes 
 
Quando X e Y são variáveis aleatórias independentes a função de probabilidade 
conjunta é igual ao produto das funções marginais de probabilidade, ou seja 
 
(18) )()(),( yfxfyxf YX= . 
 
Exemplo. Vimos que as densidades marginais da densidade conjunta 
 
f(x,y) = e-x-y, x>0, y>0 
 
são dadas por 
 
x
X exf
−=)( , para x>0 e 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
19 
 
y
Y eyf
−=)( , para y>0. 
 
Como f(x,y) = fX(x)fY(y) = e-x.e-y = e-x-y, concluímos que X e Y são 
independentes. 
_______________________________________________________ 
 
Podemos generalizar a fórmula (18). Sejam X1, X2, ..., Xn variáveis 
aleatórias independentes com função de probabilidade conjunta f(x1, x2, ..., 
xn) e funções marginais de probabilidade fX1 (x1), fX 2 (x2),..., fX n (xn ). Então é válida 
a expressão 
 
(19) f (x1,x2,...,xn ) = fX1 (x1) fX 2 (x2)... fX n (xn ). 
 
Se X e Y são independentes, então a densidade condicional de X, dado que Y = 
y é, 
 
(20) fX |Y (x | y) =
f (x,y)
fY (y)
=
fX (x) fY (y)
fY (y)
= fX (x). 
 
e a densidade condicional de Y, dado que X = x é, 
 
(21) fY |X (y | x) =
f (x,y)
fX (x)
=
fX (x) fY (y)
fX (x)
= fY (y). 
 
17.5 Esperanças Envolvendo Duas ou Mais Variáveis Aleatórias 
 
Conforme já visto nesta aula, é muito comum estarmos interessados no 
comportamento conjunto de duas ou mais variáveis aleatórias. Apresentamos 
para você os conceitos de funções de probabilidade conjunta, marginal e 
condicional para variáveis discretas e contínuas. Também estudamos a noção 
de independência entre variáveis aleatórias. 
 
Nesta seção, daremos continuidade ao estudo da associação entre 
variáveis. Frequentemente, estamos interessados em saber se existe uma 
associação entre duas variáveis. Considere, por exemplo, a Economia. Em 
geral, estamos interessados em investigar as relações que possam existir entre 
variáveis econômicas. Por exemplo: quão estreitamente caminham duas 
variáveis preço? Veremos que os conceitos de covariância e correlação nos 
ajudam a responder a essa pergunta. 
 
17.5.1 Correlação e Covariância 
 
Seja uma amostra de dez pessoas adultas, do sexo masculino, e sejam a 
altura (cm) e o peso (kg) dessas pessoas denotadas por X e Y, 
respectivamente. Para cada elemento da amostra, temos um par ordenado (x, 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratoresà
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
20 
 
y). Teremos então n = 10 pares de valores das duas variáveis, que poderão 
ser representadas em um diagrama cartesiano bidimensional denominado 
diagrama de dispersão. 
 
 
Tabela 
Pessoa Altura (cm) Peso (kg) 
1 174 74 
2 161 68 
3 171 63 
4 181 92 
5 182 80 
6 165 73 
7 155 61 
8 168 64 
9 176 90 
10 175 81 
 
 
Suponha que tenham sido obtidos os valores apresentados na tabela acima. O 
diagrama de dispersão correspondente é o da próxima figura. A vantagem do 
diagrama de dispersão está em que, muitas vezes, sua simples observação já 
nos dá uma boa idéia de como as duas variáveis se correlacionam, isto é, 
qual a tendência de variação conjunta que apresentam. 
 
 
150 155 160 165 170 175 180 185
55
60
65
70
75
80
85
90
95
 
 
 
Observando o diagrama de dispersão acima com atenção, constatamos que 
existe, para maiores valores de X (altura), uma tendência a obtermos maiores 
valores de Y (peso) e vice-versa. Quando isso ocorre, diz-se que há 
correlação linear positiva entre X e Y. 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
21 
 
 
Entretanto, também podemos ter casos em que o diagrama de dispersão 
apresenta o aspecto da figura que se segue, indicando que, para maiores 
valores de X, a tendência é observarem-se menores valores de Y e vice-versa. 
Diz-se que nesse caso a correlação é negativa. Por exemplo, a renda per 
capita de países e o índice de analfabetismo são variáveis negativamente 
correlacionadas. 
 
 
 
 
 
É claro que também pode ocorrer o caso em que as variáveis são não 
correlacionadas. Neste caso, o aspecto do diagrama de dispersão é o da 
próxima figura. 
 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
22 
 
-4 -3 -2 -1 0 1 2 3 4
-3
-2
-1
0
1
2
3
4
 
 
 
Vimos que o sinal da correlação indica a tendência da variação conjunta das 
duas variáveis. Além disso, devemos considerar também a intensidade ou o 
grau da correlação. A correlação linear (em valor absoluto) entre X e Y na 
figura em que a correlação é negativa é mais intensa do que a da figura em 
que a correlação é positiva, pois os pontos da primeira apresentam uma 
tendência mais acentuada de se colocarem segundo uma reta do que os da 
última. 
 
Sejam X e Y variáveis aleatórias. Então a covariância de X e Y é definida por 
 
(22) Cov(X,Y ) = E[(X − X )(Y −Y )] = E[XY ] − X Y . 
 
em que ][XEX = e ][YEY = . 
 
Se X e Y são variáveis aleatórias discretas e f (xi,yj) é sua função de 
probabilidade conjunta, a covariância entre X e Y é dada por 
 
(23) Cov(X,Y ) = E[(X − X )(Y −Y )] = [x i − X ][y j −Y ] f (x i,y j )
j
∑
i
∑ . 
 
Caso X e Y sejam variáveis aleatórias contínuas com função densidade de 
probabilidade conjunta f(x,y), a covariância é calculada pela integral 
 
(24) Cov(X,Y ) = x − X ( ) y −Y ( )f (x,y)dxdy
−∞
∞
∫
−∞
∞
∫ . 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
23 
 
A covariância é uma medida da intensidade e do sinal da correlação linear 
entre duas variáveis. Suponha que tenhamos uma amostra de n pares 
ordenados (x,y). Neste caso, a covariância pode ser estimada pela estatística 
 
(25) sxy ≈
(x i − x )(y i − y )
i=1
n
∑
n
. 
 
em que x é a média amostral de X (estimativa de X ), y é a média amostral 
de Y (estimativa de Y ) e n é suficientemente grande (n>30, por exemplo). 
 
Observe que a covariância depende das unidades de medida das variáveis X e 
Y. Percebe-se mais claramente o significado da covariação dividindo-se a 
covariância entre X e Y por seus respectivos desvios-padrão. Define-se a razão 
resultante como a correlação entre as variáveis aleatórias X e Y, denotada 
pela letra grega ρ (rô) 
 
(26) ρ(X,Y ) =
cov(X,Y )
σXσY
 
 
em que Xσ e Yσ denotam os desvios-padrão de X e Y, respectivamente. 
 
A correlação é estimada pelo coeficiente de correlação linear de Pearson, 
ou, simplesmente, coeficiente de correlação, definido por 
 
(27) 
yx
xy
ss
s
R = 
 
em que xys é a covariância amostral de X e Y (25), sx é o desvio-padrão 
amostral de X 
 
(28) sx ≈
(x i − x )
2
i=1
n
∑
n
 
 
e sY é o desvio-padrão amostral de Y 
 
(29) sy =
(y i − y )
2
i=1
n
∑
n
. 
 
Substituindo (25), (28) e (29) em (27), obtemos 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
24 
 
(30) R =
(x i − x )(y i − y )
i=1
n
∑
(x i − x )
2
i=1
n
∑ (y i − y )2
i=1
n
∑
=
Sxy
SxxSyy
. 
 
em que Sxy = (x i − x )(y i − y )
i=1
n
∑ , Sxx = (x i − x )2
i=1
n
∑ e Syy = (y i − y )2
i=1
n
∑ . 
 
A representação abreviada dos somatórios de (30) por meio de xyS , xxS e yyS é 
útil. Não é difícil mostrar que 
 
(31) Sxy = x iy i −
x i
i
∑
 
 
 
 
 
 × y i
i
∑
 
 
 
 
 
 
n
i
∑ . 
 
(32) Sxx = x i
2 −
x i
i
∑
 
 
 
 
 
 
2
n
i
∑ . 
 
(33) Syy = y i
2 −
y i
i
∑
 
 
 
 
 
 
2
n
i
∑ . 
 
As fórmulas (31), (32) e (33) devem ser memorizadas porque são importantes 
para a prova. 
 
Combinando as expressões anteriores, podemos também chegar à fórmula 
abaixo, para o cálculo direto do coeficiente de correlação linear de Pearson: 
 
(34) R =
n x iy i − x i
i
∑
 
 
 
 
 
 × y i
i
∑
 
 
 
 
 
 
i
∑
n x i
2 − x i
i
∑
 
 
 
 
 
 
2
i
∑
 
 
 
 
 
 
 
 
× n y i
2− y i
i
∑
 
 
 
 
 
 
2
i
∑
 
 
 
 
 
 
 
 
. 
 
O coeficiente de correlação tem as importantes propriedades de ser 
adimensional e de variar entre -1 e +1, o que não ocorre com a covariância. A 
vantagem de ser adimensional está no fato de seu valor não ser afetado pelas 
unidades adotadas. Por outro lado, o fato de termos 11 ≤≤− R faz com que um 
dado valor de R seja facilmente interpretado. Note que R = -1 corresponde ao 
caso de correlação linear negativa perfeita e R = +1 corresponde ao caso de 
correlação linear positiva perfeita. 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
25 
 
 
O coeficiente de correlação para os dados da tabela de alturas e pesos é de 
aproximadamente 0,771 (você pode conferir este resultado com uma 
calculadora ou com algum programa de computador). O coeficiente de 
correlação para os dados da figura em que a correlação é negativa é igual a -
0,9854. O coeficiente de correlação para os dados da figura em que 
aparentemente não há correlação entre X e Y é igual a 0,0164. Este último 
resultado indica que não há qualquer associação linear entre as variáveis X e Y 
(neste caso a covariância amostral também dará próxima de zero). Quanto 
maior é o valor absoluto (ou módulo) |ρ|, melhor é a associação linear entre os 
valores. 
 
Deve-se frisar que um alto valor do coeficiente de correlação, embora 
estatisticamente significativo, pode não implicar qualquer relação de causa e 
efeito, mas simplesmente a tendência de variação conjunta das variáveis em 
questão. 
 
Ressaltamos que a correlação nula, isto é, ρ = 0, significa que não há 
associação linear entre X e Y. Mesmo que X e Y tenham covariância zero, elas 
podem ter uma associação não linear, como em 122 =+YX (equação de uma 
circunferência centrada em (0,0) e de raio 1). 
 
Uma importante conseqüência da independência estatística é a seguinte: 
 
- se X e Y são variáveis aleatórias independentes, então a covariância e a 
correlação entre elas é nula (memorize para a prova!). 
 
Exemplo. Admita que X e Y sejam variáveis aleatórias independentes. Então é 
válida a expressão 
 
A) ][][][ 22 YEXEXYE = 
B) ][][][ YEXEXYE = 
C) ][/][][ YEXEXYE = 
D) ),(][ YXCovXYE = 
E) 2])[][(][ YEXEXYE = 
 
Resolução 
 
Provaremos que ][][][ YEXEXYE = supondo que X e Y sejam variáveis contínuas. 
Prova similar pode ser dada para o caso das variáveis serem discretas (tente 
você mesmo fazer após estudar a nossa solução para variáveis contínuas). 
 
Primeiramente, lembre que )()(),( yfxfyxf YX ×= , pois X e Y são independentes. 
Aplicando esse conceito na integral de E[XY], obtemos 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
26 
 
 
E[XY ] = xyfXY (x,y)dxdy
−∞
∞
∫
−∞
∞
∫ = xfX (x)dx
−∞
∞
∫
 
 
 
 
 
 × yfY (y)dy
−∞
∞
∫
 
 
 
 
 
 = E[X]E[Y ] 
 
Note que variáveis independentes são não correlacionadas, pois 
 
0][),( =−= YXXYEYXCov . 
 
GABARITO: B 
 
Distribuição Normal Bidimensional 
 
A distribuição normal bivariada ou bidimensional é um modelo importante para 
variáveis aleatórias contínuas bidimensionais. 
 
A variável (X,Y) tem distribuição normal bidimensional se sua densidade 
conjunta for dada por 
 
(35) f (x,y) =
1
2πσ xσ y 1− ρ
2
exp −
1
2(1− ρ2)
x − µx
σ x
 
 
 
 
 
 
2
− 2ρ
(x − µx )(y − µy )
σ xσ y
+
y − µy
σ y
 
 
 
 
 
 
 
 
2 
 
 
 
 
 
 
 
 
 
 
  
 
 
 
  
 
 
para −∞ < x < ∞ , −∞ < y < ∞ (foi usada a notação exp(x) = ex). Observe que a 
densidade normal conjunta depende de cinco parâmetros: µX e µY (médias), σX 
e σY (desvios padrões) e ρ (coeficiente de correlação entre Y e X). A figura 
abaixo mostra a superfície normal obtida para os seguintes parâmetros: µX = 
µY = 0, σX = σY = 1 e ρ = 0,3. 
 
 
-3
-2
-1
0
1
2
3
-2
0
2
0
0.05
0.1
0.15
xy
z
 =
 f
(x
,y
)
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
27 
 
 
 
A normal bidimensional possui as seguintes propriedades: 
 
(a) As distribuições marginais de X e Y são normais unidimensionais: X ~ 
N(µx,σ2x) e Y ~ N(µy,σ2y). 
(b) As distribuições condicionais são normais, com 
 
fY |X (y | x) ~ N µy + ρ
σ y
σ x
(x − µx ),σ y
2(1− ρ2)
 
 
 
 
 
 e 
 
fX |Y (x | y) ~ N µx + ρ
σ x
σ y
(y − µy ),σ x
2(1− ρ2)
 
 
  
 
 
  . 
 
Logo E(Y | x) = µy + ρ
σ y
σ x
(x − µx ) e E(X | y) = µx + ρ
σ x
σ y
(y − µy ). 
 
Se X e Y são conjuntamente normais e não correlacionadas (ρ=0), 
podemos escrever a densidade (35) como 
 
(36) f (x,y) =
1
σx 2π
e
−
1
2
x−µx
σ x
 
 
 
 
 
 
2
×
1
σy 2π
e
−
1
2
y−µy
σ y
 
 
  
 
 
  
2
, 
 
ou seja, a densidade conjunta é o produto das duas marginais, que são 
normais. Isto quer dizer que X e Y são independentes no caso em que X e Y 
tiverem densidade conjunta normal com ρρρρ=0 (memorize para a prova!) 
 
Atenção! A não correlação entre X e Y implica independência estatística 
somente quando X e Y são variáveis aleatórias conjuntamente 
normais. Isto não é verdade quando X e Y tem distribuição conjunta diferente 
da normal bidimensional. 
 
Já caiu em prova! (Fiscal de Rendas-MS/2006/FGV) Analise as 
afirmativas a seguir, a respeito de duas variáveis aleatórias X e Y: 
 
I. se X e Y são independentes, então Cov(X,Y) = 0; 
II. se Cov(X,Y) = 0, então X e Y são independentes; 
III. se X e Y são independentes, então E(XY) = E(X).E(Y); 
IV. se E(XY) = E(X).E(Y), então X e Y são independentes. 
 
Assinale: 
 
A) se nenhuma afirmativa estiver correta. 
B) se somente as afirmativas I e III estiverem corretas. 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - RaciocínioLógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
28 
 
C) se somente as afirmativas I e IV estiverem corretas. 
D) se somente as afirmativas II e IV estiverem corretas. 
E) se todas as afirmativas estiverem corretas. 
 
Resolução 
 
Sejam X e Y variáveis aleatórias. Então a covariância de X e Y é definida como 
 
Cov(X,Y) = E[(X-µX) (Y-µY)] = E(XY) - µXµY 
 
em que µX = E(X) e µY = E(Y). Se X e Y são variáveis aleatórias 
independentes, então a covariância entre elas é nula (o que indica que não há 
associação linear entre elas!), ou seja, 
 
Cov(X,Y) = 0 (p/ X e Y independentes) ⇒ E(XY) = µXµY. 
 
Diz-se que X e Y são não correlacionadas quando Cov(X,Y) = 0. 
 
A relação recíproca não é verdadeira: se X e Y são não correlacionadas não 
podemos afirmar que X e Y sejam independentes. Porém, a não correlação 
entre X e Y implica independência estatística quando X e Y são variáveis 
aleatórias conjuntamente normais (e somente neste único caso!). 
 
Análise das afirmativas: 
 
I. “se X e Y são independentes, então Cov(X,Y) = 0” ⇒ Verdadeira, por 
definição. 
II. “se Cov(X,Y) = 0, então X e Y são independentes” ⇒ Falsa, pois a relação 
recíproca não é verdadeira: se X e Y são não correlacionadas não podemos 
afirmar que X e Y sejam independentes. 
III. “se X e Y são independentes, então E(XY) = E(X).E(Y)” ⇒ Verdadeira, pois 
Cov(X,Y) = 0 implica E(XY) = E(X).E(Y). 
IV. “se E(XY) = E(X).E(Y), então X e Y são independentes” ⇒ Falsa, pois a não 
correlação não implica independência. 
 
GABARITO: B 
 
Já caiu em prova! (Analista da SUSEP/Atuária/2010/ESAF). Y e X são 
variáveis aleatórias com distribuição normal conjunta com E(Y) = µY, E(X) = 
µX, e Cov(Y,X) = ρσYσX, onde σY e σX são os desvios padrões de Y e X, 
respectivamente, e ρ o coeficiente de correlação entre Y e X. Qual a expressão 
da regressão de X em Y, E(X|Y=y)? 
 
A) µY + ρσY(x – µX)/σX. 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
29 
 
B) µY + ρσX(x – µX)/σY. 
C) µY + ρσY(y – µY)/σX. 
D) µX + ρσX(y – µY)/σY. 
E) µX + ρσY(y – µY)/σX. 
 
Resolução 
 
A média condicional 
 
)()|( y
y
x
x yyXE µσ
σ
ρµ −+= 
 
é uma função linear de y, ou seja E(X|y) = g(y). Desta forma, E(X|Y=y) é a 
regressão de X em Y e isso implica que as opções A e B poderiam ser 
descartadas logo de início, pois ambas são funções da variável x. 
 
A opção D contém a expressão correta. 
 
GABARITO: D 
 
17.5.2 Média e Variância de Uma Combinação Linear de Variáveis 
Aleatórias 
 
Sejam X e Y variáveis aleatórias e Z=g(X,Y) uma função dessas variáveis. 
Vamos admitir que essa função tenha a forma 
 
(37) bYaXZ += 
 
em que a e b são constantes. Essa expressão é uma combinação linear (ou 
soma ponderada). A esperança de (37) é dada por 
 
(38) ][][][ YbEXaEZE += . 
 
A Eq. (38) nos diz que o valor esperado de uma combinação linear de 
duas variáveis aleatórias é a combinação linear de seus respectivos 
valores esperados. Essa regra pode ser generalizada para um número 
arbitrário de variáveis aleatórias, quer elas sejam discretas ou contínuas. 
 
As seguintes regras relativas à variância são válidas: 
 
1. Se X, Y e Z são variáveis aleatórias e a, b e c são constantes, então 
 
(39) +++=++ ]var[]var[]var[]var[ 222 ZcYbXacZbYaX 
),cov(2),cov(2),cov(2 ZYbcZXacYXab ++ 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
30 
 
Note que ).,cov(2)var()var()var( 22 YXabYbXabYaX ++=+ 
 
2. Se X, Y e Z são independentes ou não correlacionadas 
 
(40) ]var[]var[]var[]var[ 222 ZcYbXacZbYaX ++=++ 
 
Se fizermos a = b= c =1 em (40), obtemos 
 
(41) ]var[]var[]var[]var[ ZYXZYX ++=++ . 
 
A expressão (41) nos diz que a variância da soma de variáveis aleatórias 
independentes é igual à soma das variâncias (memorize para a prova!). 
 
As regras sobre a variância de três variáveis aleatórias podem ser 
generalizadas para n variáveis aleatórias. 
 
17.6 Regressão 
 
17.6.1 A Natureza da Análise de Regressão 
 
Na análise de regressão simples, estamos interessados na dependência 
estatística entre as variáveis X e Y. Não podemos confundir a dependência 
estatística com o conceito de dependência determinista ou funcional. Por 
exemplo, a Segunda Lei de Newton da Física clássica (lei determinista) afirma 
que 
 
“A resultante das forças que agem num corpo é igual ao produto de sua massa 
pela aceleração adquirida.” 
 
Ou seja, Newton postulou que há uma dependência determinista entre força e 
aceleração, dada pela fórmula 
 
amF
i
i
�
�
×=∑ 
 
em que iF
�
 denota a i-ésima força que age num corpo, m é a massa e a
�
 é a 
aceleração. Repare que a fórmula acima NÃO contém um termo de 
perturbação ou erro aleatório, sendo, portanto, de caráter não 
probabilístico, isto é, determinista. Outros exemplos de relações físicas 
deterministas são as duas leis de Kirchhoff dos circuitos elétricos (lei das 
malhas e lei dos nós), as quatro equações de Maxwell do eletromagnetismo e a 
lei do gás de Boyle. 
 
 
 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
31 
 
Regressão versus Causação 
 
A análise de regressão ocupa-se do estudo da dependência de uma variável, a 
variável dependente, em relação a uma ou mais variáveis, as variáveis 
explicativas (ou independentes), com o objetivo de estimar e/ou prever a 
média (da população) ou o valor médio da dependente em termos dos valores 
conhecidos ou fixos (em amostragem repetitiva) das explicativas. 
 
Considere o experimento aleatório hipotético ilustrado pela próxima figura, em 
que a variável explicativa é a estatura do pai (em metros) e a variável 
dependente é a estatura do filho (em metros). Essa figura mostra três 
distribuições da estatura do filho correspondentes a valores fixos de estatura 
do pai (1,70 m, 1,80 m e 1,90 m). Note que a uma dada altura do pai 
corresponde uma população (distribuição) com cinco possíveis estaturas para o 
filho. A reta de regressão na figura (linha tracejada) sugere que a estatura 
média do filho tende a aumentar quando aumenta a estatura do pai. 
Portanto, a regressão linear permite que o valor médio da variável dependente 
(estatura do filho) seja estimado por meio dos valores observados das 
estaturasdos pais (variável explicativa). 
 
 
1.6 1.65 1.7 1.75 1.8 1.85 1.9 1.95 2
1.75
1.8
1.85
1.9
1.95
2
2.05
2.1
2.15
2.2
 
 
 
A regressão não implica necessariamente causalidade ou causação. 
Uma relação estatística, por mais forte que seja, não pode estabelecer uma 
relação de causa e efeito; a causação deve vir de fora da estatística, de outra 
teoria. 
 
Por exemplo, considere um agrônomo que esteja interessado em estudar a 
dependência da colheita de soja em relação à chuva. Consideramos que a 
colheita de soja é dependente da precipitação de chuva por uma questão de 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
32 
 
bom senso (e esta consideração é não estatística!). Mas a estatística não teria 
nada contra o fato do agrônomo estabelecer que a relação de dependência é 
inversa, ou seja, que a precipitação de chuva depende do rendimento da 
colheita de soja, apesar disso ser um evidente absurdo. 
 
Uma relação estatística, por si só, não pode logicamente implicar causalidade. 
Para atribuir causalidade, deve-se recorrer a considerações teóricas. Deste 
modo, podemos afirmar que o consumo depende da renda real com base na 
teoria econômica. 
 
Ideias Fundamentais 
 
Aprendemos que a análise de correlação tem como objetivo medir a 
intensidade ou grau de associação linear entre duas variáveis aleatórias. Por 
exemplo, podemos estar interessados em determinar a correlação existente 
entre o hábito de fumar e a incidência de câncer no pulmão, entre as notas das 
provas de física e matemática do exame vestibular, etc. Por outro lado, na 
análise de regressão estamos interessados em estimar ou prever o valor 
médio de uma variável aleatória com base nos valores fixos de outra 
variável (variável explanatória). Repare, portanto, que na análise de 
regressão há uma assimetria na maneira como as variáveis dependente e 
explanatória são tratadas. Supõe-se que a variável dependente seja 
estocástica (ou aleatória) e que as variáveis explicativas tenham valores 
fixados, isto é, sejam não estocásticas. 
 
O problema da regressão consiste em determinar a relação funcional entre as 
variáveis dependente e explicativa. 
 
Assim, se os pares ordenados (x,y) se apresentarem como na figura a seguir, 
admitiremos existir um relacionamento funcional entre os valores de y e x, 
responsável pelo aspecto do diagrama e que explica grande parte da variação 
de y com x. Esse relacionamento funcional corresponderia à linha existente na 
figura, que seria a linha de regressão, que pode não ser uma reta, como no 
caso indicado pela figura. 
 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
33 
 
2000 2500 3000 3500 4000 4500
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
 
 
 
Uma parcela da variação, contudo, permanece em geral sem ser explicada, e 
será atribuída ao acaso. Repare, na figura acima, que os valores de y flutuam 
aleatoriamente em torna da linha de regressão estimada (essa linha deve ser 
calculada por meio de algum método estatístico). Essa flutuação ou variação 
em torno da linha de regressão é devida à existência de uma variação aleatória 
adicional, que chamaremos de variação residual. A função de regressão, 
portanto, nos dá o valor médio de uma das variáveis em função do valor 
observado da outra, isto é, E[Y/x] = yˆ . 
 
O problema da regressão é simplificado quando sabemos de antemão qual é a 
relação funcional ou modelo entre as variáveis. Um problema bastante 
estudado em Estatística é a questão da seleção ou identificação do modelo (é 
uma reta? é um polinômio de grau 2?). Mas este estudo está fora do escopo 
deste curso. No estudo que se segue, admitiremos que a forma da linha 
de regressão seja uma reta. Teremos então o problema da regressão 
linear simples. O termo “simples” significa que apenas duas variáveis estão 
envolvidas. 
 
17.6.2 Regressão Linear Simples 
 
Seja Y a variável dependente e X a variável suposta sem erro, ou seja, não 
aleatória. A regressão linear simples pressupõe que seja adotado o modelo 
 
(42) εβα ++= XY , 
 
em que α é o intercepto, β é a declividade e ε denota a componente 
aleatória da variação de Y (ε é uma variável aleatória). 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
34 
 
É razoável supor que a variável aleatória ε tenha média nula, a fim de que 
toda a variação explicada de Y fique em torno da reta de regressão. Isso 
implica que a reta de regressão fornece a média de Y para cada valor de x 
considerado, como já mencionamos. 
 
Uma outra suposição básica que pode ser adotada é a de que a variação 
residual da variável Y seja independente de x. Ou seja, usualmente 
admite-se que a variação de Y em torno da linha teórica de regressão pode ser 
descrita por um desvio-padrão residual que independe do ponto em 
consideração. 
 
Por fim, admitiremos que a variação de Y em torno da linha teórica de 
regressão se dê segundo distribuições normais independentes, para 
qualquer valor de x; o que implica dizer que as variações residuais em 
relação à reta de regressão são independentes e normalmente distribuídas 
(vide figura a seguir). 
 
 
x
y
x
1
x
2 
 
 
Nota: Os autores estão cientes do fato de que os resíduos do modelo ajustado 
nem sempre seguem uma distribuição normal. Contudo, o importante é ter em 
mente que as variações residuais em relação à reta de regressão são 
independentes e normalmente distribuídas por hipótese. Isto não implica dizer 
que os resíduos, de fato, sejam normalmente distribuídos. Acredite: há muitos 
dados empíricos que violam a hipótese de normalidade! 
 
Suponhamos que a reta estimativa de (42) seja 
 
(43) bxay +=ˆ 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
35 
 
em que yˆ denota os valores dados pelareta estimativa, a é a estimativa do 
parâmetro α, e b , também denominado coeficiente de regressão linear, é a 
estimativa do parâmetro β. 
 
Existem diversos métodos de estimação da reta de regressão. Podemos até 
mesmo estimar a reta visualmente. O método de ajuste visual consiste em 
traçar diretamente a reta, com auxílio de uma régua, no diagrama de 
dispersão, procurando fazer, da melhor forma possível, com que essa reta 
passe por entre os pontos. Esse procedimento, por ser subjetivo, somente será 
razoável se a correlação linear for muito forte, caso contrário levará a 
resultados pobres. 
 
Por outro lado, o ajuste pode ser feito pelo método dos mínimos 
quadrados, segundo o qual a reta a ser adotada deverá ser aquela que torna 
mínima a soma dos quadrados das distâncias da reta aos pontos experimentais 
(em que a distância é igual ao erro aleatório no ponto em consideração como 
ilustrado pela próxima figura). Ou seja, devemos procurar a reta para a qual 
se consiga minimizar ∑
=
n
i
ie
1
2 . A idéia central desse procedimento é simplesmente 
a de minimizar a variação residual em torno da reta estimativa. 
 
 
 
 
 
Tendo em vista a expressão (43), devemos, portanto, impor a condição 
 
(44) ∑ ∑∑ −−=−=
i i
iiii
i
i bxayyye
222 )(min)ˆ(minmin . 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
36 
 
De acordo com o Cálculo (você lembra daquelas aulas “chatas” sobre derivada 
e integral nos dois primeiros anos da faculdade?!), os parâmetros a e b que 
minimizam (44) serão aqueles que anulam as derivadas parciais de (44) 
 
(45) ∑ =∂
∂
i
ie
a
02 e ∑ =∂
∂
i
ie
b
02 . 
 
Não é difícil chegar às expressões 
 
(46) 0)(2 =−−− ∑
i
ii bxay , 
 
(47) 0)(2 =−−− ∑
i
iii bxayx 
 
as quais fornecem o seguinte sistema de duas equações a duas incógnitas: 
 
(48) 






+=
+=
∑ ∑ ∑
∑ ∑
= = =
= =
n
i
n
i
n
i
iiii
n
i
n
i
ii
xbxayx
xbnay
1 1 1
2
1 1 
 
Os pontos (x,y) fornecem os elementos para a montagem de (48), cuja 
solução forneceria os coeficientes a e b. Entretanto, é mais fácil considerar de 
uma vez a solução analítica do sistema, segundo a qual 
 
(49) 




−=
=
xbya
S
S
b
xx
xy
 
 
Exemplo. Determine a equação da reta para os pontos 
 
x 1 2 3 4 5 6 7 8 
Y 0,5 0,6 0,9 0,8 1,2 1,5 1,7 2,0 
 
utilizando o método dos mínimos quadrados. Trace a reta no diagrama de 
dispersão e calcule o coeficiente de correlação linear. A Tabela abaixo contém 
os valores necessários para a determinação dos parâmetros da reta. 
 
 
ix iy ii yx 
2
i
x 2
i
y 
1 0,5 0,5 1 0,25 
2 0,6 1,2 4 0,36 
3 0,9 2,7 9 0,81 
4 0,8 3,2 16 0,64 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
37 
 
5 1,2 6,0 25 1,44 
6 1,5 9,0 36 2,25 
7 1,7 11,9 49 2,89 
8 2,0 16,0 64 4,00 
36=∑ ix 2,9=∑ iy 5,50=∑ ii yx 2042 =∑ ix 64,122 =∑ iy 
 
Vimos que 
 
Sxy = x iy i −
x i
i
∑
 
 
 
 
 
 × y i
i
∑
 
 
 
 
 
 
n
i
∑ , 
 
Sxx = x i
2 −
x i
i
∑
 
 
 
 
 
 
2
n
i
∑ 
 




−=
=
xbya
S
S
b
xx
xy
 
 
Fazendo os cálculos, temos que 
 
1,9
8
2,936
5,50 =
×
−=xyS 
 
42
8
36
204
2
=−=xxS 
 
Logo, 
 





=×−=−=
≈=
174,0
8
36
217,0
8
2,9
217,0
42
1,9
xbya
b
 
 
A equação da reta de mínimos quadrados, ilustrada na figura a seguir, é 
 
xy 217,0174,0ˆ += . 
 
Para o cálculo do coeficiente de correlação, é necessário usar os valores da 
coluna 2iy da Tabela dada: 
 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
38 
 
Syy = y i
2 −
y i
i
∑
 
 
 
 
 
 
2
n
i
∑ 
 
06,2
8
2,9
64,12
2
≈−=yyS 
 
98,0
06,242
1,9
≈
×
==
yyxx
xy
SS
S
R 
 
 
0 1 2 3 4 5 6 7 8 9
0
0.5
1
1.5
2
x
y
 
 
 
O alto valor do coeficiente de correlação linear de Pearson justifica o traçado 
da reta de regressão. 
 
Pressupostos do Modelo de Regressão Linear Simples 
 
Comentamos anteriormente alguns dos pressupostos (ou hipóteses básicas) do 
modelo de regressão: 
 
I. o erro aleatório ε tem média nula; 
II. a reta de regressão fornece a média de Y para cada valor de x 
considerado; 
III. a variação residual de Y é constante com x e 
IV. a variação de Y em torno da linha teórica de regressão se dá segundo 
distribuições normais independentes, para qualquer valor de x, o que 
implica dizer que as variações residuais em relação à reta de regressão 
são independentes e normalmente distribuídas. 
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
N u b i a A l v e s d e O l i v e i r a , C P F : 7 1 3 5 9 2 2 2 2 0 0
O conteúdo deste curso é de uso exclusivo de Nubia Alves de Oliveira, CPF:71359222200, vedada, por quaisquer
meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição, sujeitando-se os infratores à
responsabilização civil e criminal.
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados 
Profs. Alexandre Lima e Moraes Junior 
Profs. Alexandre Lima e Moraes Junior 
39 
 
 
É usual formular as hipóteses do modelo de regressão em termos do erro 
aleatório ε : 
 
1. o valor de y para cada valor de x, é 
 
εβα ++= XY . 
 
2. o valor médio do erro aleatório é 
 
0)( =εE 
 
 pois admitimos que 
 
xYE βα +=)( 
 
3. a variância do erro aleatório é 
 
)var()var( 2 Y==σε 
 
4. a covariância entre qualquer par de erros aleatórios iε e jε é 
 
0),cov(),cov( == jiji YYεε 
 
5. a variável x não é aleatória. 
 
6. A variável ε têm distribuição normal 
 
ε ~ ),0( 2σN 
 
 se Y tem distribuição normal e vice-versa. 
 
Já caiu em prova! (Analista da SUSEP/Atuária/2010/ESAF) A partir de 
uma amostra aleatória (X1,Y1), (X2,Y2),..., (X20,Y20) foram obtidas as 
estastísticas: 
 
médias X = 12,5 e Y = 19, variâncias amostrais sx
2 = 30 e sy
2 = 54 e 
covariância Sxy = 36. 
 
Qual a reta de regressão estimada de Y em X? 
 
A) ˆ Y i =19 + 0,667X i

Continue navegando