Buscar

Correlação Linear em Estatística

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

CONTEÚDO PROGRAMÁTICO
AlfaCon Concursos Públicos
Lei do Direito Autoral nº 9.610, de 19 de Fevereiro de 1998: Proíbe a reprodução total ou parcial desse material ou divulgação com 
fins comerciais ou não, em qualquer meio de comunicação, inclusive na Internet, sem autorização do AlfaCon Concursos Públicos.
1
ÍNDICE
Correlação Linear ������������������������������������������������������������������������������������������������������������������������������������������������2
Introdução ��������������������������������������������������������������������������������������������������������������������������������������������������������������������������2
Diagrama de Dispersão �����������������������������������������������������������������������������������������������������������������������������������������������������3
Propriedades da Correlação ���������������������������������������������������������������������������������������������������������������������������������������������8
Fórmula da Correlação Linear ���������������������������������������������������������������������������������������������������������������������������������������10
AlfaCon Concursos Públicos
Lei do Direito Autoral nº 9.610, de 19 de Fevereiro de 1998: Proíbe a reprodução total ou parcial desse material ou divulgação com 
fins comerciais ou não, em qualquer meio de comunicação, inclusive na Internet, sem autorização do AlfaCon Concursos Públicos.
2
Correlação Linear
Introdução
As medidas estatísticas da média, da moda, da mediana, da variância, e de algumas outras 
medidas diziam respeito somente a uma variável�
No que diz respeito à Correlação, surge uma diferença� Estudaremos, conjuntamente, duas variáveis!
A Correlação é uma medida estatística que vai responder a duas perguntas:
1ª) Existe alguma força unindo estas duas variáveis?
2ª) Caso exista esta força, como se comporta uma variável em relação à outra?
Por meio de exemplos, entenderemos bem melhor� Vejamos�
Suponhamos que se pretende estudar as duas seguintes variáveis: número de anos que uma 
pessoa frequentou os bancos escolares, e número de livros que esta pessoa lê por ano�
Ora, o senso comum nos levaria facilmente a crer que alguém que estudou por mais tempo lê 
mais livros por ano; ao passo que quem mal frequentou a escola pouco lê� Não é verdade?
Mas a Estatística não trabalha com o senso comum, e sim com dados de pesquisa�
Assim, uma pesquisa seria realizada, e seriam coletados pares de informações, ou seja, cada pessoa 
pesquisada responderia a estas duas perguntas: Quantos anos estudou? e Quantos livros lê por ano?
Dessa forma, ao fim da pesquisa, teremos um grupo de pares de informações, os quais irão ali-
mentar uma tabela� Teríamos:
E será por meio dos dados constantes nesta tabela que trabalharemos a Correlação!
Na realidade, a Correlação nada mais é que uma fórmula – veremos adiante – a qual será preen-
chida por meio dos dados (os pares de informação) constantes na tabela acima, e cujo resultado 
nos conduzirá àquelas duas conclusões: 1ª) se há uma força unindo as duas variáveis; e 2ª) como se 
comporta uma variável em relação à outra�
Neste ponto, convém que sejamos apresentados à fórmula da Correlação, que é a seguinte:
yx SS
yxCovyxr
⋅
=
),(),(
No numerador, temos a covariância entre x e y, e no denominador temos o produto entre o desvio 
padrão de x e o de y� Mais adiante, trabalharemos com essa fórmula, mas por enquanto vamos com calma�
AlfaCon Concursos Públicos
Lei do Direito Autoral nº 9.610, de 19 de Fevereiro de 1998: Proíbe a reprodução total ou parcial desse material ou divulgação com 
fins comerciais ou não, em qualquer meio de comunicação, inclusive na Internet, sem autorização do AlfaCon Concursos Públicos.
3
O resultado da aplicação da fórmula da Correlação variará, sempre, entre – 1 (menos um) e 1� Ou 
seja, nunca será menor que menos um, e nunca maior que um� Teremos:
Vamos agora aprender como se interpreta o resultado da Correlação�
Se tomarmos os dados da tabela, aplicarmos a fórmula da Correlação e encontrarmos um resul-
tado igual a zero, diremos que não existe força (linear) alguma unindo estas duas variáveis�
Ou seja, o resultado zero indica ausência total de Correlação Linear!
À medida que o resultado da Correlação vai se afastando do zero, em direção aos extremos (-1 
ou +1), vai aumentando a intensidade da força que une aquelas duas variáveis!
Quando o resultado da fórmula é igual a – 1 ou a 1, então se diz que a correlação é máxima. Ou 
seja, é máxima a força que une as duas variáveis. Correlação igual a 1 é dita correlação perfeita 
positiva. Igual a – 1, correlação perfeita negativa.
Conhecemos, pois, a primeira análise do resultado da Correlação: a existência ou inexistência de 
força unindo as duas variáveis, e quando esta força é mais intensa ou menos intensa�
A segunda análise do resultado diz respeito ao comportamento das variáveis, uma em relação à outra�
E é muito fácil esta análise:
 ˃ Se o resultado da Correlação der um valor maior que zero (positivo), teremos que as variáveis 
se comportam em um mesmo sentido de variação, ou seja, aumentando-se o valor de uma, 
aumenta também a outra, e diminuindo-se uma, diminui também a outra� É claro que isso será 
mais perceptível quando a correlação tiver valor próximo de +1�
 ˃ Se o resultado da Correlação for menor que zero (negativo), as variáveis se comportarão em 
sentidos inversos, ou seja, aumentando-se o valor de uma, o da outra diminui; e vice-versa� Isso 
será mais perceptível quando a correlação tiver valor próximo de – 1�
Interpretar o resultado da correlação pode perfeitamente ser uma questão de prova! Veremos um 
exemplo mais adiante�
Diagrama de Dispersão
Vamos voltar à tabela que vimos acima:
Com os pares de informação que vemos acima, seremos capazes de criar um gráfico, muito 
simples, chamado Diagrama de Dispersão, em que cada par de informação se transformará em um 
ponto� Vejamos como é simples:
O primeiro par de informação é (2 e 5)� Estão vendo?
Este par vai virar um ponto no gráfico�
AlfaCon Concursos Públicos
Lei do Direito Autoral nº 9.610, de 19 de Fevereiro de 1998: Proíbe a reprodução total ou parcial desse material ou divulgação com 
fins comerciais ou não, em qualquer meio de comunicação, inclusive na Internet, sem autorização do AlfaCon Concursos Públicos.
4
Da mesma forma, os demais pares irão formar, cada um, um ponto no diagrama de dispersão�
Os demais pontos serão, portanto, (3 e 4), (4 e 9), (5 e 8) e (7 e 12)�
Marcando estes pontos no gráfico, teremos:
Observando os pontos marcados acima, facilmente vemos que é impossível uni-los por meio de 
uma reta perfeita� Todavia, percebemos também que embora não formem uma reta perfeita, estes 
pontos estão dispostos em torno do formato aproximado de uma reta� Vejamos:
Percebam ainda que esta reta é ascendente, ou seja, ela está subindo, da esquerda para a direita� Quando 
isso ocorrer, ou seja, quando os pontos do diagrama de dispersão não formarem uma reta perfeita, mas 
estiverem dispostos ao longo de uma reta ascendente, então diremos que a correlação é positiva (0<r<1)�
Outra situação possível é que os pontos do diagrama, oriundos da tabela (dos pares de informação) 
também não formassem uma reta descendente perfeita, mas se aproximassem, ou seja, estivessem dispos-
tos ao longo de uma reta que desce, da esquerda para a direita� Seria algo semelhante ao seguinte:
AlfaCon Concursos Públicos
Lei do Direito Autoral nº 9.610, de 19 de Fevereiro de 1998: Proíbe a reprodução total ou parcial desse material ou divulgação com 
fins comerciais ou não, em qualquer meio de comunicação, inclusive na Internet, sem autorização do AlfaCon Concursos Públicos.
5
Neste caso, diremos que a Correlação não é perfeita, porque os pontos não formaram uma reta 
perfeita, mas é negativa, porque estão dispostos ao longo de uma reta descendente! Então, diremos 
que a correlação é negativa (-1<r<0)�
E se os pontos do diagrama formaremuma reta perfeita? São dois casos possíveis:
1º) Os pontos, unidos, formaram uma reta ascendente perfeita:
Neste caso, temos a situação de uma correlação perfeita positiva, ou seja, r=1�
2º) Os pontos, unidos, formaram uma reta descendente perfeita:
Neste caso, temos a situação de uma correlação perfeita negativa, ou seja, r=-1�
Por fim, se estivermos estudando a existência da correlação entre as duas seguintes variáveis: 1ª) 
número de anos que a pessoa frequentou a escola; e 2ª) número do sapato que a pessoa calça�
Ora, é muitíssimo provável que, ao fazermos a pesquisa e ao preenchermos uma tabela com os 
pares de informações coletados, e depois, ao marcarmos os pontos no diagrama de dispersão, che-
guemos ao seguinte gráfico:
Percebemos que, neste caso, não é possível sequer aproximar os pontos do diagrama para o 
formato de uma reta, quer ascendente, quer descendente�
Quando isso ocorrer, diremos que estamos diante da ausência da correlação, ou seja, r=0�
Com o que vimos até aqui, já estamos aptos a resolver um estilo de questão de Correlação: aquele 
que pergunta pela interpretação do diagrama de dispersão�
Um resumo desta teoria que acabamos de ver é o que se segue, nos cinco quadros seguintes:
AlfaCon Concursos Públicos
Lei do Direito Autoral nº 9.610, de 19 de Fevereiro de 1998: Proíbe a reprodução total ou parcial desse material ou divulgação com 
fins comerciais ou não, em qualquer meio de comunicação, inclusive na Internet, sem autorização do AlfaCon Concursos Públicos.
6
Acreditem: estes pequenos gráficos já foram objeto de prova� Era olhar para o desenho e acertar 
a questão�
 → Exemplo 01: Considere as seguintes afirmações:
I. Um dispositivo útil quando se quer verificar a associação entre duas variáveis quantitativas 
é o gráfico de dispersão entre essas duas variáveis�
II. O coeficiente de variação é uma medida de dispersão relativa que depende da unidade de 
medida da variável que está sendo analisada�
III. Dentre as medidas de posição central, a média é considerada uma medida robusta pelo fato 
de não ser afetada por valores aberrantes�
IV. Se o coeficiente de correlação linear de Pearson entre duas variáveis for igual a zero, não haverá 
associação linear entre elas, implicando a ausência de qualquer outro tipo de associação�
Está correto o que se afirma APENAS em:
a) I e II�
b) I e III�
c) II e IV�
d) I�
e) II e III�
 → Solução:
Vamos analisar cada uma das afirmações:
A afirmação I está correta� Por meio do gráfico de dispersão, é possível observar se há uma asso-
ciação (correlação) entre duas variáveis quantitativas�
A afirmação II está incorreta� O coeficiente de variação é uma medida de dispersão relativa, e 
é obtido pela razão entre duas medidas estatísticas (desvio padrão e média aritmética) de mesma 
unidade (gramas ou metros ou litros etc�), sendo assim adimensional (não possui unidade)�
A afirmação III está incorreta� A média aritmética é afetada por valores aberrantes (extremos), 
sendo uma desvantagem dessa medida estatística�
A afirmação IV está incorreta� Se o coeficiente de correlação linear for igual a zero, certamente 
não haverá associação linear entre as variáveis, mas poderá haver uma associação não linear�
Portanto, está correto o que se afirma apenas em I�
 → Resposta: Alternativa D�
AlfaCon Concursos Públicos
Lei do Direito Autoral nº 9.610, de 19 de Fevereiro de 1998: Proíbe a reprodução total ou parcial desse material ou divulgação com 
fins comerciais ou não, em qualquer meio de comunicação, inclusive na Internet, sem autorização do AlfaCon Concursos Públicos.
7
 → Exemplo 02: O coeficiente de correlação linear entre as variáveis aleatórias x e y é igual a 0,99� A 
partir disso pode-se, corretamente, afirmar que:
a) a probabilidade de x e y serem iguais é 99%�
b) x explica y em 99% das ocorrências de y�
c) se o valor de x diminuir, em média, o valor de y aumenta�
d) se o valor de y diminuir, em média, o valor de x diminui�
e) a covariância entre x e y é exatamente igual a 0,01�
 → Solução:
O coeficiente de correlação linear (r=0,99) é um valor positivo e indica uma forte correlação, 
pois está próximo de 1� Então, na maior parte das vezes, as variáveis terão variações em um mesmo 
sentido, ou seja, quando uma variável aumenta de valor, a outra também aumenta, e quando uma 
variável diminui de valor, a outra também diminui�
 → Resposta: Alternativa D�
 → Exemplo 03: Uma variável aleatória bidimensional, (x, y), possui coeficiente de correlação igual a 
ρ = – 0,32� Desse modo, pode-se afirmar que à medida que:
a) x diminui, em média, y diminui�
b) x aumenta, em média, y diminui de 32%�
c) x aumenta em 32%, y diminui em 32%�
d) x diminui em 32%, y, em média, diminui em 32%�
e) x aumenta, em média, y diminui�
 → Solução:
O coeficiente de correlação linear (r=-0,32) é um valor negativo� Então, na maior parte das vezes, 
as variáveis terão variações em sentidos contrários, ou seja, quando uma variável aumenta de valor, a 
outra diminui, e quando uma variável diminui de valor, a outra aumenta�
 → Resposta: Alternativa E�
 → Exemplo 04: O coeficiente de correlação linear entre as séries de dados representadas pelos pares 
ordenados (1,2), (2,2), (3,1) e (4,1) tem como resultado provável o valor:
a) –0,894�
b) +0,894�
c) 1,345�
d) –1,345�
e) 2,546�
 → Solução:
O coeficiente de correlação é um valor no intervalo de – 1 a 1� Assim, podemos descartar as alternati-
vas C, D e E, sobrando apenas as alternativas A e B� A alternativa A traz um valor negativo e a alternativa 
B traz um valor positivo� Pela observação dos pares ordenados (x, y), podemos concluir sobre o comporta-
mento entre as duas variáveis� Para facilitar a análise, vamos construir o diagrama de dispersão:
AlfaCon Concursos Públicos
Lei do Direito Autoral nº 9.610, de 19 de Fevereiro de 1998: Proíbe a reprodução total ou parcial desse material ou divulgação com 
fins comerciais ou não, em qualquer meio de comunicação, inclusive na Internet, sem autorização do AlfaCon Concursos Públicos.
8
Observamos que a reta que se ajusta aos pontos (x, y) é uma reta decrescente� Desse modo, a cor-
relação é negativa�
 → Resposta: Alternativa A�
Propriedades da Correlação
Aprenderemos agora as propriedades da Correlação� Uma questão facílima, para quem conhece 
essas tais propriedades� E o bom de tudo é que podemos reuni-las em uma única frase:
A correlação não é influenciada nem por operações de soma, nem de subtração, nem de 
produto, e nem de divisão, exceto pelo sinal�
Como é isso?
Vamos ver, por meio de vários exemplos:
 → Exemplo 05: A correlação entre duas variáveis quaisquer x e y é igual a 0,8, ou seja, r(x,y)=0,8� 
Qual a correlação entre z e w, onde z=2x-3 e w=3y+5, ou seja, quanto será r(z,w)?
a) 0,6
b) 0,7
c) 0,8
d) – 0,8
e) 0,64
Solução:
Na correlação r(z, w), vamos substituir z por 2x-3 e w por 3y+5� Assim, fica a correlação:
r(2x-3, 3y+5)
Analisemos as operações que ocorreram com as variáveis x e y�
A variável x virou o quê? Virou 2x-3�
Quais as operações que ocorreram com o x? Ele foi multiplicado por 2, e depois, subtraído de 3� 
Produto ou subtração afetam a correlação? Não! Por último: o x mudou de sinal? Não!
Quais as operações que ocorreram com o y? Ele foi multiplicado por 3, e depois, somado a cinco� 
Produto e soma não influenciam a correlação! Por fim, o y não mudou de sinal�
Assim, desconsiderando as operações que não influenciam na Correlação, teremos que:
Viram? O que temos a fazer é apenas desconsiderar aquelas operações que não influenciam na 
correlação, e depois ver o que sobrou! Apenas fiquemos atentos, e muito, para verificar se o sinal das 
variáveis x e y vai mudar ou não! Mais um exemplo�
 → Exemplo 06: A correlação entre duas variáveis quaisquer x e y é igual a 0,8, ou seja, r(x,y)=0,8� 
Qual a correlação entre z e w, onde z=2x-3 e w=-3y+5, ou seja, quanto será r(z,w)?
a) 0,6
b) 0,7
c) 0,8
d) – 0,8
e) 0,64
AlfaCon Concursos Públicos
Lei do Direito Autoral nº 9.610, de 19 de Fevereiro de 1998: Proíbea reprodução total ou parcial desse material ou divulgação com 
fins comerciais ou não, em qualquer meio de comunicação, inclusive na Internet, sem autorização do AlfaCon Concursos Públicos.
9
 → Solução:
Novamente, teremos que desconsiderar aquelas operações que não alteram o valor da correlação� 
Fazendo isso, teremos:
Estão todos vendo que, ao cortar o 3 que está multiplicando com o y, restou um sinal de menos 
antes dele? Assim, teremos que:
r(2x-3, – 3y+5) = r(x, – y) = – r(x, y) = – 0,8
Ou seja: mudando o sinal de apenas uma das variáveis, muda também o sinal da correlação!
Novo exemplo�
 → Exemplo 07: A correlação entre duas variáveis quaisquer x e y é igual a 0,8, ou seja, r(x,y)=0,8� 
Qual a correlação entre z e w, onde z=-2x-3 e w=-3y+5, ou seja, quanto será r(z,w)?
a) 0,6
b) 0,7
c) 0,8
d) – 0,8
e) 0,64
 → Solução:
Fazendo os cortes devidos, de acordo com as propriedades da correlação, teremos:
Percebemos que, desta vez, modificaram-se os sinais das duas variáveis. Com isso, o sinal da 
correlação permanecerá inalterado!
Assim, teremos:
r(-2x-3, – 3y+5) = r(-x,-y) = r(x,y) = 0,8
Até aqui, o que temos sobre as propriedades é o seguinte: cortando-se as operações de soma, sub-
tração, produto e divisão, se o que restar forem apenas as duas variáveis���
 ˃ ��� com o mesmo sinal original: a correlação não se modifica;
 ˃ ��� e modificou-se o sinal de apenas uma delas: a correlação muda de sinal;
 ˃ ��� e modificaram-se os sinais das duas variáveis: a correlação não se modifica�
Assim, considerando as constantes positivas “a”, “b”, “c” e “d”, podemos escrever as seguintes 
relações:
r(ax±b, cy±d) = r(x, y)
r(ax±b, –cy±d) = r(x, –y) = –r(x, y)
r(–ax±b, cy±d) = r(–x, y) = –r(x, y)
r(–ax±b, –cy±d) = r(–x, –y) = r(x, y)
Mais algumas informações que precisamos conhecer:
1ª) A correlação entre x e x é igual a 1� Ou seja: r(x,x)=1�
Assim, fazendo uso das propriedades que já conhecemos:
AlfaCon Concursos Públicos
Lei do Direito Autoral nº 9.610, de 19 de Fevereiro de 1998: Proíbe a reprodução total ou parcial desse material ou divulgação com 
fins comerciais ou não, em qualquer meio de comunicação, inclusive na Internet, sem autorização do AlfaCon Concursos Públicos.
10
r(-x, x) = – 1
r(x, – x) = – 1
r(-x,-x) = 1
2ª) A correlação entre x e y é igual à correlação entre y e x� Ou seja:
r(x,y) = r(y,x)
 → Exemplo 08: O coeficiente de correlação entre duas variáveis Y e X é igual a +0,8� Considere, 
agora, a variável Z definida como: Z = 0,2 – 0,5X� O coeficiente de correlação entre as variáveis Z e 
X, e o coeficiente de correlação entre as variáveis Z e Y serão iguais, respectivamente, a:
a) – 1,0 e – 0,8
b) +1,0 e +0,8
c) – 0,5 e – 0,8
d) – 0,5 e +0,8
e) – 0,2 e – 0,4
 → Solução:
Vamos iniciar pelo cálculo da correlação: r(z, x) = ?
Substituindo z pela expressão equivalente na variável x, temos:
r(z, x) = r(0,2 – 0,5x, x)
Aplicando as propriedades da Correlação, teremos:
r(z, x) = r(0,2 – 0,5x, x) = r(–x, x) = –1
Agora a correlação r(z, y) = ?� Substituindo o z de novo, temos:
r(z, y) = r(0,2 – 0,5x, y)
Aplicando as propriedades da Correlação, temos:
r(z, y) = r(0,2 – 0,5x, y) = r(–x, y) = –r(x, y)
O enunciado forneceu: r(x, y) = 0,8, então:
r(z, y) = –r(x, y) = –0,8
 → Resposta: Alternativa A�
Fórmula da Correlação Linear
Como vimos anteriormente, o Coeficiente de Correlação Linear é dado pela fórmula:
YX SS
yxCovyxr
⋅
=
),(),(
No numerador temos a Covariância entre x e y, e no denominador temos o produto entre o 
desvio padrão de x e o de y� Portanto, se a questão fornecer os valores da covariância e do desvio 
padrão de x e de y, é só substituir na expressão acima para obtermos o valor do coeficiente de corre-
lação� Contudo, na maioria das vezes não é assim, por isso apresentarei abaixo as fórmulas da cova-
riância e do desvio padrão que poderão ser necessárias�
Assim como a variância, a covariância pode ser calculada por duas formas diferentes, mas que 
geram o mesmo resultado:
AlfaCon Concursos Públicos
Lei do Direito Autoral nº 9.610, de 19 de Fevereiro de 1998: Proíbe a reprodução total ou parcial desse material ou divulgação com 
fins comerciais ou não, em qualquer meio de comunicação, inclusive na Internet, sem autorização do AlfaCon Concursos Públicos.
11
Logo mais adiante mostraremos a semelhança entre a Covariância e a Variância, que nos ajuda a 
memorizar a primeira medida�
O desvio padrão já é conhecido por nós, mas vamos relembrar� Também apresentaremos as duas 
formas de calcular o desvio padrão:
Qual das duas fórmulas devemos utilizar? Se for calcular o coeficiente de correlação a partir dos 
pares (x,y) fornecidos na questão, então é melhor utilizar a segunda fórmula� Contudo, na maioria 
das questões de concurso, são fornecidos alguns valores para facilitar os cálculos e, dependendo 
do que for fornecido, optaremos pela primeira ou segunda fórmula, conforme veremos nos dois 
próximos exemplos�
Para ajudar a memorizar as fórmulas acima, observe a dica abaixo para a memorização da 
segunda fórmula, que de forma análoga também se aplica na memorização da primeira fórmula�
Observe o primeiro termo do denominador da segunda fórmula� É o seguinte:
É somente essa parcela que será preciso memorizar! Somente essa! E, para facilitar a memoriza-
ção, lembre-se da fórmula da variância� A parcela citada acima corresponde exatamente ao numera-
dor da fórmula da variância�
Convém que você a repita várias e várias vezes no papel, até que fique definitivamente memorizada�
Depois disso, lembraremos o seguinte: o denominador tem duas raízes quadradas� Dentro da 
primeira raiz, há o termo que já memorizamos� E, dentro da segunda raiz, o termo é praticamente 
igual ao primeiro, trocando-se apenas o x por y�
AlfaCon Concursos Públicos
Lei do Direito Autoral nº 9.610, de 19 de Fevereiro de 1998: Proíbe a reprodução total ou parcial desse material ou divulgação com 
fins comerciais ou não, em qualquer meio de comunicação, inclusive na Internet, sem autorização do AlfaCon Concursos Públicos.
12
Você há, portanto, de concordar comigo, que o denominador já está todo memorizado� Concorda?
Pois bem! Voltemos àquele termo que decoramos inicialmente�
Agora, vamos desenvolvê-lo� É muito fácil fazer isso� Todos concordam que xi
2=xi.xi?
E todos também concordam que: (Σxi)
2=(xi).(Σxi)?
Assim, podemos dizer que:
Tudo bem até aqui?
Pois bem! Observamos que o desenvolvimento acima resultou em duas parcelas, nas quais só 
aparece a variável x�
Para chegarmos ao numerador da fórmula, modificaremos ligeiramente o resultado deste de-
senvolvimento, de forma que tenhamos as duas variáveis x e y, e não apenas x� O segundo x de cada 
parcela será substituído pelo y:
Teremos: ( ) ( )
n
yx
yx iiii
∑∑∑
⋅
−⋅
Pronto! Chegamos ao numerador da fórmula� Agora, sim, conhecemos a fórmula inteira!
Com isso, estamos aptos, finalmente, a resolver mais este tipo de questão de correlação!
Vamos aproveitar esse momento para apresentar o Coeficiente de Determinação� Ele tem muito 
a ver com a correlação, mas é mais utilizado dentro do assunto de Análise da Regressão� Caso uma 
questão peça que se calcule o Coeficiente de Determinação, basta que se eleve ao quadrado o coefi-
ciente de correlação linear� Só isso� Teremos o seguinte:
 → Exemplo 09: Para 5 pares de observações das variáveis X e Y, obtiveram-se os seguintes resultados:
ΣX = ΣY = 15
ΣX2 = ΣY2 = 55
ΣXY = 39
Sabendo-se que esses 5 pares de observações constituem a totalidade da distribuição conjunta 
populacional dessas duas variáveis, o valor do coeficiente de correlação entre X e Y é igual a:
a) +1,000
b) +0,709
c) +0,390
d) – 0,975
e) – 0,600
AlfaCon Concursos Públicos
Lei do Direito Autoral nº 9.610, de 19 de Fevereiro de 1998: Proíbe a reprodução total ou parcial desse material ou divulgação com 
fins comerciais ou não, em qualquer meio de comunicação, inclusive na Internet, sem autorização do AlfaCon Concursos Públicos.
13
 → Solução:
Para utilizar os somatórios fornecidosno enunciado, adotaremos a seguinte fórmula da correlação:
Vamos lançar os valores dos somatórios na fórmula:
Verifica-se que os parênteses dentro das raízes são iguais, então a raiz some� Assim, temos:
 → Resposta: Alternativa E�
 → Exemplo 10: Para 5 pares de observações das variáveis X e Y, obtiveram-se os seguintes resultados:
∑ =−− ))(( YYXX ii 210
∑ =− 2)( XXi 360
∑ =− 2)( YYi 250
Sabendo-se que esses 5 pares de observações constituem a totalidade da distribuição conjunta 
populacional dessas duas variáveis, o valor do coeficiente de correlação entre X e Y é igual a:
a) +1,0
b) +0,7
c) +0,4
d) – 0,8
e) – 0,6
 → Solução:
Foram fornecidos três somatórios� Exatamente aqueles três somatórios que precisamos para 
aplicar a fórmula (I) da correlação!
Vamos substituir os valores dos somatórios na fórmula:
 → Resposta: Alternativa B�
AlfaCon Concursos Públicos
Lei do Direito Autoral nº 9.610, de 19 de Fevereiro de 1998: Proíbe a reprodução total ou parcial desse material ou divulgação com 
fins comerciais ou não, em qualquer meio de comunicação, inclusive na Internet, sem autorização do AlfaCon Concursos Públicos.
14
Exercícios Resolvidos Adicionais
01. Para uma amostra de dez casais residentes em um mesmo bairro, registraram-se os se-
guintes salários mensais (em salários mínimos):
Sabe-se que:
Assinale a opção cujo valor corresponda à correlação entre os salários dos homens e os 
salários das mulheres.
a) 0,72
b) 0,75
c) 0,68
d) 0,81
e) 0,78
 → Solução:
De acordo com os somatórios fornecidos, deve-se optar pela segunda fórmula da Correlação� 
Vamos substituir os valores fornecidos na questão nessa fórmula:
Resolvendo, temos:
AlfaCon Concursos Públicos
Lei do Direito Autoral nº 9.610, de 19 de Fevereiro de 1998: Proíbe a reprodução total ou parcial desse material ou divulgação com 
fins comerciais ou não, em qualquer meio de comunicação, inclusive na Internet, sem autorização do AlfaCon Concursos Públicos.
15
Neste ponto, temos que calcular a raiz quadrada de 45695� Vamos achá-la na base da tentativa:
1002 = 10�000 (< 45695)
2002 = 40�000 (< 45695)
2102 = 44�100 (< 45695)
2202 = 48�400 (> 45695)
Assim, a raiz quadrada de 45695 é um valor entre 210 e 220� Usaremos esses dois valores para 
encontrarmos o coeficiente de correlação (r):
 ˃ Usando o valor de 210 como raiz quadrada de 45695, teremos:
 ˃ Usando o valor de 220 como raiz quadrada de 45695, teremos:
A partir destes dois resultados, concluímos que o coeficiente de correlação linear está entre 0,73 
e 0,766, e, portanto, a alternativa correta só pode ser a alternativa B�
02. Calcular o coeficiente de correlação linear (r) entre as variáveis X e Y, usando os dados da 
tabela abaixo:
 → Solução:
No cálculo do coeficiente de correlação linear, devemos calcular, entre outros, os seguintes so-
matórios: Σx2, Σy2 e Σx�y� Se x e y possuírem valores grandes, os cálculos desses somatórios podem 
tomar muito tempo� Então, é aconselhável, antes de usar a fórmula, efetuar um tratamento dos 
valores de X e Y no sentido de reduzi-los� Para isso, usaremos a seguinte propriedade da correlação:
A correlação não é influenciada nem por operações de soma, nem de subtração, nem de 
produto, e nem de divisão, exceto pelo sinal�
Portanto, se subtrairmos as variáveis X e Y por uma constante, isto não alterará o valor de r� 
Faremos isso!
É sempre bom subtrair a variável por um valor intermediário constante na tabela, para que redu-
zamos bem os valores da variável�
O valor intermediário para X é a constante 6, e para Y podemos usar o 8 ou o 10� Optaremos por 
esse último, pois ele aparece mais vezes na tabela do Y�
Agora, subtrairemos a variável X por 6, e a variável Y por 10� Fazendo isso, teremos:
Acabamos de efetuar a subtração por uma constante, o próximo passo para a redução da variável 
é dividi-la por outra constante� Observe na tabela e verifique se é possível dividir as duas variáveis, 
ou apenas uma delas, por alguma constante (não necessariamente a mesma constante)� Constatamos 
que sim� Podemos dividir as variáveis X e Y pela mesma constante 2� Assim, teremos:
AlfaCon Concursos Públicos
Lei do Direito Autoral nº 9.610, de 19 de Fevereiro de 1998: Proíbe a reprodução total ou parcial desse material ou divulgação com 
fins comerciais ou não, em qualquer meio de comunicação, inclusive na Internet, sem autorização do AlfaCon Concursos Públicos.
16
Passemos agora à construção da tabela dos somatórios presentes na fórmula de correlação�
Devido à redução das variáveis X e Y, obtivemos somatórios com valores pequenos� Isso vai faci-
litar os cálculos quando da aplicação da fórmula�
Para obter o coeficiente de correlação linear entre X e Y, usaremos a seguinte fórmula:
Substituindo os valores dos somatórios na fórmula, teremos:
Caso essa questão tivesse pedido o Coeficiente de Determinação, então bastaria elevar ao 
quadrado o coeficiente de correlação linear� Como exemplo:
No final da resolução acima, tínhamos que , assim o coeficiente de determinação é igual a:
Verifica-se que quando se eleva ao quadrado o coeficiente de correlação, a raiz quadrada presente 
no denominador desaparece�

Outros materiais