Buscar

AULA 6 Correlação

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 14 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 14 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 14 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

20/06/2022 13:07 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 1/14
 
 
 
 
 
 
 
 
 
 
 
 
ESTATÍSTICA APLICADA
AULA 6
 
 
 
 
 
 
 
 
 
Prof. Tiago Claudino Barbosa
20/06/2022 13:07 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 2/14
CONVERSA INICIAL
As aulas anteriores focaram quase que exclusivamente na análise de uma variável X; porém, na
economia, é mais comum o foco da análise ser na relação entre duas ou mais variáveis. Nesta aula,
abordaremos as noções de conjuntos de dados pareados e de análise de correlação. Esses conceitos
são fundamentais para a preparação para nossa futura aula de econometria, que possui como objeto
fundamental a modelagem da relação entre variáveis econômicas e do contexto social. Nesse
sentido, nossos esforços de aprendizado nesta aula são no sentido de entender:
a. o que são conjuntos de dados bivariados;
b. o que é correlação;
c. como calcular e interpretar o coeficiente de correlação;
d. o que correlações dizem sobre o mundo real e a relação entre variáveis.
CONTEXTUALIZANDO
Quão forte é a ligação entre variáveis como o preço de uma ação X e o preço de outra ação Y? E
a ligação entre anos de estudo e renda futura? Entre uma queda na taxa básica de juros e a taxa de
crescimento econômico posterior? A força dessas relações pode ser estimada mediante análise de
correlação entre duas variáveis. Há formas mais complexas e detalhadas de se analisar essas relações,
como por meio da análise de regressão; contudo, esse assunto será abordado na aula de
econometria. Como sempre foi enfatizado, o objetivo é o entendimento dos conceitos, de sua
aplicação e interpretação dos resultados, não a realização de cálculos, hoje facilmente realizáveis com
uso de softwares estatísticos.
TEMA 1 – ESTATÍSTICA BIVARIADA
As aulas anteriores se concentraram na descrição e na realização de inferências sobre uma
variável X, a chamada estatística univariada. Suas aplicações na economia são diversas; contudo,
muitas vezes nosso interesse não está em conhecer as propriedades de uma variável sozinha, mas em
20/06/2022 13:07 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 3/14
saber qual a relação entre variáveis e como prever o comportamento de uma variável com base no
comportamento de outras variáveis relacionadas, a chamada estatística bivariada, que trata da
relação ou comparação entre duas variáveis. Por fim, há o que designamos estatística multivariada,
que ocorre quando o número de variáveis comparadas for três ou mais.
As estatísticas bi e multivariada formam a base da Econometria, disciplina a ser ensinada no
último ano do nosso curso e que representa uma combinação da estatística, da teoria econômica e
da matemática aplicada à modelagem econômica. As técnicas da estatística univariada ensinadas nas
aulas anteriores serão úteis, para nós, tanto nas aplicações que envolvam somente uma variável,
como num melhor entendimento de problemas que necessitem da estatística bi e/ou multivariada.
Nossa aula vai apresentar alguns conceitos básicos da estatística bivariada e uma de suas
principais técnicas, a análise de correlação. Nosso objetivo é iniciar o estudo da força e do sentido da
relação entre duas variáveis, que será aprofundado na disciplina de Econometria.    Antes de
iniciarmos o estudo da análise de correlação, alguns conceitos iniciais da estatística bivariada devem
ser apresentados.
Em um conjunto de n pares de dados (Xi, Yi), cada valor de Xi está ligado a um valor de
específico de Yi (Hoffman, 2006). A relação entre a variável X e a variável Y pode ser forte, fraca ou
inexistente; assim como positiva – quando, conforme o valor de X aumenta, o de Y aumenta também
– ou negativa, quando ocorre o contrário. Uma das formas de se visualizar a relação entre duas
variáveis é se construindo um diagrama de dispersão, que é um gráfico que contém um eixo X
horizontal e outro eixo Y vertical, em um plano cartesiano e no qual se coloca o par ordenado de
dados (Xi, Yi) como pontos, no eixo. O Gráfico 1 é um exemplo de um diagrama de dispersão das
variáveis X e Y, cujos dados são fictícios.
Gráfico 1 – Diagrama de dispersão dos dados fictícios X e Y
20/06/2022 13:07 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 4/14
Nota-se que, conforme o valor de X aumenta, o de Y tende a aumentar também, indicando uma
relação positiva entre X e Y. O próximo tópico define melhor o que é correlação.
TEMA 2 – COEFICIENTE DE CORRELAÇÃO
Uma correlação existe entre duas variáveis quando uma delas está relacionada à outra em
termos numéricos (Triola, 2006). Há diversas formas de se analisar a associação entre variáveis, e as
mais comuns são a análise de correlação e a análise de regressão (esta última a ser ensinada na nossa
futura disciplina de Econometria).
A correlação mede a força e a direção de relações entre duas variáveis. Sua forma mais comum é
o coeficiente de correlação de Pearson, que mede a relação linear entre X e Y. Relações lineares são
como retas no plano cartesiano; relações no mundo real muito raramente são perfeitamente lineares,
mas muitas se aproximam de um padrão assim. Os Gráficos 2 e 3 mostram, respectivamente,
situações em que a relação entre as variáveis são lineares e situações em que há uma relação entre as
variáveis, mas ela não é linear.
Gráfico 2 – Exemplo de uma relação linear entre X e Y
20/06/2022 13:07 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 5/14
Gráfico 3 – Exemplo de uma relação não linear entre X e Y
Há outros tipos de relação entre variáveis que não são lineares, logo não são bem capturadas
por esse coeficiente.
Para cada unidade amostral, se coleta um par de dados sobre duas variáveis de que se deseja
conhecer a relação. Se há alguma relação entre as variáveis, um padrão emerge e uma direção da
relação pode ser notada (Triola, 2006). O coeficiente de correlação linear r mede a força da relação
linear entre dados pareados das variáveis X e Y, em uma amostra:
20/06/2022 13:07 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 6/14
 .
Valor de r próximo a zero indica que não há correlação linear entre X e Y: quanto mais próximo,
esse valor, de 1 ou -1, mais forte a correlação. Valores positivos do coeficiente r indicam uma relação
positiva entre as variáveis: o aumento de uma das variáveis é, em geral, acompanhado por um
aumento na outra variável. Já valores negativos de r indicam variáveis que caminham em direções
opostas: o aumento de uma é, em geral, acompanhado por queda na outra variável.
O coeficiente linear de correlação r tem seu valor entre -1 e 1, e o valor do coeficiente não muda
se todos os valores de uma das variáveis são convertidos para uma escala diferente. O valor é o
mesmo: não importando qual variável é X ou Y, o coeficiente mede a força de relações lineares, não
relações que sejam não lineares (Triola, 2006). Contudo, correlação não implica relação de
causalidade entre as variáveis analisadas, como será visto mais à frente.
TEMA 3 – EXEMPLOS DE CORRELAÇÃO
É fácil notar, visualmente, a força e a direção da correlação entre duas variáveis com base na
construção de diagramas de dispersão (scatterplots). Os cinco gráficos a seguir (Gráficos 4-8) retratam
os diferentes tipos de correlação e seu padrão visual, com emprego de dados fictícios.
Gráfico 4 – Correlação positiva e forte: valor de r próximo a 1
20/06/2022 13:07 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 7/14
Gráfico 5 – Correlação positiva e relativamente fraca: valor de r próximo a 0,5
Gráfico 6 – Correlação negativa e forte: valor de r próximo a -1
20/06/2022 13:07 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 8/14
Gráfico 7 – Correlação negativa e relativamente fraca: valor de r próximo a -0,5
Gráfico 8 – Correlação fraca: valor de r próximo a zero
20/06/2022 13:07 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 9/14
Quanto mais próximos de uma linha os pontos, mais forte a correlação. Correlações muito fracas
parecemmais uma nuvem de pontos dispersos no plano cartesiano, como mostra o Gráfico 8. O
Quadro 1 ilustra alguns exemplos de correlações positivas e negativas esperadas entre variáveis
econômicas e sociais, de acordo com as teorias mais comuns.
Quadro 1 – Correlações esperadas entre algumas variáveis econômicas e sociais
Variáveis econômicas e sociais com correlação positiva
esperada
Variáveis econômicas e sociais com correlação negativa
esperada
Produto interno bruto (PIB) per capita e número médio de
anos de escolaridade
Preço de um produto e quantidade/demanda do mesmo
produto
PIB per capita e expectativa de vida ao nascer Taxa de crescimento econômico e taxa de desemprego
Renda dos consumidores e gastos com consumo PIB per capita e taxa de analfabetismo
TEMA 4 – TESTE DE HIPÓTESE DE CORRELAÇÃO
Muitas vezes, o conjunto de pares de dados utilizados na análise de regressão provém de uma
amostra. É possível testar a hipótese de significância do coeficiente de correlação de Pearson entre as
duas variáveis, em termos populacionais, com base nos dados amostrais.
O parâmetro ρ (rô) é o coeficiente de correlação populacional entre X e Y, um valor fixo e muitas
vezes desconhecido. A partir da coleta de uma amostra aleatória de pares de dados, calcula-se o
20/06/2022 13:07 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 10/14
coeficiente de correlação de Pearson amostral r (Hoffman, 2006). O teste de hipótese fica assim: Ho –
ρ = 0, ou seja, não há relação positiva ou negativa significativa entre X e Y; se Ho – ρ ≠ 0, com ou ρ >
0 ou ρ < 0, há uma relação entre X e Y que é significativamente diferente de zero. Pode-se postular
que a relação é diferente de zero e que ela pode ser tanto positiva quanto negativa; ou se pode
afirmar que a relação é positiva ou negativa.
O procedimento para o teste da força do coeficiente de correlação ρ abrange:
a. determine o número de pares de dados na amostra;
b. especifique um nível de significância;
c. identifique o valor crítico correspondente (uni ou bicaudal);
d. determine se | r |> valor crítico; se sim, correlação é estatisticamente significante; caso contrário,
correlação amostral não é significante;
e. interprete o resultado conforme afirmação original.
Em geral, a hipótese nula é formulada como se ρ = 0, ou seja, não há correlação entre as
variáveis populacionais e a hipótese alternativa bicaudal ou unicaudal ρ ≠ 0 ou ρ ≥ 0 ou ρ ≤ 0. Testa-
se, pelo cálculo de t, se a correlação entre duas variáveis for significante:
 .
Segue-se uma distribuição t, com n-2 graus de liberdade. Se o valor em módulo de r for maior
que o valor crítico identificado, rejeita-se a hipótese nula, ou seja, a evidência da amostra corrobora a
hipótese alternativa de que há, sim, uma relação entre X e Y, e o sinal do coeficiente de correlação vai
indicar se a relação é positiva ou negativa.
TEMA 5 – CORRELAÇÃO E CAUSALIDADE
A análise de correlação ajuda a estimar a direção e a força da relação linear entre duas variáveis;
contudo, ela não nos diz se há alguma relação de causa e efeito entre as variáveis analisadas.
Relações de causa e efeito geralmente provêm de teorias de fora da estatística, como a teoria
20/06/2022 13:07 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 11/14
econômica. A estatística serve para testar essa teoria e para estimar relações na prática, mas não diz
nada sobre mecanismos causais. A interpretação dos resultados da análise de correlação deve ser
feita à luz dessas teorias externas à estatística.
Há três possibilidades quanto a relações de causa e efeito, em casos que os coeficientes de
correlação são elevados:
1. Há uma relação direta de causa e efeito real entre X e Y, e essa conclusão geralmente requer o
apoio de uma teoria desenvolvida em outras áreas da ciência. Porém, a correlação em si não diz
qual variável causa qual, o que exige, novamente, que se recorra a teorias externas à estatística.
Por exemplo, se a análise de correlação da taxa de crescimento econômico de alguns países se
correlacionar, de forma forte, com a taxa de aumento no consumo, pode-se dizer que há uma
relação entre aumentos na renda das famílias e aumentos no nível de consumo. E é a teoria
econômica que fundamenta esse mecanismo causal e diz qual variável afetou qual.
2. Há uma relação indireta entre as variáveis, que não é causal em si. Nesses casos, há fatores
externos anteriores que alteraram ambas as variáveis, fazendo com que a correlação fosse forte,
porém sem ligação direta através de algum mecanismo causal. Novamente, as teorias nos
dizem qual a ordem de causalidade. Um exemplo: suponha que haja uma correlação entre o
número de pessoas que usam cachecóis e o número de pessoas gripadas – o uso de cachecóis
causou um aumento nos casos de gripe ou vice-versa? Na verdade, nenhuma das duas
hipóteses são verdadeiras! um terceiro fator externo ocasionou o aumento simultâneo das duas
variáveis, no caso a temperatura fria, que fez as pessoas usarem cachecol mais frequentemente
e aumentou a transmissão da gripe. Por sinal, o frio, em si, não causa a gripe, mas tende a
aumentar sua incidência, por uma variedade de fatores.
3. Houve uma coincidência: apesar de o coeficiente de correlação ser alto, as duas variáveis não
têm ligação nenhuma, seja direta, seja indireta. Um exemplo disso é a correlação positiva e
muito forte (r > 0,99) entre o consumo de queijo muçarela, per capita, nos EUA, e o número de
doutorados concluídos no país em engenharia civil entre 2000 a 2009 (Vigen, 2015). Não há
nenhuma teoria que indique que ambas as variáveis possuem algum tipo de relação, nem o
senso comum assim o diz. Logo, essa correlação, apesar de ser bem forte, é uma coincidência e
não diz nada sobre a existência de alguma relação entre essas variáveis.
Muitos enganos são feitos ao se confundir os conceitos de correlação e causalidade, seja direta,
seja indireta. Para os economistas, as teorias econômicas fornecem a base para o entendimento das
20/06/2022 13:07 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 12/14
relações entre as variáveis econômicas e do contexto.
TROCANDO IDEIAS
Em um fórum on-line, pense e descreva situações em que há correlação entre variáveis. Há
algum suporte teórico, nelas, que diga qual variável causa qual e se há fatores externos que
interferem na relação descrita?
NA PRÁTICA
A proposta é acessar o software estatístico Statdisk Online (2004-2021) e calcular o coeficiente
de correlação entre duas variáveis (Tabela 1):
1. o PIB per capita, em 2010, de 15 países de diferentes regiões e níveis de desenvolvimento do
mundo, com base em dólares de 2011;
2. a média de anos de estudo de pessoas com 15 anos ou mais, em 2010, nesses mesmos países.
Tabela 1 – PIB per capita em 2010 (em dólares de 2011) e média de anos de estudo de pessoas
com 15 anos ou mais nos países pesquisados
PAÍS PIB PER CAPITA 2010 – US$ (2011) MÉDIA DE ANOS DE ESTUDO (15 anos ou mais)
África do Sul 11.389 9,89
Albânia 9.545 10,44
Argentina 15.842 9,71
Austrália 44.855 11,69
Bélgica 38.178 11,29
Brasil 13.541 8,17
Camarões 2.685 6,41
Chile 18.093 10,35
China 9.337 8,25
El Salvador 6.097 8,06
20/06/2022 13:07 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 13/14
Haiti 1.650 5,17
Holanda 44.004 11,71
Irã 17.328 9,15
Malásia 17.913 10,89
Marrocos 6.422 5,27
Fonte: Adaptado de Correlacion, [201-].
Os passos para a realização da atividade são:
a. acesse o site do Statdisk Online (2004-2021) em: <https://www.statdisk.com/accounts/login/?ne
xt=/>;
b. entre em sua conta;
c. o programa vai abrir sua página inicial com uma planilha vazia;
d. copie e cole as três colunas de dados da Tabela 1, não copie a primeira linha com o título – país,
PIB per capita 2010 (US$ 2011) e média de anos de estudo (15 anos ou mais);
e. após colar, clique em Analysis e na opção Correlation and Regression;
f. na caixa Significance, coloque 0,05; na caixa rolante X Variable Column, coloque 2; e, na Y
Variable Column,coloque 3;
g. clique em Evaluate – o valor do coeficiente de correlação é o quarto resultado: Correlation coeff.
r;
h. identifique o valor do coeficiente e interprete seus resultados: qual a força e a direção da
relação entre as variáveis;
i. analise se, na sua opinião, a relação entre as duas variáveis é causal ou não; se for causal, qual a
causa e qual o efeito – saiba que a relação entre escolaridade e nível de riqueza de um país é
um assunto polêmico na economia; há relações óbvias, porém a causalidade pode vir de ambos
os lados, ou seja, um aumento na renda permite às pessoas estudarem mais e, ao mesmo
tempo, um aumento no tempo que as pessoas estudam está associado a um aumento de sua
produtividade; logo, aumentos na escolarização de uma população estão associados ao
crescimento econômico.
FINALIZANDO
https://www.statdisk.com/accounts/login/?next=/
20/06/2022 13:07 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 14/14
Nossa aula nos introduziu a estatística bivariada e a importância da análise das relações entre
variáveis, para os economistas. Esses tópicos serão mais bem explorados na disciplina de
Econometria, no futuro. O importante a ter em mente é que cálculos estatísticos, hoje, são facilmente
realizados com uso de softwares, e o fundamental, para a estatística atual, é entender os conceitos,
seu modo de aplicação e como interpretar os resultados obtidos.
REFERÊNCIAS
CORRELATION between mean Years of schooling and GDP per capita, 2010. Our World in Data,
[201-]. Disponível em: <https://ourworldindata.org/grapher/correlation-between-mean-years-of-
schooling-and-gdp-per-capita>. Acesso em: 1 nov. 2021.
HOFFMAN, R. Correlação e regressão. In: _____. Estatística para economistas. 4. ed. São Paulo:
Cengage Learning, 2006. p. 279-308.
STATDISK ONLINE. [S.l.]: Triola Stats, 2004-2021. Disponível em:
<https://www.statdisk.com/accounts/login/?next=/>. Acesso em: 1 nov. 2021.
TRIOLA, M. F. Correlação e regressão. In: _____. Estatística elementar. 10. ed. Boston: Pearson
Prentice Hall, 2006. p. 514-587.
VIGEN, T. Spurious Correlations. Nova York: Hachette Books, 2015.

Outros materiais