Buscar

Aula 14 - Análise de Correlação e Regressão Linear II

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 21 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 21 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 21 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

 Correlação entre duas variáveis. 
 
 O Modelo de Regressão Linear Simples. 
 
 O Modelo de Regressão Linear Múltipla. 
 
 Aplicações. 
 
 
 
 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
Dados por postos: O Coeficiente r de Spearman 
 
◦ A correlação por postos de Spearman é uma técnica não-
paramétrica para avaliar o grau de relacionamento entre 
observações emparelhadas de duas variáveis, quando os 
dados se dispõem em postos. 
 
◦ Dados preferenciais são muito comuns em áreas como de 
teste de alimentos, eventos competitivos (concursos de 
beleza, exibições artísticas, competições atléticas) e 
estudos de atitudes. 
 
◦ O objetivo do cálculo de um coeficiente de correlação 
nesses casos é determinar até que ponto dois conjuntos de 
postos concordam ou discordam. 
 
◦ A técnica pode ser estendida também a outros tipos de 
mensuração, desde que possam ser convertidos em postos. 
 
 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
Dados por postos: O Coeficiente r de Spearman 
 
◦ Consideremos este exemplo simples: 
Dois provadores devem julgar 12 
vinhos. 
 
◦ Cada um atribuirá postos denotando 
a preferência, desde 1 (mais alta) até 
12 (mais baixa). 
 
◦ A Tabela ao lado apresenta os dados. 
 
◦ Se os provadores estão 
essencialmente de acordo, é de se 
esperar que os postos por eles 
atribuídos aos vários tipos de vinho 
sejam aproximadamente os mesmos. 
 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
Dados por postos: O Coeficiente r de Spearman 
 
 
◦ Se estão em desacordo, haverá 
emparelhamento de postos altos 
e baixos. 
 
◦ Uma medida do grau de 
concordância é o quadrado das 
diferenças entre os dois 
conjuntos de postos. 
 
◦ Se a soma é pequena, isso 
sugere concordância; se for 
grande, indica discordância. 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
Dados por postos: O Coeficiente r de Spearman 
 
◦ O cálculo da correlação utiliza a fórmula a seguir: 
 
𝑟𝑠𝑝 = 1 −
6 𝑑2
𝑛(𝑛2 − 1)
 
 
◦ onde n é o número de observações e 𝑑2 é a soma dos 
quadrados das diferenças entre os postos. 
 
◦ O coeficiente de correlação por postos assim obtido 
chama-se “r de Spearman”. 
 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
Dados por postos: O Coeficiente r de Spearman 
 
 
◦ A Tabela ao lado dá 
os cálculos 
necessários. 
 
◦ Note-se que a soma 
das diferenças é zero. 
 
◦ Isto serve para 
conferência dos 
cálculos, embora não 
seja necessário na 
fórmula. 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
Dados por postos: O Coeficiente r de Spearman 
 
◦ O coeficiente de correlação por postos de Spearman 
pode variar de -1,00 a +1,00, tal como o r de Pearson. 
 
◦ Assim, o valor de 0,86 calculado no exemplo anterior 
implica que os juízes são consistentes (concordantes) 
em seus julgamentos. 
 
◦ Se o resultado tivesse sido -0,86, a implicação seria a de 
que os juízes foram discordantes em seus julgamentos. 
 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
Dados por postos: O Coeficiente r de Spearman 
 
◦ Quando rsp está próximo de 1,00, isto indica que os dois 
conjuntos de postos são muito semelhantes, enquanto 
que se rsp está próximo de -1,00, os conjuntos de 
postos são bastante diferentes. 
 
◦ Se há acordo em alguns itens e discordância em outros, 
rsp fica próximo de 0, o que sugere ausência de 
relacionamento entre os dois conjuntos. 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
Dados por postos: O Coeficiente r de Spearman 
 
◦ Como os dados amostrais invariavelmente apresentam 
alguma diferença devodo ao acaso, há sempre a 
possibilidade de se obter o que se afigura um 
relacionamento, quando, de fato, tal não existe. 
 
◦ Consequentemente, convém testar a significância de rsp, 
particularmente se o tamanho amostral é pequeno ou se 
o valor de rsp é pequeno. 
 
◦ Para situações em que n é maior que 10, a hipótese nula 
H0: rsp = 0 pode ser testada pela fórmula a seguir, com 
n-2 graus de liberdade. 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
Dados por postos: O Coeficiente r de Spearman 
 
◦ Usando os cálculos precedentes, que deram rsp = +0,86, 
encontramos 
 
 
 
 
 
◦ Como seria preciso usar o nível 0,001 para aceitar H0, 
parece seguro concluir que o valor +0,86 é significativo 
neste exemplo. 
Análise de Correlação e Regressão Linear 
Correlação múltipla 
 
◦ Quando se usa mais de uma variável independente (ou 
preditora) numa análise de correlação, aplica-se o termo 
“análise de correlação múltipla”. 
 
◦ Conquanto se aplique à correlação múltipla a mesma 
teoria básica da correlação simples, os cálculos são mais 
longos e a interpretação dos resultados mais complexa. 
 
◦ Além disso, a inclusão de variáveis adicionais aumenta 
os dados necessários e pode aumentar substancialmente 
o custo do estudo. 
Análise de Correlação e Regressão Linear 
Correlação múltipla 
 
◦ As principais razões para se passar da análise de uma 
variável para duas ou mais variáveis independentes são: 
 
 (1) existe um relacionamento lógico e 
 
 (2) uma única variável independente não dá coeficiente de 
correlação suficientemente alto para ser julgado satisfatório. 
 
◦ Por exemplo, a capacidade de predizer o desempenho 
na universidade pode ser reforçada se as notas do 
vestibular são incluídas como terceira variável. 
 
◦ A ideia será mais bem entendida quando trouxermos a 
análise de regressão. 
Análise de Correlação e Regressão Linear 
Correlação e causalidade 
 
◦ Quando duas variáveis são correlacionadas, é possível 
predizer valores de uma delas com base no 
conhecimento da outra. 
 
◦ Isso leva frequentemente à conclusão errônea de que 
uma variável é causa da outra. 
 
◦ E isso é particularmente verdadeiro quando a variável 
“causal” precede a outra variável no tempo. 
 
◦ Entretanto, o fato de haver um relacionamento 
matemático entre duas variáveis nada nos diz quanto a 
causa e efeito. 
 
Análise de Correlação e Regressão Linear 
Correlação e causalidade 
 
◦ Logo, há três explanações possíveis para a obtenção de 
uma correlação: 
 
 i) existe uma relação de causa e efeito; 
 
 ii) ambas as variáveis se acham relacionadas com uma 
terceira; ou 
 
 iii) a correlação é devida ao acaso. 
Análise de Correlação e Regressão Linear 
Correlação e causalidade 
 
◦ A segunda possibilidade, o caso da “terceira variável”, é 
exemplificado pelas folhas que caem das árvores pouco 
antes de começar a nevar em muitas partes do norte dos 
EUA. 
 
◦ Pode-se concluir que a queda das folhas tenha causado 
a queda de neve, ou ambas as ocorrências estão 
relacionadas com a mudança de estações? 
 
Análise de Correlação e Regressão Linear 
Correlação e causalidade 
 
◦ Estatísticas têm demonstrado acentuada correlação entre 
o consumo de álcool e a elevação dos salários dos 
professores. 
 
◦ É de concluir que os professores estejam consumindo 
seus aumentos de salários para “afogar as mágoas”, ou 
será mais lógico admitir que, à medida que aumenta o 
nível geral dos salários (inclusive dos professores), haja 
também um aumento do consumo de bens em geral, 
inclusive de bebidas? 
Análise de Correlação e Regressão Linear 
Correlação e causalidade 
 
◦ Quanto à terceira possibilidade, há muitos exemplos 
interessantes de relacionamentos espúrios, ou sem 
sentido. 
 
◦ Por exemplo, um estudo recenterevelou alta correlação 
entre o movimento de preços na Bolsa de Nova Iorque e 
a variação no comprimento de saias das mulheres. 
 
◦ Outro estudo revelou correlação entre os nascimentos 
na Inglaterra e a produção de ferro gusa nos Estados 
Unidos. 
Análise de Correlação e Regressão Linear 
Correlação e causalidade 
 
◦ Por fim, é importante ressaltar que, para estabelecer 
relações válidas, é preciso mais que simplesmente 
emparelhar qualquer tipo de dados até achar alguma 
correlação. 
 
◦ Assim, resultados que parecem promissores com base 
na lógica ou na teoria devem ser submetidos a maior 
análise (tal como experimentos controlados) para 
determinar se existe uma relação de causa e efeito. 
 
Análise de Correlação e Regressão Linear 
Correlação e causalidade 
 
◦ O verdadeiro perigo na utilização de relações para fins 
preditivos que não tenham sido validadas em termos de 
causa e efeito é que as “relações” podem se modificar, 
ou que modificações deliberadas na variável “causal” 
possam não conduzir às modificações esperadas na 
variável “efeito”. 
Análise de Correlação e Regressão Linear 
Correlação entre duas variáveis 
Lista de exercícios 
 
 
 4ª lista de exercícios: 2ª bateria. 
 
◦ Pag. 384/385, exercícios 03, 04 e 05.

Continue navegando