Baixe o app para aproveitar ainda mais
Prévia do material em texto
Correlação entre duas variáveis. O Modelo de Regressão Linear Simples. O Modelo de Regressão Linear Múltipla. Aplicações. Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados por postos: O Coeficiente r de Spearman ◦ A correlação por postos de Spearman é uma técnica não- paramétrica para avaliar o grau de relacionamento entre observações emparelhadas de duas variáveis, quando os dados se dispõem em postos. ◦ Dados preferenciais são muito comuns em áreas como de teste de alimentos, eventos competitivos (concursos de beleza, exibições artísticas, competições atléticas) e estudos de atitudes. ◦ O objetivo do cálculo de um coeficiente de correlação nesses casos é determinar até que ponto dois conjuntos de postos concordam ou discordam. ◦ A técnica pode ser estendida também a outros tipos de mensuração, desde que possam ser convertidos em postos. Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados por postos: O Coeficiente r de Spearman ◦ Consideremos este exemplo simples: Dois provadores devem julgar 12 vinhos. ◦ Cada um atribuirá postos denotando a preferência, desde 1 (mais alta) até 12 (mais baixa). ◦ A Tabela ao lado apresenta os dados. ◦ Se os provadores estão essencialmente de acordo, é de se esperar que os postos por eles atribuídos aos vários tipos de vinho sejam aproximadamente os mesmos. Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados por postos: O Coeficiente r de Spearman ◦ Se estão em desacordo, haverá emparelhamento de postos altos e baixos. ◦ Uma medida do grau de concordância é o quadrado das diferenças entre os dois conjuntos de postos. ◦ Se a soma é pequena, isso sugere concordância; se for grande, indica discordância. Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados por postos: O Coeficiente r de Spearman ◦ O cálculo da correlação utiliza a fórmula a seguir: 𝑟𝑠𝑝 = 1 − 6 𝑑2 𝑛(𝑛2 − 1) ◦ onde n é o número de observações e 𝑑2 é a soma dos quadrados das diferenças entre os postos. ◦ O coeficiente de correlação por postos assim obtido chama-se “r de Spearman”. Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados por postos: O Coeficiente r de Spearman ◦ A Tabela ao lado dá os cálculos necessários. ◦ Note-se que a soma das diferenças é zero. ◦ Isto serve para conferência dos cálculos, embora não seja necessário na fórmula. Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados por postos: O Coeficiente r de Spearman ◦ O coeficiente de correlação por postos de Spearman pode variar de -1,00 a +1,00, tal como o r de Pearson. ◦ Assim, o valor de 0,86 calculado no exemplo anterior implica que os juízes são consistentes (concordantes) em seus julgamentos. ◦ Se o resultado tivesse sido -0,86, a implicação seria a de que os juízes foram discordantes em seus julgamentos. Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados por postos: O Coeficiente r de Spearman ◦ Quando rsp está próximo de 1,00, isto indica que os dois conjuntos de postos são muito semelhantes, enquanto que se rsp está próximo de -1,00, os conjuntos de postos são bastante diferentes. ◦ Se há acordo em alguns itens e discordância em outros, rsp fica próximo de 0, o que sugere ausência de relacionamento entre os dois conjuntos. Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados por postos: O Coeficiente r de Spearman ◦ Como os dados amostrais invariavelmente apresentam alguma diferença devodo ao acaso, há sempre a possibilidade de se obter o que se afigura um relacionamento, quando, de fato, tal não existe. ◦ Consequentemente, convém testar a significância de rsp, particularmente se o tamanho amostral é pequeno ou se o valor de rsp é pequeno. ◦ Para situações em que n é maior que 10, a hipótese nula H0: rsp = 0 pode ser testada pela fórmula a seguir, com n-2 graus de liberdade. Análise de Correlação e Regressão Linear Correlação entre duas variáveis Dados por postos: O Coeficiente r de Spearman ◦ Usando os cálculos precedentes, que deram rsp = +0,86, encontramos ◦ Como seria preciso usar o nível 0,001 para aceitar H0, parece seguro concluir que o valor +0,86 é significativo neste exemplo. Análise de Correlação e Regressão Linear Correlação múltipla ◦ Quando se usa mais de uma variável independente (ou preditora) numa análise de correlação, aplica-se o termo “análise de correlação múltipla”. ◦ Conquanto se aplique à correlação múltipla a mesma teoria básica da correlação simples, os cálculos são mais longos e a interpretação dos resultados mais complexa. ◦ Além disso, a inclusão de variáveis adicionais aumenta os dados necessários e pode aumentar substancialmente o custo do estudo. Análise de Correlação e Regressão Linear Correlação múltipla ◦ As principais razões para se passar da análise de uma variável para duas ou mais variáveis independentes são: (1) existe um relacionamento lógico e (2) uma única variável independente não dá coeficiente de correlação suficientemente alto para ser julgado satisfatório. ◦ Por exemplo, a capacidade de predizer o desempenho na universidade pode ser reforçada se as notas do vestibular são incluídas como terceira variável. ◦ A ideia será mais bem entendida quando trouxermos a análise de regressão. Análise de Correlação e Regressão Linear Correlação e causalidade ◦ Quando duas variáveis são correlacionadas, é possível predizer valores de uma delas com base no conhecimento da outra. ◦ Isso leva frequentemente à conclusão errônea de que uma variável é causa da outra. ◦ E isso é particularmente verdadeiro quando a variável “causal” precede a outra variável no tempo. ◦ Entretanto, o fato de haver um relacionamento matemático entre duas variáveis nada nos diz quanto a causa e efeito. Análise de Correlação e Regressão Linear Correlação e causalidade ◦ Logo, há três explanações possíveis para a obtenção de uma correlação: i) existe uma relação de causa e efeito; ii) ambas as variáveis se acham relacionadas com uma terceira; ou iii) a correlação é devida ao acaso. Análise de Correlação e Regressão Linear Correlação e causalidade ◦ A segunda possibilidade, o caso da “terceira variável”, é exemplificado pelas folhas que caem das árvores pouco antes de começar a nevar em muitas partes do norte dos EUA. ◦ Pode-se concluir que a queda das folhas tenha causado a queda de neve, ou ambas as ocorrências estão relacionadas com a mudança de estações? Análise de Correlação e Regressão Linear Correlação e causalidade ◦ Estatísticas têm demonstrado acentuada correlação entre o consumo de álcool e a elevação dos salários dos professores. ◦ É de concluir que os professores estejam consumindo seus aumentos de salários para “afogar as mágoas”, ou será mais lógico admitir que, à medida que aumenta o nível geral dos salários (inclusive dos professores), haja também um aumento do consumo de bens em geral, inclusive de bebidas? Análise de Correlação e Regressão Linear Correlação e causalidade ◦ Quanto à terceira possibilidade, há muitos exemplos interessantes de relacionamentos espúrios, ou sem sentido. ◦ Por exemplo, um estudo recenterevelou alta correlação entre o movimento de preços na Bolsa de Nova Iorque e a variação no comprimento de saias das mulheres. ◦ Outro estudo revelou correlação entre os nascimentos na Inglaterra e a produção de ferro gusa nos Estados Unidos. Análise de Correlação e Regressão Linear Correlação e causalidade ◦ Por fim, é importante ressaltar que, para estabelecer relações válidas, é preciso mais que simplesmente emparelhar qualquer tipo de dados até achar alguma correlação. ◦ Assim, resultados que parecem promissores com base na lógica ou na teoria devem ser submetidos a maior análise (tal como experimentos controlados) para determinar se existe uma relação de causa e efeito. Análise de Correlação e Regressão Linear Correlação e causalidade ◦ O verdadeiro perigo na utilização de relações para fins preditivos que não tenham sido validadas em termos de causa e efeito é que as “relações” podem se modificar, ou que modificações deliberadas na variável “causal” possam não conduzir às modificações esperadas na variável “efeito”. Análise de Correlação e Regressão Linear Correlação entre duas variáveis Lista de exercícios 4ª lista de exercícios: 2ª bateria. ◦ Pag. 384/385, exercícios 03, 04 e 05.
Compartilhar