Baixe o app para aproveitar ainda mais
Prévia do material em texto
Aula 9: Correlação e Regressão Linear Um exemplo interessante é separar as notas das provas dos alunos de uma mesma turma da faculdade A. vejamos duas disciplinas da área de Exatas, como por exemplo, Matemática e Estatística. Separando uma amostra de notas de 10 alunos escolhidos aleatoriamente, teremos: Para esboçar um diagrama de dispersão, primeiro traça-se o sistema de eixos cartesianos ortogonais. Depois, representa-se uma das variáveis no eixo “x” (horizontal) e outra no eixo “y”(vertical). Colocam-se, então os valores das variáveis sobre os respectivos eixos e marca-se um ponto para cada par de valores. Representemos, em um sistema cartesiano coordenado ortogonal, os pares ordenados (x,y). Como resultado, obtemos uma nuvem de pontos que denominamos diagrama de dispersão. Esse diagrama nos fornece uma ideia grosseira, porém útil da correlação existente entre as variáveis De um modo geral, os pontos de uma análise estatística colocados no gráfico cartesiano possuem a forma aproximada de uma elipse em diagonal. Logo, quanto mais fina for essa elipse, mais ela se aproximará de uma reta. Essa reta pode ser chamada de “imagem” da correlação. A correlação linear é a aproximação dessa elipse em uma reta que mais se aproxime da maioria dos pontos dados. No exemplo ao lado, a “imagem” é uma reta crescente, então é denominada correlação linear positiva. Podemos concluir que: Se a correlação entre duas variáveis é perfeita e positiva, então r = +1 Se a correlação entre duas variáveis é perfeita e negativa, então r = -1 Se não há correlação entre as variáveis, então r = 0; O COEFICIENTE DE CORRELAÇÃO Apesar do diagrama de dispersão nos fornecer uma idéia do tipo e extensão do relacionamento entre duas variáveis X e Y, seria altamente desejável ter um número que medisse esta relação. Esta medida existe e é denominada de coeficiente de correlação. Quando se está trabalhando com amostras o coeficiente de correlação é indicado pela letra r que é, por sua vez, uma estimativa do coeficiente de correlação populacional: ρ (rho). O coeficiente de correlação pode variar de –1,00 a + 1,00, com um coeficiente de +1, indicando uma correlação linear positiva perfeita. Neste caso, as duas variáveis serão exatamente iguais em termos de escores padronizados z, isto é, um elemento apresentando um escore padronizado de 1,5 em uma das variáveis vai apresentar o mesmo escore padronizado na outra variável. Um coeficiente de correlação de –1, indica correlação linear perfeita negativa, com os escores padronizados exatamente iguais em valores absolutos, diferindo apenas no sinal. Uma correlação de +1 ou –1 é raramente observado. O mais comum é que o coeficiente fique situado no intervalo entre estes dois valores. Um coeficiente de correlação “0”, significa que não existe um relacionamento linear entre as duas variáveis.
Compartilhar