Prévia do material em texto
Estatística Inferencial Prof. Me. em Educação Brasileira – UFC Linha de Avaliação e Pesquisa Correlação e Regressão Descrever a distribuição de valores de uma única variável: Medidas de tendência central e variabilidade; Quando trabalhamos com duas ou mais variáveis, surge um novo problema: as relações que possam existir entre as duas variáveis; Vejamos alguns casos: peso e altura de um grupo de pessoas, uso de cigarro e incidência de câncer de pulmão, vocabulário e compreensão de leitura, etc.; Procura-se verificar se existe alguma relação entre as variáveis de cada um dos pares e qual o grau dessa relação; Para isso é necessário o conhecimento de novas medidas. Correlação e Regressão – Cont. Se investigamos a existência de uma possível relação entre variáveis quantitativas, a correlação é o instrumento adequado para descobrir e medir esta relação; Se a relação existir, procuramos descrevê-la através de uma função matemática; A regressão é, portanto, o instrumento apropriado para a determinação dos parâmetros dessa função; Quando essa relação é estudada somente entre duas variáveis, chama-se de correlação simples. Correlação Relação Funcional e Relação Estatística Como sabemos, o perímetro e o lado de um quadrado estão relacionados. A relação que os liga é perfeitamente definida e pode ser expressa por meio de uma sentença: 2p = 4l, onde 2p=perímetro e l é o lado. Atribuindo-se um determinado valor a l, consegue-se calcular o exatamente valor do perímetro da figura. Considere agora a relação entre o peso e altura de pessoas. É evidente que essa relação não é, nem de longe, parecida com a anterior, pois é bem menos precisa. Pode acontecer que a estaturas diferentes correspondam pesos iguais ou que a estaturas iguais correspondam pesos diferentes. Contudo, em média, quanto maior a estatura, maior o peso. Correlação – Cont. Assim, podemos dizer que: Relações do tipo perímetro lado são definidas como relações funcionais, enquanto que as do tipo peso e estatura são conhecidas como relações estatísticas. Assim, podemos dizer que: Quando duas variáveis estão ligadas por uma relação estatística, dizemos que existe correlação entre elas. NOTA IMPORTANTE: As relações funcionais são um caso limite das estatísticas. Diagrama de Dispersão Consideremos uma amostra aleatória formada por 10 dos 98 alunos de uma classe da faculdade A e pelas notas obtidas por eles em Matemática e Estatística: Simples Gráfico de Dispersão Matemática Física Fornece uma ideia grosseira, porém útil da correlação existente. Veja abaixo: Correlação Linear – Cont. Os pontos obtidos, vistos em conjunto, formam uma elipse em diagonal; Quanto mais fina for a elipse, mais ela se aproxima de uma reta; Dizemos então que, a correlação de forma elíptica tem como imagem uma reta, sendo por esse motivo, denominada de correlação linear; É possível verificar que a cada correlação está associada como imagem uma relação funcional. Por esse motivo, as relações funcionais são chamadas de perfeitas; Veja... Como a correlação em estudo tem como imagem uma reta ascendente, é chamada de correlação linear positiva. Assim, uma correlação é: Linear positiva = se os pontos do diagrama tem como imagem uma reta ascendente; Linear negativa = se os pontos tem como imagem uma reta descendente e Não linear = se os pontos tem como imagem uma curva. Veja o slide seguinte. Continuação Coeficiente de Correlação Linear de Pearspm (r) O instrumento empregado para medir a CORRELAÇÃO LINEAR é chamado de Coeficiente de Correlação. Ele serve para indicar o grau de intensidade da correlação entre duas variáveis e ainda o sentido dessa correlação: positivo ou negativo. Tal coeficiente é dado pela fórmula seguinte, onde n é o número de observações. Os valores limites de r são: r = +1 -> correlação linear perfeita e positiva entre variáveis; r = -1 -> correlação linear perfeita e negativa entre variáveis; R = 0 -> se não há correlação nenhuma entre as variáveis. Observações Importantes Para que uma relação possa ser descrita por meio de PEARSON é imprescindível que ela se aproxime da uma função linear. Uma maneira prática de verificarmos a linearidade da relação é a inspeção do diagrama de Dispersão: se a eclipse apresenta saliências ou reentrâncias, provavelmente trata-se de uma correlação curvilínea. Para podermos tirar algumas conclusões significativas sobre o comportamento simultâneo das variáveis analisadas é necessário que: 0,6 maior igual |r| menor igual a 1 Se 0,3 maior igual |r| menor igual a 0,6 -> c.linear fraca entre variáveis; Se 0 maior |r| menor que 0,3 -> c.linear muito fraca entre variáveis Se 0,6 maior |r| -> c.linear de forte a muito forte entre variáveis A partir da tabela abaixo, calcular o r de Pearson A partir da tabela abaixo, calcular o r de Pearson Considerando os valores da tabela abaixo e substituindo-se na fórmula teremos: 1. Dante, Luiz Roberto. Matemática – Contexto & Aplicações. 3ª Ed. São Paulo: Ática; 2. CRESPO, Antônio Arnot. Matemática Comercial e Financeira. 13ª Ed. São Paulo: Saraiva, 1; 3. Viveiro, Tânia Cristina Neto G , Corrêa, Marlene, Lima Pires. Minimanual Compacto de Matemática – Teoria e Prática . 1ª Ed. São Paulo: Rideel Bibliografia image1.jpeg image2.emf NR MAT(X)FÍSICA(Y) 156 889 2478 381010 4465 5877 5998 7234 8086 9222 NOTAS image3.jpeg image4.gif image5.png image6.png image7.emf nr Matemática (xi) Estatística (yi) x.y x 2 y 2 156302536 889726481 2478564964 381010100100100 4465303625 5877494949 5998728164 723412916 8086486436 9222444 soma6565473481475 image8.png