Baixe o app para aproveitar ainda mais
Prévia do material em texto
06/05/14 1 Tema 7: Correlação e Regressão Profa. Renata M. G. Dalpiaz Correlação • É uma relação entre duas variáveis. Os dados podem ser representados por pares ordenados (x, y) onde x é a variável independente ou variável explanatória e y é a variável dependente ou resposta. Correlação • Correlacionar significa medir o grau de associação de duas variáveis tomadas juntas. • A diferença entre regressão e correlação é que na regressão têm-se duas variáveis (uma dependente e outra independente), enquanto na correlação, as duas variáveis apresentam relação mútua. 06/05/14 2 Como calcular A associação ou a correlação entre duas variáveis é medida pelo coeficiente de correlação (r), que é determinado pela fórmula a seguir: ( ) ( ) ]yy*n[*]xx*n[ y*x)xy(*n r 2222 ∑∑∑ ∑ ∑ ∑ ∑ −− − = Os valores de “r” O valor de r pode variar de –1 a +1, significando, respectivamente, correlação negativa e correlação positiva entre as variáveis. O valor zero indica que não existe correlação. Outros valores intermediários p rop i c i am in fe rênc ias a respe i to do comportamento interativo entre as variáveis. Acompanhe • As figuras apresentadas no slide a seguir. • Elas apresentam, de forma aproximada, o valor de r em função do comportamento (variação) simulado de duas variáveis distintas. 06/05/14 3 Exemplos Orientações gerais • Obtenha a soma dos valores x. • Obtenha a soma dos valores y. • Multiplique cada valor x por seu valor y. • Eleve ao quadrado cada valor x e obtenha a sua soma. • Eleve ao quadrado cada valor y e obtenha a sua soma. • Use essas cinco somas para calcular o coeficiente de correlação. ( ) ( ) ]yy*n[*]xx*n[ y*x)xy(*n r 2222 ∑∑∑ ∑ ∑ ∑ ∑ −− − = Regressão • É aquela para qual a soma dos quadrados dos resíduos é um mínimo. 06/05/14 4 Análise de Regressão • O objetivo da análise de regressão é determinar a relação existente entre uma característica qualquer de interesse experimental, dependente, e outra característica independente, tomadas juntas, visando fazer previsões. Assim sendo • y = variável que nos interessa estudar e cujo comportamento futuro desejamos prever. É a variável dependente que existe no modelo. Ela é assim denominada porque o seu valor depende do valor de x. • x = va r i á v e l q u e i n f l u e n c i a n o comportamento de y e define o seu valor. A estatística • A estatística oferece meios de se chegar à relação entre a variável dependente y e a variável independente x, por meio da análise de regressão. • Em termos matemáticos, a equação da reta é dada pela formula: y = mx + b, em que m e b são os parâmetros da função. 06/05/14 5 Ferramentas • Uma maneira prática para a determinação da função entre as variáveis dependentes e independentes é a construção do gráfico denominado de “diagrama de dispersão”, que pode fornecer uma forma aproximada da regressão. Diagrama de dispersão Sua confecção consiste na plotagem dos pontos obtidos por cálculo ou levantamento, em um sistema de coordenadas cartesianas, que permite uma visualização dos seus posicionamentos, propiciando uma interpretação aproximada do comportamento das variáveis em estudo. Ajustamento da reta Estabelecido o modelo y = mx + b, torna-se necessária a obtenção dos valores de m e b de forma que a nossa reta esteja tão próxima quanto possível dos pontos assinalados no “diagrama de dispersão”. Para d im inu i r as d i sc repânc ias , há necessidade de se ajustar a reta por meio da análise de regressão. 06/05/14 6 Ajustamento da reta Estabelecido o modelo y = mx + b, torna-se necessária a obtenção dos valores de m e b de forma que a nossa reta esteja tão próxima quanto possível dos pontos assinalados no “diagrama de dispersão”. Para d im inu i r as d i sc repânc ias , há necessidade de se ajustar a reta por meio da análise de regressão. Na regressão ( )22 . ∑∑ ∑ ∑∑ − − = −= xxn yxxyn m e xmyb Importante saber que n y y e n x x ∑ ∑ = = • n = tamanho da amostra 06/05/14 7 Exercício 1 Observa-se que um determinado produto tem o seu custo baseado na quantidade produzida, conforme segue: Qual é o custo para 22 unidades? Quant (x) 10 12 14 16 18 20 Custo em R$ (y) 100 112 119 130 139 142 Diagrama de dispersão Tabela auxiliar x y xy x2 1 10 100 1000 100 2 12 112 1344 144 3 14 119 1666 196 4 16 130 2080 256 5 18 139 2502 324 6 20 142 2840 400 Σ 90 742 11432 1420 06/05/14 8 Então, “m” será dado por: ( ) 31,4 420 1812 90420.1*6 742*90432.11*6 . 2 22 ≅ = − − = − − = ∑∑ ∑ ∑∑ m m m xxn yxxyn m Cálculo do valor de “b” 02,59 15*31,467,123 15 6 90 67,123 6 742 ≅ −=∴ === ≅== −= ∑ ∑ b b n x x n y y xmyb A equação da reta será y = 59,02 + 4,31 x E o problema solicita que calculemos o valor aproximado de y quando x = 22: y = 59,02 + 4,31 x y = 59,02 + 4,31*22 y = 59,02 + 94,82 y = 153,84 06/05/14 9 Gráfico 0 20 40 60 80 100 120 140 160 180 1 2 3 4 5 6 7 Exercício 2 Observa-se que um determinado produto tem o seu custo baseado na quantidade produzida, conforme segue: Qual o grau de correlação entre as variáveis? Quant (x) 10 12 14 16 18 20 Custo em R$ (y) 100 112 119 130 139 142 Tabela x y xy x2 y2 1 10 100 1000 100 10000 2 12 112 1344 144 12544 3 14 119 1666 196 14161 4 16 130 2080 256 16900 5 18 139 2502 324 19321 6 20 142 2840 400 20164 Σ 90 742 11432 1420 93090 06/05/14 10 Resolvendo ( ) ( ) ]yy*n[*]xx*n[ y*x)xy(*n r 2222 ∑∑∑ ∑ ∑ ∑ ∑ −− − = ])742(93090*6[*])90(1420*6[ 742*9011432*6 r 22 −− − = ]550564558540[*]81008520[ 6678068592 r −− − = Resolvendo 976.7*420 1812 r = 920.349.3 812.1 r = 28,830.1 812.1 r = 99,0r = 06/05/14 11 Correlação • É uma relação entre duas variáveis. Os dados podem ser representados por pares ordenados (x, y) onde x é a variável independente ou variável explanatória e y é a variável dependente ou resposta. Correlação • Correlacionar significa medir o grau de associação de duas variáveis tomadas juntas. • A diferença entre regressão e correlação é que na regressão têm-se duas variáveis (uma dependente e outra independente), enquanto na correlação, as duas variáveis apresentam relação mútua. Como calcular A associação ou a correlação entre duas variáveis é medida pelo coeficiente de correlação (r), que é determinado pela fórmula a seguir: ( ) ( ) ]yy*n[*]xx*n[ y*x)xy(*n r 2222 ∑∑∑ ∑ ∑ ∑ ∑ −− − = 06/05/14 12 Regressão • É aquela para qual a soma dos quadrados dos resíduos é um mínimo. Análise de Regressão • O objetivo da análise de regressão é determinar a relação existente entre uma característica qualquer de interesse experimental, dependente, e outra característica independente, tomadas juntas, visando fazer previsões. Assim sendo • y = variável que nos interessa estudar e cujo comportamento futuro desejamos prever. É a variável dependente que existe no modelo. Ela é assim denominada porque o seu valor depende do valor de x. • x = va r i á v e l q u e i n f l u e n c i a n o comportamento de y e define o seu valor. 06/05/14 13 Na regressão ( )22 . ∑∑ ∑ ∑∑ − − = −= xxn yxxyn m e xmyb
Compartilhar