Baixe o app para aproveitar ainda mais
Prévia do material em texto
CAPÍTULO X CORRELAÇÃO E REGRESSÃO Prof. Marcone Soares 10.1 Introdução Em algumas situações, precisamos estabelecer algumas relações entre duas ou mais variáveis, que damos o nome de relação funcional ou relação Estatística. Exemplos: Área do retângulo (S = a . b) é a relação entre os lados de um retângulo; Perímetro de um quadrado (2p = 4l) é a relação entre o perímetro e os lados de um quadrado. 10.2 Relações Estatísticas e Correlações São relações estabelecidas após uma pesquisa. Com bases nos resultados da pesquisa, fazem-se comparações que eventualmente podem conduzir (ou não) à ligação entre variáveis. No estudo estatístico, a relação entre duas ou mais variáveis denomina-se correlação. A utilidade e importância das correlações entre duas variáveis podem conduzir à descoberta de novos métodos, cujas estimativas são vitais em tomadas de decisões. Exemplos Idade e altura de recém nascidos Tempo de prática de esportes e ritmo cardíaco Tempo de estudo e nota na prova Taxa de desemprego e taxa de criminalidade Expectativa de vida e taxa de analfabetismo 10.3 Diagrama de Dispersão O diagrama de dispersão é um gráfico cartesiano em que cada num dos eixos corresponde as variáveis correlacionadas. A variável dependente (y) situa-se no eixo vertical e o eixo das abscissas é reservado para a variável dependente (x). Os pares ordenados ( x,y ) formam uma nuvem de pontos. A configuração geométrica do diagrama de dispersão pode estar associada a uma linha reta (correlação linear) ou uma linha curva (correlação não linear) ou, ainda ter os pontos dispersos de maneira que não defina nenhuma configuração linear, isto é, não há correlação. Y Y X X Correlação linear Correlação não linear 10.4 Correlação Linear A correlação mede a força ou grau de relacionamento entre duas variáveis. A correlação linear é uma correlação entre duas variáveis, cujo gráfico aproxima-se de uma linha. É uma linha de tendência, porque procura acompanhar a tendência da distribuição de pontos, que pode corresponder a uma reta ou uma curva. Por outro lado é também, uma linha média, porque procura deixar a mesma quantidade de pontos abaixo e acima da linha. Assim, uma correlação pode ser: Linear positiva – se os pontos do diagrama têm como imagem uma reta ascendente (crescente); Linear negativa – se os pontos têm como imagem uma reta descendente (decrescente); Não linear – se os pontos têm como imagem uma curva. Se os pontos apresentam-se dispersos, não oferecendo uma imagem definida, concluímos que não há relação alguma entre as variáveis em estudo. 10.5 Coeficiente de correlação linear O instrumento empregado para a medida da correlação linear é o coeficiente de correlação. Esse coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis e, ainda, o sentido dessa correlação se positiva ou negativa. Usaremos o coeficiente de correlação de PEARSON que é dado por: Onde n é o número de observações. Os valores limites de r são -1 e + 1, isto é, r pertence ao intervalo [-1, +1]. Dessa forma, temos que: Se a correlação entre duas variáveis é perfeita e positiva, então r = +1; Se a correlação é perfeita negativa, então r = -1; Se não há correlação entre as variáveis, ou a relação que por ventura exista não é linear, então r = 0. Para podermos tirar algumas conclusões significativas sobre o comportamento simultâneo das variáveis analisadas, é necessário que: 0,6 < 1 Se 0,3 < 0,6, há uma correlação relativamente fraca entre as variáveis; Se 0 < < 0,3, a correlação é muito fraca e, praticamente, nada podemos concluir sobre a relação entre as variáveis em estudo. Exemplo Seja uma amostra aleatória, formada por dez dos 100 alunos de uma classe da Faculdade X e pelas notas obtidas por eles em Matemática e Estatística: NOTAS Números Matemática Estatística (xi) (yi) xiyi 03 09 25 36 42 58 68 71 86 95 5,0 8,0 7,0 10,0 6,0 7,0 9,0 3,0 8,0 2,0 6,0 9,0 8,0 10,0 5,0 7,0 8,0 4,0 6,0 2,0 30 72 56 100 30 49 72 12 48 4 25 64 49 100 36 49 81 9 64 4 36 81 64 100 25 49 64 16 36 4 SOMA 65 65 473 481 475 = = = . Logo, r = 0,911, resultado que indica uma correlação linear altamente significativa entre as duas variáveis. Exercício Uma pesquisa pretende verificar se há correlação significativa entre o peso total do lixo descartado, por dia, num hotel com o peso do papel contido nesse lixo. Hotel H1 H2 H3 H4 H5 H6 H7 H8 H9 H10 Peso total 10,47 19,85 21,25 24,36 27,38 28,09 33,61 35,73 38,33 49,14 Peso do papel 2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,55 11,43 Determine o grau de correlação entre as variáveis e dê sua conclusão.(resposta:r = 0,9206). 10.6 Regressão Ajustamento da reta (mínimos quadrados) A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável dependente e a outra recebe o nome de variável independente. Suponha X a variável independente e Y a variável dependente, vamos procurar determinar o ajustamento de uma reta à relação entre essas variáveis, ou seja, vamos obter uma função definida por: Y = aX + b , onde a e b são parâmetros. Sejam duas variáveis X e Y, entre as quais exista uma correlação acentuada, embora não perfeita, por exemplo, as que formam a tabela abaixo: xi 5 8 7 10 6 7 9 3 8 2 yi 6 9 8 10 5 7 8 4 6 2 Y 10 * y = a X + b * * * * * * * * * 0 5 6 10 x Podemos calcular pela fórmula do diagrama, que se trata de uma correlação retilínea, de modo a permitir um ajustamento de uma reta, imagem da função definida por Y = aX + b Calculamos os parâmetros a e b através das fórmulas: e Onde: n é o número de observações é a média dos valores de x é a média dos valores de y Exemplo Seja uma amostra aleatória formada por dez dos 100 alunos de uma classe da Faculdade X e pelas notas obtidas por eles em Matemática e Estatística, determinea reta ajustada a essa correlação. NOTAS Números Matemática Estatística (xi) (yi) xiyi 03 09 25 36 42 58 68 71 86 95 5,0 8,0 7,0 10,0 6,0 7,0 9,0 3,0 8,0 2,0 6,0 9,0 8,0 10,0 5,0 7,0 8,0 4,0 6,0 2,0 30 72 56 100 30 49 72 12 48 4 25 64 49 100 36 49 81 9 64 4 SOMA 65 65 473 481 Como, = = 6,5 e = = 6,5 temos: b = 6,5 – 0,8632 x 6,6 = 08892, donde teremos a = 0,86 e b = 0,89 Logo: y = aX + b y = 0,86X + 0,89 EXERCÍCIOS 1) a tabela abaixo apresenta valores que mostram como o comprimento de uma barra de aço varia conforme a temperatura: Temperatura (ºC) 10 15 20 25 30 Comprimento (mm) 1.003 1.005 1.010 1.011 1.014 Determine: O coeficiente de correlação; (r = 0,89) A reta justada a essa correlação; ( y = 0,34X + 9,94) O valor estimado do comprimento da barra para a temperatura de 18ºC. ( = 1.007,5) 2) Certa empresa, estudando a variação da demanda de seu produto em relação a variação de preço de venda, obteve a tabela: Preço (xi) 38 42 50 56 59 63 70 80 95 110 Demanda (yi) 350 325 279 270 256 246 238 223 215 208 a) Determine o coeficiente de correlação (r = - 0,90) Estabeleça a equação da reta ajustada. ( y = -1,87X +386,8) Estime Y para X = 60 ( = 274,6 ) 3) Um pesquisador deseja verificar se um instrumento para medir a concentração de determinada substância no sangue está bem calibrado. Para isto, ele tomou 15 amostras de concentrações conhecidas (X) e determinou a respectiva concentração através do instrumento (Y), obtendo: X 2,0 2,0 4,0 4,0 6,0 6,0 8,0 8,0 10,0 10,0 Y 2,1 1,9 4,5 4,2 6,2 6,5 7,8 7,7 9,6 10,0 (a) Construa o diagrama de dispersão para esses dados. (b) Calcule o coeficiente de correlação entre as variáveis X e Y. (d) Obtenha a reta de regressão da variável Y em função de X. 4) Em um estudo sobre o efeito dos componentes de uma dieta (X) sobre a composição lipídica (Y) foram obtidos os seguintes dados em uma amostra de 15 animais. Componente da dieta (X) Composição lipídica (Y) 18 30 21 35 28 43 35 60 47 50 33 28 40 40 41 60 28 43 21 30 30 33 46 65 44 68 38 62 19 25 a) Apresente os dados em um diagrama de dispersão b) Calcule a reta de regressão da composição lipídica como função do componente da dieta. c) Desenhe a reta de regressão d) Interprete os coeficientes da reta de regressão e) Dê a equação da reta estimada. _1223541171.unknown _1223797787.unknown _1223799370.unknown _1223801471.unknown _1223799263.unknown _1223798192.unknown _1223798239.unknown _1223797974.unknown _1223542452.unknown _1223542474.unknown _1223542431.unknown _1223538150.unknown _1223541134.unknown _1223538123.unknown _1223538099.unknown _1223395168.unknown
Compartilhar