Baixe o app para aproveitar ainda mais
Prévia do material em texto
PAGE 3 Prof.ª Dr.ª Vera Lucia Bodini ESTATÍSTICA I PARTE 2 – CORRELAÇÃO E REGRESSÃO LINEAR 1. Correlação: o estudo da correlação linear tem por objetivo medir e avaliar o grau de relação existente entre duas variáveis quantitativas de interesse. Se colocarmos os pares de valores num diagrama bidimensional chamado de “Diagrama de dispersão” tem-se a ideia de como as duas variáveis se correlacionam, isto é, do grau de relação conjunta que apresentam, podendo ocorrer: · Correlação linear positiva · Correlação linear negativa · Correlação linear nula · Correlação não linear O instrumento de medida da correlação linear é dado pelo Coeficiente Linear de Pearson: ( ) ( ) ( ) [ ] ( ) [ ] å å å å å å å - - - = 2 2 2 2 y y n x x n y x xy n r Onde o campo de variação do coeficiente r se situa entre – 1 e 1 - 1 £ r £ 1 Sua interpretação dependerá do valor numérico e do sinal - Correlação linear positiva 0 < r < 1 - Correlação linear positiva perfeita r = 1 - Correlação nula r = 0 - Correlação linear negativa -1 < r < 0 - Correlação linear negativa perfeita r = -1 2. Regressão linear: Suponhamos ser a linha teórica de regressão uma reta, portanto queremos encontrar uma função do tipo y = α + βx , onde a estimação dos parâmetros α e β da linha teórica é feita através de pontos experimentais fornecidos pela amostra, obtendo uma reta estimada da forma y = a + bx , onde: a = ao estimador de α e b = estimador de β. Para tanto usaremos o método dos mínimos quadrados. Em que a reta adotada torna mínima a soma dos quadrados das distâncias da reta até os pontos experimentais no sentido vertical. A idéia consiste em minimizar a variação residual em torno da reta estimada, utilizando as seguintes fórmulas: ( ) å å å å å - - = 2 2 n b x x n y x xy x y b a - = ou n n y å å - = x b a 3. Coeficiente de determinação ou de explicação (r²): indica a proporção da variância da variável dependente y que é estatisticamente explicada pela equação de regressão, isto é, pelo conhecimento da variável independente x. O coeficiente de determinação mede o grau em que as predições baseadas na equação de regressão superam as predições baseadas no valor médio de y. 4. Erro padrão de estimação: a medida de variação em torno da reta ajustada da regressão é chamada de erro padrão de estimação ou de estimativa. Calculado pela seguinte formula: 2 2 ^ - ÷ ø ö ç è æ - = å n Y Y S xy EXERCÍCIOS: 1) Para estudar a relação existente entre a velocidade do veículo (km/h) na hora de um acidente e gravidade do acidente, observou-se algumas ocorrências: Velocidade 60 80 60 120 100 100 50 70 80 Grau de gravidade 1 4 2 5 4 4 1 3 2 a) Determine a correlação e a regressão dos dados b) Estime a gravidade de um acidente se a velocidade na hora do mesmo for de 140 km/h 2) Um estudo sobre a quantidade de chuva diária (0,01 cm) e de poluição do ar (µg/m3) removida produziu os seguintes dados. Poluição removida 126 121 116 118 114 118 132 141 108 Chuva 4,3 4,5 5,9 5,6 6,1 5,2 5,8 2,1 7,5 a) Determine o coeficiente de correlação de Pearson. b) Determine a regressão c) Interprete o coeficiente de determinação d) Estime a remoção de partículas quando a quantidade de chuva for de 4,8 unidades 3) Acredita-se que o custo de manutenção da planta de produção de uma empresa tenha relação com a quantidade produzida dentro do período. Produção (em ton.) 120 130 150 120 140 190 200 190 Manutenção (em milhares de reais) 11 14 16 12 15 16 30 20 a) Calcule o coeficiente de correlação de Pearson. b) Determine a regressão c) Interprete o coeficiente de explicação d) Sabendo que a produção do próximo período será de 210.000 kg, qual o custo previsto de manutenção? 4). A empresa XX está retirando um produto do mercado, pois as suas vendas não estão mais cobrindo seu custo de produção e está sendo substituído por outro similar da empresa. Os dados abaixo mostram como está ocorrendo esta redução: Determine: MÊS 1 2 3 4 5 6 7 8 PRODUÇÃO 250 200 180 150 150 120 100 87 a. O coeficiente de correlação linear. b. A equação de regressão linear. c. A quantidade estimada de produção para os próximos dois períodos d. O coeficiente de determinação e) Identificar de forma gráfica a existência de tendência de demanda _1214220619.unknown _1279298646.unknown _1467658511.unknown _1214220620.unknown _1205583320.unknown _1214220595.unknown _1139646340.unknown
Compartilhar