Baixe o app para aproveitar ainda mais
Prévia do material em texto
TESTE DE COEFICIENTE CORRELAÇÃO Os testes de hipóteses aplicados nas análises de regressão e correlação buscam verifica a possibilidade de aceitação da hipótese de nulidade dos coeficientes populacionais inferidos. Como nos procedimentos tradicionais dos testes hipóteses, devem ser seguidos os cincos passos: Definição das hipóteses nula e alternativa: 4. Valor de t pode ser calculado usando: Onde: n - numero de observações k – numero de variáveis explicativas Como sempre a hipótese nula será rejeitada se o valor calculado for maior que o tabelado pela distribuição t-Student para o nível de significância α: Para os dados do município de Picuí, o teste de hipótese de nulidade do coeficiente pode ser visto a seguir: Para α=5%, gl= 12-3, temos: Assim, rejeitamos . Através da tabela 1 é possível verificar que o valor de F de 72,48801 é maior que Ftab (5.715). Assim, o modelo é aceito com 95% de confiança. TABELA 1- ANOVA gl SQ MQ F F de significação Regressão 2 2544,254 1272,126975 72,48801 2,82197E-06 Resíduo 9 157,9453 17,54948233 Total 11 2702,199 Fonte: elaboração própria. MODELO O modelo de regressão linear múltipla é composto por duas ou mais variáveis explicativas. Algebricamente, é dado pela seguinte expressão: Onde: a= é o intercepto (i=1,..., n) são os coeficientes de regressão. (i=1,..., k) são as variáveis explicativas. Com base, nos dados fornecidos pela tabela 2 chegou-se ao seguinte modelo: Tabela 2 - interseção, variável x1 e variável x2 Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseção -16,9179546 7,727223572 -2,189396281 0,056306 -34,39814871 0,562239598 Variável X 1 0,030274334 0,021340785 1,418613888 0,189699 -0,018001875 0,078550542 Variável X 2 0,0171757 0,002592969 6,623951342 9,66E-05 0,011309997 0,023041403 Fonte: elaboração própria. COEFICIENTE DE DETERMINAÇÃO E COEFICIENTE DE DETERMINAÇÃO AJUSTADO Na tabela 3 é possível verificar que o valor de r² do coeficiente de determinação é igual 0,941549337, ou seja, 94,15% da variação nos custo de distribuição está relacionada linearmente com variações de vendas e números de pedidos. Em outras palavras, as duas variáveis independentes utilizadas no modelo linear ajudam a explicar cerca de 94,15% da variação nos custo de distribuição, ficando por explicar 5,85 das outras variações. O R² ajustado não necessariamente aumenta com a adição de parâmetros no modelo. Na verdade se as variáveis explicativas são incluídas no modelo R² ajustado desse modelo excederá R² ajustado do modelo com p variáveis apenas se a estatística parcial F para testar a significância dos adicionais s coeficientes passar de 1. Consequentemente, um critério para a seleção de um modelo ótimo é escolher o modelo que tem o R² ajustado máximo. O valor expresso na tabela 3 para o R² ajustado é de 0,9285603, ou seja, próximo a 1. TABELA 3- Estatística de regressão R múltiplo 0,970334652 R-Quadrado 0,941549337 R-quadrado ajustado 0,9285603 Erro padrão 4,189210227 Observações 12 Fonte: elaboração própria. INTERVALO DE CONFIANÇA. Um intervalo de confiança é um intervalo de valores de coeficientes de regressão para um dado valor estimado do coeficiente e um dado nível de probabilidade. A interpretação do intervalo de confiança é que ele é um intervalo que acreditamos que incluirá o parâmetro verdadeiro com nível de confiança especificado. Em nível de 95% de confiança, com base nos valores encontrados na tabela 2, os intervalos de confiança são: Para o coeficiente linear Para os coeficientes angulares: E, SIGNIFICÂNCIA DAS VARIÁVEIS EXPLICATIVAS Teste de hipótese para a nulidade dos coeficientes angulares: v Como nos procedimentos tradicionais dos testes de hipóteses, devem ser seguidos os cinco passos: 1. Definir das hipóteses nula e alternativa: 4. Calcular o valor da estatística teste. Como o valor de , coeficiente populacional alegado, é igual a zero nos testes de hipóteses formulado, o valor da estatística teste será igual a: 5. Comparar a estatística teste calculada com os valores críticos determinados após a partição da distribuição. Considerando um nível de significância padrão, alfa igual 5%, e nove grau de liberdade, os valores críticos de t seriam iguais a 2,2622. Como o valor estatística teste situa-se dentro dos limites definidos por t teste, não rejeita-se a hipótese de nulidade do coeficiente. Para , segue o mesmo passos: 1. Definir das hipóteses nula e alternativa: 4. Calcular o valor da estatística teste. Como o valor de , coeficiente populacional alegado, é igual a zero nos testes de hipóteses formulado, o valor da estatística teste será igual a: 5. Comparar a estatística teste calculada com os valores críticos determinados após a partição da distribuição. Considerando um nível de significância padrão, alfa igual 5%, e nove grau de liberdade, os valores críticos de t seriam iguais a 2,2622. Como o valor estatística teste situa-se dentro dos limites definidos por t teste, , rejeita-se a hipótese de nulidade do coeficiente. NOVO MODELO Pelo fato de , no teste de hipótese não ter sido rejeitado a hipótese nula () faz com que seja preciso eliminar a variável vendas do modelo atual e formular um novo modelo com a variável dependente custos e independente números de pedidos. Após, realizado a regressão linear simples chegou a seguinte equação para o novo modelo: ESTIMAÇÃO DAS VARIÁVEIS COM VALORES DETERMINADOS Substituindo o valor do numero de pedidos no lugar de x na equação abaixo, temos que: O custo de distribuição do deposito mensal da empresa será de R$ 74,488. REFERÊNCIAS SANTOS, Valterlin. MQ Análise de regressão múltipla. Disponível em: https://docs.google.com/viewer?a=v&pid=sites&srcid=ZGVmYXVsdGRvbWFpbnxwcm9mdmFsdGVybGlufGd4OjVlNmQ3ZDI2MzM4YWZjZDc. Acesso em: 19/06/2019. HENRIQUES, Carla. Análise de Regressão Linear Simples e Múltipla. Departamento de Matemática, Escola Superior de Tecnologia de Viseu. Disponível:http://www.estgv.ipv.pt/PaginasPessoais/psarabando/Ambiente%202010-2011/Slides/Regressaoalunos.pdf. Acesso em: 25/06/2017 ANEXO REGRESSAO MÚLTIPLA NO EXCEL: RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,970334652 R-Quadrado 0,941549337 R-quadrado ajustado 0,9285603 Erro padrão 4,189210227 Observações 12 ANOVA gl SQ MQ F F de significação Regressão 2 2544,253951 1272,126975 72,48801 2,82197E-06 Resíduo 9 157,9453409 17,54948233 Total 11 2702,199292 Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseção -16,9179546 7,727223572 -2,189396281 0,056306 -34,39814871 0,562239598 Variável X 1 0,030274334 0,021340785 1,418613888 0,189699 -0,018001875 0,078550542 Variável X 2 0,0171757 0,002592969 6,623951342 9,66E-05 0,011309997 0,023041403 RESULTADOS DE RESÍDUOS Observação Y previsto Resíduos Resíduos padrão 1 62,65185558 0,328144424 0,08659802 2 69,0660255 3,233974495 0,853452831 3 63,51844749 -4,528447486 -1,19506704 4 76,64579964 2,734200363 0,721561361 5 94,91137543 -0,471375433 -0,124396991 6 55,7800138 3,959986199 1,045048882 7 89,17833446 1,361665542 0,359346468 8 99,62818651 -6,388186514 -1,685856172 9 70,42212426 -1,092124265 -0,288213944 10 58,546256 -4,836256003 -1,27629837 11 92,16760064 6,012399355 1,586685132 12 67,11398068 -0,313980678-0,082860177 SOMA 0
Compartilhar