Baixe o app para aproveitar ainda mais
Prévia do material em texto
Regressão Linear na Prática (com PSPP e Excel) Exemplo 1: Aloca-se os valores: Vendas é a variável dependente e, os comerciais, são as variáveis independentes. E depois clique em OK. Aparecerá estes valores. O R é a correlação, igual aparecia no Excel. O R Square, é o R², que mostra que 0,87 = 87% das vendas são explicadas pelos comerciais. O R² ajustado não será necessário (Adjusted R Square) pois só há uma variável. Dando continuidade no resultado, reparemos no resultado do ANOVA. No ANOVA reparamos no SIG, se o SIG for maior que 0,05 pode-se ignorar pois não é uma boa regressão. É necessário que de menos que 0,05. E por último a equação: Ambos os valores deram menor que 0,05. Se fosse maior, deveria-se aplicar denovo a regressão sem considerar os valores constantes. E na coluna B, se monta a equação, que seria Y = 36,15 + 4,95X, onde X é o número de comerciais. Caso queira-se calcular regressão linear de outra forma no Excel, de outra maneira mais aprimorada, pode-se seguir o exemplo abaixo. Antes de tudo, deve-se incluir um suplemento no Excel: Vai-se em Arquivo > Opções > Suplementos > Na parte de Suplementos do Excel, clique em IR > E marca-se a opção Ferramentas de Análise > OK. O suplemento estará na Guia Dados no final, na opção Análise de Dados. Clica-se na opção Análise de Dados > Seleciona-se a opção Regressão. Quando a tela abrir, seleciona-se o intervalo Y de entrada (que é Vendas), porém, não seleciona-se o título (Vendas x $100), apenas os valores. O X são os comerciais e novamente, não seleciona-se o título (Comerciais), apenas os valores. Clica-se na opção Nível de Confiança > Ajusta-lo à 95% para calcular o ANOVA. No menu Opções de Saída > Seleciona-se Nova Planilha > Clica-se em Ok. Aparecerá os resultados, da mesma forma que no PSPP. Este seria o SIG, mostrando que é bem próximo de 0, onde o teste ANOVA afirma ser possível fazer a regressão. Exemplo com regressão múltipla no PSPP e no Excel: Primeiramente, no Excel: Guia Dados > Análise de Dados > Regressão > Ok > No intervalo Y, seleciona-se os valores da coluna Total > No intervalo X, seleciona-se todos os outros valores das colunas, desde B até I, com exceção dos títulos (Tarefa1, Tarefa2, etc...) Seleciona-se o Nível de Confiança em 95% > Clica-se em OK. Chega-se aos resultados: R Múltiplo = 1, significa uma regressão perfeita, em que os dados explicam 100% da saída. A Regressão, o SIG, novamente deu 0, mostrando que tudo é significativo. A Interseção é o valor da constante, que foi superior a 0,05, ou seja a constante não faz parte da regressão, bem como as variáveis X1, X6, X7 e X8 também não fazem parte, pois estão próximas de 0. Neste caso, iremos rodar novamente os resultados. Seleciona-se planilha Notas > Análise de Dados > Regressão > OK > Marca-se a opção ‘Constante é 0’ > E no intervalo de X, seleciona-se as variáveis de X2 à X5 > OK. Verifica-se os resultados: Analisando os valores da coluna Coeficientes, chega-se na função da MÉDIA, que seria: MÉDIA = 0,7 * Tarefa5 + 0,1 * Tarefa4 + 0,1 * Tarefa3 + 0,1 * Tarefa2 Se o mesmo exercício fosse realizado no PSPP: Abre-se o arquivo Regressão Média 1.sav > Analisar > Regression > Linear > Aloca-se o Total na parte de Dependent e todas as Tarefas e Quests na parte de Independent > OK. Todos os resultados deram semelhantes aos do Excel, ao se observar o SIG da constante, das quests e a tarefa 1, é possível verificar que são os valores que devem ser retirados para realizar uma nova análise. Novamente: Analisar > Regression > Linear > Aloca-se como Dependent o Total e como Independente apenas da Tarefa 2 à Tarefa 5 > OK. Verifica-se os valores da coluna B, que mostram semelhante ao Excel qual seria a fórmula, que é: MÉDIA = 0,7 * Tarefa5 + 0,1 * Tarefa4 + 0,1 * Tarefa3 + 0,1 * Tarefa2 A Coluna Standardized Coefficientes leva em conta mais alguns fatores, como o desvio padrão e a média, colocando em ordem o que de fato mais tem peso (logo, basta apenas olhar para os valores da coluna B, deve-se reperar nesta coluna Standardized Coefficientes também). Mostrando novamente, que a Tarefa5 possui um peso maior que as outras. Se uma das tarefas tem nota de 0 a 100, a coluna B iria ter algum dos valores diferentes, porém, em Standardized Coefficientes ainda teriam os mesmos valores padronizados. Para o exercício do Butler Trucking no PSPP e no Excel, usar os dados que estão nos arquivos do moodle, pois os resultados são cobrados no questionário da AC2. No exercício, milhas e tempo são variáveis independentes, e o consumo de gasolina é a variável dependente.
Compartilhar