Baixe o app para aproveitar ainda mais
Prévia do material em texto
Jessica de Moura Silva Santos - RA: 2021309501 Atividade 3 - Análise de Regressão Univariada Foram entrevistados 12 estudantes trabalhadores e os dados coletados estão apresentados na Tabela a seguir. Tendo isso em vista, iremos construir uma análise de regressão linear para avaliar a relação entre renda familiar e tempo de estudo, sabendo que a reta estimada é = 282,5 + 1141,2 X. Logo, utilizaremos Xi para tempo de estudos em anos e Yi para renda familiar em reais, obtendo a seguinte relação: Jessica de Moura Silva Santos - RA: 2021309501 Assim, podemos grafar os dados apresentados, da seguinte maneira: Após isto, é necessário analisar os pontos acima estimando a regra aproximada. A reta de regressão é dada por Y = αX + β + erro. Sendo que, α (alfa) é o coeficiente dependente e β (beta) o independente. Assim, a tabela começa a receber mais informações: Jessica de Moura Silva Santos - RA: 2021309501 Aplicando a fórmula α = n ∑ Xi Yi - ∑ Xi Yi ÷ n ∑ Xi2 - (∑ Xi)2 e β = y - αx, podemos chegar aos seguintes resultados para α e β : α = 12 (407.441) - (108).(44.204) ÷ 12 (1.006) - (108)2 α = 4.889.292 - 4.774.032 ÷ 12.072 - 11.664 α = 115.260 ÷ 408 α = 282,5 β = (44.204 ÷ 12) - (282,5).(108 ÷ 12) β = 3.683,66 - 282,5.9 β = 3.683,66 - 2.542,5 β = 1.141,16 ≈ 1.141,2 Assim, chegamos à conclusão de que a reta estimada para essa amostra é: Y = 282,5 + 1.141,2X + erro. O próximo passo agora é a elaboração da ANOVA. Iremos utilizar as seguintes fórmulas na ferramenta Excel: Jessica de Moura Silva Santos - RA: 2021309501 Incluindo a fonte de variação (FV) dos graus de liberdade, da soma dos quadrados, do quadrado médio (QM) e da estatística F: Assim, usando os dados presentes nas tabelas, para formulação do intervalo de Confiança Linear (α = β0): IC = ( β0 ; y = 95% ) = [ ^ β0 +- tα/2 , (n - 2) √𝑄𝑀𝑅𝑒𝑠 [1/𝑛 + 𝑥 ²/𝑆𝑥𝑥 ]] IC = ( β0 ; y = 95% ) = [ 282,5 +- 2,228 √56.979.619,42 [1/12 + 81/34]] IC = ( β0 ; y = 95% ) = [ 282,5 +- 2,228 √56.979.619,42 [2,4657]] IC = ( β0 ; y = 95% ) = [ 282,5 +- 2,228 * 11.853,04381] IC = ( β0 ; y = 95% ) = [ 282,5 +- 26.408,58] IC = ( β0 ; y = 95% ) = [ 282,5 +- 26.408,58; 282,5 + 26.408,58] IC = ( β0 ; y = 95% ) = [ - 26.126,08; + 26.691,08] Com a interpretação do ^ β0 e seu intervalo, obtemos o resultado 282,5 como média de renda familiar. Logo, para quem não tem nenhum tempo de estudo, a média da renda familiar é de R$282,50. Para cada 100 intervalos de confiança, a 95% de chance de serem selecionados valores [ - 26.126,08; + 26.691,08], havendo o valor verdadeiro de β0. Agora, será utilizado novamente os valores das tabelas, para o intervalo do Coeficiente Angular (β1≠0): IC = ( β1 ; y = 95% ) = [ ^ β1 +- tα/2 , (n - 2) √𝑄𝑀𝑅𝑒𝑠/𝑆𝑥𝑥 ] IC = ( β1 ; y = 95% ) = [ 1.141,2 +- 2,228 √56.979.619,42/34 ] IC = ( β1 ; y = 95% ) = [ 1.141,2 +- 2,228 * 1.294,5544 ] Jessica de Moura Silva Santos - RA: 2021309501 IC = ( β1 ; y = 95% ) = [ 1.141,2 +- 2.884,267 ] IC = ( β1 ; y = 95% ) = [ 1.141,2 +- 2.884,267 ; 1.141,2 + 2.884,267] IC = ( β1 ; y = 95% ) = [ - 1.743,07; + 4.025,47] Analisando o coeficiente estimado ^ β1 e seu intervalo, tem-se 1.141,2 como valor para cada ano de estudo. Logo, quanto mais anos de estudo, maior a renda. A seguir, iremos realizar o teste de hipótese. Que tem como objetivo nos permitir analisar os dados trazendo evidências sobre a amostragem. Teste de coeficiente linear: H0: β0= 282, em que não existe efeito linear entre Y e X, contra a hipótese alternativa Ha: β0 ≠ 282 dado o modelo estimado: ^y = 282,5 + 1141,2 X + erro Teste de coeficiente angular: Ho: β1 = 1.141, sendo uma constante, contra a hipótese alternativa Ha: β1 ≠ 1.141, sendo diferente da constante. Sabe-se, ainda, que o quadrado médio do resíduo é 56.979.619,42, de acordo com a tabela ANOVA, e 𝑆𝑥𝑥 = 𝑋𝑖2 − 𝑛𝑥² = 1.006 - 12 (81) = 1.006 - 972 = 34. Ao testar β0 = 14, obtêm-se: Tobs = β0 - k ÷ √𝑄𝑀𝑅𝑒𝑠 [1/n + x2 /𝑆𝑥𝑥] Tobs = 282,5 - 282 ÷ √𝑄𝑀𝑅𝑒𝑠 [1/n + x2 /𝑆𝑥𝑥] Tobs = 0,5 ÷ √𝑄𝑀𝑅𝑒𝑠 [1/n + x2 /𝑆𝑥𝑥] Tobs = 0,5 ÷ 11.853,04381 Tobs = 0,00004213 Dessa forma, ao considerar o valor crítico tabelado como -2,228, é possível concluir que Tobs < tc e assim, não pertence à região crítica por não rejeitar H0. Já para testar β1 = 1.141,2, temos: Tobs = β1 - k ÷ √𝑄𝑀𝑅𝑒𝑠 /𝑆𝑥𝑥 Tobs = 1.141,2 - 1.141 ÷ √56.979.619,42/34 Tobs = 0,2 ÷ 1.294,5544 Jessica de Moura Silva Santos - RA: 2021309501 Tobs = 0,00015449 Logo, Tobs < tc e também não pertence à região crítica. Utilizando a tabela F-Snedecor para α = 5% e considerando Ho: β1 = 0 contra Ho: β1 ≠ 0, dado o modelo estimado ȳ = 282,5 + 1141,2 X, tem-se: ● O quadrado médio de regressão equivalente a 55,02 ● O quadrado médio do resíduo equivalente a 0,59, de acordo com a tabela ANOVA Fobs = QMReg / QMRes Fobs = 610.576.322,88 / 56.979.619,42 Fobs = 10,72 Levando em consideração a tabela t-Student, o valor equivale a: Fc = F (1,n-2) Fc = F 5% (1, 12-2) Fc = 4,96 Desse modo, Fobs > Fc , pertence à região crítica e rejeitando H0. Isso indica que existe relação linear entre Y e X e o modelo proposto é aceitável. A cada ano de estudo, o salário aumenta R$1.141. Aplicando o conceito de coeficiente linear, chegamos ao seguinte resultado: R2 = SQReg / SQTot R2 = 610.576.322,88 / 1.180.372.517,12 R2 = 51,73% Assim, conclui-se que a variabilidade total do modelo é explicada pela variável independente em 51,73%, que pode ser considerada uma explicação aceitável ao modelo.
Compartilhar