Buscar

Atividade 3 - Análise de Regressão Univariada

Prévia do material em texto

Jessica de Moura Silva Santos - RA: 2021309501
Atividade 3 - Análise de Regressão Univariada
Foram entrevistados 12 estudantes trabalhadores e os dados coletados estão
apresentados na Tabela a seguir.
Tendo isso em vista, iremos construir uma análise de regressão linear para
avaliar a relação entre renda familiar e tempo de estudo, sabendo que a reta
estimada é = 282,5 + 1141,2 X.
Logo, utilizaremos Xi para tempo de estudos em anos e Yi para renda familiar
em reais, obtendo a seguinte relação:
Jessica de Moura Silva Santos - RA: 2021309501
Assim, podemos grafar os dados apresentados, da seguinte maneira:
Após isto, é necessário analisar os pontos acima estimando a regra
aproximada.
A reta de regressão é dada por Y = αX + β + erro. Sendo que, α (alfa) é o
coeficiente dependente e β (beta) o independente.
Assim, a tabela começa a receber mais informações:
Jessica de Moura Silva Santos - RA: 2021309501
Aplicando a fórmula α = n ∑ Xi Yi - ∑ Xi Yi ÷ n ∑ Xi2 - (∑ Xi)2 e β
= y - αx, podemos chegar aos seguintes resultados para α e β :
α = 12 (407.441) - (108).(44.204) ÷ 12 (1.006) - (108)2
α = 4.889.292 - 4.774.032 ÷ 12.072 - 11.664
α = 115.260 ÷ 408
α = 282,5
β = (44.204 ÷ 12) - (282,5).(108 ÷ 12)
β = 3.683,66 - 282,5.9
β = 3.683,66 - 2.542,5
β = 1.141,16 ≈ 1.141,2
Assim, chegamos à conclusão de que a reta estimada para essa amostra é:
Y = 282,5 + 1.141,2X + erro.
O próximo passo agora é a elaboração da ANOVA. Iremos utilizar as
seguintes fórmulas na ferramenta Excel:
Jessica de Moura Silva Santos - RA: 2021309501
Incluindo a fonte de variação (FV) dos graus de liberdade, da soma dos
quadrados, do quadrado médio (QM) e da estatística F:
Assim, usando os dados presentes nas tabelas, para formulação do intervalo
de Confiança Linear (α = β0):
IC = ( β0 ; y = 95% ) = [ ^ β0 +- tα/2 , (n - 2) √𝑄𝑀𝑅𝑒𝑠 [1/𝑛 + 𝑥 ²/𝑆𝑥𝑥 ]]
IC = ( β0 ; y = 95% ) = [ 282,5 +- 2,228 √56.979.619,42 [1/12 + 81/34]]
IC = ( β0 ; y = 95% ) = [ 282,5 +- 2,228 √56.979.619,42 [2,4657]]
IC = ( β0 ; y = 95% ) = [ 282,5 +- 2,228 * 11.853,04381]
IC = ( β0 ; y = 95% ) = [ 282,5 +- 26.408,58]
IC = ( β0 ; y = 95% ) = [ 282,5 +- 26.408,58; 282,5 + 26.408,58]
IC = ( β0 ; y = 95% ) = [ - 26.126,08; + 26.691,08]
Com a interpretação do ^ β0 e seu intervalo, obtemos o resultado 282,5 como
média de renda familiar. Logo, para quem não tem nenhum tempo de estudo, a
média da renda familiar é de R$282,50.
Para cada 100 intervalos de confiança, a 95% de chance de serem
selecionados valores [ - 26.126,08; + 26.691,08], havendo o valor verdadeiro de β0.
Agora, será utilizado novamente os valores das tabelas, para o intervalo do
Coeficiente Angular (β1≠0):
IC = ( β1 ; y = 95% ) = [ ^ β1 +- tα/2 , (n - 2) √𝑄𝑀𝑅𝑒𝑠/𝑆𝑥𝑥 ]
IC = ( β1 ; y = 95% ) = [ 1.141,2 +- 2,228 √56.979.619,42/34 ]
IC = ( β1 ; y = 95% ) = [ 1.141,2 +- 2,228 * 1.294,5544 ]
Jessica de Moura Silva Santos - RA: 2021309501
IC = ( β1 ; y = 95% ) = [ 1.141,2 +- 2.884,267 ]
IC = ( β1 ; y = 95% ) = [ 1.141,2 +- 2.884,267 ; 1.141,2 + 2.884,267]
IC = ( β1 ; y = 95% ) = [ - 1.743,07; + 4.025,47]
Analisando o coeficiente estimado ^ β1 e seu intervalo, tem-se 1.141,2 como
valor para cada ano de estudo. Logo, quanto mais anos de estudo, maior a renda.
A seguir, iremos realizar o teste de hipótese. Que tem como objetivo nos
permitir analisar os dados trazendo evidências sobre a amostragem.
Teste de coeficiente linear:
H0: β0= 282, em que não existe efeito linear entre Y e X, contra a hipótese
alternativa Ha: β0 ≠ 282 dado o modelo estimado: ^y = 282,5 + 1141,2 X + erro
Teste de coeficiente angular:
Ho: β1 = 1.141, sendo uma constante, contra a hipótese alternativa Ha: β1 ≠
1.141, sendo diferente da constante.
Sabe-se, ainda, que o quadrado médio do resíduo é 56.979.619,42, de
acordo com a tabela ANOVA, e 𝑆𝑥𝑥 = 𝑋𝑖2 − 𝑛𝑥² = 1.006 - 12 (81) = 1.006 - 972 =
34.
Ao testar β0 = 14, obtêm-se:
Tobs = β0 - k ÷ √𝑄𝑀𝑅𝑒𝑠 [1/n + x2 /𝑆𝑥𝑥]
Tobs = 282,5 - 282 ÷ √𝑄𝑀𝑅𝑒𝑠 [1/n + x2 /𝑆𝑥𝑥]
Tobs = 0,5 ÷ √𝑄𝑀𝑅𝑒𝑠 [1/n + x2 /𝑆𝑥𝑥]
Tobs = 0,5 ÷ 11.853,04381
Tobs = 0,00004213
Dessa forma, ao considerar o valor crítico tabelado como -2,228, é possível
concluir que Tobs < tc e assim, não pertence à região crítica por não rejeitar H0.
Já para testar β1 = 1.141,2, temos:
Tobs = β1 - k ÷ √𝑄𝑀𝑅𝑒𝑠 /𝑆𝑥𝑥
Tobs = 1.141,2 - 1.141 ÷ √56.979.619,42/34
Tobs = 0,2 ÷ 1.294,5544
Jessica de Moura Silva Santos - RA: 2021309501
Tobs = 0,00015449
Logo, Tobs < tc e também não pertence à região crítica.
Utilizando a tabela F-Snedecor para α = 5% e considerando Ho: β1 = 0 contra
Ho: β1 ≠ 0, dado o modelo estimado ȳ = 282,5 + 1141,2 X, tem-se:
● O quadrado médio de regressão equivalente a 55,02
● O quadrado médio do resíduo equivalente a 0,59, de acordo com a
tabela ANOVA
Fobs = QMReg / QMRes
Fobs = 610.576.322,88 / 56.979.619,42
Fobs = 10,72
Levando em consideração a tabela t-Student, o valor equivale a:
Fc = F (1,n-2)
Fc = F 5% (1, 12-2)
Fc = 4,96
Desse modo, Fobs > Fc , pertence à região crítica e rejeitando H0. Isso indica
que existe relação linear entre Y e X e o modelo proposto é aceitável. A cada ano de
estudo, o salário aumenta R$1.141.
Aplicando o conceito de coeficiente linear, chegamos ao seguinte resultado:
R2 = SQReg / SQTot
R2 = 610.576.322,88 / 1.180.372.517,12
R2 = 51,73%
Assim, conclui-se que a variabilidade total do modelo é explicada pela
variável independente em 51,73%, que pode ser considerada uma explicação
aceitável ao modelo.

Continue navegando