Buscar

ATIVIDADE 1 - ANÁLISE DE REGRESSÃO UNIVARIADA

Prévia do material em texto

UNIVERSIDADE POTIGUAR 
 
Disciplina: ANÁLISE DE REGRESSÃO UNIVARIADA 
Curso: BACHARELADO EM ESTÁTISTICA 
Discente: Marcus Denner de Sousa Carvalho 
Matrícula: 2020201856 
 
UNIDADE 1: ASSOCIAÇÃO E CAUSAÇÃO 
 
1. Reproduza os dados do gráfico apresentado na contextualização em uma tabela; 
observa-se que os valores obtidos são aproximados e, portanto, pode não haver 
uniformidade total dos resultados; 
n x y xy x2 y2 rank x rank y di di2 
1 3,9 85,0 331,5 15,2 7225,0 1,0 2,5 -1,5 2,3 
2 4,0 75,0 298,5 15,8 5625,0 2,0 1,0 1,0 1,0 
3 4,1 85,0 350,2 17,0 7225,0 3,0 2,5 0,5 0,3 
4 4,3 95,0 408,5 18,5 9025,0 4,0 4,0 0,0 0,0 
5 4,4 110,0 484,0 19,4 12100,0 5,0 6,0 -1,0 1,0 
6 4,5 105,0 472,5 20,3 11025,0 6,0 5,0 1,0 1,0 
7 4,6 125,0 575,0 21,2 15625,0 7,0 15,0 -8,0 64,0 
8 4,7 120,0 564,0 22,1 14400,0 8,0 14,0 -6,0 36,0 
9 4,8 115,0 552,0 23,0 13225,0 9,0 7,0 2,0 4,0 
10 4,9 170,0 833,0 24,0 28900,0 10,0 17,0 -7,0 49,0 
11 5,0 117,0 579,2 24,5 13689,0 11,0 8,0 3,0 9,0 
12 5,0 119,0 595,0 25,0 14161,0 12,0 12,0 0,0 0,0 
13 5,1 118,0 601,8 26,0 13924,0 13,0 9,5 3,5 12,3 
14 5,4 215,0 1161,0 29,2 46225,0 14,0 21,0 -7,0 49,0 
15 5,5 119,0 654,5 30,3 14161,0 15,0 12,0 3,0 9,0 
16 5,5 118,0 651,4 30,5 13924,0 16,0 9,5 6,5 42,3 
17 5,6 190,0 1064,0 31,4 36100,0 17,0 19,0 -2,0 4,0 
18 5,7 178,0 1005,7 31,9 31684,0 18,0 18,0 0,0 0,0 
19 5,7 119,0 678,3 32,5 14161,0 19,0 12,0 7,0 49,0 
20 5,9 210,0 1239,0 34,8 44100,0 20,0 20,0 0,0 0,0 
21 6,0 285,0 1695,8 35,4 81225,0 21,0 25,0 -4,0 16,0 
22 6,2 158,0 971,7 37,8 24964,0 22,0 16,0 6,0 36,0 
23 6,3 257,0 1606,3 39,1 66049,0 23,0 23,0 0,0 0,0 
24 6,4 255,0 1621,8 40,4 65025,0 24,0 22,0 2,0 4,0 
25 6,8 330,0 2244,0 46,2 108900,0 25,0 26,0 -1,0 1,0 
26 7,3 260,0 1898,0 53,3 67600,0 26,0 24,0 2,0 4,0 
27 8,4 448,0 3740,8 69,7 200704,0 27,0 27,0 0,0 0,0 
SOMA 145,7 4581,0 26877,3 814,4 980971,0 
 
394,0 
 
 
 
2. Calcule o coeficiente de correlação de Pearson e o coeficiente de correlação de Spearman 
entre anos de escolaridade (x) e renda per capita (y); 
 
Cálculo do coeficiente de correlação linear de Pearson (i): 
 
 𝐫 = 
𝐧 ∑ 𝐱𝐲 − (∑ 𝐱)(∑ 𝐲)
√𝐧 ∑ 𝐱𝟐 − (∑ 𝐱)𝟐√𝐧 ∑ 𝐲𝟐 − (∑ 𝐲)𝟐
=
𝟐𝟕 × 𝟐𝟔𝟖𝟕𝟕, 𝟑 − 𝟏𝟒𝟓, 𝟕 × 𝟒𝟓𝟖𝟏, 𝟎
√𝟐𝟕 × 𝟖𝟏𝟒, 𝟒 − (𝟏𝟒𝟓, 𝟕)𝟐√𝟐𝟕 × 𝟗𝟖𝟎𝟗𝟕𝟏, 𝟎 − (𝟒𝟓𝟖𝟏, 𝟎)𝟐
 
 
= 
𝟕𝟐𝟓. 𝟔𝟖𝟕, 𝟏 − 𝟔𝟔𝟕. 𝟒𝟓𝟏, 𝟕
√𝟐𝟏. 𝟗𝟖𝟖, 𝟖 − 𝟐𝟏. 𝟐𝟐𝟖, 𝟒𝟗√𝟐𝟔. 𝟒𝟖𝟔. 𝟐𝟏𝟕 − 𝟐𝟎. 𝟗𝟖𝟓. 𝟓𝟔𝟏
=
𝟓𝟖. 𝟐𝟑𝟓, 𝟒
√𝟕𝟔𝟎, 𝟑𝟏√𝟓. 𝟓𝟎𝟎. 𝟔𝟓𝟔
 
 
=
𝟓𝟖. 𝟐𝟑𝟓, 𝟒
𝟐𝟕, 𝟔 × 𝟐. 𝟑𝟒𝟓, 𝟒
=
𝟓𝟖. 𝟐𝟑𝟓, 𝟒
𝟔𝟒. 𝟕𝟑𝟑
= 𝟎, 𝟖𝟗𝟗𝟔 
 
Portanto 𝐫 = 𝟎, 𝟖𝟗𝟗𝟔, ou seja, possui uma associação linear positiva forte entre as variáveis x 
e y. 
 
Cálculo do coeficiente de correlação de ranks de Spearman (ii): 
 
 𝐫𝐬 = 𝟏 − 
𝟔 ∑ 𝐝𝐢
𝟐
𝐧(𝐧𝟐 − 𝟏)
= 𝟏 −
𝟔 × 𝟑𝟗𝟒
𝟐𝟕 × (𝟐𝟕𝟐 − 𝟏)
= 𝟏 −
𝟐. 𝟑𝟔𝟒
𝟐𝟕 × 𝟕𝟐𝟖
= 𝟏 −
𝟐. 𝟑𝟔𝟒
𝟏𝟗. 𝟔𝟓𝟔
= 𝟏 − 𝟎, 𝟏𝟐𝟎𝟐 
 
 = 𝟎, 𝟖𝟕𝟗𝟕 
 
Portanto 𝐫𝐬 = 𝟎, 𝟖𝟕𝟗𝟕, ou seja, possui uma associação positiva forte. 
 
3. Teste se as correlações calculadas são significativas; 
 
Teste para correlação de Pearson: 
1) n = 27 (quantidade de pares de dados na amostra); 
2) α = 0,05 (nível de significância de 5%); 
3) 𝐯𝐜𝐫𝐢𝐭 = 𝟎, 𝟑𝟖𝟏 (foi encontrado o valor do 𝐯𝐜𝐫𝐢𝐭 utilizando a tabela de valores críticos para 
o coeficiente de correlação linear 𝐫 de Pearson.); 
4) | 𝐫 | = 𝟎, 𝟖𝟗𝟗 > 𝟎, 𝟑𝟖𝟏; 
Como | 𝐫 | > 𝐯𝐜𝐫𝐢𝐭 , portanto, há evidência suficiente, ao nível de significância de 5%, 
para concluir que há uma correlação linear entre os anos de escolaridade (x) e a renda 
per capta (y). 
 
Teste para a correlação de ranks de Spearman: 
 Utilizando agora o Teste de hipótese para um coeficiente de correlação 𝐫𝐬 para determinar 
se o coeficiente de correlação de ranks de Spearman fornece evidência suficiente. 
1) 
{
 𝐬𝐞 𝐇𝟎: 𝐫 = 𝟎 , 𝐞𝐧𝐭ã𝐨 𝐧ã𝐨 𝐡á 𝐜𝐨𝐫𝐫𝐞𝐥𝐚çã𝐨 𝐬𝐢𝐠𝐧𝐢𝐟𝐢𝐜𝐚𝐭𝐢𝐯𝐚;
𝐬𝐞 𝐇𝐚 : 𝐫 ≠ 𝟎 , 𝐞𝐧𝐭ã𝐨 𝐡á 𝐜𝐨𝐫𝐫𝐞𝐥𝐚çã𝐨 𝐬𝐢𝐠𝐧𝐢𝐟𝐢𝐜𝐚𝐭𝐢𝐯𝐚.
 
 
2) α = 0,05 (nível de significância de 5%); 
3) 𝐠. 𝐥 = n – 2 = 27 – 2 = 25 => g.l = 25 (graus de liberdade); 
4) 𝐯𝐜𝐫𝐢𝐭 = 𝟎, 𝟒𝟎𝟎 (foi encontrado o valor do 𝐯𝐜𝐫𝐢𝐭 utilizando a tabela de valores críticos para 
o coeficiente de correlação de ranks de Spearman.); 
5) Por definição: se | 𝐫𝐬 | > 𝐯𝐜𝐫𝐢𝐭 , então rejeitar 𝐇𝟎; 
6) Como | 𝐫𝐬 | = 𝟎, 𝟖𝟕𝟗 > 𝟎, 𝟒𝟎𝟎 = 𝐯𝐜𝐫𝐢𝐭, então há evidência suficiente, ao nível de 
significância de 5%, para concluir que há correlação entre os ranks de (x) e de (y). 
 
 
 
 
4. Por fim, interprete os resultados obtidos e escreva um texto com suas conclusões, 
incluindo os cálculos do coeficiente de correlação de Pearson e de Spearman, com as 
etapas explícitas – aproximadamente 10 linhas. 
 
Primeiramente, analisando o resultado obtido no cálculo do coeficiente de correlação 
linear de Pearson (i), vemos que o resultado foi de 𝐫 = 𝟎, 𝟖𝟗𝟗𝟔, ou, 𝐫 ≈ 𝟎, 𝟗. Ou seja, que 
existe uma associação positiva muito forte entre os anos de estudo (variável x) e a renda per 
capta (variável y). Com um coeficiente de determinação r2 = 0,809 que, no caso, significa 
que o modelo linear explica 80,9% da variância da variável dependente a partir das variáveis 
independentes incluídas no modelo linear. 
Analisando o resultado obtido no cálculo do coeficiente de correlação de ranks de 
Spearman (ii), que no caso foi de 𝐫𝐬 = 𝟎, 𝟖𝟕𝟗𝟕, temos que há também uma associação muito 
forte entre os ranks (x) e (y), indicando que a direção da associação entre x e y é positiva. 
Conclui-se então, que quanto maior os anos de escolaridade média da população, maior a 
renda per capta nos estados, ou seja, quanto maior o valor de x, maior o valor de y.

Continue navegando