Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE POTIGUAR Disciplina: ANÁLISE DE REGRESSÃO UNIVARIADA Curso: BACHARELADO EM ESTÁTISTICA Discente: Marcus Denner de Sousa Carvalho Matrícula: 2020201856 UNIDADE 1: ASSOCIAÇÃO E CAUSAÇÃO 1. Reproduza os dados do gráfico apresentado na contextualização em uma tabela; observa-se que os valores obtidos são aproximados e, portanto, pode não haver uniformidade total dos resultados; n x y xy x2 y2 rank x rank y di di2 1 3,9 85,0 331,5 15,2 7225,0 1,0 2,5 -1,5 2,3 2 4,0 75,0 298,5 15,8 5625,0 2,0 1,0 1,0 1,0 3 4,1 85,0 350,2 17,0 7225,0 3,0 2,5 0,5 0,3 4 4,3 95,0 408,5 18,5 9025,0 4,0 4,0 0,0 0,0 5 4,4 110,0 484,0 19,4 12100,0 5,0 6,0 -1,0 1,0 6 4,5 105,0 472,5 20,3 11025,0 6,0 5,0 1,0 1,0 7 4,6 125,0 575,0 21,2 15625,0 7,0 15,0 -8,0 64,0 8 4,7 120,0 564,0 22,1 14400,0 8,0 14,0 -6,0 36,0 9 4,8 115,0 552,0 23,0 13225,0 9,0 7,0 2,0 4,0 10 4,9 170,0 833,0 24,0 28900,0 10,0 17,0 -7,0 49,0 11 5,0 117,0 579,2 24,5 13689,0 11,0 8,0 3,0 9,0 12 5,0 119,0 595,0 25,0 14161,0 12,0 12,0 0,0 0,0 13 5,1 118,0 601,8 26,0 13924,0 13,0 9,5 3,5 12,3 14 5,4 215,0 1161,0 29,2 46225,0 14,0 21,0 -7,0 49,0 15 5,5 119,0 654,5 30,3 14161,0 15,0 12,0 3,0 9,0 16 5,5 118,0 651,4 30,5 13924,0 16,0 9,5 6,5 42,3 17 5,6 190,0 1064,0 31,4 36100,0 17,0 19,0 -2,0 4,0 18 5,7 178,0 1005,7 31,9 31684,0 18,0 18,0 0,0 0,0 19 5,7 119,0 678,3 32,5 14161,0 19,0 12,0 7,0 49,0 20 5,9 210,0 1239,0 34,8 44100,0 20,0 20,0 0,0 0,0 21 6,0 285,0 1695,8 35,4 81225,0 21,0 25,0 -4,0 16,0 22 6,2 158,0 971,7 37,8 24964,0 22,0 16,0 6,0 36,0 23 6,3 257,0 1606,3 39,1 66049,0 23,0 23,0 0,0 0,0 24 6,4 255,0 1621,8 40,4 65025,0 24,0 22,0 2,0 4,0 25 6,8 330,0 2244,0 46,2 108900,0 25,0 26,0 -1,0 1,0 26 7,3 260,0 1898,0 53,3 67600,0 26,0 24,0 2,0 4,0 27 8,4 448,0 3740,8 69,7 200704,0 27,0 27,0 0,0 0,0 SOMA 145,7 4581,0 26877,3 814,4 980971,0 394,0 2. Calcule o coeficiente de correlação de Pearson e o coeficiente de correlação de Spearman entre anos de escolaridade (x) e renda per capita (y); Cálculo do coeficiente de correlação linear de Pearson (i): 𝐫 = 𝐧 ∑ 𝐱𝐲 − (∑ 𝐱)(∑ 𝐲) √𝐧 ∑ 𝐱𝟐 − (∑ 𝐱)𝟐√𝐧 ∑ 𝐲𝟐 − (∑ 𝐲)𝟐 = 𝟐𝟕 × 𝟐𝟔𝟖𝟕𝟕, 𝟑 − 𝟏𝟒𝟓, 𝟕 × 𝟒𝟓𝟖𝟏, 𝟎 √𝟐𝟕 × 𝟖𝟏𝟒, 𝟒 − (𝟏𝟒𝟓, 𝟕)𝟐√𝟐𝟕 × 𝟗𝟖𝟎𝟗𝟕𝟏, 𝟎 − (𝟒𝟓𝟖𝟏, 𝟎)𝟐 = 𝟕𝟐𝟓. 𝟔𝟖𝟕, 𝟏 − 𝟔𝟔𝟕. 𝟒𝟓𝟏, 𝟕 √𝟐𝟏. 𝟗𝟖𝟖, 𝟖 − 𝟐𝟏. 𝟐𝟐𝟖, 𝟒𝟗√𝟐𝟔. 𝟒𝟖𝟔. 𝟐𝟏𝟕 − 𝟐𝟎. 𝟗𝟖𝟓. 𝟓𝟔𝟏 = 𝟓𝟖. 𝟐𝟑𝟓, 𝟒 √𝟕𝟔𝟎, 𝟑𝟏√𝟓. 𝟓𝟎𝟎. 𝟔𝟓𝟔 = 𝟓𝟖. 𝟐𝟑𝟓, 𝟒 𝟐𝟕, 𝟔 × 𝟐. 𝟑𝟒𝟓, 𝟒 = 𝟓𝟖. 𝟐𝟑𝟓, 𝟒 𝟔𝟒. 𝟕𝟑𝟑 = 𝟎, 𝟖𝟗𝟗𝟔 Portanto 𝐫 = 𝟎, 𝟖𝟗𝟗𝟔, ou seja, possui uma associação linear positiva forte entre as variáveis x e y. Cálculo do coeficiente de correlação de ranks de Spearman (ii): 𝐫𝐬 = 𝟏 − 𝟔 ∑ 𝐝𝐢 𝟐 𝐧(𝐧𝟐 − 𝟏) = 𝟏 − 𝟔 × 𝟑𝟗𝟒 𝟐𝟕 × (𝟐𝟕𝟐 − 𝟏) = 𝟏 − 𝟐. 𝟑𝟔𝟒 𝟐𝟕 × 𝟕𝟐𝟖 = 𝟏 − 𝟐. 𝟑𝟔𝟒 𝟏𝟗. 𝟔𝟓𝟔 = 𝟏 − 𝟎, 𝟏𝟐𝟎𝟐 = 𝟎, 𝟖𝟕𝟗𝟕 Portanto 𝐫𝐬 = 𝟎, 𝟖𝟕𝟗𝟕, ou seja, possui uma associação positiva forte. 3. Teste se as correlações calculadas são significativas; Teste para correlação de Pearson: 1) n = 27 (quantidade de pares de dados na amostra); 2) α = 0,05 (nível de significância de 5%); 3) 𝐯𝐜𝐫𝐢𝐭 = 𝟎, 𝟑𝟖𝟏 (foi encontrado o valor do 𝐯𝐜𝐫𝐢𝐭 utilizando a tabela de valores críticos para o coeficiente de correlação linear 𝐫 de Pearson.); 4) | 𝐫 | = 𝟎, 𝟖𝟗𝟗 > 𝟎, 𝟑𝟖𝟏; Como | 𝐫 | > 𝐯𝐜𝐫𝐢𝐭 , portanto, há evidência suficiente, ao nível de significância de 5%, para concluir que há uma correlação linear entre os anos de escolaridade (x) e a renda per capta (y). Teste para a correlação de ranks de Spearman: Utilizando agora o Teste de hipótese para um coeficiente de correlação 𝐫𝐬 para determinar se o coeficiente de correlação de ranks de Spearman fornece evidência suficiente. 1) { 𝐬𝐞 𝐇𝟎: 𝐫 = 𝟎 , 𝐞𝐧𝐭ã𝐨 𝐧ã𝐨 𝐡á 𝐜𝐨𝐫𝐫𝐞𝐥𝐚çã𝐨 𝐬𝐢𝐠𝐧𝐢𝐟𝐢𝐜𝐚𝐭𝐢𝐯𝐚; 𝐬𝐞 𝐇𝐚 : 𝐫 ≠ 𝟎 , 𝐞𝐧𝐭ã𝐨 𝐡á 𝐜𝐨𝐫𝐫𝐞𝐥𝐚çã𝐨 𝐬𝐢𝐠𝐧𝐢𝐟𝐢𝐜𝐚𝐭𝐢𝐯𝐚. 2) α = 0,05 (nível de significância de 5%); 3) 𝐠. 𝐥 = n – 2 = 27 – 2 = 25 => g.l = 25 (graus de liberdade); 4) 𝐯𝐜𝐫𝐢𝐭 = 𝟎, 𝟒𝟎𝟎 (foi encontrado o valor do 𝐯𝐜𝐫𝐢𝐭 utilizando a tabela de valores críticos para o coeficiente de correlação de ranks de Spearman.); 5) Por definição: se | 𝐫𝐬 | > 𝐯𝐜𝐫𝐢𝐭 , então rejeitar 𝐇𝟎; 6) Como | 𝐫𝐬 | = 𝟎, 𝟖𝟕𝟗 > 𝟎, 𝟒𝟎𝟎 = 𝐯𝐜𝐫𝐢𝐭, então há evidência suficiente, ao nível de significância de 5%, para concluir que há correlação entre os ranks de (x) e de (y). 4. Por fim, interprete os resultados obtidos e escreva um texto com suas conclusões, incluindo os cálculos do coeficiente de correlação de Pearson e de Spearman, com as etapas explícitas – aproximadamente 10 linhas. Primeiramente, analisando o resultado obtido no cálculo do coeficiente de correlação linear de Pearson (i), vemos que o resultado foi de 𝐫 = 𝟎, 𝟖𝟗𝟗𝟔, ou, 𝐫 ≈ 𝟎, 𝟗. Ou seja, que existe uma associação positiva muito forte entre os anos de estudo (variável x) e a renda per capta (variável y). Com um coeficiente de determinação r2 = 0,809 que, no caso, significa que o modelo linear explica 80,9% da variância da variável dependente a partir das variáveis independentes incluídas no modelo linear. Analisando o resultado obtido no cálculo do coeficiente de correlação de ranks de Spearman (ii), que no caso foi de 𝐫𝐬 = 𝟎, 𝟖𝟕𝟗𝟕, temos que há também uma associação muito forte entre os ranks (x) e (y), indicando que a direção da associação entre x e y é positiva. Conclui-se então, que quanto maior os anos de escolaridade média da população, maior a renda per capta nos estados, ou seja, quanto maior o valor de x, maior o valor de y.
Compartilhar