Baixe o app para aproveitar ainda mais
Prévia do material em texto
IV- ESTATÍSTICA INFERENCIAL 4.2 TESTES NÃO PARAMÉTRICOS 1.TESTES DO AJUSTAMENTO À NORMALIDADE 2.TESTE DE ADERÊNCIA DO QUI-QUADRADO GRAÇA TRINDADE ISCTE – IUL 1 I – TESTE DE AJUSTAMENTO KOLMOGOROV-SMIRNOV (K-S) TESTE DE AJUSTAMENTO SHAPIRO-WILK (S-W) (Adequado a variáveis métricas) KOLMOGOROV-SMIRNOV TEST (K-S) n >50 SHAPIRO-WILK TEST (S-W) n ≤ 50 OBJECTIVO: pretende-se testar se determinada variável métrica segue distribuição normal. FORMULAÇÃO DE HIPÓTESES: H0: A variável Idade no grupo populacional de sexo i segue distribuição normal Ha: A variável Idade no grupo populacional i não segue distribuição normal EXECUÇÃO DO TESTE COM RECURSO AO SPSS: Obtenham-se os outputs através dos comandos: Analyze→ Descriptive Statistics → Explore Dependent list: Idade Factor list: Sexo OUTPUTS:____________________________________________________________________ Case Processing Summary 28 82,4% 6 17,6% 34 100,0% 60 90,9% 6 9,1% 66 100,0% Sexo feminino masculino Idade N Percent N Percent N Percent Valid Missing Total Cases IV- ESTATÍSTICA INFERENCIAL 4.2 TESTES NÃO PARAMÉTRICOS 1.TESTES DO AJUSTAMENTO À NORMALIDADE 2.TESTE DE ADERÊNCIA DO QUI-QUADRADO GRAÇA TRINDADE ISCTE – IUL 2 Como 5028 ≤=Fn , toma-se a decisão através do teste S-W; 5060 >=n , toma-se a decisão através do teste K-S ou pode-se recorrer ao teorema do limite central se a condição da simetria não for grave. Tests of Normality ,138 28 ,182 ,959 28 ,323 ,089 60 ,200* ,961 60 ,051 Sexo feminino masculino Idade Statistic df Sig. Statistic df Sig. Kolmogorov-Smirnov a Shapiro-Wilk This is a lower bound of the true significance.*. Lilliefors Significance Correctiona. * Correcção devida a não se estar a trabalhar com os verdadeiros valores dos parâmetros. II - TESTE DE ADERÊNCIA DO QUI-QUADRADO (Adequado a variáveis qualitativas) OBJECTIVO: Pretende-se testar se a proporção populacional de leitores de cada jornal semanário é igual FORMULAÇÃO DE HIPÓTESES: H0: A variável Proporção populacional de leitores de cada semanário é igual na população de onde foi retirada esta amostra H1: A variável não segue distribuição uniforme A estatística do teste é: ( ) ( )I 2 1 1 2 −− = χ−∑ kc c i i ii Fe FeFo onde c = nº categorias (ou de modalidades) da variável e k = nº de parâmetros a estimar Região Crítica Unilateral à Direita Valor da estatística do teste: No grupo feminino: T=0,959 No grupo masculino: T=0,089 Nível de significância = 0,05 Decisão: No grupo de leitores do sexo feminino: como, Sig = 0,323 > 0,05 ⇒ Não rejeitar H0, ou seja, há evidência estatística de que a distribuição populacional da Idade dos leitores do sexo feminino seja normal. No grupo de leitores do sexo masculino: • como Sig = 0,200 > 0,05 ⇒ Não rejeitar H0, ou seja, a distribuição populacional da Idade dos leitores do sexo masculino deve seguir distribuição normal. IV- ESTATÍSTICA INFERENCIAL 4.2 TESTES NÃO PARAMÉTRICOS 1.TESTES DO AJUSTAMENTO À NORMALIDADE 2.TESTE DE ADERÊNCIA DO QUI-QUADRADO GRAÇA TRINDADE ISCTE – IUL 3 EXECUÇÃO DO TESTE COM RECURSO AO SPSS: Obtenham-se os outputs através dos comandos: Analyze→ Non-parametric tests→ Chi-Square Test Variable list: P1 Expected Values: All categories equal OUTPUTS: ___________________________________________________________________ Semanario preferido 50 33,3 16,7 25 33,3 -8,3 25 33,3 -8,3 100 expresso semanario sol Total Observed N Expected N Residual Test Statistics 12,500 2 ,002 ,002 ,000 Chi-Square a df Asymp. Sig. Exact Sig. Point Probability Semanario preferido 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 33,3. a. POTENCIAL PROBLEMA: Se o SPSS não convergir para uma solução (o que não sucedeu neste exemplo) e se não tivermos a significância exacta, antes de se interpretar a Asymp. Sig. dada pelo teste assimptótico deve-se interpretar a alínea a. do respectivo output onde se identificam as condições de aplicabilidade do teste assimptótico. - frequências observadas, FOi (Observed N) - frequências esperadas no caso da hipótese nula ser verdadeira, Fei (Expected N) - diferenças entre frequências observadas e esperadas (Residual) Valor da estatística do teste = 12,500 Graus de liberdade = (3-0-1) = 2 Nível de significância = 0,05 Decisão: 0,002 < 0,05 ⇒ Rejeitar H0, ou seja, a distribuição populacional das preferências dos leitores pelos 3 semanários não é igual IV- ESTATÍSTICA INFERENCIAL 4.2 TESTES NÃO PARAMÉTRICOS 1.TESTES DO AJUSTAMENTO À NORMALIDADE 2.TESTE DE ADERÊNCIA DO QUI-QUADRADO GRAÇA TRINDADE ISCTE – IUL 4 CONDIÇÕES DE APLICABILIDADE DO TESTE ASSIMPTÓTICO: Este teste só se pode realizar se ambas as condições abaixo especificadas forem cumpridas. 1) Não mais de 20% dos cruzamentos (cells) deverão ter frequências esperadas < 5 2) Nenhum cruzamento deverá ter frequência esperada < 1 III - TESTE DE INDEPENDÊNCIA DO QUI-QUADRADO (Adequado a duas variáveis qualitativas nominais ou tratadas como tal) CASO I: Pretende-se testar se a variável Sexo é independente das Preferências pelos semanários. FORMULAÇÃO DE HIPÓTESES: H0: As variáveis Sexo e Semanário Preferido são independentes (não estão relacionadas) Ha: as duas variáveis não são independentes (estão relacionadas) Estatística do teste: ( ) ( ) ( )I 2 11 2 21 −− χ − ∑∑ cci j ij ijij Fe FeFo onde c1 = nº categorias ou modalidades da variável 1 e c2 = nº categorias ou modalidades da variável 2 EXECUÇÃO DO TESTE COM RECURSO AO SPSS: Obtenham-se os outputs através dos comandos: Analyze → Descriptive Statistics→ Crosstabs: Row: Sexo Column: P1 Região Crítica Unilateral à Direita IV- ESTATÍSTICA INFERENCIAL 4.2 TESTES NÃO PARAMÉTRICOS 1.TESTES DO AJUSTAMENTO À NORMALIDADE 2.TESTE DE ADERÊNCIA DO QUI-QUADRADO GRAÇA TRINDADE ISCTE – IUL 5 Statistics: Chi-Square Exact: Exact Tests Cells: Counts:Observed Expected Percents: Row Colum Total A decisão a tomar vai ser baseada no teste exacto se este convergir para determinado valor. Se não convergir, a decisão vai ter de ser baseada no teste assimptótico se as condições de aplicabilidade se verificarem. OUTPUTS ______________________________________________________________________ 1. as preferências amostrais dos leitores femininos concentram-se no Expresso e no Independente; 2. enquanto que os leitores masculinos, nesta amostra, preferem sobretudo o Expresso e, em seguida, o Semanário. Chi-Square Tests 10,517a 2 ,005 ,005 10,241 2 ,006 ,006 9,926 ,007 5,791b 1 ,016 ,022 ,012 ,006 100 Pearson Chi-Square Continuity Correction Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases Value df Asymp. Sig. (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided) Point Probability 0 cells (,0%) have expected count less than 5. The minimum expected count is 8,50.a. The standardized statistic is -2,407.b. Tabela de contingência ou de dupla entrada: - frequências observadas, FOij (count) - frequências esperadas no caso deindependência entre as 2 variáveis, Feij (expected count) IV- ESTATÍSTICA INFERENCIAL 4.2 TESTES NÃO PARAMÉTRICOS 1.TESTES DO AJUSTAMENTO À NORMALIDADE 2.TESTE DE ADERÊNCIA DO QUI-QUADRADO GRAÇA TRINDADE ISCTE – IUL 6 Se estão relacionadas, deve-se pedir o coeficiente de associação adequado a estas variáveis. O coeficiente de associação amostral, sendo igual a 0,324, mostra que as variáveis estão fracamente associadas na amostra apesar desse valor ser extrapolável para a população como sendo significativamente diferente de zero. CASO II: Pretende-se testar se a variável Licenciatura e Realização Pessoal da base de dados Universidade.sav estão relacionadas. A variável Licenciatura é uma variável nominal expressa em 4 categorias diferentes; a variável Realização Pessoal é uma variável nominal expressa em 4 categorias. FORMULAÇÃO DE HIPÓTESES: H0: As variáveis Licenciatura a que pertence e Realização pessoal (não estão relacionadas) Ha: as duas variáveis não são independentes (estão relacionadas) Valor da estatística do teste = 10,517 Graus de liberdade = (3-1) x (2-1) = 2 Nível de significância = 0,05 Decisão: 0,005 < 0,05 ⇒ Rejeitar H0, ou seja, as duas variáveis não são independentes, i. e., estão relacionadas. Região Crítica Unilateral à Direita IV- ESTATÍSTICA INFERENCIAL 4.2 TESTES NÃO PARAMÉTRICOS 1.TESTES DO AJUSTAMENTO À NORMALIDADE 2.TESTE DE ADERÊNCIA DO QUI-QUADRADO GRAÇA TRINDADE ISCTE – IUL 7 FIGURA 1 DETERMINAÇÃO DAS CÉLULAS RESPONSÁVEIS PELA ESTRUTURA PRESENTE NOS DADOS E PATENTE NA FIGURA 1 Para essa determinação há que seguir os seguintes comandos: Analyze → Descriptive statistics → Crosstabs → Statistics → Chi-Square → Cells → Adjusted Standardized Para 050,=α , as células responsáveis por tal estrutura são as que apresentam resíduos Adjusted standardized fora do domínio ] [96,1;96,1− na tabela seguinte: IV- ESTATÍSTICA INFERENCIAL 4.2 TESTES NÃO PARAMÉTRICOS 1.TESTES DO AJUSTAMENTO À NORMALIDADE 2.TESTE DE ADERÊNCIA DO QUI-QUADRADO GRAÇA TRINDADE ISCTE – IUL 8 Licenciatura * Realização pessoal Crosstabulation Realização pessoal Total Aproveitar individualmente as coisas boas da vida Preparar um futuro de bem estar estável e duradouro Viver intensamente o dia-a-dia com os outros Participar com os outros no desenvolv/ e melhoria do mundo Licenciatura Ciência Política Count 2 11 8 13 34 Expected Count 2,3 7,7 9,3 14,7 34,0 Adjusted Residual -,2 1,4 -,5 -,6 Comunicação Social Count 4 6 10 10 30 Expected Count 2,0 6,8 8,2 13,0 30,0 Adjusted Residual 1,5 -,4 ,8 -1,2 Relações Internacionais Count 6 17 5 11 39 Expected Count 2,7 8,9 10,6 16,8 39,0 Adjusted Residual 2,3 3,3 -2,2 -2,0 Serviço Social Count 8 33 54 93 188 Expected Count 12,8 42,8 51,2 81,2 188,0 Adjusted Residual -2,3 -2,9 ,8 2,9 Sociologia Count 0 0 3 0 3 Expected Count ,2 ,7 ,8 1,3 3,0 Adjusted Residual -,5 -,9 2,8 -1,5 Total Count 20 67 80 127 294 Expected Count 20,0 67,0 80,0 127,0 294,0 As célula a sombreado a rosa na tabela acima indicada são as responsáveis pela estrutura da relação presente na Figura 1. Chi-Square Tests Value df Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) Pearson Chi-Square 35,416a 12 ,000 .b Likelihood Ratio 33,388 12 ,001 .c Fisher's Exact Test .c . c Linear-by-Linear Association 6,639 1 ,010 .b .b N of Valid Cases 294 a. 7 cells (35,0%) have expected count less than 5. The minimum expected count is ,20. b. Cannot be computed because there is insufficient memory. c. Cannot be computed because the time limit has been exceeded. PROBLEMA: Como o teste exacto não convergiu, tem de se fazer a leitura da significância assimptótica se e só se as condições de aplicabilidade forem respeitadas. Deve-se interpretar a asymp. sig (significância assimptótico) e a alínea a. do respectivo output. CONDIÇÕES DE APLICABILIDADE DO TESTE ASSIMPTÓTICO: � Não mais de 20% dos cruzamentos (cells) deverão ter frequências esperadas < 5 � Nenhum cruzamento deverá ter frequência esperada < 1 IV- ESTATÍSTICA INFERENCIAL 4.2 TESTES NÃO PARAMÉTRICOS 1.TESTES DO AJUSTAMENTO À NORMALIDADE 2.TESTE DE ADERÊNCIA DO QUI-QUADRADO GRAÇA TRINDADE ISCTE – IUL 9 Como há 35% de frequências esperadas inferiores a 5 (=7/20) e há frequências esperadas inferiores a 1 (=2) não se deve fazer a interpretação da significância assimptótica. CONCLUSÃO: O teste de independência não pode ser interpretado. SOLUÇÃO: como o problema parece ser o nº escasso de alunos inquiridos que frequentam a licenciatura de Sociologia, a solução passa por agregar estes 3 alunos ou à licenciatura de Ciência Política ou à licenciatura de Comunicação Social através do RECODE. GET FILE='H:\ISCTE\Base_Dados\Base Universidade AD.sav'. DATASET NAME DataSet1 WINDOW=FRONT. RECODE lic (1=1) (2=2) (3=3) (4=4) (5=1) (SYSMIS=SYSMIS) INTO rlic. EXECUTE. Frequency Percent Valid Percent Valid Ciência Política+Sociologia 37 12,4 12,4 Comunicação Social 32 10,7 10,7 Relações Internacionais 41 13,7 13,8 Serviço Social 188 62,9 63,1 Total 298 99,7 100,0 Missing System 1 ,3 Total 299 100,0 FIGURA 2 Verifica-se que a estrutura entre as variáveis foi mantida. IV- ESTATÍSTICA INFERENCIAL 4.2 TESTES NÃO PARAMÉTRICOS 1.TESTES DO AJUSTAMENTO À NORMALIDADE 2.TESTE DE ADERÊNCIA DO QUI-QUADRADO GRAÇA TRINDADE ISCTE – IUL 10 Licenciatura recodificada * Realização pessoal Crosstabulation Realização pessoal Total Aproveitar individualment e as coisas boas da vida Preparar um futuro de bem estar estável e duradouro Viver intensamente o dia-a-dia com os outros Participar com os outros no desenvolv/ e melhoria do mundo Licenciatura recodificada Ciência Política+Sociologia Count 2 11 11 13 37 Expected Count 2,5 8,4 10,1 16,0 37,0 Adjusted Residual -,4 1,1 ,4 -1,1 Comunicação Social Count 4 6 10 10 30 Expected Count 2,0 6,8 8,2 13,0 30,0 Adjusted Residual 1,5 -,4 ,8 -1,2 Relações Sociais Count 6 17 5 11 39 Expected Count 2,7 8,9 10,6 16,8 39,0 Adjusted Residual 2,3 3,3 -2,2 -2,0 Serviço Social Count 8 33 54 93 188 Expected Count 12,8 42,8 51,2 81,2 188,0 Adjusted Residual -2,3 -2,9 ,8 2,9 Total Count 20 67 80 127 294 Expected Count 20,0 67,0 80,0 127,0 294,0 Chi-Square Tests Value df Asymp. Sig. (2- sided) Exact Sig. (2-sided) Exact Sig. (1-sided) Pearson Chi-Square 27,152a 9 ,001 .b Likelihood Ratio 25,456 9 ,003 .c Fisher's Exact Test .b .b Linear-by-Linear Association 6,732 1 ,009 .b .b N of Valid Cases 294 a. 3 cells (18,8%) have expected count less than 5. The minimum expected count is 2,04. b. Cannot be computed because there is insufficient memory. c. Cannot be computed because the time limit has been exceeded. DECISÃO: uma vez que as condições de aplicabilidade do teste assimptótico estão validadas, pode-se concluir que se rejeita Ho. Ou seja, as variáveis não são independents na população, i. e., estão relacionadas. Symmetric Measures Value Approx. Sig. Exact Sig. Nominal by Nominal Phi ,304 ,001 . c Cramer's V ,175 ,001 .c N of Valid Cases 294 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. c.Cannot be computed because there is insufficient memory. CONCLUSÃO: as variáveis estão fracamente relacionadas na amostra (V-Cramer=0,175), apesar de na população elas estarem relacionadas.
Compartilhar