Prévia do material em texto
Teste de Hipóteses / Estatísticas Inferenciais Análise dos dados Descritivas: descrever os dados da amostra (média, mediana, etc) Inferenciais: Avaliar o erro na generalização dos resultados (teste t, correlação, etc) Formulação de Hipóteses Teste estatístico ‘testa’ a ‘falsidade’ da hipótese nula; mas não ‘confirma’ a hipótese nula. Hipótese nula (H0): Não há efeito (ou o efeito é apenas aleatório) – Não há relação entre duas variáveis. Duas amostras foram retiradas da mesma população e qualquer diferença é ao acaso. Ex: Não há associação entre terapia e diminuição dos sintomas de depressão. Hipótese Alternativa (H1): Uma hipótese alternativa afirma que existe uma relação entre duas variáveis. Há efeito sistemático – há relação entre duas variáveis Duas amostras foram retiradas de populações diferentes, portanto a diferença é real e não se deve ao erro de amostragem Significância estatística (valor de p) - Probabilidade do resultado ser devido ao erro amostral, caso não exista relação entre as variáveis na população - Probabilidade de observar um ‘padrão’ nos dados, sendo a hipótese nula verdadeira. Depende: - Tamanho de efeito - Correlações mais fortes são mais fáceis de observar, portanto há uma tendência de valores de p menores - Tamanho da amostra – quanto maior a amostra, menor a chance de erro, portanto, menor é o valor de p. Há basicamente duas grandes famílias de perguntas para os testes estatísticos: Correlação: O aparecimento de um fenômeno é concomitante ao aparecimento de outro, mais do que se esperaria ao acaso. - medir as relações entre variáveis e o que elas representam. - avaliar o quanto duas variáveis variam conjuntamente (isto é, covariam) Diferenças: Verificação de discrepância entre medidas (médias) relacionadas a aspectos em estudo, discrepância esta que ultrapasse a mera variabilidade inerente aos fenômenos naturais e que possa ser considerada portanto sistemática: TEST-T E ANOVA Test T - Independente e Dependente Para que serve? Comparar duas médias, dois grupos diferentes - O resultado da manipulação experimental é aleatório ou sistemático. - Variação sistemática: Aconteceu algo no experimento que resultou em diferenças sistemáticas entre os grupos ou entre tempos diferentes. - Variação aleatória: O efeito do experimento se deve a condições naturais e aleatórias alheias às condições experimentais. Para amostra independentes: diferentes participantes em cada grupo (ou condição experimental) Para amostra dependentes (ou para medidas repetidas) – quando o mesmo participante participa de duas condições da pesquisa (antes e depois da terapia, por exemplo) Test-T (para Amostras Independentes) ● Serve para verificar se duas amostras possuem médias que diferem significativamente entre si; ● As duas amostras precisam ser independentes; Sempre, iremos utilizar o teste de Levene para verificar a homogeneidade da variância (ou igualdade das variâncias) QUEREMOS QUE ELAS SEJAM HOMOGÊNEAS - Levene compara a variância interna do grupo A com a do grupo B. Se o Levene for significativo (p < 0,05), p menor, então não há homogeneidade. Portanto, você ‘quer’ que o p (do Levene) seja maior do que 0,05. Exige (tem como pressuposto): - Os dois grupos devem ter mais ou menos o mesmo número de participantes (n grupo 1 = n grupo 2) - As variâncias dos dois grupos devem ser homogêneas (igualdade das variâncias - levene) Test-T Student - Quando a homogeneidade é assumida Teste-T Welch - Quando a homogeneidade das variâncias não puder ser assumida Quando a homogeneidade das variâncias não puder ser assumida (p < 0,05), ou possuem um tamanho de grupos for muito desequilíbrio (grupo 1, n=200; grupo 2, n=30). Utilizamos do Test-T Welch. Teste t de Welch - Grupos não têm variância homogênea - Grupos não têm tamanhos iguais (ou parecidos) p < 0,05 = grupos não têm variâncias homogêneas. Tamanho do Efeito Significância estatística (valor de p) é bem importante para sabermos se o que estamos observado não é aleatório, mas sua interpretação acaba aí. - Tamanho de efeito indica a ‘força’ de uma relação entre variáveis. Test-T (para Amostras Dependentes) Diferenças são estatisticamente significativas se p < 0,05 (Ou seja, não podem ser atribuídas ao acaso) Para diferenças de duas médias, o mais utilizado é o d de Cohen Significância estatística Levene para homogeneidade/igualdade das variâncias (pressuposto do teste t) - H0 nula: não há diferença entre as variâncias dos grupos (ou seja, variâncias internas dos grupos) - p < 0,05 = grupos variam de forma diferente, não há homogeneidade (indesejável) - p > 0,05 = desejável, assume-se que os grupos são homogêneos (há igualdade das variâncias OU há homogeneidade das variâncias) Teste t - H0 nula: não há diferença entre as MÉDIAS dos grupos - p < 0,05 = desejável, grupos têm médias diferentes - p > 0,05 = indesejável, não há evidências de que os grupos tenham médias diferentes Tamanho de efeito (d de Cohen) - p < 0,05 = Não faz sentido, então não há p para tamanho de efeito. Análise da Variância - ANOVA Quando se tem mais de 2 grupos, é utilizado a ANOVA para fazer o teste. Quando comparado com mais de grupos, o p do test-t fica subestimado (errado) Com Anova é possível concluir apenas que existem diferenças entre os grupos. Se, Igualdade/homogeneidade das variâncias não foi assumida = analisa-se com Anova de Welch Se, Igualdade/homogeneidade das variâncias assumidas = analisa-se com Anova de Fisher Para saber qual dos grupos diferem entre si, é preciso utilizar algum teste Post Hoc: Games-Howell & Tukey - Tukey padrão quando a homogeneidade das variâncias pode ser assumida (Levene, p > 0,05) - Games-Howell quando a homogeneidade das variâncias não puder ser assumida (Levene, p < 0,05) ANOVA PASSO A PASSO: Passo 1: Avaliar a homogeneidade das variâncias - Levene, p > 0,05 = assume-se a homogeneidade - Levene, p < 0,05 = NÃO se assume a homogeneidade Passo 2: Avaliar a diferença entre os grupos - Usar Anova de Fischer, se homogeneidade das variâncias for assumida (quando Levene, p > 0,05) - Usar Anova de Welch (ou correção de Welch), se homogeneidade das variâncias NÃO for assumida (quando Levene, p < 0,05) Passo 3: Avaliar com testes Post-Hoc quais grupos específicos que apresentam diferenças - Usar Tukey, se homogeneidade das variâncias for assumida (quando Levene, p > 0,05) - Usar Games-Howell, se homogeneidade das variâncias NÃO for assumida (quando Levene, p < 0,05) Grupos são diferentes quando p-value (do Post Hoc) for menor do que 0,05 (p < 0,05) - Atenção: p de 0,001; 0,005 são menores do que 0,05 - Atenção: p-value = p = significância estatística CORRELAÇÃO II - Pearson - Duas variáveis estão correlacionadas se existe associação entre elas. Isso significa que quando os valores de uma mudam, valores da outra mudam também (a não ser que a correlação seja 0). - Quanto mais próxima de 1 (ou -1), mais forte é a correlação Significância estatística (p) Quando analisamos correlações, a hipótese nula que é testada é: a correlação na população é nula, ou seja, igual a zero. p < 0,05 – correlação é estatisticamente significativa (há evidência que a correlação na população não é nula). Teste de Correlação de Spearman - Interpretação idêntica à correlação de Pearson; variáveis ordinais. rho de Spearman indica a força da associação - Rho positivo – indica que as duas variáveis variam na mesma direção (uma sobe a outra também sobe) - Rho negativo – indica que as duas variáveis variam em direção oposta (uma sobe a outra desce) Testes Não Paramétricos Não requerem (não assumem) pressupostos, ou seja, são úteis para dados que não apresentam distribuição normal, para variáveis ordinais (e alguns para variáveis dicotômicas) e para grupos heterogêneos. Para interpretação, sugerido utilizar a mediana (média). Testes não-paramétricos são mais apropriados quando: - Não tem distribuição normal - Há heterogeneidade de variâncias - As variáveis são medidas em nível ordinal Mann-Whitney (U):Teste não-Paramétrico para duas amostras independentes Exigência: Pelo menos nível ordinal de mensuração; Teste de Wilcoxon: Teste não-Paramétrico para duas amostras dependentes. Teste de Kruskal-Wallis: Teste não-Paramétrico para a ANOVA (grupos independentes) Teste de ANOVA DE Friedman: Teste não-Paramétrico medidas repetidas (amostras dependentes) Distribuição Normal Histograma – tem formato de sino invertido Teste Shapiro-Wilk: compara os seus dados com a distribuição normal p > 0,05 = não há evidência que os seus dados sejam diferentes de uma distribuição normal - prática: p > 0,05 – distribuição normal p < 0,05 – não tenho distribuição normal. Achatamento (Curtose): caudas maiores ou menores do que o esperado para uma distribuição normal Negativo: Platicúrtica: mais achatada e caudas leves = poucos valores ao redor da média Positivo: Leptocúrtica: menos achatada e caudas mais pesadas = valores mais próximos da média Normal: Mesocúrtica