Prévia do material em texto
TESTES PARAMÉTRICOS Variável dependente medida em escala métrica P1 – Revisão de conceitos: Em 1990, a média de idade das mulheres quando tinham o primeiro filho era 27 anos. Será que em 2017 se manteve? 1. Qual a variável em estudo e sua escala de medida? Idade com que as mulheres tiveram o seu 1º filho; escala métrica de razão. 2. Indique a média, o desvio-padrão e o erro-padrão da idade com que as mães têm o primeiro filho, usando o SPSS. média erro-padrão desvio-padrão 3. Faça o teste de hipóteses para um nível de significância de 0.05 (sem spss). i. Especificação das Hipóteses H0 : Em 2017, a idade com que as mães tiveram o primeiro filho (é igual a 27) não foi diferente de 27. H1 : Em 2017, a idade com que as mães tiveram o primeiro filho foi diferente de 27. H0 : μ = 27 vs. H1 : μ ≠ 27 ii. Cálculo da estatística de teste e do valor-p associado valor médio hipotético p/ população (µ0) erro-padrão da amostra média da amostra Estatística de Teste = = 6.58 |valor crítico| = 1.96 |estatística de teste| = 6.58 A probabilidade (do acaso) de obtermos um valor de estatística de teste igual ou superior a 6.58 é inferior a 0.05 – valor-p próximo de 0. iii. Decisão sobre as hipóteses Como 6.58 > 1.96, rejeita-se a H0. NOTA: Se utilizarmos o valor-p: Quando p < 0.05, rejeita-se a H0; quando p > 0.05, considera-se a H0. iv. Conclusão sobre o problema de investigação Rejeita-se H0 e, portanto, pode-se dizer que a idade com que as mulheres foram mães pela primeira vez é significativamente diferente de 27. Em média, a idade com que as mães tiveram o primeiro em 2017 foi diferente da de 1990. 4. Faça o teste de hipóteses para um nível de significância de 0.05 (com spss). estatística de teste valor-p graus de liberdade i. Especificação das hipóteses H0 : μ = 27 vs. H1 : μ ≠ 27 ii. Cálculo da estatística de teste e de valor-p associado Pelo output do SPSS, t(49) = 6.58 e p < 0.05 iii. Decisão sobre as hipóteses Como p < 0.05, rejeita-se a hipótese nula (H0) iv. Conclusão Em 2017, em média, a idade com que as mães tiveram o primeiro filho foi diferente de 27 anos, logo diferente de 1990. P2 – Modelo nulo O modelo nulo é uma constante, não inclui o peso de nenhuma VI e, portanto, faz a mesma predição para todas as observações. Um investigador quer saber a quantidade de chocolates que as pessoas comem durante um dia. Para o efeito, observou a quantidade de barras de chocolates consumidos por um grupo de 12 pessoas. 1. Representação gráfica do modelo nulo Y’i = b0 melhor parâmetro estimado para os dados quando todas as VIs são iguais a zero Se assumirmos que, em média, se comem 5 chocolates por dia, então, o modelo nulo será: Y’i = 5 2. Erro do modelo nulo Todos os modelos têm um erro associado: diferença entre os dados observados e o modelo. ei = Yi – Y’i Em média, comem-se 5 chocolates por dia, com um desvio padrão de 2.41 3. Princípio fundamental de análise dos dados O princípio fundamental da análise de dados é minimizar o erro associado ao nosso modelo. Ou seja, quanto menor o erro modelo, mais próximo o modelo está dos dados, melhor é modelo. A minimização do erro é feita através do Método dos Mínimos Quadrados (MMQ). 5 é o valor de b0 a que corresponde o valor mínimo de erro quadrado, ou seja, o modelo com menos erro associado De acordo com o MMQ, a média é o melhor modelo para representar os dados, num modelo sem variável independente e com variável dependente métrica. P3 – Modelo I: Modelo proposto Modelo estatístico mais completo: faz predições para cada observação, ou seja, contempla o peso de uma ou mais VIs. O investigador levantou a hipótese de que a quantidade de chocolates que as pessoas comem varia em função do seu nível de ansiedade. 1. Representação gráfica do modelo proposto Y’i = b0 + b1Xi Valor do efeito da variável independente (na dependente), quando todos os outros parâmetros são iguais a zero soma quadrados dos erros (X) soma produtos dos erros 2. Proporção da redução do erro soma quadrados dos erros Modelo proposto (SEQ) modelo proposto:b0 Modelos nulo (SEQ) Y’i = -0.29 + 5.329Xi b1 P4 – Modelo II: VD contínua e VI dicotómica O investigador levantou a hipótese de que a quantidade de chocolates que homens e mulheres comem é diferente. 1. Revisão do cálculo manual i. Modelo nulo Y’i = 5.00 Em média, comem-se 5 chocolates por dia. ii. Erro do modelo nulo Em média, comem-se 5 chocolates, com um desvio-padrão de 2.41 (soma dos quadrados dos erros = 64) iii. Modelo proposto Codificação em dummy: Permite representar um efeito de uma variável qualitativa de uma forma quantitativa; consiste na atribuição dos códigos “1” e “0”, que devem respeitar as seguintes regras: · nº dummies = C − 1, onde C = a quantidade de categorias; · atribuição do código “1” a uma condição e “0” às outras condições. Exp. Homens = 0; Mulheres = 1 Y’i = 3.17 + 3.66X iv. Proporção de redução do erro/ Tamanho do efeito PRE = 40.33/64 = 0.63 2. Cálculo em spss NOTA: A grande diferença entre a ANOVA e o Regressão Linear é que a primeira faz comparação entre grupos em desenhos experimentais, enquanto a segunda trata de grupos não experimentais. 3. Teste de hipóteses (cálculo manual) Método de inferência estatística que permite determinar se determinado efeito identificado na nossa amostra pode ser generalizado para a população. Teste para b0 i. Enumeração da hipótese H0: b0 = 0 H1: b1 ≠ 0 ii. Identificação da estatística de teste e valor-p associado Estatística de teste (t) = erro-padrão t = 5.04 p = 0.01 soma quadrados dos erros desvio-padrão iii. Decisão e conclusões Como p < 0.05, rejeita-se H0. Ou seja, b0 é significativamente diferente de 0 – o número de chocolates que os homens comem é significativamente diferente de 0. Teste para b1 i. Enumeração da hipótese H0: b0 = 0 H1: b1 ≠ 0 ii. Identificação da estatística de teste e valor-p associado t = 4.13 p = 0.02 iii. Decisão e conclusões Como p < 0.05, rejeita-se H0. Ou seja, a variação no número de chocolates comidos por homens e por mulheres é significativamente diferente de 0. 4. Teste de hipóteses (cálculo em spss) P5 – Modelo III: VD contínua e VI categórica Um investigador quer saber se mensagens persuasivas influenciam o consumo de chocolates. Existem 2 hipóteses: i) a mensagem de que o chocolate “faz mal” leva a menor consumo comparado com a mensagem “neutra”; ii) a mensagem de que o chocolate “faz bem” leva a maior consumo comparado com a mensagem “neutra”. Os participantes foram distribuídos aleatoriamente pelos três grupos e mediu-se posteriormente o nº de chocolates comidos nesse dia. Nº de dummies = C – 1 = 3 – 1 = 2 dummies Modelo nulo: Modelo proposto: Proporção de redução do erro (PRE) ou Tamanho de efeito Estatística de teste F para o teste de hipóteses do PRE Erro do modelo proposto (SEQ) Redução do erro Erro do modelo nulo (SEQ) Valor-p para o teste de hipóteses do PRE b0 Estatística de teste T e valor-p para o teste de hipóteses dos parâmetros b1 b2 Teste de hipóteses para η2: a. Hipóteses Será que o modelo proposto reduz significativamente o erro em relação ao modelo nulo? H0: Ꞃ2 = 0 H1: Ꞃ2 ≠ 0 b. Estatística de teste e valor-p associado F =11.07 Valor-p = 0.004 c. Decisão e conclusões Como p ≤ 0.05, rejeita-se H0. Ou seja, o modelo proposto reduz significativamente o erro em relação ao modelo nulo. Teste de hipóteses para β1 (unilateral): d. Hipóteses Será que se comem menos chocolates na condição “faz mal” do que na condição controlo? H0: β = 0 H1: β < 0 e. Estatística de teste e valor-p associado T = -1.98 Valor-p = 0.08/2 = 0.04 f. Decisão e conclusões Como p < 0.05, rejeita-se H0. Ou seja, o consumo de chocolates na condição “faz mal” é menor do que na condição controlo. Teste de hipóteses para β2 (unilateral):g. Hipóteses Será que se comem mais chocolates na condição “faz bem” do que na condição controlo? H0: β = 0 H1: β > 0 h. Estatística de teste e valor-p associado T = 2.71 Valor-p = 0.02/2 = 0.01 i. Decisão e conclusões Como p < 0.05, rejeita-se H0. Ou seja, o consumo de chocolates na condição “faz bem” é maior do que na condição controlo. TESTES NÃO PARAMÉTRICOS Variável dependente medida em escala ordinal, ou seja, não existe constância na distância entre valores. Valores mais altos (mais visitantes num país, mais rápido, mais dinheiro) correspondem a rankings mais baixos (primeiros lugares). P8 - Teste U de Mann-Whitney Será que a iluminação de um espaço público influencia a perceção de segurança desse espaço? E será que influencia a segurança real? 1. Qual a variável dependente e independente e suas escalas de medida? Variável dependente: segurança; escala ordinal Variável independente: iluminação, escala nominal 2. Faça a representação gráfica da soma dos ranks da segurança percebida e segurança real. Como a soma dos rankings de segurança na condição de pouca iluminação é superior, significa que existe menor segurança – a segurança está em último lugar nestes locais. Então, a soma dos rankings de segurança na condição de muita iluminação é menor, pois há maior segurança, isto é, os lugares mais iluminados são considerados os primeiros (1º, 2º, 3º, etc.) lugares em segurança. Neste caso, quanto menor a soma dos rankings, maior segurança existe nessa condição. 3. Para a segurança percebida, faça o teste de hipóteses para um nível de significância de 0.05, sem usar o spss. Indique o que se pode concluir. Segurança percebida: i. Especificação das hipóteses H0: A segurança percebida em locais de pouca iluminação não é diferente da segurança percebida em locais de muita iluminação H1: A segurança percebida em locais de pouca iluminação é diferente da segurança percebida em locais com muita iluminação, e vice-versa. ii. Cálculo da estatística de teste e do valor-p associado Z = = -2.78 Nº de elementos (grupo 1) Soma dos ranks do grupo 1 (porque é o T maior) Nº de elementos (grupo 2) Grupo 1 – 15 pessoas na condição de pouca luminosidade Grupo 2 – 15 pessoas na condição de muita luminosidade T1 = 23+13+8+29+9+25+16+27+15+28+24+5+22+26+30 = 300 T2 = 165 U1 = 15 x 15 + – 300 = 45 µ(U) = = 112.5 SE (U) = = 24.11 iii. Decisão sobre as hipóteses |estatística de teste| = 2.78 |valor crítico| = 1.96 2.78 > 1.96 Como |estatística de teste| > |valor crítico| então rejeita-se H0. iv. Conclusão Como se rejeita a H0, admite-se que a segurança percebida é diferente em locais muito ou pouco iluminados. 4. Para a segurança percebida, faça o teste de hipóteses para um nível de significância de 0.05, usando o spss. Indique o que se pode concluir. estatística de teste valor-p Z = -2.8 P = 0.005 Como p < 0.05, rejeita-se a H0. Logo, existem diferenças na segurança percebida em sítios com muita e pouca iluminação. P8 - Teste H de Kruskal-Wallis Será que a profissão influencia a capacidade de orientação espacial? 1. Qual a variável dependente e independente e suas escalas de medida? Variável independente: profissão dos participantes; escala nominal com 3 níveis Variável dependente: capacidade de orientação espacial; escala ordinal 2. Faça a representação gráfica da soma das ordens da capacidade de orientação para as 3 profissões. Como os taxistas têm menor soma de ranks (rankings mais baixos – primeiros lugares), significa que têm uma melhor capacidade de orientação. Como os psicólogos têm maior soma de ranks (rankings mais altos – últimos lugares), significa que têm uma menor capacidade de orientação. 3. A profissão tem um efeito na capacidade de orientação? Faça o teste de hipóteses para um nível de significância de 0.05, sem usar o spss. i. Especificação das hipóteses H0: A profissão não influencia a capacidade de orientação H1: A profissão influencia a capacidade de orientação ii. Cálculo da estatística de teste e do valor-p associado soma dos ranks de cada grupo Nº de participantes em cada grupo total de participantes R1 = 1+2+3+6+7+10+11+14 = 54 R2 = 5+9+12+15+17+18+22+24 = 122 R3 = 4+8+13+16+19+20+21+23 = 124 iii. Decisão sobre as hipóteses α = 0.05 graus de liberdade: nº grupos - 1 |valor crítico|= 5.991 |estatística teste|= 7.94 Como 7.94 > 5.991, rejeita-se H0. iv. Conclusão Como se rejeita a hipótese nula, considera-se que a profissão influencia a capacidade de orientação. 4. A profissão tem um efeito na capacidade de orientação? Faça o teste de hipóteses para um nível de significância de 0.05, usando o spss. H = X2 Graus de liberdade valor-p Como p < 0.05, rejeita-se H0. 5. Indique se as hipóteses colocadas pelos investigadores são apoiadas pelo teste de hipóteses. Colocaram-se as seguintes hipóteses: B1) A capacidade de orientação dos taxistas é diferente da dos arquitetos. v. Especificação das hipóteses H0: β1 = 0 vs. H0: β1 ≠ 0 vi. Cálculo da estatística de teste e do valor-p associado Z = -2.415 Valor-p = 0.016 vii. Decisão sobre as hipóteses Pela correção de Bonferroni, α = 0.05/2 = 0.025 Como p < 0.025, então rejeita-se a H0. viii. Conclusão A capacidade de orientação dos taxistas é diferente da dos arquitetos. Logos, a hipótese B1 é apoiada pelos dados. B2) A capacidade de orientação dos arquitetos é diferente da dos psicólogos. i. Especificação das hipóteses H0: β2 = 0 vs. Β2 ≠ 0 ii. Cálculo da estatística de teste e do valor-p associado Z = -0.105 Valor-p = 0.916 iii. Decisão sobre as hipóteses Pela correção de Bonferroni, α = 0.05/2 = 0.025 Como p > 0.025, então admite-se H0. iv. Conclusão A capacidade de orientação dos arquitetos não é diferente da dos psicólogos. Logo, a hipótese B2 não é apoiada pelos dados. P9 – Teste Qui-Quadrado Um investigador pretende saber se a idade das crianças determina o tipo de brincadeira que escolhem. Para isso observou 20 crianças de 4 anos e 20 crianças de 8 anos e registou se brincavam a um jogo de imitação ou a um jogo de construção. 1. Qual a variável dependente e independente e suas escalas de medida? Variável dependente: tipo de brincadeira; escala nominal de 2 níveis Variável independente: idade; escala nominal de 2 níveis 2. Faça a representação gráfica das frequências observadas. 3. Preencha as tabelas de contingência das frequências observadas (FO) e das frequências esperadas (FE). 40 20 20 19 21 12 7 8 13 Frequências Esperadas: FA = [(A+C)*(A+B)] / (A+B+C+D) FB = [(B+D)*(A+B)] / (A+B+C+D) FC = [(A+C)*(C+D)] / (A+B+C+D) FD = [(B+D)*(C+D)] / (A+B+C+D) FA = 21*20 / 40 = 10.5 FB =19*20 / 40 = 9.5 FC = 21*20 / 40 = 10.5 FD = 19*20 / 40 = 9.5 4. Faça o teste de hipóteses para um nível de significância de 0.05, sem usar o spss. i. Especificação das hipóteses H0: A idade não influencia o tipo de brincadeira H1: A idade influencia o tipo de brincadeira ii. Cálculo da estatística de teste e do valor-p associado graus de liberdade: (nºcolunas – 1)* (nºlinhas – 1) α = 0.05 Valor crítico = 3.841 iii. Decisão sobre as hipóteses 2.506 < 3.841 Como |estatística de teste| < |valor crítico|, admite-se H0. iv. Conclusão A idade não influencia o tipo de brincadeira das crianças. 5. Faça o teste de hipóteses para um nível de significância de 0.05, usando o spss. valor-p X2 Como p > 0.05, admite-se H0, ou seja, conclui-se que a idade não influencia o tipo de brincadeira. P10 – Pressupostos para análise de dados (I): Será que a frequência das palavras prediz os tempos de resposta numa tarefa de decisão lexical? 1. Qual a variável dependente e independente e suas escalas de medida? Variável dependente: tempo de resposta; escala métrica de razão Variável independente: frequência das palavras; escala métrica de razão 2. Antes daanálise dos pressupostos, faça o teste de hipóteses para um nível de significância de 0.05, usando o spss. i. Especificação das hipóteses H0: A frequência das palavras não influencia o tempo de resposta H1: A frequência das palavras influencia o tempo de resposta ii. Cálculo da estatística de teste e do valor-p associado Estatística de teste = -1.832 Valor-p = 0.080 iii. Decisão sobre as hipóteses Como p > 0.05, então admite-se H0. iv. Conclusão A frequência das palavras não influencia o tempo de resposta. 3. Proceda à análise dos outliers, incluindo (i) representação gráfica, (ii) deteção de potenciais outliers e sua eliminação. (i) Representação gráfica (ii) Deteção de potenciais outliers e respetiva eliminação limites TR limites FL 4. Proceda à análise da normalidade da distribuição do erro, através de (i) representação gráfica, (ii) cálculo da simetria e achatamento padronizados e (iii) teste Kolmogorov-Smirnov. (i) Representação gráfica (ii) Cálculo da simetria e achatamento padronizados simetria achatamento Simetria: H0: simetria = 0 vs. H1: simetria ≠ 0 Z (estatística de teste) simetria = 0.172/0.481 = 0.358 Valor crítico para α = 0.01 é 2.58 Como |estatística de teste| < |valor crítico|, então admite-se H0. Ou seja, a simetria não é diferente (é igual) à distribuição normal. Achatamento: H0: achatamento = 0 vs. H1: achatamento ≠ 0 Z (estatística de teste) achatamento = -0.135/0.935 = -0.144 Valor crítico para α = 0.01 é 2.58 Como |estatística de teste| < |valor crítico|, então admite-se H0. Ou seja, o achatamento não é diferente (é igual) à distribuição normal. (iii) Teste Kolmogorov-Smirnov H0: distribuição do erro não difere da distribuição normal H1: distribuição do erro difere da distribuição normal Estatística de tese = 0.105 Valor-p = 0.200 Como p > 0.01, então admite-se H0. Ou seja, a distribuição do erro não difere da distribuição normal. 5. Depois da análise dos pressupostos, faça o teste de hipóteses para um nível de significância de 0.05, usando o spss. i. Especificação das hipóteses H0: A frequência das palavras não prediz o tempo de resposta H1: A frequência das palavras prediz o tempo de resposta ii. Cálculo da estatística de teste e do valor-p associado Estatística de teste = -2.789 Valor-p = 0.011 iii. Decisão sobre as hipóteses Como p < 0.05, então rejeita-se H0. iv. Conclusão A frequência das palavras prediz o tempo de resposta. P11 – Pressupostos para a análise de dados (II): 1. Faça a análise da homogeneidade dos erros, incluindo (i) representação gráfica, (ii) Cálculo da relação entre a VI e o quadrado do erro. (i) Representação gráfica O pressuposto da homogeneidade assume que a variabilidade do erro é igual em todas as condições da variável independente. É necessário calcular o quadrado do erro do modelo proposto e verificar se a sua relação com a VI é constante. (ii) Cálculo da relação entre a variável independente e o quadrado do erro Erro do modelo proposto Quadrado do Erro do modelo proposto Cálculo da relação entre quadrado do erro e VI, através de regressão linear. Valor-p Teste da homogeneidade do erro: H0: a VI não prediz variações no quadrado do erro (a relação entre a VI e o quadrado do erro é constante, há homogeneidade) H1: a VI prediz variações no quadrado do erro (a relação entre a VI e o quadrado do erro não é constante, não há homogeneidade) Como p > 0.05, então admite-se H0. Ou seja, há homogeneidade do erro. Será que a frequência e o tamanho das palavras predizem os tempos de resposta numa tarefa de decisão lexical? 2. Para o novo problema de investigação, proceda à análise da multicolinearidade, através de (i) representação gráfica, (ii) cálculo da correlação entre as VIs. (i) Representação gráfica Este pressuposto só se aplica a problemas de investigação com duas ou mais variáveis independentes e assume que não existem correlações muito fortes (r > 0.90) entre as VIs. (ii) Cálculo da correlação entre as variáveis independentes Como r < 0.090, a correlação não é muito forte. Ou seja, não existe multicolinearidade. Ambas as variáveis (frequência e tamanho) podem ser usadas no modelo. 3. Depois de verificados os pressupostos, faça o teste de hipóteses para um nível de significância de 0.05, usando o spss. Valor-p (frequência) Valor-p (tamanho) Como p < 0.05, a frequência das palavras prediz o tempo de resposta. No entanto, como p > 0.05, o tamanho das palavras não prediz o tempo.