Outputs em SPSS - Estatística

•

IPCS

Sara Nunes

16/12/2020

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 32 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 32 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 32 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

TESTES PARAMÉTRICOS
Variável dependente medida em escala métrica
P1 – Revisão de conceitos:
Em 1990, a média de idade das mulheres quando tinham o primeiro filho era 27 anos. Será que em 2017 se manteve?
1. Qual a variável em estudo e sua escala de medida?
Idade com que as mulheres tiveram o seu 1º filho; escala métrica de razão.
2. Indique a média, o desvio-padrão e o erro-padrão da idade com que
as mães têm o primeiro filho, usando o SPSS.
média
erro-padrão
desvio-padrão
3. Faça o teste de hipóteses para um nível de significância de 0.05 (sem spss).
i. Especificação das Hipóteses
H0 : Em 2017, a idade com que as mães tiveram o primeiro filho (é igual a 27) não foi
diferente de 27.
H1 : Em 2017, a idade com que as mães tiveram o primeiro filho foi
diferente de 27.
H0 : μ = 27
vs.
H1 : μ ≠ 27
ii. Cálculo da estatística de teste e do valor-p associado
valor médio hipotético p/ população (µ0)
erro-padrão da amostra
média da amostra 
Estatística de Teste = = 6.58
|valor crítico| = 1.96
|estatística de teste| = 6.58
A probabilidade (do acaso) de obtermos um valor de estatística de teste igual ou superior a 6.58 é inferior a 0.05 – valor-p próximo de 0.
iii. Decisão sobre as hipóteses
Como 6.58 > 1.96, rejeita-se a H0. 
NOTA: Se utilizarmos o valor-p: Quando p < 0.05, rejeita-se a H0; quando p > 0.05, considera-se a H0.
iv. Conclusão sobre o problema de investigação
Rejeita-se H0 e, portanto, pode-se dizer que a idade com que as mulheres foram mães pela primeira vez é significativamente diferente de 27. Em média, a idade com que as mães tiveram o primeiro em 2017 foi diferente da de 1990.
4. Faça o teste de hipóteses para um nível de significância de 0.05 (com spss).
estatística de teste
valor-p
graus de liberdade
i. Especificação das hipóteses
H0 : μ = 27
vs.
H1 : μ ≠ 27
ii. Cálculo da estatística de teste e de valor-p associado
Pelo output do SPSS, t(49) = 6.58 e p < 0.05
iii. Decisão sobre as hipóteses
Como p < 0.05, rejeita-se a hipótese nula (H0)
iv. Conclusão
Em 2017, em média, a idade com que as mães tiveram o primeiro filho foi diferente de 27 anos, logo diferente de 1990.
P2 – Modelo nulo
O modelo nulo é uma constante, não inclui o peso de nenhuma VI e, portanto, faz a mesma predição para todas as observações.
Um investigador quer saber a quantidade de chocolates que as pessoas comem durante um dia. Para o efeito, observou a quantidade de barras de chocolates consumidos por um grupo de 12 pessoas.
1. Representação gráfica do modelo nulo
Y’i = b0
melhor parâmetro estimado para os
dados quando todas as VIs são iguais a zero
Se assumirmos que, em média, se comem 5 chocolates por dia, então, o modelo nulo será:
Y’i = 5
	
2. Erro do modelo nulo
Todos os modelos têm um erro associado: diferença entre os dados observados e o modelo.
ei = Yi – Y’i
Em média, comem-se 5 chocolates por dia, com um desvio padrão de 2.41
	
3. Princípio fundamental de análise dos dados
O princípio fundamental da análise de dados é minimizar o erro associado ao nosso modelo. Ou seja, quanto menor o erro modelo, mais próximo o modelo está dos dados, melhor é modelo.
A minimização do erro é feita através do Método dos Mínimos Quadrados (MMQ).
5 é o valor de b0 a que corresponde o valor mínimo de erro quadrado, ou seja, o modelo com menos erro associado 
De acordo com o MMQ, a média é o melhor modelo para representar os dados, num modelo sem variável independente e com variável dependente métrica.
P3 – Modelo I: Modelo proposto
	Modelo estatístico mais completo: faz predições para cada observação, ou seja, contempla o peso de uma ou mais VIs.
O investigador levantou a hipótese de que a quantidade de chocolates que as pessoas comem varia em função do seu nível de ansiedade.
1. Representação gráfica do modelo proposto
Y’i = b0 + b1Xi 
Valor do efeito da variável independente (na dependente), quando todos os outros parâmetros são iguais a zero
soma quadrados dos erros (X)
soma produtos dos erros
2. Proporção da redução do erro
soma quadrados dos erros
Modelo proposto (SEQ)
modelo proposto:b0
Modelos nulo (SEQ)
Y’i = -0.29 + 5.329Xi
b1
P4 – Modelo II: VD contínua e VI dicotómica
O investigador levantou a hipótese de que a quantidade de chocolates que homens e mulheres comem é diferente.
1. Revisão do cálculo manual
i. Modelo nulo
Y’i = 5.00
Em média, comem-se 5 chocolates por dia.
ii. Erro do modelo nulo
Em média, comem-se 5 chocolates, com um desvio-padrão de 2.41 (soma dos quadrados dos erros = 64)
iii. Modelo proposto
Codificação em dummy:
Permite representar um efeito de uma variável qualitativa de uma forma quantitativa; consiste na atribuição dos códigos “1” e “0”, que devem respeitar as seguintes regras:
· nº dummies = C − 1, onde C = a quantidade de categorias;
· atribuição do código “1” a uma condição e “0” às outras condições.
Exp. Homens = 0; Mulheres = 1
Y’i = 3.17 + 3.66X
iv. Proporção de redução do erro/ Tamanho do efeito
PRE = 40.33/64 = 0.63
2. Cálculo em spss
NOTA: A grande diferença entre a ANOVA e o Regressão Linear é que a primeira faz comparação entre grupos em desenhos experimentais, enquanto a segunda trata de grupos não experimentais.
3. Teste de hipóteses (cálculo manual)
Método de inferência estatística que permite determinar se determinado efeito identificado na nossa amostra pode ser generalizado para a população.
Teste para b0
i. Enumeração da hipótese
H0: b0 = 0
H1: b1 ≠ 0
ii. Identificação da estatística de teste e valor-p associado
Estatística de teste (t) = 
erro-padrão
t = 5.04
p = 0.01
soma quadrados dos erros
desvio-padrão
iii. Decisão e conclusões
Como p < 0.05, rejeita-se H0. Ou seja, b0 é significativamente diferente de 0 – o número de chocolates que os homens comem é significativamente diferente de 0.
Teste para b1
i. Enumeração da hipótese
H0: b0 = 0
H1: b1 ≠ 0
ii. Identificação da estatística de teste e valor-p associado
t = 4.13
p = 0.02
iii. Decisão e conclusões
Como p < 0.05, rejeita-se H0. Ou seja, a variação no número de chocolates comidos por homens e por mulheres é significativamente diferente de 0.
4. Teste de hipóteses (cálculo em spss)
P5 – Modelo III: VD contínua e VI categórica
Um investigador quer saber se mensagens persuasivas influenciam o consumo de chocolates. Existem 2 hipóteses: i) a mensagem de que o chocolate “faz mal” leva a menor consumo comparado com a mensagem “neutra”; ii) a mensagem de que o chocolate “faz bem” leva a maior consumo comparado com a mensagem “neutra”. Os participantes foram distribuídos aleatoriamente pelos três grupos e mediu-se posteriormente o nº de chocolates comidos nesse dia.
	Nº de dummies = C – 1 = 3 – 1 = 2 dummies
	Modelo nulo: 
	Modelo proposto: 
Proporção de redução do erro (PRE) ou Tamanho de efeito
Estatística de teste F para o teste de hipóteses do PRE
Erro do modelo proposto (SEQ)
Redução do erro
Erro do modelo nulo (SEQ)
Valor-p para o teste de hipóteses do PRE
b0
Estatística de teste T e valor-p para o teste de hipóteses dos parâmetros
b1
b2
	Teste de hipóteses para η2:
a. Hipóteses
Será que o modelo proposto reduz significativamente o erro em relação ao modelo nulo?
H0: Ꞃ2 = 0
H1: Ꞃ2 ≠ 0
b. Estatística de teste e valor-p associado
F =11.07
Valor-p = 0.004
c. Decisão e conclusões
Como p ≤ 0.05, rejeita-se H0. Ou seja, o modelo proposto reduz significativamente o erro em relação ao modelo nulo.
Teste de hipóteses para β1 (unilateral):
d. Hipóteses
Será que se comem menos chocolates na condição “faz mal” do que na condição controlo?
H0: β = 0
H1: β < 0
e. Estatística de teste e valor-p associado
T = -1.98
Valor-p = 0.08/2 = 0.04
f. Decisão e conclusões
Como p < 0.05, rejeita-se H0. Ou seja, o consumo de chocolates na condição “faz mal” é menor do que na condição controlo.
Teste de hipóteses para β2 (unilateral):g. Hipóteses
Será que se comem mais chocolates na condição “faz bem” do que na condição controlo?
H0: β = 0
H1: β > 0
h. Estatística de teste e valor-p associado
T = 2.71 
Valor-p = 0.02/2 = 0.01
i. Decisão e conclusões
Como p < 0.05, rejeita-se H0. Ou seja, o consumo de chocolates na condição “faz bem” é maior do que na condição controlo.
TESTES NÃO PARAMÉTRICOS
Variável dependente medida em escala ordinal, ou seja, não existe constância na distância entre valores.
Valores mais altos (mais visitantes num país, mais rápido, mais dinheiro) correspondem a rankings mais baixos (primeiros lugares).
P8 - Teste U de Mann-Whitney 
Será que a iluminação de um espaço público influencia a perceção de segurança desse espaço? E será que influencia a segurança real?
1. Qual a variável dependente e independente e suas escalas de medida?
Variável dependente: segurança; escala ordinal
Variável independente: iluminação, escala nominal
2. Faça a representação gráfica da soma dos ranks da segurança percebida e segurança real.
Como a soma dos rankings de segurança na condição de pouca iluminação é superior, significa que existe menor segurança – a segurança está em último lugar nestes locais. Então, a soma dos rankings de segurança na condição de muita iluminação é menor, pois há maior segurança, isto é, os lugares mais iluminados são considerados os primeiros (1º, 2º, 3º, etc.) lugares em segurança.
Neste caso, quanto menor a soma dos rankings, maior segurança existe nessa condição.
3. Para a segurança percebida, faça o teste de hipóteses para um nível de significância de 0.05, sem usar o spss. Indique o que se pode concluir.
Segurança percebida:
i. Especificação das hipóteses
H0: A segurança percebida em locais de pouca iluminação não é diferente da segurança percebida em locais de muita iluminação
H1: A segurança percebida em locais de pouca iluminação é diferente da segurança percebida em locais com muita iluminação, e vice-versa.
ii. Cálculo da estatística de teste e do valor-p associado
Z = = -2.78
Nº de elementos (grupo 1)
Soma dos ranks do grupo 1 (porque é o T maior)
Nº de elementos (grupo 2)
Grupo 1 – 15 pessoas na condição de pouca luminosidade
Grupo 2 – 15 pessoas na condição de muita luminosidade
T1 = 23+13+8+29+9+25+16+27+15+28+24+5+22+26+30 = 300
T2 = 165
U1 = 15 x 15 + – 300 = 45
µ(U) = = 112.5
SE (U) = = 24.11
iii. Decisão sobre as hipóteses
|estatística de teste| = 2.78
|valor crítico| = 1.96
2.78 > 1.96
Como |estatística de teste| > |valor crítico| então rejeita-se H0.
iv. Conclusão
Como se rejeita a H0, admite-se que a segurança percebida é diferente em locais muito ou pouco iluminados.
4. Para a segurança percebida, faça o teste de hipóteses para um nível de significância de 0.05, usando o spss. Indique o que se pode concluir.
estatística de teste
valor-p
Z = -2.8
P = 0.005
Como p < 0.05, rejeita-se a H0. Logo, existem diferenças na segurança percebida em sítios com muita e pouca iluminação.
P8 - Teste H de Kruskal-Wallis
Será que a profissão influencia a capacidade de orientação espacial?
1. Qual a variável dependente e independente e suas escalas de medida?
Variável independente: profissão dos participantes; escala nominal com 3 níveis
Variável dependente: capacidade de orientação espacial; escala ordinal
2. Faça a representação gráfica da soma das ordens da capacidade de orientação para as 3 profissões.
Como os taxistas têm menor soma de ranks (rankings mais baixos – primeiros lugares), significa que têm uma melhor capacidade de orientação.
Como os psicólogos têm maior soma de ranks (rankings mais altos – últimos lugares), significa que têm uma menor capacidade de orientação.
3. A profissão tem um efeito na capacidade de orientação? Faça o teste de hipóteses para um nível de significância de 0.05, sem usar o spss.
i. Especificação das hipóteses
H0: A profissão não influencia a capacidade de orientação
H1: A profissão influencia a capacidade de orientação
ii. Cálculo da estatística de teste e do valor-p associado
soma dos ranks de cada grupo
Nº de participantes em cada grupo
total de participantes
R1 = 1+2+3+6+7+10+11+14 = 54
R2 = 5+9+12+15+17+18+22+24 = 122
R3 = 4+8+13+16+19+20+21+23 = 124
iii. Decisão sobre as hipóteses
α = 0.05
graus de liberdade:
nº grupos - 1
|valor crítico|= 5.991
|estatística teste|= 7.94
Como 7.94 > 5.991, rejeita-se H0.
iv. Conclusão
Como se rejeita a hipótese nula, considera-se que a profissão influencia a capacidade de orientação.
4. A profissão tem um efeito na capacidade de orientação? Faça o teste de hipóteses para um nível de significância de 0.05, usando o spss.
H = X2
Graus de liberdade
valor-p
	Como p < 0.05, rejeita-se H0.
5. Indique se as hipóteses colocadas pelos investigadores são apoiadas pelo teste de hipóteses.
Colocaram-se as seguintes hipóteses:
B1) A capacidade de orientação dos taxistas é diferente da dos arquitetos.
v. Especificação das hipóteses
H0: β1 = 0 vs. H0: β1 ≠ 0
vi. Cálculo da estatística de teste e do valor-p associado
Z = -2.415
Valor-p = 0.016
vii. Decisão sobre as hipóteses
Pela correção de Bonferroni, α = 0.05/2 = 0.025
Como p < 0.025, então rejeita-se a H0.
viii. Conclusão
A capacidade de orientação dos taxistas é diferente da dos arquitetos.
Logos, a hipótese B1 é apoiada pelos dados.
B2) A capacidade de orientação dos arquitetos é diferente da dos psicólogos.
i. Especificação das hipóteses
H0: β2 = 0 vs. Β2 ≠ 0
ii. Cálculo da estatística de teste e do valor-p associado
Z = -0.105
Valor-p = 0.916
iii. Decisão sobre as hipóteses
Pela correção de Bonferroni, α = 0.05/2 = 0.025
Como p > 0.025, então admite-se H0.
iv. Conclusão
A capacidade de orientação dos arquitetos não é diferente da dos psicólogos. Logo, a hipótese B2 não é apoiada pelos dados.
P9 – Teste Qui-Quadrado
Um investigador pretende saber se a idade das crianças determina o tipo de brincadeira que escolhem.
Para isso observou 20 crianças de 4 anos e 20 crianças de 8 anos e registou se brincavam a um jogo de imitação ou a um jogo de construção.
1. Qual a variável dependente e independente e suas escalas de medida?
Variável dependente: tipo de brincadeira; escala nominal de 2 níveis
Variável independente: idade; escala nominal de 2 níveis
2. Faça a representação gráfica das frequências observadas.
3. Preencha as tabelas de contingência das frequências observadas (FO) e das frequências esperadas (FE).
40
20
20
19
21
12
7
8
13
Frequências Esperadas:
FA = [(A+C)*(A+B)] / (A+B+C+D)
FB = [(B+D)*(A+B)] / (A+B+C+D)
FC = [(A+C)*(C+D)] / (A+B+C+D)
FD = [(B+D)*(C+D)] / (A+B+C+D)
FA = 21*20 / 40 = 10.5
FB =19*20 / 40 = 9.5
FC = 21*20 / 40 = 10.5
FD = 19*20 / 40 = 9.5
4. Faça o teste de hipóteses para um nível de significância de 0.05, sem usar o spss.
i. Especificação das hipóteses
H0: A idade não influencia o tipo de brincadeira
H1: A idade influencia o tipo de brincadeira
ii. Cálculo da estatística de teste e do valor-p associado
graus de liberdade:
(nºcolunas – 1)* (nºlinhas – 1)
α = 0.05
Valor crítico = 3.841
iii. Decisão sobre as hipóteses
2.506 < 3.841
Como |estatística de teste| < |valor crítico|, admite-se H0.
iv. Conclusão
A idade não influencia o tipo de brincadeira das crianças.
5. Faça o teste de hipóteses para um nível de significância de 0.05, usando o spss.
valor-p
X2
Como p > 0.05, admite-se H0, ou seja, conclui-se que a idade não influencia o tipo de brincadeira.
P10 – Pressupostos para análise de dados (I):
Será que a frequência das palavras prediz os tempos de resposta numa tarefa de decisão lexical?
1. Qual a variável dependente e independente e suas escalas de medida?
Variável dependente: tempo de resposta; escala métrica de razão
Variável independente: frequência das palavras; escala métrica de razão
2. Antes daanálise dos pressupostos, faça o teste de hipóteses para um nível de significância de 0.05, usando o spss.
i. Especificação das hipóteses
H0: A frequência das palavras não influencia o tempo de resposta
H1: A frequência das palavras influencia o tempo de resposta
ii. Cálculo da estatística de teste e do valor-p associado
Estatística de teste = -1.832
Valor-p = 0.080
iii. Decisão sobre as hipóteses
Como p > 0.05, então admite-se H0.
iv. Conclusão
A frequência das palavras não influencia o tempo de resposta.
3. Proceda à análise dos outliers, incluindo (i) representação gráfica, (ii) deteção de potenciais outliers e sua eliminação.
(i) Representação gráfica
(ii) Deteção de potenciais outliers e respetiva eliminação
limites TR
limites FL
4. Proceda à análise da normalidade da distribuição do erro, através de (i) representação gráfica, (ii) cálculo da simetria e achatamento padronizados e (iii) teste Kolmogorov-Smirnov.
(i) Representação gráfica
(ii) Cálculo da simetria e achatamento padronizados
simetria
achatamento
Simetria:
H0: simetria = 0 vs. H1: simetria ≠ 0
Z (estatística de teste) simetria = 0.172/0.481 = 0.358
Valor crítico para α = 0.01 é 2.58
Como |estatística de teste| < |valor crítico|, então admite-se H0. Ou seja, a simetria não é diferente (é igual) à distribuição normal.
Achatamento:
H0: achatamento = 0 vs. H1: achatamento ≠ 0
Z (estatística de teste) achatamento = -0.135/0.935 = -0.144
Valor crítico para α = 0.01 é 2.58
Como |estatística de teste| < |valor crítico|, então admite-se H0. Ou seja, o achatamento não é diferente (é igual) à distribuição normal.
(iii) Teste Kolmogorov-Smirnov
H0: distribuição do erro não difere da distribuição normal 
H1: distribuição do erro difere da distribuição normal
Estatística de tese = 0.105
Valor-p = 0.200
Como p > 0.01, então admite-se H0. Ou seja, a distribuição do erro não difere da distribuição normal.
5. Depois da análise dos pressupostos, faça o teste de hipóteses para um nível de significância de 0.05, usando o spss.
i. Especificação das hipóteses
H0: A frequência das palavras não prediz o tempo de resposta
H1: A frequência das palavras prediz o tempo de resposta
ii. Cálculo da estatística de teste e do valor-p associado
Estatística de teste = -2.789
Valor-p = 0.011
iii. Decisão sobre as hipóteses
Como p < 0.05, então rejeita-se H0.
iv. Conclusão
A frequência das palavras prediz o tempo de resposta.
P11 – Pressupostos para a análise de dados (II):
1. Faça a análise da homogeneidade dos erros, incluindo (i) representação gráfica, (ii) Cálculo da relação entre a VI e o quadrado do erro.
(i) Representação gráfica
O pressuposto da homogeneidade assume que a variabilidade do erro é igual em todas as condições da variável independente.
É necessário calcular o quadrado do erro do modelo proposto e verificar se a sua relação com a VI é constante.
(ii) Cálculo da relação entre a variável independente e o quadrado do erro
Erro do modelo proposto
Quadrado do Erro do modelo proposto
Cálculo da relação entre quadrado do erro e VI, através de regressão
linear.
Valor-p
Teste da homogeneidade do erro:
H0: a VI não prediz variações no quadrado do erro (a relação entre a VI e o quadrado do erro é constante, há homogeneidade)
H1: a VI prediz variações no quadrado do erro (a relação entre a VI e o quadrado do erro não é constante, não há homogeneidade)
Como p > 0.05, então admite-se H0. Ou seja, há homogeneidade do erro.
Será que a frequência e o tamanho das palavras predizem os tempos de resposta numa tarefa de decisão lexical?
2. Para o novo problema de investigação, proceda à análise da multicolinearidade, através de (i) representação gráfica, (ii) cálculo da correlação entre as VIs.
(i) Representação gráfica
Este pressuposto só se aplica a problemas de investigação com duas
ou mais variáveis independentes e assume que não existem correlações muito fortes (r > 0.90) entre as VIs.
	
(ii) Cálculo da correlação entre as variáveis independentes
Como r < 0.090, a correlação não é muito forte. Ou seja, não existe multicolinearidade. 
Ambas as variáveis (frequência e tamanho) podem ser usadas no modelo.
3. Depois de verificados os pressupostos, faça o teste de hipóteses para um nível de significância de 0.05, usando o spss.
Valor-p (frequência)
Valor-p (tamanho)
	Como p < 0.05, a frequência das palavras prediz o tempo de resposta.
	No entanto, como p > 0.05, o tamanho das palavras não prediz o tempo.