Testes de hipóteses

Bioestatística I

•
UFMG

Thais Zielke
17/10/2014
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Bioestatística I

12.435 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
1
Testesdehipóteses
Suaaplicaçõeselimites
Semináriosdemétodose
análisededados
LuísFaíscaDoutoramentoemPsicologia
Fevereiro2010
Testesdehipóteses
Suaaplicaçõeselimites
EnquadramentodosTestesde
HipótesesnaEstatística
AimportânciadaEstatística…
Representaçãomatemáticadoreal
MUNDOREAL
(objectode
estudo)
NÚMEROS
(representação
matemática)
Análise
estatística
DivisãoclássicadaEstatística
Estatísticadescritiva
Estatísticaindutiva
(ouinferencial)
Estatística
POPULAÇÃO
(estudantesda
UALG)
amostra
amostragem
Inferência
100alunosinquiridos
AimportânciadaEstatística…
Aquilo que
sepretende
conhecer…
Aquilo que se
conhece através
da Estatística
Descritiva…
Generalizar comsegurança para a
população adescrição obtida na amostra
Estatísticadescritiva
Conjuntodeprocedimentospara
organizar esumariar ainformaçãode
umaformatãobreve eprecisa quanto
possível.
2
Aplicaçõesdaestatísticadescritiva
AnAnáálisedescritiva(unielisedescritiva(uniebivariadabivariada))
Descrevereresumirconjuntosvolumososdedados
Gráficos/Tabelas/Estatísticasdescritivas
AnAnáálisedescritiva(lisedescritiva(multivaridamultivarida))
Representaçõesgráficasmultidimensionais
Reduçãodadimensionalidadedosdados
Descriçãounivariada
255044283832364531343927201737
272143354837354037403521282524
412939254046384434393745384138
362547423633493327554726463424
454125404237412336484243424039
392741484431415253434326383837
204244412229394122212242423029
243521224138242532353423433223
543923513336353535201930242618
363919333339234250284634313439
AptidãoNuméricaemestudantesdo9º ano
N=150alunos;aptidãonuméricamedidapelaGATB
Média=35,19
Desvio-padrão=9,00
Mediana=37
Mínimo=17
Máximo=55
Estatísticadescritiva
univariada
Descriçãounivariada Descriçãobivariada
Existerelaçãoentreanotadeingressodoalunonumcursodelicenciaturae
resultadoqueeleobtémnoprimeirotesteefectuadonaUniversidade?
Teste1=- 8,72+1,24*Notaing
R2 =28,6%
Estatística
descritiva
bivariada
Descriçãobivariada Descriçãomultivariada
CaracterizarrelaCaracterizarrelaççãoentrediversasvariãoentrediversasvariááveisveis
Será possíveldistinguirtiposdedificuldadesdeaprendizagemapartir
deumabateriadedozetestesdeavaliação?
N=10estudantescomproblemasdeaprendizagem
TécnicadeanáliseQ
3
Estatísticadescritivamultivariada
(análisedeclusters)
Descriçãomultivariada
0
1
2
3
4
5
6
7
8
0 1 2 3 4 5 6 7 8
S07
S02
S04
S08
S10
S03
S06
S01
S05
S09
Estatísticadescritivamultivariada
(escalonamentomultidimensional)
Descriçãomultivariada
Estatísticaindutiva
Conjuntodeprocedimentosusados
parafazerinferências apartirde
informaçãoparcial,avaliandoograude
incerteza envolvidodageneralização.
Errosenvolvidosnoestudode
amostrasedepopulações
Aplicaçõesdaestatísticaindutiva
AnAnááliseinferencialliseinferencial
Estimaçãointervalar
Testesdehipóteses
Modelação
Estimaçãodeparâmetros(valores
desconhecidosdapopulação)
Qualapercentagemdeestudantesuniversitáriosdispostosa
experimentardrogasduras?
Amostrarepresentativa dapopulação,controlandovariáveis
consideradasimportantes(amostraestratificada,e.g.)
Questionárioadequadoaestetemasensívele
contabilizaçãodasrespostas
Dos350estudantesinquiridos,24
disseramque“Sim”
4
Estatísticaindutiva- estimação
Há 95%deconfiança
dequea
percentagemde
estudantes
dispostosa
experimentardrogas
durassesituaentre
4,21%e9,51%
População Amostra
6,86%de
respostas “Sim”
(N=350)
Estimaçãodeparâmetros Testesdehipóteses
AvaliarseasdiferenAvaliarseasdiferenççasobservadasnaamostraasobservadasnaamostra
reflectemdiferenreflectemdiferenççasreaisnapopulaasreaisnapopulaççãoouse,peloãoouse,pelo
contrcontráário,sedevemounãoaoacaso.rio,sedevemounãoaoacaso.
Testedehipóteses
a)Formularumahipótese
b)Recolherdadosamostraisparaverificarse
apoiamounãoahipótese
c)Avaliarograuemqueesseapoiosepode
deveraoacaso
Estatísticaindutiva– testesdehipóteses
Significânciada
diferença
Nãohá diferenças
significativasnotempo
derespostaentreas
duascondições
experimentais (p>0,2).
Apresençaderuídoambientalafectaamemorizaçãodeumtexto?
Hipótese(nula):amemorizaçãodeumtextoé tãoboaemsilênciocomo
emcondiçõesderuído
50
55
60
65
70
75
80
85
90
Silêncio Ruído
Condiçãoexperimental
Ite
n
s
co
rr
et
am
e
n
te
e
v
o
c
ad
o
s
(%
)
Testesdehipóteses
Modelaçãopor“path analysis”
Modelação
Explicitarasrelaçõesqueseestabelecemnum
conjuntoalargadodevariáveis.
Estatística…
AEstatísticaDescritiva permitedescrevera
amostraeaEstatísticaIndutiva permite
generalizarcomconfiançaessadescrição
paraapopulaçãodeondeaamostrafoi
retirada,recorrendoparaissoà Teoriadas
Probabilidades.
Testesdehipóteses
Suaaplicaçõeselimites
Testesdehipóteses
5
Testedehipóteses
Otestedehipótesesé a técnicadaEstatística Indutiva
maisutilizadanainvestigaçãoemPsicologia.
Consiste em averiguar se a hipótese formulada sobre
aspectos desconhecidos de uma população é ou não
apoiada pela informação contida na amostra retirada
dessapopulação.
Tiposdetesteestatísticos
1) Testesunilateraisebilaterais
Testesunilateraismenosexigentes,poisassuas
hipótesesimplicamfundamentaçãoapriori.
2)Testesparamétricosenãoparamétricos(distribution
free)
Testesnãoparamétricosmenosexigentesemtermos
dascondiçõesdeaplicaçãomas,eventualmente,
menospotentesparadetectardiferenças.
Passosnumtestedehipóteses
Passo1. Aquestãoeminvestigaçãodeverá permitir
formularumahipótesesobreumoumaisparâmetros
desconhecidosdapopulação.
Aformulaçãodehipótesesé umformalismodeste
procedimento;namaiorpartedasvezes,ahipótesede
investigaçãoé contráriaà hipótesenulaemquesebaseia
otesteestatístico.
Passosnumtestedehipóteses
Perguntateoricamenterelevante:
Duranteaadolescência,serãoosrapazesmaisansiososdoqueas
raparigas?
Hipótesenula:Onívelmédiodeansiedadenapopulaçãoderapazes
é igualaodapopulaçãoderaparigas
H0:µM =µF
Passosnumtestedehipóteses
Passo2. Extrairumaamostradapopulação,aplicaruma
medidadeansiedadeecalcularasestatísticasdescritivas
relevantes.
µM =?
µF =?
População
Amostra
100rapazes
100raparigas
XM =28
XF =32
Passosnumtestedehipóteses
Asmedidasdeansiedadequeusamosnãosão
totalmentefiáveis,envolvendomargemdeerro.
Nãohavendopossibilidadedeavaliaraansiedadede
todososadolescentes(rapazeseraparigas)da
populaçãosobreaqualsepretendetirarconclusões,
limitámo-nosaestudaraumaamostra(porexemplo,
duasoutrêsescolasdeFaro).
6
Passosnumtestedehipóteses
Pelomenos,duasfontesdeerro:
errodemedição errodeamostragem
Informaçãoamostral
sobreníveldeansiedade
nãoé 100%segura
Passosnumtestedehipóteses
Adiferençade4pontos
observadaentrerapazese
raparigasreflecteumadiferença
realoué apenasaparente
(devidaaoserrosenvolvidosna
obtençãodestasmédias)?
Amostra
XM =28
XF =32
Passosnumtestedehipóteses
Passo3. Maquinariadostestesdesignificância
Recorrendoà TeoriadasProbabilidadeseassumindo
algumascondições,é possívelsaberemquemedida
duasmédiasamostraiscontaminadasdeerropodem
diferirentresiquandoaamostraprovémdeuma
populaçãosemelhanteà estipuladanahipótese(ouseja,
emquenãohá diferençaentrerapazeseraparigas).
Passosnumtestedehipóteses
Distribuiçãodeamostragem
Comosecomportamtodasas
médiasquesepodemextrairde
umapopulaçãocomas
característicaespecificadasna
hipótesenula?
Passosnumtestedehipóteses
Conhecimentoapriori dasdistribuiçõesdeamostragem–
EstatísticaClássica
Passosnumtestedehipóteses
Perguntaaquerespondeumtestedesignificância:
“Senãoexistirdiferençaentreosníveismédiosde
ansiedadederapazeseraparigas(hipótesenula),qualé
aprobabilidadede,devidoaoacaso,encontrarmosuma
diferençaigual(oumaisextrema)doqueobservadana
amostra?”.
7
PassosnumtestedehipótesesAmostra
XM =28
XF =32
SM =12
SF =14
NM =100
NF =100
t=2,45
df =98
p=0,015
Testetde
Student
Significância
Aprobabilidadede
adiferençaentre
rapazeseraparigas
observadana
amostrasedever
aoacasoé 0,015.
Passosnumtestedehipóteses
Passo4. Decisão
Comoé poucoprovávelqueosdadosobservados
provenhamdeumapopulaçãocomascaracterísticas
especificasemH0,devemosabandoná-laeconcluirque
existemdiferençasentrerapazeseraparigas.
Será umadecisãocorrecta?
Errosenvolvidosnumadecisão
estatística
Decisão correcta
(rejeitar H0
quando ela é
falsa)
Decisão errada
Erro de tipo I
(rejeitar H0
quando é
verdadeira)
Rejeitar H0
Decisão errada
Erro de tipo II
(aceitar H0
quando ela é
falsa)
Decisão correcta
(aceitar H0
quando ela é
verdadeira)
Aceitar H0
H0 é falsaH0 é verdadeira
Caracterização da população
(desconhecida)
Decisão
do teste
estatístico
����
��
��
�
���
��
����
��
��
�	
��
	
�
�
�
��
�
�
�
�	
��
	
�
��
��
�
���
�
�
�
�
�
��
�
��
�
��ﬀﬁ�
ﬂ
ﬁ
�
��
�
�
�
�
��ﬀﬁ�
ﬂ
ﬁ
ﬃ
� !"#$
%
�&'!
(
&
(
�
Errosenvolvidosnumadecisão
Errosenvolvidosnumadecisão
estatística
Natomadadedecisãoestatísticaé importanteconsiderar
orisco(probabilidade)decometerosdoistiposdeerro:
ProbabilidadedecometererrodetipoI=αααα
níveldesignificânciadoteste
ProbabilidadedecometererrodetipoII=1– ββββ
complementardapotênciadoteste
Níveldesignificânciadoteste
O nível de significância do teste αααα corresponde à
probabilidadedenosestamosaenganaraorejeitarH0
(rejeitarahipótesequandoelaé verdadeira - errode
tipoI).Deveserdefinidoantesdarealizaçãodoteste.
Porexemplo, seo teste indicara rejeiçãode H0 (sugerindo-nos
haver diferença de ansiedade entre rapazes e raparigas) isso
podeserumerropoispodemosestarperanteumasituaçãorara
em que a diferença observada se deve realmente ao acaso (e
não haver diferença verdadeira na população entre rapazes e
raparigas).
8
Níveldesignificânciadoteste
Em geral, define-se em 5% onível de significância
dotesteαααα.
Estevalorresultadeumaconvençãoenãotemnada
de especial; por vezes utilizam-se níveis de
significânciamaisexigentes(porexemplo,1%),outras
vezesníveismenosexigentes (10%),masovalorde
5%é otradicionalmentemaisutilizado.Porquê?
Níveldesignificância
Deumamaneirageral,pretende-sequeaprobabilidade
decometeroerrodetipoIsejamínima.Noentanto,esta
probabilidadenãopodeserreduzidaa0poisdiminui-la
emexcessofazaumentaraprobabilidadedecometero
errodetipoII.Porisso,podenãoseradequadousar
níveisdesignificânciamuitobaixos.
Potênciadoteste
A potência do teste 1-ββββ corresponde à probabilidade
denãonosestamosaenganaraoaceitarH0 (aceitara
hipótesequandoelaé falsa- errodetipoII).
Um teste potente permite-nos decidir com um baixo
riscodenosenganarmosquandoaceitamosH0,ouseja,
dá-nos segurança que não há diferenças reais entre
rapazeseraparigasquandootestesugerequenãose
rejeiteH0.
Potênciadoteste
A determinação da potência do teste é complexa e, entre
outros factores, depende da dimensão da amostra:
amostras de maiores dimensões garantem testes mais
potentes.
Pode-seestabelecerà partidaapotênciadoteste,bastando
para isso definir a dimensão da amostra necessária para
garantir que uma diferença de determinada magnitude na
população tenha probabilidade elevada de ser realmente
detectada(porexemplo,potênciadoteste1- β =0,80).
Potênciadoteste
Apesardetervindoasersecundarizado faceaonívelde
significância,aquestãodapotênciadoteste é fulcral:de
nada serve realizar um teste estatístico que não tenha
potência para detectar a diferença teoricamente
especificada – ficamos sempre na dúvida se H0 é
realmenteverdadeiraouse,pelocontrário,é falsamaso
teste não teve suficiente potência para detectar essa
falsidade.
Níveldesignificânciaepotênciado
teste
Relação entre α e β (quando se assume que a distribuição de
amostragemdasmédiasamostraisé normal).
9
Elementosnaanálisedapotênciade
umteste
• Variabilidade dos dados (não temos grande controlo
sobreesteelemento)
• Magnitudedadiferençaquesepretendedetectar
• Níveldesignificânciado teste(riscodecometeroerro
detipoI)
• Dimensãodaamostra
Potênciadoteste
Comoaumentarapotênciadeumteste?
• Aumentaradimensãodasamostras
• Aumentar a magnitude da diferença que se pretende
queotestedetecte
• Diminuironíveldesignificânciaα
Sa
m
pl
e
Po
w
er
SampleSize
high
low
small large
A
B
C
NNííveloptimizadoveloptimizado
EficazEficaz masmas ineficienteineficiente
IneficazIneficaz
PowerCurve
Curvadapotênciadoteste Quepotência?
Nãohá critériosuniversal.
• Oqueé maisimportante?
Falharumatendência?
Detectarumatendênciafalsa?
• Geralmenteentre80%e95%
Testesdehipóteses
Suaaplicaçõeselimites
Testesdehipótesespara
comparaçãoentregrupos
Comparaçõesentregrupos
A comparação de grupos é um dos formatos mais
usuaisnainvestigaçãopsicológica:
� Comparaçãoentregruposnaturais(diferençasentre
sexos, por exemplo) ou entre populações clínicas
(grupos de disléxicos face grupo de controlo de
idade)
� Comparaçãoentregruposexperimentais(grupoque
recebe o tratamento experimental versus grupo de
controlo)
10
Comparaçõesentregrupos
Algunsaspectosalevaremconsideração:
� Natureza métrica davariável em estudo (nominal /
deescala)
� Natureza dos conjuntos de medidas (amostras
independentes/amostrasemparelhadas)
� Númerodegruposemcomparação
Comparaçõesentregrupos
Casodevariáveisdeescala
Se o nível de medida da variável em questão é de
escala, a comparação entre grupos geralmente
corresponde a testes de hipóteses sobre valores
médios.Naverdade,aocomparargruposestamos,em
geral, interessados em tomar decisões sobre a
magnitude dosvaloresqueavariáveltomapopulações
deondeforamextraídososgrupos.
Porexemplo,verificarsehá diferençasentrerapazese
raparigasnaAptidãoverbal.
Comparaçõesentregrupos
Casodevariáveisnominais
Seoníveldemedidadavariávelemquestãoé nominal,
a comparação entre grupos geralmente corresponde a
testes de hipóteses sobre proporções ou a testes de
independênciaentrevariáveis.
Por exemplo, comparar se a percentagem de
reformados é igual na população de utentes de dois
serviçoshospitalares.
Testesdehipóteses
Suaaplicaçõeselimites
Comparaçãoentreduas
médiasgrupos
A.Amostras
independentes
Testesdehipóteses
Suaaplicaçõeselimites
Condiçõesdeaplicação
� Umadasvariáveisestá medidano formatoescala;a
outravariáveldefineosgrupos (pode ser dicotómica
oudicotomizada)
� A distribuição das variáveis deve ser normal ou a
dimensõesdosgruposacomparardevesergrande
� A variância de cada grupo deve ser semelhante
(homogeneidadedasvariâncias).
Testessobrediferençasentredois
valoresmédios(amostrasindependentes)
11
A hipótese nula postula que os dois grupos têm
médiaigual.
Arejeiçãodahipótesenula(p≤ α)indicaqueexistem
diferençassignificativasentreasduasmédias.
Amagnitudedadiferençapodeseravaliadaporuma
medidademagnitudedoefeito(effect size)
Testessobrediferençasentredois
valoresmédios(amostrasindependentes) Exemplo
Num estudo sobre o efeito da estimulação durante o sono na
aprendizagem, dividiu-se aleatoriamente um conjunto de 62
crianças em dois grupos. Durante um mês, todas as noites
enquantodormiam,metadedascrianças foramexpostasauma
gravaçãoáudio comum relatode informaçãosobre Históriade
Portugal. As restantes crianças foram expostas a um gravação
áudiodediscursoseminformaçãorelevante.
No final do mês, os conhecimentos de História de ambos os
gruposforamavaliadosatravésdeumteste(classificaçãode0a
20).Verifiqueseoprocedimentoseguidoteveefeitosignificativo
(α =0.05).
Exemplo
Desvio-
padrão
Média
31
30
29
2827
26
25
24
23
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Partici-
pantes
161728
3,6013,232Desvio-
padrão
13,54514,967Média
9
151230
131429
131727
91426
14925
181524
121823
101022
71421
151220
16819
151718
81917
191916
131815
141714
201313
181512
81911
171610
9129
10138
18157
10176
11165
14104
12203
14142
17191
Grupo de
Controlo
Grupo
Experimental
Partici-
pantes
Resultados obtidos nos dois
grupos.Umadascriançasdo
grupo experimental não
compareceuaoteste.
Queteste?
Hipóteses:
H0:µµµµExp =µµµµCont versus H1:µµµµExp >µµµµCont
Testedeunilateraldireitodediferençasentrevalores
médios(paradoisgruposindependentes).
Testede
diferenças
Testedeunilateral
direito
Diferençassignificativas?
Aavaliaçãodasignificância
dadiferençaentredois
valoresmédiosnão
dependeapenasdovalorda
diferençamastambémda
sobreposiçãodasduas
distribuições(ouseja,da
suadispersão).
Noexemplo,apesarda
diferençaentrevalores
médiosseridênticanastrês
situações,essadiferença
aparentasermais
significativaapenasna
situaçãodebaixadispersão.
TestetdeStudent paraamostras
independentes
� Amostrasaleatórias retiradasdepopulaçãonormalouamostras
comdimensãosuficientementegrandeparaseaplicaroTeorema
doLimiteCentral(emgeral,N≥ 30paraambasasamostras).
OK (N = 31 para o grupo de controlo e N = 30 para o grupo
experimental)
� Homogeneidade das variâncias: as variância / desvios-padrão
dosdoisgrupostêmdeseriguais.Arazãodestaexigênciaé que
o teste assume que as populações de onde vêm as duas
amostras são iguais em tudo (distribuição, dispersão, etc)
exceptonosrespectivosvaloresmédios.
Averificar (S=3,232paraogrupodecontroloeS=3,601parao
grupoexperimental)
Condiçõesdeaplicação
12
Condiçõesdeaplicação:
� As observações da amostra 1 são independentes das
observaçõesdaamostra2.
OK (os resultados de um grupo não afectam os resultados de
outrogrupo)
� A variável em estudo tem de estar medida pelo menos numa
escala quasi-intervalar (quasi-intervalar, intervalar ou de
quociente).
OK (variável:classificaçãoobtidanoteste)
TestetdeStudent paraamostras
independentes Condiçõesdeaplicação
Verificaçãodenormalidade(desnecessárionestecasopoisas
amostrassãograndes)
Gráficodequartis
Gráficodequantis danormal
Condiçõesdeaplicação
Verificaçãodahomogeneidadedasvariâncias
GrupoExperimental
S2 =3,2322 =10,4458
GrupoControlo
S2 =3,6012 =12,9672
Asvariânciassãogrosseiramentesemelhantes(adivisãodeumapela
outra dá cerca de 1,2), embora convenha sempre efectuar um teste
estatísticoformalparagarantirquenãohá razõesparaasassumirmos
comodiferentes(testedeLevene paraaigualdadedevariâncias).
TestedeLevene paraaveriguara
homogeneidadedasvariâncias
HipótesesdotestedeLevene
(testedehomogeneidadedasvariâncias):
H0:σσσσ2Exp =σσσσ2Cont versus H1:σσσσ2Exp ≠≠≠≠ σσσσ2Cont
NoSPSS,estetestevemincluídonooutput dotestetde
Student paraamostrasindependentes.
TestedeLevene (output doSPSS)
TestedeLevene sobre
homogeneidadedevariâncias
Valorpdotestede
Levene – não
significativo
Estatísticasdescritivasparacada
grupo(média,desvio-padrãoe
erro-padrão damédia)
TestedeLevene paraaveriguara
homogeneidadedasvariâncias
ConclusãodotestedeLevene
Rejeita-seH0 aoníveldesignificânciaα =0,05,ouseja,
pode-seconsiderarqueasvariânciasdosdoisgrupos
sãoiguais(F=0,54,p=0,467).
Assegura-seassimopressupostodahomogeneidade
dasvariâncias,peloquesepodeprosseguircomoteste
tparaavaliaradiferençaentrevaloresmédios.
13
Testet(output doSPSS)
Estatísticade
teste
Valorpdotestet
(bilateral)
Decisão
Como o teste é unilateral, tem de se dividir por dois o valor
calculadopeloSPSS.
Assim,Sig.=0,071/2=0,036<α.
Logo, rejeita-se H0 ao nível de significância α = 0,05, ou seja, o
grupo experimental tem, em média, um desempenho superior no
testedeHistóriadoqueogrupodecontrolo(t=1,84,gl =59,p=
0,036), indicandoqueaestimulaçãoduranteosonoteveumefeito
positivosignificativonaaprendizagem.
Consequênciasdeviolarascondiçõesdeaplicação
dotestetdeStudent
Normalidade
Otesteté robusto faceà violaçãodopressupostodanormalidade
dadistribuiçãodavariável,mesmocomamostraspequenas.Assim,
as consequências da não normalidade dos dados afecta
minimamenteoserrosdetipoIetipoIIenvolvidosnadecisão.
Porexemplo,seadistribuiçãodavariávelemestudo forassimétricaeasamostras
emcomparaçãotiveremdimensõestãopequenascomo5,sabe-sequeaverdadeira
margemdeerrodetipoIenvolvidanadecisãopoderá afastar-senomáximoem2%
do valor de α estipulado, o que é negligenciável em termos práticos (Hsu & Feldt,
1969). No entanto, ainda assim existe a possibilidade de recorrer a testes não
paramétricosalternativos(testedeMann-Whitney).
Consequênciasdeviolarascondiçõesdeaplicação
dotestetdeStudent
Homogeneidadedasvariâncias
O teste t baseia-se nos desvios-padrão das duas amostras para
obter uma estimativa conjunta de σ2 (S2pool). Se não existir
homogeneidade das variâncias, esta estimativa conjunta não faz
sentido.
Sabe-sequeotesteté robustofaceà violaçãodopressupostoda
homogeneidade das variâncias desde que as duas amostras
tenham igual dimensão – nestes casos, as consequências da
heterogeneidadedasvariânciasafectamminimamenteoserrosde
tipoIetipoIIenvolvidosnadecisão.
Consequênciasdeviolarascondiçõesdeaplicação
dotestetdeStudent
Homogeneidadedasvariâncias
Contudo, quando as amostras têm dimensão diferente, verifica-
seque:
� Se a amostra maior tiver a maior variância, o teste t é
conservador(ouseja,aprobabilidade realdecometeroerrode
tipoIé maispequenadoqueovalorα estipulado).
� Seaamostramaispequenaestiverassociadaà maiorvariância,
o este t é bastante liberal (ou seja, a probabilidade real de
cometeroerrodetipoIé superioraoestipulado)– situaçãomais
problemática.
Consequênciasdeviolarascondiçõesdeaplicação
dotestetdeStudent
Homogeneidadedasvariâncias
O SPSS fornece uma correcção ao teste t para as situações de
heterogeneidade das variâncias (procedimento de Welch), que
consistenumajustamentodosgrausdeliberdade.
Um procedimento alternativo para lidar com a estas situações é
realizar um teste não-paramétrico equivalente, que não exija
homogeneidadedasvariâncias(testeMann-Whitney).
14
B.Amostras
emparelhadas
Testesdehipóteses
Suaaplicaçõeselimites
A hipótese nula postula que os dois conjuntos de
dadosprovêmdepopulaçõescomvalormédioigual.
As investigações que levam à recolha de dados
emparelhados surge em estudos longitudinais (o
mesmoindivíduoé observadoduasvezes)ouquando
indivíduos diferentes são emparelhados por
diferentes razões (por semelhança em variáveis
relevantesouporpertenceremà mesmaunidade,por
exemploumcasal).
Testessobrediferençasentredois
valoresmédios(amostrasemparelhadas)
Exemplo
Para avaliar o efeito dos ritmos circadianos na memória, um
conjunto de 30 crianças com idades entre 6 e 9 anos realizaram
umaprovadememória imediata(digit span)demanhãeamesma
prova12horasdepois.
Teste, ao nível de significância α = 0,05, se existem diferenças
significativasnodesempenhoobservadonosdoismomentos.
Exemplo
54305615
34296514
77284413
53275612
55265511
56255610
5524769
5523458
4522457
5621446
5620455
6519454
5618563
6717452
5516671
TardeManhãParticipanteTardeManhãParticipante
Queteste?
Hipóteses:
H0:µµµµManhã =µµµµTarde versus H1:µµµµManhã ≠µ≠µ≠µ≠µTarde
Testedebilateraldireitodediferençasentrevalores
médios(paradoisgruposemparelhados).
Testede
diferenças
Testedebilateral
Amostrasindependentesversus
Amostrasemparelhadas
Se cada observação da amostra 1 puder ser emparelhada a uma
observação da amostra 2, os dois conjuntos de dados não são
independentes masemparelhados.
Observação2Observação2
ObservaçãonObservaçãon……
Observação1Observação1
Amostra2Amostra1
Nocasodeamostrasemparelhadas,
a unidade em estudo não é a
observação mas sim o par de
observações.
Não se pretende saber se existe
diferenças entre a média das
observações do grupo 1 e a média
das observações do grupo 2 mas
simsaberseamédiadasdiferenças
entre os elementos de cada par é
significativa.
15
Amostrasindependentesversus
Amostrasemparelhadas
Designaçõesparaestetipodedesign:
� Amostrasemparelhadas(versus amostrasindependentes);
� Medidasrepetidas(versus medidasindependentes);
� Planeamento experimental intra-sujeito (versus planeamento
entre-sujeitos)(within subjects versusbetween subjects).
TestetdeStudent
(paraamostrasemparelhadas)
Condiçõesdeaplicação:
� Amostras aleatórias retiradas de população normal ou
amostras com dimensão suficientemente grande para se
aplicar o Teorema do Limite Central (em geral, N ≥ 30 para
ambasasamostras).
OK (N=30paresdeobservações)
� Observaçõesemparelhadas.
OK (estamosperanteumdesign commedidasrepetidas,uma
vezquecadasujeitoé ocontrolodesipróprio)
Data view: os valores
observados nos dois
momentos de avaliação
sãodispostos ladoa lado
em colunas diferentes
(facetaTdadatabox).
Testedediferençasentrevaloresmédios
Variávelquecorrespondeao
desempenhodossujeitos
duranteamanhã
Variávelquecorresponde
aodesempenhodos
sujeitosduranteatarde
TestetdeStudent
(paraamostrasemparelhadas)
TestetdeStudent paraamostras
emparelhadas(output doSPSS)
Correlaçãoexistenteentreosdoisconjuntosde
observações– reflecteograuemqueodesempenho
damanhãestá relacionadocomodesempenhoda
tarde.Noentanto,nãoesclarecesehá diferençano
nívelmédiodessesdoisdesempenhos.
Testedediferenças– significativo
Estatísticasdescritivasparacada
conjuntodeobservações(média,desvio-
padrãoeerro-padrão damédia)
Decisão
ComoSig.=0,025=<α,rejeita-seH0.
O desempenho no teste de memória é diferente quando este é
realizado de manhã e à tarde (t = 2,36, 29gl, p = 0,025),
indicando que o ritmo circadiano poderá influenciar o
desempenhonestetipodeprova.
Esenãoserespeitassem
asmedidasemparelhadas?
Se, em vez de 30 pares de
observações, considerássemos
que existiam 60 observações
independentes (30demanhãe
30detarde),osdadosestariam
lançadosnumaúnicacoluna,já
não havendo o cuidado de
emparelhar o desempenho do
mesmo sujeito nos dois
momentos.
O testeautilizar seriao teste t
paraamostrasindependentes.
Variávelqueidentificao
momentodaobservação
Variávelcorrespondente
aodesempenhonaprova
dememória
16
Output doSPSS
Testedediferenças– nãosignificativo
O facto de se ter ignorado o emparelhamento dos dados resulta numa
conclusãodiferente– nãohá diferençasentreodesempenhodemanhãeà
tarde.Porquê,seosdados(“números”)sãoidênticos?
Utilizaroprocedimentodemedidas
repetidassemprequeosdadosopermitam
O testeparaamostraemparelhadasé mais potente na detecção de
diferenças que o teste para medidas independentes, pois anula a
variância (ruído)causadapelo factodehaversujeitosdiferentesnas
duas condições experimentais (quando as amostras são
emparelhadas, o mesmo sujeito é exposto às duas condições
experimentais, pelo que se anula, parcialmente, o efeito das
diferençasindividuais).
Quanto maior a correlação entre as observações do par, maior a
vantagememusaroprocedimentosparaamostrasemparelhadas.
No entanto, o design com medidas repetidas tem alguns problemas
intrínsecos (aprendizagem, mortalidade experimental, carry over
effects).
Parte2
Comparaçãoentremais
doquedoisconjuntos
demedidas
Testesdehipóteses
Suaaplicaçõeselimites
Testesdehipótesessobrediferenças
entremaisdedoisvaloresmédios
Testet paradiferençasentrevaloresmédios:adequado
natestagemdehipótesessobredoisvaloresmédios.
Que fazerquandosepretendecompararmaisdoque
doisvaloresmédios?
Exemplo
Pretende-seavaliarseonívelmédiodesatisfaçãodosestudantes
com os Serviços Sociais da Universidade é igual nas diferentes
faculdades(FCHS,FCT,FERN,FCMAeFE).
Haverá diferençassignificativas,aoníveldesignificânciadeα =5%,
entreascincofaculdades?
Comoresponderaestaquestão?
Oproblemadascomparações
múltiplas
Bastará compararasfaculdadesduasaduascomumtestet para
amostrasindependentes?
Quantostestest teriamdeserfeitos?
5C2 =10(FCHSvsFCT;FCHSvsFERN;FCHSvsFCMA;etc…)
Se em cada um destes testes corremos um risco α de chegar a
uma decisão errada (5%), qual a probabilidade cometermos erro
aobasearmosanossaconclusãogeralnasdezcomparações?
17
Oproblemadascomparações
múltiplas
Sequisermosdecidirseasfaculdadessãoounãoiguaisemtermos
desatisfação,aofazerascomparaçõesparaparempolamosorisco
de cometer um erro de tipo I (achar que há diferenças quando, na
verdade,nãoexistem).
Probabilidade de cometer pelo menos um erro de tipo I ao fazer k
comparações duas a duas através de um teste t ao nível de
significânciaα (experimentwise error):
1– (1- αααα)k
Oproblemadascomparações
múltiplas
Nocasodeα =0,05ek=10comparações,vem:
1– (1– 0,05)10 =0,4013
O risco de nos enganarmos é demasiadamente alto para ser
considerada uma abordagem estatisticamente segura. Mesmo
que não haja diferença entre as faculdades, há 40% de
probabilidadedepelomenosumtestet indicarqueexisteuma
(falsa)diferença(rejeitarH0).
Oproblemadascomparações
múltiplas
A probabilidade de tomar pelo
menos uma decisão errada
aumenta marcadamente com o
número de grupos a comparar.
Por exemplo, se compararmos 8
grupos, há 75% de probabilidade
decometerpelomenosumerro.
Valordaprobabilidadedecometerpelomenos
umerrodetipoIaocompararkgrupos
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,00
2 3 4 5 6 7 8 9 10 11 12 13 14 15
k-nºdegrupos
Pr
o
b
er
ro
Ti
po
I
Níveldesignif icâncianominal
Nota:estescálculosassumemqueos
testest sãoindependentes,oquenãoé
rigorosamenteverdadeumavezquese
baseiameminformaçãosobreposta,oque
pioraaindamaisestecenário.
Oproblemadascomparações
múltiplas
Conclusão:
Aabordagemaoproblemaemcausa fazendo testes t múltiplosé
inadequada, porque o risco de nos enganarmos aumenta
proporcionalmente ao número de comparações que têm de ser
feitas.
Dequealternativasdispomos?
A.Amostras
independentes
Testesdehipóteses
Suaaplicaçõeselimites
ANOVA
A técnica estatística denominada ANOVA (Analysis of
Variance) foi desenvolvida por Ronald Fisher (1890-
1962) para poder testar em simultâneo a igualdade do
número de valores médios que se pretender, sem
empolarovalordeα.
Trata-se, assim, de um procedimento ideal para
compararovalormédiodemaisdedoisgrupos.
18
Exemplo
A fimdeestudaroefeitodo ruídoambientanacompreensãode
um texto lido, dividiram-se nove pessoas por três condições
experimentais:Grupo1– silêncio;Grupo2– commúsicadefundo
instrumental;Grupo3– comruído(nãomusical)defundo.
Nofinal,fez-seacadapessoaumtotaldedezperguntassobreo
textolido,registando-seonúmeroderespostascorrectas.Haverá
diferençaentreascondiçõesexperimentais?
FactoreVariáveldependente
Variáveldependente
Desempenho no teste de compreensão (nº de respostas
certas)
Variávelindependente(factor)
Ruídodefundo– trêsníveis:silêncioversusmúsicadefundo
instrumentalversusruído(nãomusical)defundo.
Queteste?
Hipóteses:
H0:Oskvaloresmédiossãoiguais
versus
H1:Pelomenosumvalormédioé diferentedosrestantes
H0:µµµµ1 =µµµµ2 = µµµµ3 versus H1:∃∃∃∃i,j,µµµµi ≠≠≠≠ µµµµj
Repare-sequeahipótesenulaserefereglobalmentea
todososgruposdoestudo(hipótesesomnibus,global).
HipótesesnaANOVA
AlgumasprecisõessobreotestedehipótesesatravésdeANOVA:
� Ashipótesessãoglobais(omnibus)– apenassetestaoefeito
globaldaexperiência(hipótesenuladequeosvaloresmédios
são todos iguais versus a hipótese alternativa de que pelo
menosumdelesé diferentedosrestantes).
� Numa ANOVA não se coloca a questão do teste ser biou
unilateral.
� Nãoaceitarahipótese nulanãonosesclareceonde reside a
diferençadetectada– essaanáliseé feitanumafaseposterior.
CondiçõesdeaplicaçãodaANOVA
� Amostrasaleatóriasretiradasdepopulaçõesnormaisou
amostrascomdimensãosuficientementegrandeparase
aplicaroTeoremadoLimiteCentral(emgeral,N≥ 30).
� Homogeneidadedasvariâncias:asvariância(desvios-
padrão)dosdiferentesgrupostêmdeseriguais.
� Asobservaçõesdecadagruposãoindependentesentresi.
� Avariávelemestudotemdeestarmedida,pelomenos,numa
escala quasi-intervalar (quasi-intervalar, intervalar ou de
quociente).
Violaçãodascondiçõesdeaplicação
A ANOVA é robusta face a violações de algumas
condições referidas, nomeadamente a exigência de
normalidade (desde que todos os grupos tenham
dimensão suficiente) e a exigência da homogeneidade
dasvariâncias(desdequeosgrupostenhamdimensão
semelhante).
Mais grave é a violação da independência das
observações entre grupos (não devem estar
correlacionados; resolve-se garantindo a aleatoriedade
naformaçãodosgruposemcomparação).
19
“Mecanismo” daANOVA
Emborasedenomine“análisedevariância”,trata-sede
umprocedimentoparaaveriguarseosvaloresmédios
são estatisticamente diferentes (e não para ver se as
variânciassãodiferentes).
OnomeresultadaANOVArecorreraocálculodevariânciaspara
decidir se as médias são diferentes. O raciocínio é o seguinte:
calcula-seavariânciadentrodecadagrupoedepois compara-se
comavariânciaentreosgrupos– sehouverdiferenças,é porque
asmédiasdosgrupossãodiferentes.
“Mecanismo” daANOVA
Na ANOVA, avalia-se em que medida duas fontes de
variabilidadecontribuemparaavariaçãototaldosdados:
* Alguma variação resulta da diferença entre indivíduos
dentrodecadagrupo(variaçãowithin,residualouvariância
dentrodogrupo)
*Algumavariaçãoresultadasdiferençasintroduzidaspelos
grupos(variaçãobetween,ouvariânciaentregrupos)
Exemplo
Númeroderespostascorrectasemcadagrupo:
Média 458
7
8
8
9
Grupo1
45
36
64
35
Grupo3Grupo2
Haverá diferença entre os valores médios das populações de onde
vieramestestrêsgrupos?
Para isso, a ANOVA vai comparar a variância dentro dos grupo
(variâncianaturaldosdados)comavariânciaentremédias (variância
devidaaoefeitodiferenciadordascondiçõesexperimentais).
ANOVAetestedevaloresmédios
AAnálisedeVariânciacomparaavariânciadentrodos
grupos (variância residual ou variância within) com a
variância entre grupos (variância entre grupos ou
variânciabetween).
Se a variância residual for claramente inferior à
variância entre grupos, então pode-se afirmar que os
valoresmédiossãodiferentes.
NaANOVAaestatísticade testeé designadaporFe corresponde
aoquocienteentreavariânciaentregruposeavariânciaresidual:
AestatísticaFsegueumadistribuiçãoFdeSnedecor comυ1 =k-1
gl (associados ao numerador) e υ2 = N-k gl (associados ao
denominador).
Estatísticadetesteesuadistribuição
Nota:osgrausde liberdade indicadoscorrespondemà situaçãoemqueoskgrupos
têmamesmadimensão,formandoumtotaldeNobservações.
Oneway ANOVA(output doSPSS)
TestedeLevene paraavaliaropressuposto
dahomogeneidadedasvariâncias
Estatísticasdescritivaspor
grupo(média,desvio-
padrão,erro-padrão da
média,IC,mínimoe
máximo)
TabelaANOVA(resultados
dotestedecomparaçãode
médias)
20
TabelaANOVA
Fontesde
variaçãodos
dados
Valorp
Estatística
F
Somade
quadrados
Grausde
liberdade
associadosa
cadasomade
quadrados
Estimativada
variância
(média
quadrática)
TabelaANOVA
Valorp
Osgrausde
liberdade
também
somam
AadiçãodasSomas
deQuadrados
correspondeà Soma
deQuadradostotal
Nº degrupos- 1
N- 1
Asmédiasquadráticas
resultamdedividira
SomadeQuadrados
pelosgrausde
liberdade
correspondentes
AestatísticaFresulta
dadivisãodaMédia
Quadráticabetween
pelaMédia
Quadráticawithin
Decisão
SeSig.≤ α,rejeita-seH0,oqueseverificanopresenteexemplo
(Sig.=0,001<0,05).
Logo, rejeita-seH0 aonível designificância α =0,05,ouseja,
pelo menos um dos grupos têm valor médio diferente dos
restantes[F(2,9)=15,6,p=0,001].
Oneway ANOVA(output doSPSS)
Gráficodemédias
(means plot),permite
visualizarquemédias
sãodiferentes
O Grupo 1 (silêncio)
aparenta diferir dos
restantesdois.
Como verificar estatistica-
mente seassimé?
Análisesposteriores
Se não se rejeitar H0, é fácil concluir que os grupos são idênticos.
Mas se se rejeitar H0, apenas sabemos que pelo menos um dos
grupos é diferente dos restantes. Como determinar os grupos que
diferementresi?
G1=G2=G3
G1≠ (G2=G3)ouG2≠ (G1=G3)ouG3≠ (G1=G2)
G1≠ G2≠ G3
Emquesituaçãoestamos?
NãorejeitarH0
RejeitarH0
Análisespost-hoc
Existem inúmeros procedimentos para decidir que média são
realmentediferentesumasdasoutras.
Todos estes procedimentos consistem em comparar pares de
médias,masagoraestascomparaçõesestãoprotegidasquanto
aoempolamentodoerrodetipoI.
Há procedimentos mais conservadores e procedimentos mais
liberais – sem razão especial, vamos utilizar o procedimento
post-hoc deTukey HSD(honestly significant difference).
21
Análisespost-hoc
Valorp paraadiferença
entrecadaparde
condições
Valordadiferençapara
cadaparademédias
Assinalam-secom*as
diferençassignificativas
paraovalordeα escolhido
Análisespost-hoc
Valorp paraadiferença
entreasmédiasdentro
decadagrupo
As condições organizam-se em dois
grupos: “Condições 3 e 2” (que
apresentammédiacomvalores4e5)
e Condição 1 (que apresenta média
comvalor8).
Conclusãofinal
Em resumo, as diferenças detectadas pela ANOVA resultam do
Grupo 1 ter uma desempenho significativamente mais elevado
queosoutrosdoisgrupos(Grupo1vs Grupo2:p=0,008;Grupo
1vs Grupo3:p=0,001),que,porsuavez,nãosedistinguemde
formaestatisticamentesignificativa(Grupo2vs Grupo3:p=0,409).
Análisespost-hoc – procedimentode
Bonferroni
Umaoutraformaderealizaranálisespost-hoc controlandoataxade
erro global (experimentwise error) é através do procedimento de
Bonferroni, que aqui se vai descrever por ser fácil de conduzir
manualmente.
Sepretendemosfazerumaanálisepost-hoc apósrejeitarnaANOVA
uma hipótese omnibus, basta realizar as k comparações através
testestentreparesdemédiaseutilizarcomoníveldesignificância
nãoα massimα/k.
Trata-sedeumprocedimentoconservador,masfácildeaplicar.
Análisespost-hoc – procedimentode
Bonferroni
Como são três grupos em comparação, vamos utilizar o nível
designificânciaα/3=0,05/3=0,0167.
Apenasacomparação2vs3nãoé significativaparaestenível
designificânciacorrigido.
0,2676t=1,22Grupo2vsGrupo3
0,0036t=4,90Grupo1vsGrupo3
0,0026t=5,20Grupo1vsGrupo2
ValorpGLEstatísticatComparação
Análisespost-hoc – outros
procedimento
O SPSS oferece 18 alternativas no que
respeitaà análisepost-hoc.
Algunscritériospodemnortearaescolha
deumadessasalternativas:
� ControlosobreoerrodetipoI
� ControlosobreoerrodetipoII
� Desigualdadenotamanhodosgruposacomparar
� Heterogeneidadedasvariâncias
22
Análisespost-hoc – outros
procedimento
Games-HowellVariâncias
diferentes
Grupos
diferentes
Gabriel(poucodiferentes)
Hochberg GT2(muitodiferentes)
Variâncias
diferentes
Tukey
REGWQ
Bonferroni (conservador)
VariânciasiguaisGrupos
iguais
Procedimentopost-hocHomogeneidade
dasvariâncias
Dimensão
dosgrupos
SegundoField (2000)
Contrastesapriori
Emvezdeolharmosparaasdiferençasentre todososparesde
grupos, podemos estar interessados em apreciar contrastes
planeadosapriori.
Porexemplo,numestudoexperimental,podeinteressarcomparar
o grupo de controlo com dois grupos experimentais. Estes
contrastesdevemserespecificadosantesda realizaçãodo teste
omnibus.
Contrastesapriori
OSPSSdisponibilizaumconjuntodecontrastesapriori:
Testatendênciaslineares,quadráticasecúbicase
quárticas nosdados
Polynomial
Cadanívelé comparadocomoefeitomédiodas
categoriasanteriores
Difference
Cadanívelé comparadocomoefeitomédiodas
categoriasseguintesHelmert
Cadanívelé comparadocomonívelseguinteRepeated
Cadanívelé comparadocomoprimeiro/últimoSimple (first /last)
Comparaoefeitodecadanível(exceptooprimeiro/
último)comoefeitoglobaldoestudo
Deviation (first /last)
Contraste
Exemplo
Considerequeseplanearaaprioricontrastaroefeitodacondição
“Silêncio” com o efeito das outras duas condições. O contraste
adequadoserá odeHelmert.
O silêncio (nível 1) difere
significativamente da
média dos outros dois
níveis (p = 0,000). No
entanto, os outros dois
níveisnãodiferementresi
de forma estaticamente
significativa(p=0,213).
Relaçãoentreotestet eaANOVA
unifactorial
O teste t é umcasoparticularda ANOVAunifactorial (quando o
númerodegruposemcomparaçãoé 2).
Nessasituação,ovalordaestatísticaFcorrespondeaoquadrado
daestatísticat. Ovalorp será idênticoemambosostestes.
B.Amostras
emparelhadas
Testesdehipóteses
Suaaplicaçõeselimites
23
ANOVAcommedidasrepetidas
EXEMPLO
Objectivo: avaliaroefeitodacornaidentificaçãoenomeaçãode
objectos.
Desenho experimental: 25 sujeitos expostos a três condições
experimentais (os objectos a nomear são representados através
“desenhos”, “fotografias a preto e branco” ou “fotografias a cor”).
Todos os sujeitos foram expostos a cada uma das condições
experimentais.
Atençãoaosefeitosdeordem!
ANOVAcommedidasrepetidas
Desenhoexperimentalintra-sujeitos(omesmosujeitoé expostoàs
trêscondições– amostrasemparelhadas)
Factores:
Tipodeimagem:“desenho”,“fotoB&W”,“fotocor”
(factorwithin subject)
Variáveldependente:
Tempodenomeação
Fontesdevariaçãonosdados
Porqueé queduasobservaçõessãodiferentes?
� Porque os sujeitos nomearam estímulos diferentemente
coloridos(efeitodofactorTipodeimagem)
� Porqueossujeitossãodiferentes(efeitoresidual)
Hipótesessobrevaloresmédios
H0: Não há diferenças no desempenho médio dos sujeitos nas
trêscondiçõesexperimentais
H1: Em pelo menos uma das condições experimentais o
desempenho médio dos sujeitos difere do desempenho nas
restantescondições
Dados
Vinteecincosujeitosexpostosatrês
condiçõesexperimentais,definidas
consoanteotipodeimagemanomear.
Osvaloresreferemotempomédiode
nomeaçãodasimagens(em
segundos)paracadacondição.
Aquestãodaesfericidade
Testedaesfericidade
Quandoofactorwithin temmaisdoqueduasmodalidades,é necessárioque
severifiqueaesfericidade damatrizdascovariâncias.Trata-sedeumaexigência
semelhanteà homogeneidadedevariâncias,masdestavezparaocasodaANOVA
commedidasrepetidas.
Napresentesituação,rejeita-seH0 [X2(2)=14,4,p=0,001],ouseja,nãosepode
assumiraesfericidadedamatrizdeco-variâncias,peloqueé precisoseguiralguns
cuidadosnarealizaçãodestaANOVAdemedidasrepetidas.
24
ANOVAparamedidasrepetidas
(output doSPSS)
EfeitodoTipodeImagem
Rejeita-seH0 [F(1.4,32.8)=45,9,p=0,000],ouseja,otempodenomeação
dasimagensfoiinfluenciadopelamanipulaçãoexperimental(presençaou
nãodecor).
Asignificânciado
efeitodo“Tipode
Imagem” lê-senesta
linhapoisnãose
podeassumira
esfericidadedos
dados.
AcorrecçãodeGreenhouse-Geisser alteraosgraudeliberdadedaestatísticaF,de
formaagarantirmaiorfiabilidadeaosresultadosdaANOVA.
ANOVAparamedidasrepetidas
(output doSPSS)
EfeitodoTipode
Imagem
Anomeaçãodos
desenhosparecesermais
lentadoqueanomeação
dasfotografias,quersejam
acorouapretoebranco.
ANOVAparamedidasrepetidas
(output doSPSS)
Comparaçãoentremodalidades
Otempodenomeaçãodosdesenhosé
estatisticamentediferentedotempode
nomeaçãodosoutrosdoistiposdeimagem
(fotosB&WefotosCor).
Análisepost hoc atravésdo
métododeBonferroni
Relaçãocomoutrosprocedimentosparateste
estatísticodehipótesessobrevaloresmédios
Tal como o procedimento “One-way ANOVA” é a generalização do
testetdeStudent (Two independent samples ttest)parasituaçõesem
que se pretende comparar a média de mais do que duas amostras
independentes,tambémoprocedimento“Repeated measures ANOVA”
é a generalização do teste t de Student (Two paired samples t test)
parasituaçõesemquesepretendecompararamédiademaisdoque
duasamostraemparelhadas.
Senãosecumpriremos requisitosmínimosdeaplicaçãodaANOVA
com medidas repetidas, é sempre possível recorrer ao teste não
paramétricodeFriedman.
Parte3
Testesnãoparamétricos
(distribution free)
Testesdehipóteses
Suaaplicaçõeselimites
Árvorededecisãoparatestessobre
valoresmédios
Tipo
de
dados
Nominais
Escala
Ordinais
Nãoseaplicao
conceitodevalor
médio;talvezse
pretendaumteste
dequi-quadrado
Amostrasprovémde
populaçõesnormais
Nãosesabeseas
amostrasprovémde
populaçõesnormais
Amostrasgrandes
(N≥ 30)
Amostraspequenas
(N<30)
Testesnão-
paramétricos
Testes
paramétricos
25
Árvorededecisão
(testesparamétricossobrevaloresmédios)
Testede
conformidade
Testede
diferenças
Amostras
independentes
Amostras
emparelhadas
Comparardois
valoresmédios
Compararmaisde
doisvaloresmédios
Homogeneidade
devariâncias
Heterogeneidade
devariâncias
Independent-
Samples TTest
(Welch Method)
Independent-
Samples TTest
One-Sample
TTest
Paired-Samples
TTest
Oneway-
ANOVA
Welch &Brown-
Forsythe Method
Amostras
independentes
Testes
paramétricos
sobrevalores
médios
Amostras
emparelhadas GLM- Repeated
Measures
Homogeneidade
devariâncias
Heterogeneidade
devariâncias
Testesparamétricosenão
paramétricos
Os testes apresentados testam hipóteses sobre
parâmetros (valor médio). Quando as exigências de
aplicação destes testes paramétrico não são
respeitadas, pode-se optar pela alternativa não
paramétricascorrespondente.
Noentanto,ostestesnãoparamétricos,talcomooseu
nome indica, não avaliam hipóteses sobre parâmetros,
pelo que as duas abordagens (paramétrica e não-
paramétrica) não coincidem totalmente. Os testes não
paramétricos testam, de um forma geral, igualdade de
distribuições.
Condiçõesdeaplicação
Emgeram,ostestesnãoparamétricosexigemapenasque...
� Asobservaçõesdeumaamostrasejamindependentesentresi.
� Asobservações resultemdamediaçãodeumavariávelmétrica
(medidaaonívelordinaloudeescala).
Árvorededecisão
(testesnão-paramétricos)
Testede
conformidade
Testede
diferenças
Amostras
independentes
Amostras
emparelhadas
Comparardois
valoresmédios
Compararmaisde
doisvaloresmédios
Não existe alternativa
não-paramétrica
Amostras
independentes
Testesnão-
paramétricos
equivalentesa
testessobre
valoresmédios
Amostras
emparelhadas
Nonparametrictests
2Independentsamples
(Mann-Whitney)
Nonparametrictests
KIndependentsamples
(Kruskal-Wallis)
Nonparametrictests
KRelatedsamples
(Friedman)
Nonparametrictests
2Relatedsamples
(Wilcoxon)
Ranking
Os testes não paramétricos indicados não se baseiam nos
dados originalmente recolhidos mas na sua conversão em
ranks (ordens).
Exemploderanking
Dadosoriginais Ranks
7,2 → 4
5,4 → 3
2,8 → 1
9,3 → 5
5,2 → 2
As ordens ignoram o valor das
diferençasexistentesentreobservações,
transformando uma variável medida ao
nívelescalarnumavariávelordinal.
Ranking
Exemploderanking comempates
Dadosoriginais Ordenação Ranks
2,8 → 1ou2 1,5
2,8 → 1ou2 1,5
5,2 → 3 3
5,4 → 4ou5ou6 5
5,4 → 4ou5ou6 5
5,4 → 4ou5ou6 5
7,2 → 7 7
9,3 → 8 8
Faz-seamédiadasordens:
(1+2)/2=1,5
Faz-seamédiadasordens:
(4+5+6)/3=5
26
Parte4
Desenhosexperimentais
complexos
Testesdehipóteses
Suaaplicaçõeselimites
Planosexperimentaisfactoriais
Eminvestigaçãoexperimental,é frequenteestudaroefeito
simultâneodedoisoumais factoresnodesempenhodos
participantes.
Porexemplo…
Testar a agradabilidade provocada pelo contacto
comumestímulo táctilemquesevarioudiferentes
características(texturaetemperatura).
Factores/modalidade/condições
Trata-se de um plano experimental bifactorial, pois manipularam-se
dois factores:o factor experimental “textura” temduasmodalidades
(liso e rugoso) e o factor experimental “temperatura”tem três
modalidades(frio,normalequente).
Para avaliar o efeito destas seis condições experimentais na
variáveldependente (“agradabilidadesentida”),dever-se-á recorrera
umaANOVA2x3.
Rugoso
Liso
QuenteNormalFrio
Situaçõesmultifactoriais
O plano experimental anterior pode estender-se a três factores,
incluindo um factor adicional (por exemplo, a “humidade” do
estímulo: seco ou húmido), passando assim a uma situação
trifactorial edefinindo-se2x3x2=12condiçõesexperimentais.
SecoHúmido
QuenteNormalFrio
Rugoso
Liso
QuenteNormalFrio
Naturezadosfactores
Existemdoistiposdefactoresexperimentais:
� Factores entre-sujeitos (between subjects) – quando cada
sujeito experimental é exposto apenas a uma modalidade de
cadafactor.
� Factoresintra-sujeitos (within subjects)– quandoumsujeitoé
expostoamaisdoqueumamodalidadedeummesmofactor.
Planoexperimentalentre-sujeitos
Nestaexperiência,cadasujeitoé expostoaumaúnicacondição.
Para comparar condições temos de comparar o desempenho de
sujeitos diferentes. Assim, trata-se de um plano experimental
entre-sujeitos (between subjects design).
Raul
Tânia
Paulo
Paula
José
Mário
Vasco
Manuel
Julieta
Rugoso
Joaquim
Vanessa
Rui
Tiago
Hugo
Vânia
Pedro
João
Maria
Liso
QuenteNormalFrio
27
Planoexperimentalintra-sujeitos
Nesta experiência, cada sujeito é exposto a todas as condições
experimentais. Para comparar condições temos de comparar o
desempenhodecadasujeitonumacondiçãocomoseudesempenho
noutra condição. Assim, trata-se de um plano experimental intra-
sujeitos puro(within subjects design).
Pedro
João
Maria
Pedro
João
Maria
Pedro
João
Maria
Rugoso
Pedro
João
Maria
Pedro
João
Maria
Pedro
João
Maria
Liso
QuenteNormalFrio
Planoexperimentalmisto
Nestaexperiência,cadasujeitoé expostoàsduasmodalidadesdofactor“textura” mas
apenas a uma modalidade do factor “temperatura”. Num dos factores (“textura”) o
desempenho do sujeito numa condição pode ser comparado com o seu desempenho
noutracondição;nooutrofactor(“temperatura”),oseudesempenhoé comparadocomo
desempenho de outros sujeitos. Assim, trata-se de um plano experimental misto
(mixed design):a“textura” é umfactor intra-sujeitosea“temperatura” umfactorentre-
sujeitos.
Joaquim
Vanessa
Rui
Tiago
Hugo
Vânia
Pedro
João
Maria
Rugoso
Joaquim
Vanessa
Rui
Tiago
Hugo
Vânia
Pedro
João
Maria
Liso
QuenteNormalFrio
Interacção
Em estudos com mais de um factor, o foco de interesse é o
efeito da interacção entre esses factores na variável
dependente.
Será oefeitodeum factor independente dooutro factorouo
seu efeito conjunto leva a produzir padrões de resultados
inesperados?
A análise das interacções é um ponto fundamental na
investigaçãopsicológica.
A.ANOVAbifactorial
Testesdehipóteses
Suaaplicaçõeselimites
ANOVAbifactorial
(paragruposindependentes)
EXEMPLO
Objectivo: avaliar o impacto de uma formação breve nas
competênciasparautilizarsoftwareestatístico.
Amostra: grupodecontrolo(20estudantes)egrupoexperimental
(20estudantesque receberama formaçãobreve).Cadagrupo foi
definidode formaagarantirquemetadedosestudantes tivessem
experiência no uso de software (grupo de experientes) e a outra
metadenãotivessequalquerexperiênciadeutilizaçãodesoftware
(grupodenãoexperientes).
ANOVAbifactorial
Planoexperimentalbifactorial entre-sujeitos
Factores
Formação:Grupoexperimentalversus Grupodecontrolo
Experiência:Experientesversus Não-experientes
Variáveldependente
Competênciasdeutilizaçãodemonstradasnumatarefa
comosoftware emcausa
Procedimentodeanálise:ANOVA2x2
28
Fontesdevariaçãonosdados
Porquerazãoduasobservaçõesdesteestudosãodiferentes?
� Porque os sujeitos receberam formação diferente (efeito do factor
“Formação”).
� Porqueossujeitostêmexperiênciaspréviasdiferentecomsoftware
(efeitodofactor“Experiência”).
� Porque o efeito da formação nos sujeitos depende da sua
experiência prévia (efeito da interacção entre “Experiência” e
“Formação”).
� Porquesãopessoasdiferentes(efeitoresidual)
Serãoesteefeitosrealmentesignificativosnodesempenho?
Fontesdevariaçãonosdados
Efeitospresentesnumplanobifactorial:
� Efeitodofactor“Formação”
� Efeitodofactor“Experiência”
� Efeito da interacção “Experiência x Formação” (interacção de 2ª
ordem)
Efeitosprincipais
(main effects)
Hipóteses
Factorformação
H0:Nãohá diferençasentreGrupoExperimentaleGrupodeControlo
H1:Há diferençasentregrupoExperimentaleGrupodeControlo
FactorExperiência
H0:Nãohá diferençasentreExperienteseNão-experientes
H1:Há diferençasentreExperienteseNão-experientes
Interacçãoentreformaçãoeexperiência
H0:Oefeitodaformaçãoé independentedaexperiênciadosparticipantes.
H1:Oefeitodaformaçãodependedaexperiênciadosparticipantes.
Dados
15,1614,19,
13,14,15,16,
17,17
15,16,15,17,
15,16,15,17,
15,16
Experimental
(com
formação)
15,14,15,16,
16,15,16,17,
15,14
11,12,13,14,
10,12,11,13,
14,12
Controlo
(sem
formação)
ExperientesInexperientesResultadosna
tarefa
A amostra total é constituída por 40
observaçõesdistribuídaspelasquatro
condiçõesexperimentais.
Homogeneidadedasvariâncias
TestedehomogeneidadedasvariânciasdeLevene
Perantegruposindependentes,arealizaçãodaANOVAexige
queasvariânciasdosgruposemcomparaçãosejam
semelhantes.
ComonãoserejeitaH0 [F(3,36)=2,2,p=0,111],pode-se
assumirahomogeneidadedasvariâncias,peloqueexistem
condiçõesparaprosseguiraANOVA.
Interacçãoentrefactores
AvantagemdasANOVAs bifactoriais sobreasANOVAs unifactoriais diz
respeitoà possibilidadedeavaliarseosdoisefeitosagem
independentementeumdooutrosobreavariáveldependenteouse,pelo
contrário,oefeitodeumdependedoefeitodooutro(interacção).
Noexemploemanálise,será queoefeitobenéficodaformaçãodependerá
dofactodossujeitosseremExperientesouInexperientes?
Se não existe interacção significativa, os factores principais podem ser
interpretados isoladamente. Quando existe interacção, não se pode falar
dos efeitos principais isoladamente, uma vez que o efeito de um factor
depende do efeito do outro. Assim, a interacção deve ser sempre
interpretada em primeiro lugar, antes da interpretação dos efeitos
principais.
29
Testedashipótesessobrevalores
médios– efeitodeinteracção
EfeitodainteracçãoFormaçãoxExperiência
Rejeita-seH0 [F(1,36)=15,8,p=0,000],ouseja,oefeitodaformaçãonãoé
idênticoparaexperientesenãoexperientes;oesclarecimentosobreo
significadodestainteracçãoé facilitadopelaanálisedográficodemédias.
Gráficodemédias
InteracçãoFormaçãox
Experiência
Enquantoquenos
Experientesaformação
pareceterumefeito
negligenciável,ofactodos
Inexperientesterem
frequentadoocursode
formaçãofezcomqueoseu
desempenhoseaproximasse
dodosExperientes.
Análisegráficadosefeitosde
interacção
A1 A2 A1 A2 A1 A2
B2
B1
EfeitoA:nsig
EfeitoB:nsig
Interacção:nsig
EfeitoA:nsig
EfeitoB:sig
Interacção:nsig
EfeitoA:sig
EfeitoB:sig
Interacção:nsig
Nota:aausênciadeinteracçãodetecta-sefacilmenteatravésdeumgráficode
médias:aslinhassãogrosseiramenteparalelas.
Análisegráficadosefeitosde
interacção
A1 A2 A1 A2 A1 A2
EfeitoA:nsig
EfeitoB:sig
Interacção:sig
EfeitoA:sig
EfeitoB:nsig
Interacção:sig
EfeitoA:nsig
EfeitoB:nsig
Interacção:sig
A1 A2
EfeitoA:sig
EfeitoB:sig
Interacção:sig
Nota:apresençadeinteracçãodetecta-sefacilmenteatravésdeumgráficode
médias:aslinhascruzam,convergemoudivergem.
Identificaçãodasdiferenças
significativasnumainteracção
Os diversos padrões de interacção que podem surgir obrigam a
identificarquecondiçõesdiferementresi.
O SPSS não permite fazer comparações post hoc para efeitos de
interacção, pelo que é preciso recorrer a testes t de Student ou a
ANOVAs para identificar que médias diferem umas das outras.
Nestescasos,é necessáriousarsempreacorrecçãodeBonferroni.
NOTA: para realizar esta comparação posthoc com o teste t, utilize o
comando“split file” parafazeraanáliseseparadamenteemfunçãodonível
deexperiência.
Grupodeexperientes
Grupodeinexperientes
Identificaçãodasdiferenças
significativasnumainteracção
30
Identificaçãodasdiferenças
significativasnumainteracção
Como estamos a fazer dois testes, a correcção de Bonferroni recomenda
usaroníveldesignificânciaα/2=0,05/2=0,025.
Confirma-se, assim, que a formação
não exerce efeito nos experientes
(médias: 15,3 vs 15,6; t = -0,47, df =
18, p = 0,643) mas melhora
significativamente o desempenho dos
inexperientes(médias:12,2vs15,7;t=
-7,13,df =18,p=0,000).
Testedashipótesessobrevalores
médios– efeitosprincipais
EfeitodaFormação
Rejeita-se H0 [F(1, 36) = 22,3, p = 0,000], ou seja, a formação introduziu
diferenciação significativa no desempenho da tarefa. Pela tabela das
estatísticas descritivas, pode-se observar que o grupo experimental (com
formação) teveumdesempenhomédio significativamente superior aogrupo
decontrolo(15,65versus 13,75).
Testedashipótesessobrevalores
médios– efeitosprincipais
EfeitodaExperiência
Rejeita-seH0 [F(1,36)=13,9,p=0,001], ouseja,aexperiência introduziu
diferenciação significativa no desempenho da tarefa. Pela tabela das
estatísticas descritivas, pode-se observar que, independentemente da
formação,ogrupoexperienteteveumdesempenhomédiosignificativamente
superioraogrupoinexperiente(15,45versus 13,95).
Conclusãogeral
A formação parece ter efeito positivo apenas no grupo de
inexperientes,permitindo-lhesumníveldedesempenhoigual
aosexperientes.OseubenefícioparaosExperientesé não
significativo.
Apesar dos efeitos principais serem significativos, perdem
significado perante a interacção detectada (ou seja, a
vantagem dos Experientes observa-se apenas na condição
“Sem formação” e a vantagem da formação observa-se
apenasparaogrupodeInexperientes).
Dificuldadesnainterpretaçãodos
efeitosdeinteracção
A presença de efeitos designados por “ceiling effect” ou “floor
effect” podetornarinviávelainterpretaçãodasinteracções.
Efeitodetecto (ceiling effect)– ocorrequandoodesempenho
de um dos grupos se aproxima do nível máximo possível
permitidopelaprova(ouseja,aprovaé demasiadamente fácil
paraessegrupo).
Efeitodechão (floor effect)– ocorrequandoodesempenhode
um dos grupos se aproxima do nível mínimo permitido pela
prova(aprovaé demasiadamentedifícilparaessegrupo).
Efeitodetectoeefeitodechão
Umainteracçãosignificativaentredoisfactorespodeserum
artefactodevidoà presençadeefeitodetectooudeefeitode
chão,tornandoassimainvestigaçãoinconclusiva.
Poressarazão,oinvestigadordevegarantirqueaprovaou
testequeestá autilizarparaavaliarodesempenhodos
sujeitossejasuficientementediscriminativa(nemmuitofácil
nemmuitodifícil),paragarantirqueosníveisdedesempenho
sesituemaumnívelmédio(longedo“tecto” elongedo
“chão”).
31
Efeitodetecto
Nesteexemplo,ogrupoAtemumdesempenhopróximodomáximo
(100%)emambasascondiçõesexperimentais(ceiling effect).
Aanáliseestatísticavaidetectaruma
interacçãoque,muitoprovavelmente,
será umartefactodevidoaoceiling effect.
OfactodogrupoAter-seaproximadodo
nívelmáximodedesempenhoemambas
ascondiçõesnãogaranteque,numa
provamaisdifícil,oseudesempenhonão
diferisseentrecondições,assemelhando-
seaodogrupoB(aslinhasdográfico
ficariamentãoparalelasedeixariade
haverinteracção).
50
55
60
65
70
75
80
85
90
95
100
GrupoA GrupoB
R
es
po
st
a
s
c
o
rr
ec
ta
s
(%
)
ComLuz
SemLuz
Efeitodechão
Nesteexemplo,ogrupoBtemumdesempenhopróximodonívelmínimoque
aprovapermite(0%)emambasascondiçõesexperimentais(floor effect).
TambémaquiaANOVAvaidetectaruma
interacçãosignificativaqueserá um
artefactodevidoà presençadefloor
effect.OfactodogrupoBter-se
aproximadosistematicamentedonível
mínimodedesempenhoemambasas
condiçõesnãogaranteque,numaprova
maisfácil,oseudesempenhopermitisse
umadissociaçãoentrecondições
experimentais,semelhanteà observada
nogrupoA.
0
10
20
30
40
50
60
GrupoA GrupoB
R
es
po
s
ta
s
c
o
rr
e
c
ta
s
(%
)
ComLuz
SemLuz
B.ANOVAbifactorial
commedidasrepetidas
Testesdehipóteses
Suaaplicaçõeselimites
ANOVAcommedidasrepetidas
Planosbifactoriais emqueambososfactoressão intra-sujeitossão
frequentesemestudosexperimentais,quandoomesmoconjuntode
sujeitos é exposto às diferentes condições manipuladas pelo
experimentador.
A utilização da mesma amostra nas diferentes condições permite
reduzir a variação residual atribuível a diferenças individuais. No
entanto, é preciso cuidados metodológicos especiais neste tipo de
estudos,paraevitarefeitosdeordemnodesempenhodossujeitos
(cansaço,treino,expectativas).
ANOVAcommedidasrepetidas
EXEMPLO
Objectivo: avaliar o efeito da fase do dia (manhã e noite) e da
natureza do material (letras, números, formas geométricas) no
desempenhoemprovasdememóriaimediata.
Plano experimental: 30 sujeitos expostos a três condições
experimentais durante a manhã (memorizar letras, números e
formas geométricas) e às mesmas três condições experimentais
duranteo iníciodanoite.Regista-seonúmerode respostascertas
nasdiferentesprovasdememória.Foramacauteladososefeitosde
ordem.
ANOVAcommedidasrepetidas
EXEMPLO
Planoexperimentalintra-sujeitos
Factores(within subject):
Tipodematerial:“letras”,“números”,“formas”
Fasedodia:“manhã”,“noite”
Variáveldependente:
Desempenhonasprovasdememóriaimediata
Procedimentodeanálise:ANOVA3x2commedidasrepetidas
32
Hipóteses
FactorFasedodia
H0:Nãohá diferençasdedesempenhoentreamanhãeanoite
H1:Existemdiferençasentreamanhãeanoite
FactorTipodematerial
H0:Nãohá diferençasdedesempenhoparaostrêstiposdematerial
H1:Pelomenosumdostiposdemateriallevouadesempenhodiferentesdos
restantes
Interacçãoentrefactores
H0:Oefeitodotipodematerialé independentedafasedodiadoteste
H1:Oefeitodotipodematerialdependedafasedodiadoteste
Dados
Trintasujeitosexpostosa
seis(2x3)condições
experimentais.
Comosetratadeumplano
deestudocommedidas
repetidas,abasededados
inclui30linhas(sujeitos)e6
colunas(condições).
Osvaloresreferema
acuidadedasrespostas
dadasnasprovasde
memóriaimediatarealizadas
emcadacondição.
ANOVAcommedidasrepetidasno
SPSS
É necessárioatribuirumnomeaosdois
factoreswithin subjects eidentificaro
númerodeníveisqueelespossuem.
Aquitrata-sedofactor“fase_dia” (com
duasmodalidades:“manhã” e“noite”)e
dofactor“material” (comtrês
modalidades:“letras”,“números” e
“formas”).
ANOVAcommedidasrepetidasno
SPSS
Atribuirasseisvariáveisaos
factoreswithin subjects.
Options
Solicitarumgráficodemédias,
parafacilitarainterpretaçãode
eventuaisinteracções.
Output– estatísticasdescritivas
Estatísticasdescritivas:
acuidadenodesempenho
emcadaprova
DescriptiveStatistics
7,37 2,918 30
6,10 2,845 30
4,10 2,591 30
7,00 2,213 30
4,40 2,568 30
3,97 2,236 30
manha_num
manha_let
manha_for
noite_num
noite_let
noite_for
Mean Std.Deviation N
Mauchly'sTestofSphericityb
Measure:MEASURE_1
1,000 ,000 0 . 1,000 1,000 1,000
,203 44,687 2 ,000 ,556 ,563 ,500
,778 7,020 2 ,030 ,818 ,861 ,500
WithinSubjectsEffect
fase_dia
material
fase_dia*material
Mauchly'sW
Approx.
Chi-Square df Sig.
Greenhous
e-Geisser Huynh-Feldt Lower-bound
Epsilona
Teststhenullhypothesisthattheerrorcovariancematrixoftheorthonormalizedtransformeddependentvariablesis
proportionaltoanidentitymatrix.
Maybeusedtoadjustthedegreesoffreedomfortheaveragedtestsofsignificance.Correctedtestsaredisplayedin
theTestsofWithin-SubjectsEffectstable.
a.
Design:Intercept
WithinSubjectsDesign:fase_dia+material+fase_dia*material
b.
Output – esfericidade
Rejeita-seahipótesedeesfericidadenoscasosemqueelatemdesertestada
(ouseja, parao factor “material”, que tem3níveis, ena interacçãoque tem
2x3 níveis). Por haver problemas de esfericidade, é preciso procederàs
devidascorrecçõesnaANOVA(correcçãodeGreenhouse-Geisser).
33
Output – testedashipóteses
Comosereferiuanteriormente,nosplanosbifactoriais deve-se
começarsempreporverificarseainteracçãoé significativaantesde
analisarosefeitosprincipais…
Istoporque,casoainteracçãosejasignificativa,é arriscadofalardo
efeitoisoladodeumfactorsemquesetenha,obrigatoriamente,de
referirooutrofactor(umavezqueosdoisfactoresinteragemna
influênciaquetêmsobreavariáveldependente).
Apenasquandoainteracçãonãoé significativaé queoefeitoisolado
decadafactorpodeserreferido,independentementedooutrofactor
daexperiência.
TestsofWithin-SubjectsEffects
Measure:MEASURE_1
24,200 1 24,200 34,858 ,000
24,200 1,000 24,200 34,858 ,000
24,200 1,000 24,200 34,858 ,000
24,200 1,000 24,200 34,858 ,000
20,133 29 ,694
20,133 29,000 ,694
20,133 29,000 ,694
20,133 29,000 ,694
302,811 2 151,406 16,892 ,000
302,811 1,113 272,119 16,892 ,000
302,811 1,125 269,075 16,892 ,000
302,811 1,000 302,811 16,892 ,000
519,856 58 8,963
519,856 32,271 16,109
519,856 32,636 15,929
519,856 29,000 17,926
21,433 2 10,717 13,741 ,000
21,433 1,637 13,093 13,741 ,000
21,433 1,722 12,449 13,741 ,000
21,433 1,000 21,433 13,741 ,001
45,233 58 ,780
45,233 47,472 ,953
45,233 49,928 ,906
45,233 29,000 1,560
SphericityAssumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
SphericityAssumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
SphericityAssumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
SphericityAssumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
SphericityAssumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
SphericityAssumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Source
fase_dia
Error(fase_dia)
material
Error(material)
fase_dia*material
Error(fase_dia*material)
TypeIIISum
ofSquares df MeanSquare F Sig.
Output – testedashipóteses
Ainteracçãoentreos
doisfactoresé
significativa(correcção
deGreenhouse-
Geisser).
Output – testedashipóteses
(interacção)
Efeitodainteracçãoentrefactores
Rejeita-seH0 [F(1.6,47.5)=13,7,p=0,000],ouseja,asdiferenças
de desempenho nas três provas não são iguais de manhã e à
noite…
… ou seja, as diferenças entre o desempenho matinal e nocturno
nãoé igualnastrêsprovas.
… ouseja,oefeitodotipodematerialdependedaalturadodiaem
queaprovaé realizada.
Output – gráficodemédias
Interacçãoentremateriale
fasedodia
Acapacidadedememória
paranúmeroseparaformas
parecesemelhantenosdois
momentosdeavaliação;a
memóriaparaletrasparece
sermaiseficazdurantea
manhã.Paraverificara
significânciadestaleitura,é
precisoprocederaanálises
post hoc.
PairedSamplesTest
,367 1,608 ,294 -,234 ,967 1,249 29 ,222
1,700 1,119 ,204 1,282 2,118 8,323 29 ,000
,133 ,819 ,150 -,173 ,439 ,891 29 ,380
manha_num-noite_numPair1
manha_let-noite_letPair2
manha_for-noite_forPair3
Mean Std.Deviation
Std.Error
Mean Lower Upper
95%Confidence
Intervalofthe
Difference
PairedDifferences
t df Sig.(2-tailed)
Identificaçãodasdiferençassignificativas
nainteracção(análisepost hoc)
Acomparaçãopost hoc entreasmédiasdográficodeinteracçãopoderá ser
feita recorrendoao teste tparaamostrasemparelhadas (comcorrecçãode
Bonferroni,utilizando-seovalorα/3=0.05/3=0.0167,poisé realizadoum
conjuntodetrêstestes).
Aanálisepost hoc permite afirmar que apenas na prova dememória para
letrasexistediferençasignificativaentremanhãenoite(t=8,3,gl =29,p=
0,000).
Output – testedashipóteses(efeitos
principais)
Efeitodotipodematerial
Rejeita-seH0 [F(1.1,32.3)=16,9,p=0,000],ouseja,odesempenhodepelo
menosumadasprovasé diferentedosrestantes.
Comoestefactortemtrês
modalidades,é precisoprocedera
análisespost hoc paraidentificar
quemodalidadessãodiferentes
entresi(apenassabemosquepelo
menosumadiferedasrestantes).
34
PairwiseComparisons
Measure:MEASURE_1
1,933* ,659 ,019 ,260 3,607
3,150* ,656 ,000 1,483 4,817
-1,933* ,659 ,019 -3,607 -,260
1,217* ,179 ,000 ,762 1,671
-3,150* ,656 ,000 -4,817 -1,483
-1,217* ,179 ,000 -1,671 -,762
(J)material
2
3
1
3
1
2
(I)material
1
2
3
Mean
Difference
(I-J) Std.Error Sig.a LowerBound UpperBound
95%ConfidenceIntervalfor
Differencea
Basedonestimatedmarginalmeans
Themeandifferenceissignificantatthe,05level.*.
Adjustmentformultiplecomparisons:Bonferroni.a.
Output – análisepost hoc
Comparaçãoentremateriais
Observam-sediferençassignificativasentreodesempenhonastrêsprovas,peloque
sepodeafirmarque,independentementedahoradodia,acapacidadedememória
paranúmerosé sempremelhordoqueacapacidadedememóriaparaletraseambas
sãomelhoresdoqueacapacidadedememóriaparaformasgeométricas.
Análisepost hoc através
dométododeBonferroni
Output – testedashipóteses(efeitos
principais)
Efeitodafasedodia
Rejeita-seH0 [F(1,29)=34,9,p=0,000],ouseja,odesempenhogeralnas
provasdememóriadependedafasedodiaemquefoiavaliado.
Aanálisedasmédiasindicaqueo
desempenhogeralnasprovasde
memóriaduranteamanhãé superiorao
desempenhoduranteanoite(neste
caso,comoofactor“fasedodia” apenas
temduasmodalidades,nãoé preciso
procederaanálisespost hoc);no
entanto,aanálisedainteracçãorevelou-
nosqueessadiferençadeve-se
sobretudoà provadeletras..
Conclusãogeral
Embora o desempenho de provas de memória seja
sistematicamentemelhorquandosetrabalhacomnúmerose
pior quando se trabalha com formas geométricas, o
desempenho em provas de memória que utilizem letras
parecedependerdaalturadodiaemqueaprovaé realizada. C.ANOVAmista
Testesdehipóteses
Suaaplicaçõeselimites
ANOVAcomplanoexperimentalmisto
EXEMPLO
Objectivo: avaliaroefeitodeumasessãode relaxamentonapressão
arterialsistólica.
Planoexperimental:Apósumaprovadeesforço(destinadaaaumentar
apressãoarterial),30sujeitosforamaleatoriamentedistribuídospordois
grupos: um grupo realizou uma sessão de relaxamento activo com
duração de 10 minutos (grupo experimental) e o outro grupo ficou em
repouso(grupodecontrolo).Mediu-seapressãoarterialantesedepois
decadasessão.Pretende-seavaliarseasessãoderelaxamentoactivo
teve mais efeito na redução da tensão arterial do que sessão de
repouso.
ANOVAcomplanoexperimentalmisto
Planoexperimentalmisto
Factores:
Tempo:“antesdasessão” versus “depoisdasessão”
(factor within subjects)
Tipodesessão:relaxamentoactivoversus repouso
(factorbetween subjects)
Variáveldependente:
Pressãoarterialsistólica
Procedimentodeanálise:ANOVAcommedidasrepetidas
35
Hipóteses
FactorTempo
H0:Nãohá diferençasnapressãoarterialantesedepoisdassessões
H1:Há diferençasnapressãoarterialantesedepoisdassessões
FactorTipodeRelaxamento
H0:Nãohá diferençasentreRelaxamentoActivoeRepouso
H1:Há diferençasentreRelaxamentoActivoeRepouso
Interacçãoentrefactores
H0: A diferença na pressão antes e depois é independente do tipo de
relaxamento
H1:Adiferençanapressãoantesedepoisdependedotipoderelaxamento
Estaé ahipótesequeinteressaexplorarnesta
investigação,poispermiteaveriguarseotipode
relaxamentoafectaadescidadapressãoarterial.
Dados
Trintasujeitosdistribuídosporduas
condiçõesexperimentais
Osvaloresreferemà pressãoarterial
sistólica (PA)antesedepoisdo
tratamento(sessãoderelaxamento/
repouso)
Homogeneidadedevariâncias
Homogeneidadedasvariâncias
Comonestaanáliseexisteumfactorentre-sujeitos,é necessárioverificar
se a variância das variáveis em estudo (PA_antes e PA_depois) é igual
nosdoisgruposemcomparação.
Verifica-se existir homogeneidade das variâncias para as duas variáveis
(para ambas a variáveis, p > 0,050), pelo que se pode prosseguir a
ANOVA.
Levene'sTestofEqualityofErrorVariancesa
,119 1 28 ,732
,285 1 28 ,597
PA_antes
PA_depois
F df1 df2 Sig.
Teststhenullhypothesisthattheerrorvarianceofthe
dependentvariableisequalacrossgroups.
Design:Intercept+Sessão
WithinSubjectsDesign:tempo
a.
Esfericidade
Testedaesfericidade
Comoofactorwithin temapenasdoisníveis(“antes” e“depois”)nãofaz
sentidotestaraesfericidadedamatrizdascovariâncias.Mauchly'sTestofSphericityb
Measure:MEASURE_1
1,000 ,000 0 . 1,000 1,000 1,000
WithinSubjectsEffect
tempo
Mauchly'sW
Approx.
Chi-Square df Sig.
Greenhous
e-Geisser Huynh-Feldt Lower-bound
Epsilona
Teststhenullhypothesisthattheerrorcovariancematrixoftheorthonormalizedtransformeddependentvariablesis
proportionaltoanidentitymatrix.
Maybeusedtoadjustthedegreesoffreedomfortheaveragedtestsofsignificance.Correctedtestsaredisplayedin
theTestsofWithin-SubjectsEffectstable.
a.
Design:Intercept+Sessão
WithinSubjectsDesign:tempo
b.
TestsofWithin-SubjectsEffects
Measure:MEASURE_1
390,150 1 390,150 104,504 ,000
390,150 1,000 390,150 104,504 ,000
390,150 1,000 390,150 104,504 ,000
390,150 1,000 390,150 104,504 ,000
30,817 1 30,817 8,254 ,008
30,817 1,000 30,817 8,254 ,008
30,817 1,000 30,817 8,254 ,008
30,817 1,000 30,817 8,254 ,008
104,533 28 3,733
104,533 28,000 3,733
104,533 28,000 3,733
104,533 28,000 3,733
SphericityAssumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
SphericityAssumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
SphericityAssumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Source
tempo
tempo*Sessão
Error(tempo)
TypeIIISum
ofSquares df MeanSquare F Sig.
Testedashipóteses– factorwithin
EfeitodoTempo(efeitowithin)
Como seria de esperar (pois a pressão arterial deverá baixar naturalmente 10
minutosapósaconclusãodoexercício),rejeita-seH0 [F(1,28)=104,5,p=0,000],
ouseja,há diferençasnapressãoarterialantesedepoisdassessões.
Asignificânciado
efeitodofactowithin
(Tempo)lê-senesta
linhapoisnãose
colocaaexigênciada
esfericidade.
TestsofBetween-SubjectsEffects
Measure:MEASURE_1
TransformedVariable:Average
596206,017 1 596206,017 1315,354 ,000
170,017 1 170,017 ,375 ,545
12691,467 28 453,267
Source
Intercept
Sessão
Error
TypeIIISum
ofSquares df MeanSquare F Sig.
Testedashipóteses– factorbetween
EfeitodaSessão(efeitobetween)
NãoserejeitaH0 [F(1,28)=0,4,p=0,545],ouseja,nãoexistediferença
entresessões.
Atenção:comosetratadeumfactorbetween,oSPSSapresentaoteste
correspondentenumatabeladiferentedaanterior.
36
TestsofWithin-SubjectsEffects
Measure:MEASURE_1
390,150 1 390,150 104,504 ,000
390,150 1,000 390,150 104,504 ,000
390,150 1,000 390,150 104,504 ,000
390,150 1,000 390,150 104,504 ,000
30,817 1 30,817 8,254 ,008
30,817 1,000 30,817 8,254 ,008
30,817 1,000 30,817 8,254 ,008
30,817 1,000 30,817 8,254 ,008
104,533 28 3,733
104,533 28,000 3,733
104,533 28,000 3,733
104,533 28,000 3,733
SphericityAssumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
SphericityAssumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
SphericityAssumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Source
tempo
tempo*Sessão
Error(tempo)
TypeIIISum
ofSquares df MeanSquare F Sig.
Testedashipóteses- interacção
EfeitodainteracçãoTempoxSessão(efeitomisto)
Existe interacçãoentreTempoeSessão [F(1,28)=8,3,p=0,008],ouseja,a
reduçãodapressãoobservadaentreomomento“antes” e“depois” é diferenteno
grupoquefezrelaxamentoenogrupoderepouso.
Gráficodemédias
InteracçãoTempox
Sessão
Adiminuiçãodatensão
entreomomento“antes” e
“depois” (efeitodoTempo)
é distintanosdoisgrupos:
taldiminuiçãoé mais
marcadanogrupoque
seguiuasessãode
relaxamento.
Identificaçãodasdiferenças
significativasnainteracção
Também aqui poderá ser necessário fazer comparações post hoc para
identificarquemédiasdiferemumasdasoutras.
Otesteaescolherdependeseseestá trabalharcomofactorintra-sujeitosou
ofactorentre-sujeitos…
É necessáriousarsempreacorrecçãodeBonferroni.
Identificaçãodasdiferenças
significativasnainteracção
Duasalternativasdeanálise…
Fazeranálisedofactorintra-sujeitos
paracadagrupodefinidopelofactor
entre-sujeitos.
Fazeracomparaçãoentreosgrupos
definidopelofactorentre-sujeitos para
cadaumdosmomentosdefinidospelo
factorintra-sujeitos.
Identificaçãodasdiferenças
significativasnainteracção
GrupoSessão=repouso
GrupoSessão=relaxamento
Identificaçãodasdiferenças
significativasnainteracção
Verifica-sequeoefeitoentreoinícioeofimdasessãoé significativoparaos
doistiposdesessão(repouso:t=9,49,df =14,p=0,000;relaxamento:t=
7,10, df = 14, p = 0,000). No entanto, a diminuição dos níveis médios de
pressãoé maiornassessõesderelaxamento(diferençaentremédias=6,53)
doquenassessõesderepouso(diferençaentremédias=3,67).
Umasessão de relaxamento activo parece ter um efeito mais marcado na
reduçãodapressãoarterialapósexercíciodoqueumasessãode repouso
simples.
37
Conclusão
Uma sessão de relaxamento activo parece ter um
efeito mais marcado na redução da pressão arterial
após exercício do que uma sessão de repouso
simples.
D.Situaçõesmais
complexas
Testesdehipóteses
Suaaplicaçõeselimites
ANOVAs maiscomplexas
Podem surgir estudos mais complexos, dependendo do número de
factores envolvidos e do número de modalidades presentes em cada
factor:
a) Estudos com dois factores, mas onde cada factor tem mais de duas
modalidades(porexemplo,ANOVA3x4)
b) Estudos com mais do que dois factores – análise de variância
multifactorial (porexemplo,ANOVA2x3x2).
Análisebifactorial commaisdeduas
modalidades
ANOVA3x2
O efeito da iluminação é
diferente consoante o nível
de experiência do sujeito:
ser leitor experiente traz
vantagens para a
velocidade de leitura em
condiçõesdepenumbra.
10
12
14
16
18
20
22
24
26
28
30
Luz Penumbra Sombra
Condiçõesdeleitura
Ve
lo
ci
da
de
de
le
itu
ra
Experientes
Inexperientes
ANOVA3x4
O aumento do número de
modalidades de cada factor
dificulta a interpretação da
interacção.
A análise post-hoc desta interacção
implica o recurso à ANOVA
unifactorial e ao método de Tukey
(para comparar, por exemplo, o
desempenho dos três grupos ESS
emcadaanodeescolaridade).10
11
12
13
14
15
16
17
18
19
20
1ºano 2ºano 3ºano 4ºano
ESSbaixo
ESSmédio
ESSalto
Análisemultifactorial
Quanto existem três factores em jogo (A, B e C), para além dos factores
principais(main effects)edainteracçãode2ª ordem(interacçãoentrepares
defactores:AxB,AxC eBxC),existeaindaa interacçãode3ª ordementre
ostrêsfactores(AxBxC).
Adificuldadeem interpretarosefeitosde interacçãoaumenta rapidamente
assimquesepassaparaanálisescommaisdoquetrêsfactores.
38
Análisetrifactorial
Considere-sequesepretendeavaliarapresençademúsicanasessãode
relaxamento(commúsicaousemmúsica)temefeitonareduçãodapressão
sistólica (antes versus depois), procurando averiguar se esse feito é
diferenteentrehomensemulheres.
TemosumaANOVA2x2x2,comosseguintesfactores:
Sexo(masculinovsfeminino)
Momento(antesvsdepois)
Condiçãoexperimental(commúsicavssemmúsica)
Interacçãode3ª ordem
Areduçãodapressãosistólica (antesversusdepois)é diferenteentresexos
quandoo treinoé feitosemmúsica (asmulheres relaxammais)mas igual
nosdoissexosquandootreinoé feitocommúsica.
E.ANCOVA
Testesdehipóteses
Suaaplicaçõeselimites
ANCOVA– Analysis of Covariance
Covariáveis são variáveis de natureza quantitativa utilizadas em
ANOVA para reduzir a variação devida ao erro residual,
aumentandoassimapotênciadotesteparadetectardiferenças.
No estudo sobre o efeito do ruído na compreensão de um texto
podemos considerar que o resultado numa prova de Vocabulário
(medida da vocabulário que o sujeito possui) está correlacionado
comacompreensãodotexto,peloquepodeserusadoparatornar
otestemaissensível(maispotente)poiscontrola-seoefeitodessa
variável estranha no efeito que se pretende avaliar (efeito das
condiçõesderuídonacompreensãodeumtexto).
ANCOVA– Analysis of Covariance
EXEMPLO
Objectivo: avaliaroruídoambientalnacompreensãodeumtexto.
Amostra: três grupos de 4 crianças cada foram expostos a três
condições ambientais distintas (silêncio vs música de fundo vs
ruídodefundo)ouviramaleituradeumtexto.Nofinal,foramfeitas