Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Testesdehipóteses Suaaplicaçõeselimites Semináriosdemétodose análisededados LuísFaíscaDoutoramentoemPsicologia Fevereiro2010 Testesdehipóteses Suaaplicaçõeselimites EnquadramentodosTestesde HipótesesnaEstatística AimportânciadaEstatística… Representaçãomatemáticadoreal MUNDOREAL (objectode estudo) NÚMEROS (representação matemática) Análise estatística DivisãoclássicadaEstatística Estatísticadescritiva Estatísticaindutiva (ouinferencial) Estatística POPULAÇÃO (estudantesda UALG) amostra amostragem Inferência 100alunosinquiridos AimportânciadaEstatística… Aquilo que sepretende conhecer… Aquilo que se conhece através da Estatística Descritiva… Generalizar comsegurança para a população adescrição obtida na amostra Estatísticadescritiva Conjuntodeprocedimentospara organizar esumariar ainformaçãode umaformatãobreve eprecisa quanto possível. 2 Aplicaçõesdaestatísticadescritiva AnAnáálisedescritiva(unielisedescritiva(uniebivariadabivariada)) Descrevereresumirconjuntosvolumososdedados Gráficos/Tabelas/Estatísticasdescritivas AnAnáálisedescritiva(lisedescritiva(multivaridamultivarida)) Representaçõesgráficasmultidimensionais Reduçãodadimensionalidadedosdados Descriçãounivariada 255044283832364531343927201737 272143354837354037403521282524 412939254046384434393745384138 362547423633493327554726463424 454125404237412336484243424039 392741484431415253434326383837 204244412229394122212242423029 243521224138242532353423433223 543923513336353535201930242618 363919333339234250284634313439 AptidãoNuméricaemestudantesdo9º ano N=150alunos;aptidãonuméricamedidapelaGATB Média=35,19 Desvio-padrão=9,00 Mediana=37 Mínimo=17 Máximo=55 Estatísticadescritiva univariada Descriçãounivariada Descriçãobivariada Existerelaçãoentreanotadeingressodoalunonumcursodelicenciaturae resultadoqueeleobtémnoprimeirotesteefectuadonaUniversidade? Teste1=- 8,72+1,24*Notaing R2 =28,6% Estatística descritiva bivariada Descriçãobivariada Descriçãomultivariada CaracterizarrelaCaracterizarrelaççãoentrediversasvariãoentrediversasvariááveisveis Será possíveldistinguirtiposdedificuldadesdeaprendizagemapartir deumabateriadedozetestesdeavaliação? N=10estudantescomproblemasdeaprendizagem TécnicadeanáliseQ 3 Estatísticadescritivamultivariada (análisedeclusters) Descriçãomultivariada 0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 7 8 S07 S02 S04 S08 S10 S03 S06 S01 S05 S09 Estatísticadescritivamultivariada (escalonamentomultidimensional) Descriçãomultivariada Estatísticaindutiva Conjuntodeprocedimentosusados parafazerinferências apartirde informaçãoparcial,avaliandoograude incerteza envolvidodageneralização. Errosenvolvidosnoestudode amostrasedepopulações Aplicaçõesdaestatísticaindutiva AnAnááliseinferencialliseinferencial Estimaçãointervalar Testesdehipóteses Modelação Estimaçãodeparâmetros(valores desconhecidosdapopulação) Qualapercentagemdeestudantesuniversitáriosdispostosa experimentardrogasduras? Amostrarepresentativa dapopulação,controlandovariáveis consideradasimportantes(amostraestratificada,e.g.) Questionárioadequadoaestetemasensívele contabilizaçãodasrespostas Dos350estudantesinquiridos,24 disseramque“Sim” 4 Estatísticaindutiva- estimação Há 95%deconfiança dequea percentagemde estudantes dispostosa experimentardrogas durassesituaentre 4,21%e9,51% População Amostra 6,86%de respostas “Sim” (N=350) Estimaçãodeparâmetros Testesdehipóteses AvaliarseasdiferenAvaliarseasdiferenççasobservadasnaamostraasobservadasnaamostra reflectemdiferenreflectemdiferenççasreaisnapopulaasreaisnapopulaççãoouse,peloãoouse,pelo contrcontráário,sedevemounãoaoacaso.rio,sedevemounãoaoacaso. Testedehipóteses a)Formularumahipótese b)Recolherdadosamostraisparaverificarse apoiamounãoahipótese c)Avaliarograuemqueesseapoiosepode deveraoacaso Estatísticaindutiva– testesdehipóteses Significânciada diferença Nãohá diferenças significativasnotempo derespostaentreas duascondições experimentais (p>0,2). Apresençaderuídoambientalafectaamemorizaçãodeumtexto? Hipótese(nula):amemorizaçãodeumtextoé tãoboaemsilênciocomo emcondiçõesderuído 50 55 60 65 70 75 80 85 90 Silêncio Ruído Condiçãoexperimental Ite n s co rr et am e n te e v o c ad o s (% ) Testesdehipóteses Modelaçãopor“path analysis” Modelação Explicitarasrelaçõesqueseestabelecemnum conjuntoalargadodevariáveis. Estatística… AEstatísticaDescritiva permitedescrevera amostraeaEstatísticaIndutiva permite generalizarcomconfiançaessadescrição paraapopulaçãodeondeaamostrafoi retirada,recorrendoparaissoà Teoriadas Probabilidades. Testesdehipóteses Suaaplicaçõeselimites Testesdehipóteses 5 Testedehipóteses Otestedehipótesesé a técnicadaEstatística Indutiva maisutilizadanainvestigaçãoemPsicologia. Consiste em averiguar se a hipótese formulada sobre aspectos desconhecidos de uma população é ou não apoiada pela informação contida na amostra retirada dessapopulação. Tiposdetesteestatísticos 1) Testesunilateraisebilaterais Testesunilateraismenosexigentes,poisassuas hipótesesimplicamfundamentaçãoapriori. 2)Testesparamétricosenãoparamétricos(distribution free) Testesnãoparamétricosmenosexigentesemtermos dascondiçõesdeaplicaçãomas,eventualmente, menospotentesparadetectardiferenças. Passosnumtestedehipóteses Passo1. Aquestãoeminvestigaçãodeverá permitir formularumahipótesesobreumoumaisparâmetros desconhecidosdapopulação. Aformulaçãodehipótesesé umformalismodeste procedimento;namaiorpartedasvezes,ahipótesede investigaçãoé contráriaà hipótesenulaemquesebaseia otesteestatístico. Passosnumtestedehipóteses Perguntateoricamenterelevante: Duranteaadolescência,serãoosrapazesmaisansiososdoqueas raparigas? Hipótesenula:Onívelmédiodeansiedadenapopulaçãoderapazes é igualaodapopulaçãoderaparigas H0:µM =µF Passosnumtestedehipóteses Passo2. Extrairumaamostradapopulação,aplicaruma medidadeansiedadeecalcularasestatísticasdescritivas relevantes. µM =? µF =? População Amostra 100rapazes 100raparigas XM =28 XF =32 Passosnumtestedehipóteses Asmedidasdeansiedadequeusamosnãosão totalmentefiáveis,envolvendomargemdeerro. Nãohavendopossibilidadedeavaliaraansiedadede todososadolescentes(rapazeseraparigas)da populaçãosobreaqualsepretendetirarconclusões, limitámo-nosaestudaraumaamostra(porexemplo, duasoutrêsescolasdeFaro). 6 Passosnumtestedehipóteses Pelomenos,duasfontesdeerro: errodemedição errodeamostragem Informaçãoamostral sobreníveldeansiedade nãoé 100%segura Passosnumtestedehipóteses Adiferençade4pontos observadaentrerapazese raparigasreflecteumadiferença realoué apenasaparente (devidaaoserrosenvolvidosna obtençãodestasmédias)? Amostra XM =28 XF =32 Passosnumtestedehipóteses Passo3. Maquinariadostestesdesignificância Recorrendoà TeoriadasProbabilidadeseassumindo algumascondições,é possívelsaberemquemedida duasmédiasamostraiscontaminadasdeerropodem diferirentresiquandoaamostraprovémdeuma populaçãosemelhanteà estipuladanahipótese(ouseja, emquenãohá diferençaentrerapazeseraparigas). Passosnumtestedehipóteses Distribuiçãodeamostragem Comosecomportamtodasas médiasquesepodemextrairde umapopulaçãocomas característicaespecificadasna hipótesenula? Passosnumtestedehipóteses Conhecimentoapriori dasdistribuiçõesdeamostragem– EstatísticaClássica Passosnumtestedehipóteses Perguntaaquerespondeumtestedesignificância: “Senãoexistirdiferençaentreosníveismédiosde ansiedadederapazeseraparigas(hipótesenula),qualé aprobabilidadede,devidoaoacaso,encontrarmosuma diferençaigual(oumaisextrema)doqueobservadana amostra?”. 7 PassosnumtestedehipótesesAmostra XM =28 XF =32 SM =12 SF =14 NM =100 NF =100 t=2,45 df =98 p=0,015 Testetde Student Significância Aprobabilidadede adiferençaentre rapazeseraparigas observadana amostrasedever aoacasoé 0,015. Passosnumtestedehipóteses Passo4. Decisão Comoé poucoprovávelqueosdadosobservados provenhamdeumapopulaçãocomascaracterísticas especificasemH0,devemosabandoná-laeconcluirque existemdiferençasentrerapazeseraparigas. Será umadecisãocorrecta? Errosenvolvidosnumadecisão estatística Decisão correcta (rejeitar H0 quando ela é falsa) Decisão errada Erro de tipo I (rejeitar H0 quando é verdadeira) Rejeitar H0 Decisão errada Erro de tipo II (aceitar H0 quando ela é falsa) Decisão correcta (aceitar H0 quando ela é verdadeira) Aceitar H0 H0 é falsaH0 é verdadeira Caracterização da população (desconhecida) Decisão do teste estatístico ���� �� �� � ��� �� ���� �� �� � �� � � � �� � � � � �� � �� �� � ��� � � � � � �� � �� � ��fffi� fl fi � �� � � � � ��fffi� fl fi ffi � !"#$ % �&'! ( & ( � Errosenvolvidosnumadecisão Errosenvolvidosnumadecisão estatística Natomadadedecisãoestatísticaé importanteconsiderar orisco(probabilidade)decometerosdoistiposdeerro: ProbabilidadedecometererrodetipoI=αααα níveldesignificânciadoteste ProbabilidadedecometererrodetipoII=1– ββββ complementardapotênciadoteste Níveldesignificânciadoteste O nível de significância do teste αααα corresponde à probabilidadedenosestamosaenganaraorejeitarH0 (rejeitarahipótesequandoelaé verdadeira - errode tipoI).Deveserdefinidoantesdarealizaçãodoteste. Porexemplo, seo teste indicara rejeiçãode H0 (sugerindo-nos haver diferença de ansiedade entre rapazes e raparigas) isso podeserumerropoispodemosestarperanteumasituaçãorara em que a diferença observada se deve realmente ao acaso (e não haver diferença verdadeira na população entre rapazes e raparigas). 8 Níveldesignificânciadoteste Em geral, define-se em 5% onível de significância dotesteαααα. Estevalorresultadeumaconvençãoenãotemnada de especial; por vezes utilizam-se níveis de significânciamaisexigentes(porexemplo,1%),outras vezesníveismenosexigentes (10%),masovalorde 5%é otradicionalmentemaisutilizado.Porquê? Níveldesignificância Deumamaneirageral,pretende-sequeaprobabilidade decometeroerrodetipoIsejamínima.Noentanto,esta probabilidadenãopodeserreduzidaa0poisdiminui-la emexcessofazaumentaraprobabilidadedecometero errodetipoII.Porisso,podenãoseradequadousar níveisdesignificânciamuitobaixos. Potênciadoteste A potência do teste 1-ββββ corresponde à probabilidade denãonosestamosaenganaraoaceitarH0 (aceitara hipótesequandoelaé falsa- errodetipoII). Um teste potente permite-nos decidir com um baixo riscodenosenganarmosquandoaceitamosH0,ouseja, dá-nos segurança que não há diferenças reais entre rapazeseraparigasquandootestesugerequenãose rejeiteH0. Potênciadoteste A determinação da potência do teste é complexa e, entre outros factores, depende da dimensão da amostra: amostras de maiores dimensões garantem testes mais potentes. Pode-seestabelecerà partidaapotênciadoteste,bastando para isso definir a dimensão da amostra necessária para garantir que uma diferença de determinada magnitude na população tenha probabilidade elevada de ser realmente detectada(porexemplo,potênciadoteste1- β =0,80). Potênciadoteste Apesardetervindoasersecundarizado faceaonívelde significância,aquestãodapotênciadoteste é fulcral:de nada serve realizar um teste estatístico que não tenha potência para detectar a diferença teoricamente especificada – ficamos sempre na dúvida se H0 é realmenteverdadeiraouse,pelocontrário,é falsamaso teste não teve suficiente potência para detectar essa falsidade. Níveldesignificânciaepotênciado teste Relação entre α e β (quando se assume que a distribuição de amostragemdasmédiasamostraisé normal). 9 Elementosnaanálisedapotênciade umteste • Variabilidade dos dados (não temos grande controlo sobreesteelemento) • Magnitudedadiferençaquesepretendedetectar • Níveldesignificânciado teste(riscodecometeroerro detipoI) • Dimensãodaamostra Potênciadoteste Comoaumentarapotênciadeumteste? • Aumentaradimensãodasamostras • Aumentar a magnitude da diferença que se pretende queotestedetecte • Diminuironíveldesignificânciaα Sa m pl e Po w er SampleSize high low small large A B C NNííveloptimizadoveloptimizado EficazEficaz masmas ineficienteineficiente IneficazIneficaz PowerCurve Curvadapotênciadoteste Quepotência? Nãohá critériosuniversal. • Oqueé maisimportante? Falharumatendência? Detectarumatendênciafalsa? • Geralmenteentre80%e95% Testesdehipóteses Suaaplicaçõeselimites Testesdehipótesespara comparaçãoentregrupos Comparaçõesentregrupos A comparação de grupos é um dos formatos mais usuaisnainvestigaçãopsicológica: � Comparaçãoentregruposnaturais(diferençasentre sexos, por exemplo) ou entre populações clínicas (grupos de disléxicos face grupo de controlo de idade) � Comparaçãoentregruposexperimentais(grupoque recebe o tratamento experimental versus grupo de controlo) 10 Comparaçõesentregrupos Algunsaspectosalevaremconsideração: � Natureza métrica davariável em estudo (nominal / deescala) � Natureza dos conjuntos de medidas (amostras independentes/amostrasemparelhadas) � Númerodegruposemcomparação Comparaçõesentregrupos Casodevariáveisdeescala Se o nível de medida da variável em questão é de escala, a comparação entre grupos geralmente corresponde a testes de hipóteses sobre valores médios.Naverdade,aocomparargruposestamos,em geral, interessados em tomar decisões sobre a magnitude dosvaloresqueavariáveltomapopulações deondeforamextraídososgrupos. Porexemplo,verificarsehá diferençasentrerapazese raparigasnaAptidãoverbal. Comparaçõesentregrupos Casodevariáveisnominais Seoníveldemedidadavariávelemquestãoé nominal, a comparação entre grupos geralmente corresponde a testes de hipóteses sobre proporções ou a testes de independênciaentrevariáveis. Por exemplo, comparar se a percentagem de reformados é igual na população de utentes de dois serviçoshospitalares. Testesdehipóteses Suaaplicaçõeselimites Comparaçãoentreduas médiasgrupos A.Amostras independentes Testesdehipóteses Suaaplicaçõeselimites Condiçõesdeaplicação � Umadasvariáveisestá medidano formatoescala;a outravariáveldefineosgrupos (pode ser dicotómica oudicotomizada) � A distribuição das variáveis deve ser normal ou a dimensõesdosgruposacomparardevesergrande � A variância de cada grupo deve ser semelhante (homogeneidadedasvariâncias). Testessobrediferençasentredois valoresmédios(amostrasindependentes) 11 A hipótese nula postula que os dois grupos têm médiaigual. Arejeiçãodahipótesenula(p≤ α)indicaqueexistem diferençassignificativasentreasduasmédias. Amagnitudedadiferençapodeseravaliadaporuma medidademagnitudedoefeito(effect size) Testessobrediferençasentredois valoresmédios(amostrasindependentes) Exemplo Num estudo sobre o efeito da estimulação durante o sono na aprendizagem, dividiu-se aleatoriamente um conjunto de 62 crianças em dois grupos. Durante um mês, todas as noites enquantodormiam,metadedascrianças foramexpostasauma gravaçãoáudio comum relatode informaçãosobre Históriade Portugal. As restantes crianças foram expostas a um gravação áudiodediscursoseminformaçãorelevante. No final do mês, os conhecimentos de História de ambos os gruposforamavaliadosatravésdeumteste(classificaçãode0a 20).Verifiqueseoprocedimentoseguidoteveefeitosignificativo (α =0.05). Exemplo Desvio- padrão Média 31 30 29 2827 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 Partici- pantes 161728 3,6013,232Desvio- padrão 13,54514,967Média 9 151230 131429 131727 91426 14925 181524 121823 101022 71421 151220 16819 151718 81917 191916 131815 141714 201313 181512 81911 171610 9129 10138 18157 10176 11165 14104 12203 14142 17191 Grupo de Controlo Grupo Experimental Partici- pantes Resultados obtidos nos dois grupos.Umadascriançasdo grupo experimental não compareceuaoteste. Queteste? Hipóteses: H0:µµµµExp =µµµµCont versus H1:µµµµExp >µµµµCont Testedeunilateraldireitodediferençasentrevalores médios(paradoisgruposindependentes). Testede diferenças Testedeunilateral direito Diferençassignificativas? Aavaliaçãodasignificância dadiferençaentredois valoresmédiosnão dependeapenasdovalorda diferençamastambémda sobreposiçãodasduas distribuições(ouseja,da suadispersão). Noexemplo,apesarda diferençaentrevalores médiosseridênticanastrês situações,essadiferença aparentasermais significativaapenasna situaçãodebaixadispersão. TestetdeStudent paraamostras independentes � Amostrasaleatórias retiradasdepopulaçãonormalouamostras comdimensãosuficientementegrandeparaseaplicaroTeorema doLimiteCentral(emgeral,N≥ 30paraambasasamostras). OK (N = 31 para o grupo de controlo e N = 30 para o grupo experimental) � Homogeneidade das variâncias: as variância / desvios-padrão dosdoisgrupostêmdeseriguais.Arazãodestaexigênciaé que o teste assume que as populações de onde vêm as duas amostras são iguais em tudo (distribuição, dispersão, etc) exceptonosrespectivosvaloresmédios. Averificar (S=3,232paraogrupodecontroloeS=3,601parao grupoexperimental) Condiçõesdeaplicação 12 Condiçõesdeaplicação: � As observações da amostra 1 são independentes das observaçõesdaamostra2. OK (os resultados de um grupo não afectam os resultados de outrogrupo) � A variável em estudo tem de estar medida pelo menos numa escala quasi-intervalar (quasi-intervalar, intervalar ou de quociente). OK (variável:classificaçãoobtidanoteste) TestetdeStudent paraamostras independentes Condiçõesdeaplicação Verificaçãodenormalidade(desnecessárionestecasopoisas amostrassãograndes) Gráficodequartis Gráficodequantis danormal Condiçõesdeaplicação Verificaçãodahomogeneidadedasvariâncias GrupoExperimental S2 =3,2322 =10,4458 GrupoControlo S2 =3,6012 =12,9672 Asvariânciassãogrosseiramentesemelhantes(adivisãodeumapela outra dá cerca de 1,2), embora convenha sempre efectuar um teste estatísticoformalparagarantirquenãohá razõesparaasassumirmos comodiferentes(testedeLevene paraaigualdadedevariâncias). TestedeLevene paraaveriguara homogeneidadedasvariâncias HipótesesdotestedeLevene (testedehomogeneidadedasvariâncias): H0:σσσσ2Exp =σσσσ2Cont versus H1:σσσσ2Exp ≠≠≠≠ σσσσ2Cont NoSPSS,estetestevemincluídonooutput dotestetde Student paraamostrasindependentes. TestedeLevene (output doSPSS) TestedeLevene sobre homogeneidadedevariâncias Valorpdotestede Levene – não significativo Estatísticasdescritivasparacada grupo(média,desvio-padrãoe erro-padrão damédia) TestedeLevene paraaveriguara homogeneidadedasvariâncias ConclusãodotestedeLevene Rejeita-seH0 aoníveldesignificânciaα =0,05,ouseja, pode-seconsiderarqueasvariânciasdosdoisgrupos sãoiguais(F=0,54,p=0,467). Assegura-seassimopressupostodahomogeneidade dasvariâncias,peloquesepodeprosseguircomoteste tparaavaliaradiferençaentrevaloresmédios. 13 Testet(output doSPSS) Estatísticade teste Valorpdotestet (bilateral) Decisão Como o teste é unilateral, tem de se dividir por dois o valor calculadopeloSPSS. Assim,Sig.=0,071/2=0,036<α. Logo, rejeita-se H0 ao nível de significância α = 0,05, ou seja, o grupo experimental tem, em média, um desempenho superior no testedeHistóriadoqueogrupodecontrolo(t=1,84,gl =59,p= 0,036), indicandoqueaestimulaçãoduranteosonoteveumefeito positivosignificativonaaprendizagem. Consequênciasdeviolarascondiçõesdeaplicação dotestetdeStudent Normalidade Otesteté robusto faceà violaçãodopressupostodanormalidade dadistribuiçãodavariável,mesmocomamostraspequenas.Assim, as consequências da não normalidade dos dados afecta minimamenteoserrosdetipoIetipoIIenvolvidosnadecisão. Porexemplo,seadistribuiçãodavariávelemestudo forassimétricaeasamostras emcomparaçãotiveremdimensõestãopequenascomo5,sabe-sequeaverdadeira margemdeerrodetipoIenvolvidanadecisãopoderá afastar-senomáximoem2% do valor de α estipulado, o que é negligenciável em termos práticos (Hsu & Feldt, 1969). No entanto, ainda assim existe a possibilidade de recorrer a testes não paramétricosalternativos(testedeMann-Whitney). Consequênciasdeviolarascondiçõesdeaplicação dotestetdeStudent Homogeneidadedasvariâncias O teste t baseia-se nos desvios-padrão das duas amostras para obter uma estimativa conjunta de σ2 (S2pool). Se não existir homogeneidade das variâncias, esta estimativa conjunta não faz sentido. Sabe-sequeotesteté robustofaceà violaçãodopressupostoda homogeneidade das variâncias desde que as duas amostras tenham igual dimensão – nestes casos, as consequências da heterogeneidadedasvariânciasafectamminimamenteoserrosde tipoIetipoIIenvolvidosnadecisão. Consequênciasdeviolarascondiçõesdeaplicação dotestetdeStudent Homogeneidadedasvariâncias Contudo, quando as amostras têm dimensão diferente, verifica- seque: � Se a amostra maior tiver a maior variância, o teste t é conservador(ouseja,aprobabilidade realdecometeroerrode tipoIé maispequenadoqueovalorα estipulado). � Seaamostramaispequenaestiverassociadaà maiorvariância, o este t é bastante liberal (ou seja, a probabilidade real de cometeroerrodetipoIé superioraoestipulado)– situaçãomais problemática. Consequênciasdeviolarascondiçõesdeaplicação dotestetdeStudent Homogeneidadedasvariâncias O SPSS fornece uma correcção ao teste t para as situações de heterogeneidade das variâncias (procedimento de Welch), que consistenumajustamentodosgrausdeliberdade. Um procedimento alternativo para lidar com a estas situações é realizar um teste não-paramétrico equivalente, que não exija homogeneidadedasvariâncias(testeMann-Whitney). 14 B.Amostras emparelhadas Testesdehipóteses Suaaplicaçõeselimites A hipótese nula postula que os dois conjuntos de dadosprovêmdepopulaçõescomvalormédioigual. As investigações que levam à recolha de dados emparelhados surge em estudos longitudinais (o mesmoindivíduoé observadoduasvezes)ouquando indivíduos diferentes são emparelhados por diferentes razões (por semelhança em variáveis relevantesouporpertenceremà mesmaunidade,por exemploumcasal). Testessobrediferençasentredois valoresmédios(amostrasemparelhadas) Exemplo Para avaliar o efeito dos ritmos circadianos na memória, um conjunto de 30 crianças com idades entre 6 e 9 anos realizaram umaprovadememória imediata(digit span)demanhãeamesma prova12horasdepois. Teste, ao nível de significância α = 0,05, se existem diferenças significativasnodesempenhoobservadonosdoismomentos. Exemplo 54305615 34296514 77284413 53275612 55265511 56255610 5524769 5523458 4522457 5621446 5620455 6519454 5618563 6717452 5516671 TardeManhãParticipanteTardeManhãParticipante Queteste? Hipóteses: H0:µµµµManhã =µµµµTarde versus H1:µµµµManhã ≠µ≠µ≠µ≠µTarde Testedebilateraldireitodediferençasentrevalores médios(paradoisgruposemparelhados). Testede diferenças Testedebilateral Amostrasindependentesversus Amostrasemparelhadas Se cada observação da amostra 1 puder ser emparelhada a uma observação da amostra 2, os dois conjuntos de dados não são independentes masemparelhados. Observação2Observação2 ObservaçãonObservaçãon…… Observação1Observação1 Amostra2Amostra1 Nocasodeamostrasemparelhadas, a unidade em estudo não é a observação mas sim o par de observações. Não se pretende saber se existe diferenças entre a média das observações do grupo 1 e a média das observações do grupo 2 mas simsaberseamédiadasdiferenças entre os elementos de cada par é significativa. 15 Amostrasindependentesversus Amostrasemparelhadas Designaçõesparaestetipodedesign: � Amostrasemparelhadas(versus amostrasindependentes); � Medidasrepetidas(versus medidasindependentes); � Planeamento experimental intra-sujeito (versus planeamento entre-sujeitos)(within subjects versusbetween subjects). TestetdeStudent (paraamostrasemparelhadas) Condiçõesdeaplicação: � Amostras aleatórias retiradas de população normal ou amostras com dimensão suficientemente grande para se aplicar o Teorema do Limite Central (em geral, N ≥ 30 para ambasasamostras). OK (N=30paresdeobservações) � Observaçõesemparelhadas. OK (estamosperanteumdesign commedidasrepetidas,uma vezquecadasujeitoé ocontrolodesipróprio) Data view: os valores observados nos dois momentos de avaliação sãodispostos ladoa lado em colunas diferentes (facetaTdadatabox). Testedediferençasentrevaloresmédios Variávelquecorrespondeao desempenhodossujeitos duranteamanhã Variávelquecorresponde aodesempenhodos sujeitosduranteatarde TestetdeStudent (paraamostrasemparelhadas) TestetdeStudent paraamostras emparelhadas(output doSPSS) Correlaçãoexistenteentreosdoisconjuntosde observações– reflecteograuemqueodesempenho damanhãestá relacionadocomodesempenhoda tarde.Noentanto,nãoesclarecesehá diferençano nívelmédiodessesdoisdesempenhos. Testedediferenças– significativo Estatísticasdescritivasparacada conjuntodeobservações(média,desvio- padrãoeerro-padrão damédia) Decisão ComoSig.=0,025=<α,rejeita-seH0. O desempenho no teste de memória é diferente quando este é realizado de manhã e à tarde (t = 2,36, 29gl, p = 0,025), indicando que o ritmo circadiano poderá influenciar o desempenhonestetipodeprova. Esenãoserespeitassem asmedidasemparelhadas? Se, em vez de 30 pares de observações, considerássemos que existiam 60 observações independentes (30demanhãe 30detarde),osdadosestariam lançadosnumaúnicacoluna,já não havendo o cuidado de emparelhar o desempenho do mesmo sujeito nos dois momentos. O testeautilizar seriao teste t paraamostrasindependentes. Variávelqueidentificao momentodaobservação Variávelcorrespondente aodesempenhonaprova dememória 16 Output doSPSS Testedediferenças– nãosignificativo O facto de se ter ignorado o emparelhamento dos dados resulta numa conclusãodiferente– nãohá diferençasentreodesempenhodemanhãeà tarde.Porquê,seosdados(“números”)sãoidênticos? Utilizaroprocedimentodemedidas repetidassemprequeosdadosopermitam O testeparaamostraemparelhadasé mais potente na detecção de diferenças que o teste para medidas independentes, pois anula a variância (ruído)causadapelo factodehaversujeitosdiferentesnas duas condições experimentais (quando as amostras são emparelhadas, o mesmo sujeito é exposto às duas condições experimentais, pelo que se anula, parcialmente, o efeito das diferençasindividuais). Quanto maior a correlação entre as observações do par, maior a vantagememusaroprocedimentosparaamostrasemparelhadas. No entanto, o design com medidas repetidas tem alguns problemas intrínsecos (aprendizagem, mortalidade experimental, carry over effects). Parte2 Comparaçãoentremais doquedoisconjuntos demedidas Testesdehipóteses Suaaplicaçõeselimites Testesdehipótesessobrediferenças entremaisdedoisvaloresmédios Testet paradiferençasentrevaloresmédios:adequado natestagemdehipótesessobredoisvaloresmédios. Que fazerquandosepretendecompararmaisdoque doisvaloresmédios? Exemplo Pretende-seavaliarseonívelmédiodesatisfaçãodosestudantes com os Serviços Sociais da Universidade é igual nas diferentes faculdades(FCHS,FCT,FERN,FCMAeFE). Haverá diferençassignificativas,aoníveldesignificânciadeα =5%, entreascincofaculdades? Comoresponderaestaquestão? Oproblemadascomparações múltiplas Bastará compararasfaculdadesduasaduascomumtestet para amostrasindependentes? Quantostestest teriamdeserfeitos? 5C2 =10(FCHSvsFCT;FCHSvsFERN;FCHSvsFCMA;etc…) Se em cada um destes testes corremos um risco α de chegar a uma decisão errada (5%), qual a probabilidade cometermos erro aobasearmosanossaconclusãogeralnasdezcomparações? 17 Oproblemadascomparações múltiplas Sequisermosdecidirseasfaculdadessãoounãoiguaisemtermos desatisfação,aofazerascomparaçõesparaparempolamosorisco de cometer um erro de tipo I (achar que há diferenças quando, na verdade,nãoexistem). Probabilidade de cometer pelo menos um erro de tipo I ao fazer k comparações duas a duas através de um teste t ao nível de significânciaα (experimentwise error): 1– (1- αααα)k Oproblemadascomparações múltiplas Nocasodeα =0,05ek=10comparações,vem: 1– (1– 0,05)10 =0,4013 O risco de nos enganarmos é demasiadamente alto para ser considerada uma abordagem estatisticamente segura. Mesmo que não haja diferença entre as faculdades, há 40% de probabilidadedepelomenosumtestet indicarqueexisteuma (falsa)diferença(rejeitarH0). Oproblemadascomparações múltiplas A probabilidade de tomar pelo menos uma decisão errada aumenta marcadamente com o número de grupos a comparar. Por exemplo, se compararmos 8 grupos, há 75% de probabilidade decometerpelomenosumerro. Valordaprobabilidadedecometerpelomenos umerrodetipoIaocompararkgrupos 0,00 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,55 0,60 0,65 0,70 0,75 0,80 0,85 0,90 0,95 1,00 2 3 4 5 6 7 8 9 10 11 12 13 14 15 k-nºdegrupos Pr o b er ro Ti po I Níveldesignif icâncianominal Nota:estescálculosassumemqueos testest sãoindependentes,oquenãoé rigorosamenteverdadeumavezquese baseiameminformaçãosobreposta,oque pioraaindamaisestecenário. Oproblemadascomparações múltiplas Conclusão: Aabordagemaoproblemaemcausa fazendo testes t múltiplosé inadequada, porque o risco de nos enganarmos aumenta proporcionalmente ao número de comparações que têm de ser feitas. Dequealternativasdispomos? A.Amostras independentes Testesdehipóteses Suaaplicaçõeselimites ANOVA A técnica estatística denominada ANOVA (Analysis of Variance) foi desenvolvida por Ronald Fisher (1890- 1962) para poder testar em simultâneo a igualdade do número de valores médios que se pretender, sem empolarovalordeα. Trata-se, assim, de um procedimento ideal para compararovalormédiodemaisdedoisgrupos. 18 Exemplo A fimdeestudaroefeitodo ruídoambientanacompreensãode um texto lido, dividiram-se nove pessoas por três condições experimentais:Grupo1– silêncio;Grupo2– commúsicadefundo instrumental;Grupo3– comruído(nãomusical)defundo. Nofinal,fez-seacadapessoaumtotaldedezperguntassobreo textolido,registando-seonúmeroderespostascorrectas.Haverá diferençaentreascondiçõesexperimentais? FactoreVariáveldependente Variáveldependente Desempenho no teste de compreensão (nº de respostas certas) Variávelindependente(factor) Ruídodefundo– trêsníveis:silêncioversusmúsicadefundo instrumentalversusruído(nãomusical)defundo. Queteste? Hipóteses: H0:Oskvaloresmédiossãoiguais versus H1:Pelomenosumvalormédioé diferentedosrestantes H0:µµµµ1 =µµµµ2 = µµµµ3 versus H1:∃∃∃∃i,j,µµµµi ≠≠≠≠ µµµµj Repare-sequeahipótesenulaserefereglobalmentea todososgruposdoestudo(hipótesesomnibus,global). HipótesesnaANOVA AlgumasprecisõessobreotestedehipótesesatravésdeANOVA: � Ashipótesessãoglobais(omnibus)– apenassetestaoefeito globaldaexperiência(hipótesenuladequeosvaloresmédios são todos iguais versus a hipótese alternativa de que pelo menosumdelesé diferentedosrestantes). � Numa ANOVA não se coloca a questão do teste ser biou unilateral. � Nãoaceitarahipótese nulanãonosesclareceonde reside a diferençadetectada– essaanáliseé feitanumafaseposterior. CondiçõesdeaplicaçãodaANOVA � Amostrasaleatóriasretiradasdepopulaçõesnormaisou amostrascomdimensãosuficientementegrandeparase aplicaroTeoremadoLimiteCentral(emgeral,N≥ 30). � Homogeneidadedasvariâncias:asvariância(desvios- padrão)dosdiferentesgrupostêmdeseriguais. � Asobservaçõesdecadagruposãoindependentesentresi. � Avariávelemestudotemdeestarmedida,pelomenos,numa escala quasi-intervalar (quasi-intervalar, intervalar ou de quociente). Violaçãodascondiçõesdeaplicação A ANOVA é robusta face a violações de algumas condições referidas, nomeadamente a exigência de normalidade (desde que todos os grupos tenham dimensão suficiente) e a exigência da homogeneidade dasvariâncias(desdequeosgrupostenhamdimensão semelhante). Mais grave é a violação da independência das observações entre grupos (não devem estar correlacionados; resolve-se garantindo a aleatoriedade naformaçãodosgruposemcomparação). 19 “Mecanismo” daANOVA Emborasedenomine“análisedevariância”,trata-sede umprocedimentoparaaveriguarseosvaloresmédios são estatisticamente diferentes (e não para ver se as variânciassãodiferentes). OnomeresultadaANOVArecorreraocálculodevariânciaspara decidir se as médias são diferentes. O raciocínio é o seguinte: calcula-seavariânciadentrodecadagrupoedepois compara-se comavariânciaentreosgrupos– sehouverdiferenças,é porque asmédiasdosgrupossãodiferentes. “Mecanismo” daANOVA Na ANOVA, avalia-se em que medida duas fontes de variabilidadecontribuemparaavariaçãototaldosdados: * Alguma variação resulta da diferença entre indivíduos dentrodecadagrupo(variaçãowithin,residualouvariância dentrodogrupo) *Algumavariaçãoresultadasdiferençasintroduzidaspelos grupos(variaçãobetween,ouvariânciaentregrupos) Exemplo Númeroderespostascorrectasemcadagrupo: Média 458 7 8 8 9 Grupo1 45 36 64 35 Grupo3Grupo2 Haverá diferença entre os valores médios das populações de onde vieramestestrêsgrupos? Para isso, a ANOVA vai comparar a variância dentro dos grupo (variâncianaturaldosdados)comavariânciaentremédias (variância devidaaoefeitodiferenciadordascondiçõesexperimentais). ANOVAetestedevaloresmédios AAnálisedeVariânciacomparaavariânciadentrodos grupos (variância residual ou variância within) com a variância entre grupos (variância entre grupos ou variânciabetween). Se a variância residual for claramente inferior à variância entre grupos, então pode-se afirmar que os valoresmédiossãodiferentes. NaANOVAaestatísticade testeé designadaporFe corresponde aoquocienteentreavariânciaentregruposeavariânciaresidual: AestatísticaFsegueumadistribuiçãoFdeSnedecor comυ1 =k-1 gl (associados ao numerador) e υ2 = N-k gl (associados ao denominador). Estatísticadetesteesuadistribuição Nota:osgrausde liberdade indicadoscorrespondemà situaçãoemqueoskgrupos têmamesmadimensão,formandoumtotaldeNobservações. Oneway ANOVA(output doSPSS) TestedeLevene paraavaliaropressuposto dahomogeneidadedasvariâncias Estatísticasdescritivaspor grupo(média,desvio- padrão,erro-padrão da média,IC,mínimoe máximo) TabelaANOVA(resultados dotestedecomparaçãode médias) 20 TabelaANOVA Fontesde variaçãodos dados Valorp Estatística F Somade quadrados Grausde liberdade associadosa cadasomade quadrados Estimativada variância (média quadrática) TabelaANOVA Valorp Osgrausde liberdade também somam AadiçãodasSomas deQuadrados correspondeà Soma deQuadradostotal Nº degrupos- 1 N- 1 Asmédiasquadráticas resultamdedividira SomadeQuadrados pelosgrausde liberdade correspondentes AestatísticaFresulta dadivisãodaMédia Quadráticabetween pelaMédia Quadráticawithin Decisão SeSig.≤ α,rejeita-seH0,oqueseverificanopresenteexemplo (Sig.=0,001<0,05). Logo, rejeita-seH0 aonível designificância α =0,05,ouseja, pelo menos um dos grupos têm valor médio diferente dos restantes[F(2,9)=15,6,p=0,001]. Oneway ANOVA(output doSPSS) Gráficodemédias (means plot),permite visualizarquemédias sãodiferentes O Grupo 1 (silêncio) aparenta diferir dos restantesdois. Como verificar estatistica- mente seassimé? Análisesposteriores Se não se rejeitar H0, é fácil concluir que os grupos são idênticos. Mas se se rejeitar H0, apenas sabemos que pelo menos um dos grupos é diferente dos restantes. Como determinar os grupos que diferementresi? G1=G2=G3 G1≠ (G2=G3)ouG2≠ (G1=G3)ouG3≠ (G1=G2) G1≠ G2≠ G3 Emquesituaçãoestamos? NãorejeitarH0 RejeitarH0 Análisespost-hoc Existem inúmeros procedimentos para decidir que média são realmentediferentesumasdasoutras. Todos estes procedimentos consistem em comparar pares de médias,masagoraestascomparaçõesestãoprotegidasquanto aoempolamentodoerrodetipoI. Há procedimentos mais conservadores e procedimentos mais liberais – sem razão especial, vamos utilizar o procedimento post-hoc deTukey HSD(honestly significant difference). 21 Análisespost-hoc Valorp paraadiferença entrecadaparde condições Valordadiferençapara cadaparademédias Assinalam-secom*as diferençassignificativas paraovalordeα escolhido Análisespost-hoc Valorp paraadiferença entreasmédiasdentro decadagrupo As condições organizam-se em dois grupos: “Condições 3 e 2” (que apresentammédiacomvalores4e5) e Condição 1 (que apresenta média comvalor8). Conclusãofinal Em resumo, as diferenças detectadas pela ANOVA resultam do Grupo 1 ter uma desempenho significativamente mais elevado queosoutrosdoisgrupos(Grupo1vs Grupo2:p=0,008;Grupo 1vs Grupo3:p=0,001),que,porsuavez,nãosedistinguemde formaestatisticamentesignificativa(Grupo2vs Grupo3:p=0,409). Análisespost-hoc – procedimentode Bonferroni Umaoutraformaderealizaranálisespost-hoc controlandoataxade erro global (experimentwise error) é através do procedimento de Bonferroni, que aqui se vai descrever por ser fácil de conduzir manualmente. Sepretendemosfazerumaanálisepost-hoc apósrejeitarnaANOVA uma hipótese omnibus, basta realizar as k comparações através testestentreparesdemédiaseutilizarcomoníveldesignificância nãoα massimα/k. Trata-sedeumprocedimentoconservador,masfácildeaplicar. Análisespost-hoc – procedimentode Bonferroni Como são três grupos em comparação, vamos utilizar o nível designificânciaα/3=0,05/3=0,0167. Apenasacomparação2vs3nãoé significativaparaestenível designificânciacorrigido. 0,2676t=1,22Grupo2vsGrupo3 0,0036t=4,90Grupo1vsGrupo3 0,0026t=5,20Grupo1vsGrupo2 ValorpGLEstatísticatComparação Análisespost-hoc – outros procedimento O SPSS oferece 18 alternativas no que respeitaà análisepost-hoc. Algunscritériospodemnortearaescolha deumadessasalternativas: � ControlosobreoerrodetipoI � ControlosobreoerrodetipoII � Desigualdadenotamanhodosgruposacomparar � Heterogeneidadedasvariâncias 22 Análisespost-hoc – outros procedimento Games-HowellVariâncias diferentes Grupos diferentes Gabriel(poucodiferentes) Hochberg GT2(muitodiferentes) Variâncias diferentes Tukey REGWQ Bonferroni (conservador) VariânciasiguaisGrupos iguais Procedimentopost-hocHomogeneidade dasvariâncias Dimensão dosgrupos SegundoField (2000) Contrastesapriori Emvezdeolharmosparaasdiferençasentre todososparesde grupos, podemos estar interessados em apreciar contrastes planeadosapriori. Porexemplo,numestudoexperimental,podeinteressarcomparar o grupo de controlo com dois grupos experimentais. Estes contrastesdevemserespecificadosantesda realizaçãodo teste omnibus. Contrastesapriori OSPSSdisponibilizaumconjuntodecontrastesapriori: Testatendênciaslineares,quadráticasecúbicase quárticas nosdados Polynomial Cadanívelé comparadocomoefeitomédiodas categoriasanteriores Difference Cadanívelé comparadocomoefeitomédiodas categoriasseguintesHelmert Cadanívelé comparadocomonívelseguinteRepeated Cadanívelé comparadocomoprimeiro/últimoSimple (first /last) Comparaoefeitodecadanível(exceptooprimeiro/ último)comoefeitoglobaldoestudo Deviation (first /last) Contraste Exemplo Considerequeseplanearaaprioricontrastaroefeitodacondição “Silêncio” com o efeito das outras duas condições. O contraste adequadoserá odeHelmert. O silêncio (nível 1) difere significativamente da média dos outros dois níveis (p = 0,000). No entanto, os outros dois níveisnãodiferementresi de forma estaticamente significativa(p=0,213). Relaçãoentreotestet eaANOVA unifactorial O teste t é umcasoparticularda ANOVAunifactorial (quando o númerodegruposemcomparaçãoé 2). Nessasituação,ovalordaestatísticaFcorrespondeaoquadrado daestatísticat. Ovalorp será idênticoemambosostestes. B.Amostras emparelhadas Testesdehipóteses Suaaplicaçõeselimites 23 ANOVAcommedidasrepetidas EXEMPLO Objectivo: avaliaroefeitodacornaidentificaçãoenomeaçãode objectos. Desenho experimental: 25 sujeitos expostos a três condições experimentais (os objectos a nomear são representados através “desenhos”, “fotografias a preto e branco” ou “fotografias a cor”). Todos os sujeitos foram expostos a cada uma das condições experimentais. Atençãoaosefeitosdeordem! ANOVAcommedidasrepetidas Desenhoexperimentalintra-sujeitos(omesmosujeitoé expostoàs trêscondições– amostrasemparelhadas) Factores: Tipodeimagem:“desenho”,“fotoB&W”,“fotocor” (factorwithin subject) Variáveldependente: Tempodenomeação Fontesdevariaçãonosdados Porqueé queduasobservaçõessãodiferentes? � Porque os sujeitos nomearam estímulos diferentemente coloridos(efeitodofactorTipodeimagem) � Porqueossujeitossãodiferentes(efeitoresidual) Hipótesessobrevaloresmédios H0: Não há diferenças no desempenho médio dos sujeitos nas trêscondiçõesexperimentais H1: Em pelo menos uma das condições experimentais o desempenho médio dos sujeitos difere do desempenho nas restantescondições Dados Vinteecincosujeitosexpostosatrês condiçõesexperimentais,definidas consoanteotipodeimagemanomear. Osvaloresreferemotempomédiode nomeaçãodasimagens(em segundos)paracadacondição. Aquestãodaesfericidade Testedaesfericidade Quandoofactorwithin temmaisdoqueduasmodalidades,é necessárioque severifiqueaesfericidade damatrizdascovariâncias.Trata-sedeumaexigência semelhanteà homogeneidadedevariâncias,masdestavezparaocasodaANOVA commedidasrepetidas. Napresentesituação,rejeita-seH0 [X2(2)=14,4,p=0,001],ouseja,nãosepode assumiraesfericidadedamatrizdeco-variâncias,peloqueé precisoseguiralguns cuidadosnarealizaçãodestaANOVAdemedidasrepetidas. 24 ANOVAparamedidasrepetidas (output doSPSS) EfeitodoTipodeImagem Rejeita-seH0 [F(1.4,32.8)=45,9,p=0,000],ouseja,otempodenomeação dasimagensfoiinfluenciadopelamanipulaçãoexperimental(presençaou nãodecor). Asignificânciado efeitodo“Tipode Imagem” lê-senesta linhapoisnãose podeassumira esfericidadedos dados. AcorrecçãodeGreenhouse-Geisser alteraosgraudeliberdadedaestatísticaF,de formaagarantirmaiorfiabilidadeaosresultadosdaANOVA. ANOVAparamedidasrepetidas (output doSPSS) EfeitodoTipode Imagem Anomeaçãodos desenhosparecesermais lentadoqueanomeação dasfotografias,quersejam acorouapretoebranco. ANOVAparamedidasrepetidas (output doSPSS) Comparaçãoentremodalidades Otempodenomeaçãodosdesenhosé estatisticamentediferentedotempode nomeaçãodosoutrosdoistiposdeimagem (fotosB&WefotosCor). Análisepost hoc atravésdo métododeBonferroni Relaçãocomoutrosprocedimentosparateste estatísticodehipótesessobrevaloresmédios Tal como o procedimento “One-way ANOVA” é a generalização do testetdeStudent (Two independent samples ttest)parasituaçõesem que se pretende comparar a média de mais do que duas amostras independentes,tambémoprocedimento“Repeated measures ANOVA” é a generalização do teste t de Student (Two paired samples t test) parasituaçõesemquesepretendecompararamédiademaisdoque duasamostraemparelhadas. Senãosecumpriremos requisitosmínimosdeaplicaçãodaANOVA com medidas repetidas, é sempre possível recorrer ao teste não paramétricodeFriedman. Parte3 Testesnãoparamétricos (distribution free) Testesdehipóteses Suaaplicaçõeselimites Árvorededecisãoparatestessobre valoresmédios Tipo de dados Nominais Escala Ordinais Nãoseaplicao conceitodevalor médio;talvezse pretendaumteste dequi-quadrado Amostrasprovémde populaçõesnormais Nãosesabeseas amostrasprovémde populaçõesnormais Amostrasgrandes (N≥ 30) Amostraspequenas (N<30) Testesnão- paramétricos Testes paramétricos 25 Árvorededecisão (testesparamétricossobrevaloresmédios) Testede conformidade Testede diferenças Amostras independentes Amostras emparelhadas Comparardois valoresmédios Compararmaisde doisvaloresmédios Homogeneidade devariâncias Heterogeneidade devariâncias Independent- Samples TTest (Welch Method) Independent- Samples TTest One-Sample TTest Paired-Samples TTest Oneway- ANOVA Welch &Brown- Forsythe Method Amostras independentes Testes paramétricos sobrevalores médios Amostras emparelhadas GLM- Repeated Measures Homogeneidade devariâncias Heterogeneidade devariâncias Testesparamétricosenão paramétricos Os testes apresentados testam hipóteses sobre parâmetros (valor médio). Quando as exigências de aplicação destes testes paramétrico não são respeitadas, pode-se optar pela alternativa não paramétricascorrespondente. Noentanto,ostestesnãoparamétricos,talcomooseu nome indica, não avaliam hipóteses sobre parâmetros, pelo que as duas abordagens (paramétrica e não- paramétrica) não coincidem totalmente. Os testes não paramétricos testam, de um forma geral, igualdade de distribuições. Condiçõesdeaplicação Emgeram,ostestesnãoparamétricosexigemapenasque... � Asobservaçõesdeumaamostrasejamindependentesentresi. � Asobservações resultemdamediaçãodeumavariávelmétrica (medidaaonívelordinaloudeescala). Árvorededecisão (testesnão-paramétricos) Testede conformidade Testede diferenças Amostras independentes Amostras emparelhadas Comparardois valoresmédios Compararmaisde doisvaloresmédios Não existe alternativa não-paramétrica Amostras independentes Testesnão- paramétricos equivalentesa testessobre valoresmédios Amostras emparelhadas Nonparametrictests 2Independentsamples (Mann-Whitney) Nonparametrictests KIndependentsamples (Kruskal-Wallis) Nonparametrictests KRelatedsamples (Friedman) Nonparametrictests 2Relatedsamples (Wilcoxon) Ranking Os testes não paramétricos indicados não se baseiam nos dados originalmente recolhidos mas na sua conversão em ranks (ordens). Exemploderanking Dadosoriginais Ranks 7,2 → 4 5,4 → 3 2,8 → 1 9,3 → 5 5,2 → 2 As ordens ignoram o valor das diferençasexistentesentreobservações, transformando uma variável medida ao nívelescalarnumavariávelordinal. Ranking Exemploderanking comempates Dadosoriginais Ordenação Ranks 2,8 → 1ou2 1,5 2,8 → 1ou2 1,5 5,2 → 3 3 5,4 → 4ou5ou6 5 5,4 → 4ou5ou6 5 5,4 → 4ou5ou6 5 7,2 → 7 7 9,3 → 8 8 Faz-seamédiadasordens: (1+2)/2=1,5 Faz-seamédiadasordens: (4+5+6)/3=5 26 Parte4 Desenhosexperimentais complexos Testesdehipóteses Suaaplicaçõeselimites Planosexperimentaisfactoriais Eminvestigaçãoexperimental,é frequenteestudaroefeito simultâneodedoisoumais factoresnodesempenhodos participantes. Porexemplo… Testar a agradabilidade provocada pelo contacto comumestímulo táctilemquesevarioudiferentes características(texturaetemperatura). Factores/modalidade/condições Trata-se de um plano experimental bifactorial, pois manipularam-se dois factores:o factor experimental “textura” temduasmodalidades (liso e rugoso) e o factor experimental “temperatura”tem três modalidades(frio,normalequente). Para avaliar o efeito destas seis condições experimentais na variáveldependente (“agradabilidadesentida”),dever-se-á recorrera umaANOVA2x3. Rugoso Liso QuenteNormalFrio Situaçõesmultifactoriais O plano experimental anterior pode estender-se a três factores, incluindo um factor adicional (por exemplo, a “humidade” do estímulo: seco ou húmido), passando assim a uma situação trifactorial edefinindo-se2x3x2=12condiçõesexperimentais. SecoHúmido QuenteNormalFrio Rugoso Liso QuenteNormalFrio Naturezadosfactores Existemdoistiposdefactoresexperimentais: � Factores entre-sujeitos (between subjects) – quando cada sujeito experimental é exposto apenas a uma modalidade de cadafactor. � Factoresintra-sujeitos (within subjects)– quandoumsujeitoé expostoamaisdoqueumamodalidadedeummesmofactor. Planoexperimentalentre-sujeitos Nestaexperiência,cadasujeitoé expostoaumaúnicacondição. Para comparar condições temos de comparar o desempenho de sujeitos diferentes. Assim, trata-se de um plano experimental entre-sujeitos (between subjects design). Raul Tânia Paulo Paula José Mário Vasco Manuel Julieta Rugoso Joaquim Vanessa Rui Tiago Hugo Vânia Pedro João Maria Liso QuenteNormalFrio 27 Planoexperimentalintra-sujeitos Nesta experiência, cada sujeito é exposto a todas as condições experimentais. Para comparar condições temos de comparar o desempenhodecadasujeitonumacondiçãocomoseudesempenho noutra condição. Assim, trata-se de um plano experimental intra- sujeitos puro(within subjects design). Pedro João Maria Pedro João Maria Pedro João Maria Rugoso Pedro João Maria Pedro João Maria Pedro João Maria Liso QuenteNormalFrio Planoexperimentalmisto Nestaexperiência,cadasujeitoé expostoàsduasmodalidadesdofactor“textura” mas apenas a uma modalidade do factor “temperatura”. Num dos factores (“textura”) o desempenho do sujeito numa condição pode ser comparado com o seu desempenho noutracondição;nooutrofactor(“temperatura”),oseudesempenhoé comparadocomo desempenho de outros sujeitos. Assim, trata-se de um plano experimental misto (mixed design):a“textura” é umfactor intra-sujeitosea“temperatura” umfactorentre- sujeitos. Joaquim Vanessa Rui Tiago Hugo Vânia Pedro João Maria Rugoso Joaquim Vanessa Rui Tiago Hugo Vânia Pedro João Maria Liso QuenteNormalFrio Interacção Em estudos com mais de um factor, o foco de interesse é o efeito da interacção entre esses factores na variável dependente. Será oefeitodeum factor independente dooutro factorouo seu efeito conjunto leva a produzir padrões de resultados inesperados? A análise das interacções é um ponto fundamental na investigaçãopsicológica. A.ANOVAbifactorial Testesdehipóteses Suaaplicaçõeselimites ANOVAbifactorial (paragruposindependentes) EXEMPLO Objectivo: avaliar o impacto de uma formação breve nas competênciasparautilizarsoftwareestatístico. Amostra: grupodecontrolo(20estudantes)egrupoexperimental (20estudantesque receberama formaçãobreve).Cadagrupo foi definidode formaagarantirquemetadedosestudantes tivessem experiência no uso de software (grupo de experientes) e a outra metadenãotivessequalquerexperiênciadeutilizaçãodesoftware (grupodenãoexperientes). ANOVAbifactorial Planoexperimentalbifactorial entre-sujeitos Factores Formação:Grupoexperimentalversus Grupodecontrolo Experiência:Experientesversus Não-experientes Variáveldependente Competênciasdeutilizaçãodemonstradasnumatarefa comosoftware emcausa Procedimentodeanálise:ANOVA2x2 28 Fontesdevariaçãonosdados Porquerazãoduasobservaçõesdesteestudosãodiferentes? � Porque os sujeitos receberam formação diferente (efeito do factor “Formação”). � Porqueossujeitostêmexperiênciaspréviasdiferentecomsoftware (efeitodofactor“Experiência”). � Porque o efeito da formação nos sujeitos depende da sua experiência prévia (efeito da interacção entre “Experiência” e “Formação”). � Porquesãopessoasdiferentes(efeitoresidual) Serãoesteefeitosrealmentesignificativosnodesempenho? Fontesdevariaçãonosdados Efeitospresentesnumplanobifactorial: � Efeitodofactor“Formação” � Efeitodofactor“Experiência” � Efeito da interacção “Experiência x Formação” (interacção de 2ª ordem) Efeitosprincipais (main effects) Hipóteses Factorformação H0:Nãohá diferençasentreGrupoExperimentaleGrupodeControlo H1:Há diferençasentregrupoExperimentaleGrupodeControlo FactorExperiência H0:Nãohá diferençasentreExperienteseNão-experientes H1:Há diferençasentreExperienteseNão-experientes Interacçãoentreformaçãoeexperiência H0:Oefeitodaformaçãoé independentedaexperiênciadosparticipantes. H1:Oefeitodaformaçãodependedaexperiênciadosparticipantes. Dados 15,1614,19, 13,14,15,16, 17,17 15,16,15,17, 15,16,15,17, 15,16 Experimental (com formação) 15,14,15,16, 16,15,16,17, 15,14 11,12,13,14, 10,12,11,13, 14,12 Controlo (sem formação) ExperientesInexperientesResultadosna tarefa A amostra total é constituída por 40 observaçõesdistribuídaspelasquatro condiçõesexperimentais. Homogeneidadedasvariâncias TestedehomogeneidadedasvariânciasdeLevene Perantegruposindependentes,arealizaçãodaANOVAexige queasvariânciasdosgruposemcomparaçãosejam semelhantes. ComonãoserejeitaH0 [F(3,36)=2,2,p=0,111],pode-se assumirahomogeneidadedasvariâncias,peloqueexistem condiçõesparaprosseguiraANOVA. Interacçãoentrefactores AvantagemdasANOVAs bifactoriais sobreasANOVAs unifactoriais diz respeitoà possibilidadedeavaliarseosdoisefeitosagem independentementeumdooutrosobreavariáveldependenteouse,pelo contrário,oefeitodeumdependedoefeitodooutro(interacção). Noexemploemanálise,será queoefeitobenéficodaformaçãodependerá dofactodossujeitosseremExperientesouInexperientes? Se não existe interacção significativa, os factores principais podem ser interpretados isoladamente. Quando existe interacção, não se pode falar dos efeitos principais isoladamente, uma vez que o efeito de um factor depende do efeito do outro. Assim, a interacção deve ser sempre interpretada em primeiro lugar, antes da interpretação dos efeitos principais. 29 Testedashipótesessobrevalores médios– efeitodeinteracção EfeitodainteracçãoFormaçãoxExperiência Rejeita-seH0 [F(1,36)=15,8,p=0,000],ouseja,oefeitodaformaçãonãoé idênticoparaexperientesenãoexperientes;oesclarecimentosobreo significadodestainteracçãoé facilitadopelaanálisedográficodemédias. Gráficodemédias InteracçãoFormaçãox Experiência Enquantoquenos Experientesaformação pareceterumefeito negligenciável,ofactodos Inexperientesterem frequentadoocursode formaçãofezcomqueoseu desempenhoseaproximasse dodosExperientes. Análisegráficadosefeitosde interacção A1 A2 A1 A2 A1 A2 B2 B1 EfeitoA:nsig EfeitoB:nsig Interacção:nsig EfeitoA:nsig EfeitoB:sig Interacção:nsig EfeitoA:sig EfeitoB:sig Interacção:nsig Nota:aausênciadeinteracçãodetecta-sefacilmenteatravésdeumgráficode médias:aslinhassãogrosseiramenteparalelas. Análisegráficadosefeitosde interacção A1 A2 A1 A2 A1 A2 EfeitoA:nsig EfeitoB:sig Interacção:sig EfeitoA:sig EfeitoB:nsig Interacção:sig EfeitoA:nsig EfeitoB:nsig Interacção:sig A1 A2 EfeitoA:sig EfeitoB:sig Interacção:sig Nota:apresençadeinteracçãodetecta-sefacilmenteatravésdeumgráficode médias:aslinhascruzam,convergemoudivergem. Identificaçãodasdiferenças significativasnumainteracção Os diversos padrões de interacção que podem surgir obrigam a identificarquecondiçõesdiferementresi. O SPSS não permite fazer comparações post hoc para efeitos de interacção, pelo que é preciso recorrer a testes t de Student ou a ANOVAs para identificar que médias diferem umas das outras. Nestescasos,é necessáriousarsempreacorrecçãodeBonferroni. NOTA: para realizar esta comparação posthoc com o teste t, utilize o comando“split file” parafazeraanáliseseparadamenteemfunçãodonível deexperiência. Grupodeexperientes Grupodeinexperientes Identificaçãodasdiferenças significativasnumainteracção 30 Identificaçãodasdiferenças significativasnumainteracção Como estamos a fazer dois testes, a correcção de Bonferroni recomenda usaroníveldesignificânciaα/2=0,05/2=0,025. Confirma-se, assim, que a formação não exerce efeito nos experientes (médias: 15,3 vs 15,6; t = -0,47, df = 18, p = 0,643) mas melhora significativamente o desempenho dos inexperientes(médias:12,2vs15,7;t= -7,13,df =18,p=0,000). Testedashipótesessobrevalores médios– efeitosprincipais EfeitodaFormação Rejeita-se H0 [F(1, 36) = 22,3, p = 0,000], ou seja, a formação introduziu diferenciação significativa no desempenho da tarefa. Pela tabela das estatísticas descritivas, pode-se observar que o grupo experimental (com formação) teveumdesempenhomédio significativamente superior aogrupo decontrolo(15,65versus 13,75). Testedashipótesessobrevalores médios– efeitosprincipais EfeitodaExperiência Rejeita-seH0 [F(1,36)=13,9,p=0,001], ouseja,aexperiência introduziu diferenciação significativa no desempenho da tarefa. Pela tabela das estatísticas descritivas, pode-se observar que, independentemente da formação,ogrupoexperienteteveumdesempenhomédiosignificativamente superioraogrupoinexperiente(15,45versus 13,95). Conclusãogeral A formação parece ter efeito positivo apenas no grupo de inexperientes,permitindo-lhesumníveldedesempenhoigual aosexperientes.OseubenefícioparaosExperientesé não significativo. Apesar dos efeitos principais serem significativos, perdem significado perante a interacção detectada (ou seja, a vantagem dos Experientes observa-se apenas na condição “Sem formação” e a vantagem da formação observa-se apenasparaogrupodeInexperientes). Dificuldadesnainterpretaçãodos efeitosdeinteracção A presença de efeitos designados por “ceiling effect” ou “floor effect” podetornarinviávelainterpretaçãodasinteracções. Efeitodetecto (ceiling effect)– ocorrequandoodesempenho de um dos grupos se aproxima do nível máximo possível permitidopelaprova(ouseja,aprovaé demasiadamente fácil paraessegrupo). Efeitodechão (floor effect)– ocorrequandoodesempenhode um dos grupos se aproxima do nível mínimo permitido pela prova(aprovaé demasiadamentedifícilparaessegrupo). Efeitodetectoeefeitodechão Umainteracçãosignificativaentredoisfactorespodeserum artefactodevidoà presençadeefeitodetectooudeefeitode chão,tornandoassimainvestigaçãoinconclusiva. Poressarazão,oinvestigadordevegarantirqueaprovaou testequeestá autilizarparaavaliarodesempenhodos sujeitossejasuficientementediscriminativa(nemmuitofácil nemmuitodifícil),paragarantirqueosníveisdedesempenho sesituemaumnívelmédio(longedo“tecto” elongedo “chão”). 31 Efeitodetecto Nesteexemplo,ogrupoAtemumdesempenhopróximodomáximo (100%)emambasascondiçõesexperimentais(ceiling effect). Aanáliseestatísticavaidetectaruma interacçãoque,muitoprovavelmente, será umartefactodevidoaoceiling effect. OfactodogrupoAter-seaproximadodo nívelmáximodedesempenhoemambas ascondiçõesnãogaranteque,numa provamaisdifícil,oseudesempenhonão diferisseentrecondições,assemelhando- seaodogrupoB(aslinhasdográfico ficariamentãoparalelasedeixariade haverinteracção). 50 55 60 65 70 75 80 85 90 95 100 GrupoA GrupoB R es po st a s c o rr ec ta s (% ) ComLuz SemLuz Efeitodechão Nesteexemplo,ogrupoBtemumdesempenhopróximodonívelmínimoque aprovapermite(0%)emambasascondiçõesexperimentais(floor effect). TambémaquiaANOVAvaidetectaruma interacçãosignificativaqueserá um artefactodevidoà presençadefloor effect.OfactodogrupoBter-se aproximadosistematicamentedonível mínimodedesempenhoemambasas condiçõesnãogaranteque,numaprova maisfácil,oseudesempenhopermitisse umadissociaçãoentrecondições experimentais,semelhanteà observada nogrupoA. 0 10 20 30 40 50 60 GrupoA GrupoB R es po s ta s c o rr e c ta s (% ) ComLuz SemLuz B.ANOVAbifactorial commedidasrepetidas Testesdehipóteses Suaaplicaçõeselimites ANOVAcommedidasrepetidas Planosbifactoriais emqueambososfactoressão intra-sujeitossão frequentesemestudosexperimentais,quandoomesmoconjuntode sujeitos é exposto às diferentes condições manipuladas pelo experimentador. A utilização da mesma amostra nas diferentes condições permite reduzir a variação residual atribuível a diferenças individuais. No entanto, é preciso cuidados metodológicos especiais neste tipo de estudos,paraevitarefeitosdeordemnodesempenhodossujeitos (cansaço,treino,expectativas). ANOVAcommedidasrepetidas EXEMPLO Objectivo: avaliar o efeito da fase do dia (manhã e noite) e da natureza do material (letras, números, formas geométricas) no desempenhoemprovasdememóriaimediata. Plano experimental: 30 sujeitos expostos a três condições experimentais durante a manhã (memorizar letras, números e formas geométricas) e às mesmas três condições experimentais duranteo iníciodanoite.Regista-seonúmerode respostascertas nasdiferentesprovasdememória.Foramacauteladososefeitosde ordem. ANOVAcommedidasrepetidas EXEMPLO Planoexperimentalintra-sujeitos Factores(within subject): Tipodematerial:“letras”,“números”,“formas” Fasedodia:“manhã”,“noite” Variáveldependente: Desempenhonasprovasdememóriaimediata Procedimentodeanálise:ANOVA3x2commedidasrepetidas 32 Hipóteses FactorFasedodia H0:Nãohá diferençasdedesempenhoentreamanhãeanoite H1:Existemdiferençasentreamanhãeanoite FactorTipodematerial H0:Nãohá diferençasdedesempenhoparaostrêstiposdematerial H1:Pelomenosumdostiposdemateriallevouadesempenhodiferentesdos restantes Interacçãoentrefactores H0:Oefeitodotipodematerialé independentedafasedodiadoteste H1:Oefeitodotipodematerialdependedafasedodiadoteste Dados Trintasujeitosexpostosa seis(2x3)condições experimentais. Comosetratadeumplano deestudocommedidas repetidas,abasededados inclui30linhas(sujeitos)e6 colunas(condições). Osvaloresreferema acuidadedasrespostas dadasnasprovasde memóriaimediatarealizadas emcadacondição. ANOVAcommedidasrepetidasno SPSS É necessárioatribuirumnomeaosdois factoreswithin subjects eidentificaro númerodeníveisqueelespossuem. Aquitrata-sedofactor“fase_dia” (com duasmodalidades:“manhã” e“noite”)e dofactor“material” (comtrês modalidades:“letras”,“números” e “formas”). ANOVAcommedidasrepetidasno SPSS Atribuirasseisvariáveisaos factoreswithin subjects. Options Solicitarumgráficodemédias, parafacilitarainterpretaçãode eventuaisinteracções. Output– estatísticasdescritivas Estatísticasdescritivas: acuidadenodesempenho emcadaprova DescriptiveStatistics 7,37 2,918 30 6,10 2,845 30 4,10 2,591 30 7,00 2,213 30 4,40 2,568 30 3,97 2,236 30 manha_num manha_let manha_for noite_num noite_let noite_for Mean Std.Deviation N Mauchly'sTestofSphericityb Measure:MEASURE_1 1,000 ,000 0 . 1,000 1,000 1,000 ,203 44,687 2 ,000 ,556 ,563 ,500 ,778 7,020 2 ,030 ,818 ,861 ,500 WithinSubjectsEffect fase_dia material fase_dia*material Mauchly'sW Approx. Chi-Square df Sig. Greenhous e-Geisser Huynh-Feldt Lower-bound Epsilona Teststhenullhypothesisthattheerrorcovariancematrixoftheorthonormalizedtransformeddependentvariablesis proportionaltoanidentitymatrix. Maybeusedtoadjustthedegreesoffreedomfortheaveragedtestsofsignificance.Correctedtestsaredisplayedin theTestsofWithin-SubjectsEffectstable. a. Design:Intercept WithinSubjectsDesign:fase_dia+material+fase_dia*material b. Output – esfericidade Rejeita-seahipótesedeesfericidadenoscasosemqueelatemdesertestada (ouseja, parao factor “material”, que tem3níveis, ena interacçãoque tem 2x3 níveis). Por haver problemas de esfericidade, é preciso procederàs devidascorrecçõesnaANOVA(correcçãodeGreenhouse-Geisser). 33 Output – testedashipóteses Comosereferiuanteriormente,nosplanosbifactoriais deve-se começarsempreporverificarseainteracçãoé significativaantesde analisarosefeitosprincipais… Istoporque,casoainteracçãosejasignificativa,é arriscadofalardo efeitoisoladodeumfactorsemquesetenha,obrigatoriamente,de referirooutrofactor(umavezqueosdoisfactoresinteragemna influênciaquetêmsobreavariáveldependente). Apenasquandoainteracçãonãoé significativaé queoefeitoisolado decadafactorpodeserreferido,independentementedooutrofactor daexperiência. TestsofWithin-SubjectsEffects Measure:MEASURE_1 24,200 1 24,200 34,858 ,000 24,200 1,000 24,200 34,858 ,000 24,200 1,000 24,200 34,858 ,000 24,200 1,000 24,200 34,858 ,000 20,133 29 ,694 20,133 29,000 ,694 20,133 29,000 ,694 20,133 29,000 ,694 302,811 2 151,406 16,892 ,000 302,811 1,113 272,119 16,892 ,000 302,811 1,125 269,075 16,892 ,000 302,811 1,000 302,811 16,892 ,000 519,856 58 8,963 519,856 32,271 16,109 519,856 32,636 15,929 519,856 29,000 17,926 21,433 2 10,717 13,741 ,000 21,433 1,637 13,093 13,741 ,000 21,433 1,722 12,449 13,741 ,000 21,433 1,000 21,433 13,741 ,001 45,233 58 ,780 45,233 47,472 ,953 45,233 49,928 ,906 45,233 29,000 1,560 SphericityAssumed Greenhouse-Geisser Huynh-Feldt Lower-bound SphericityAssumed Greenhouse-Geisser Huynh-Feldt Lower-bound SphericityAssumed Greenhouse-Geisser Huynh-Feldt Lower-bound SphericityAssumed Greenhouse-Geisser Huynh-Feldt Lower-bound SphericityAssumed Greenhouse-Geisser Huynh-Feldt Lower-bound SphericityAssumed Greenhouse-Geisser Huynh-Feldt Lower-bound Source fase_dia Error(fase_dia) material Error(material) fase_dia*material Error(fase_dia*material) TypeIIISum ofSquares df MeanSquare F Sig. Output – testedashipóteses Ainteracçãoentreos doisfactoresé significativa(correcção deGreenhouse- Geisser). Output – testedashipóteses (interacção) Efeitodainteracçãoentrefactores Rejeita-seH0 [F(1.6,47.5)=13,7,p=0,000],ouseja,asdiferenças de desempenho nas três provas não são iguais de manhã e à noite… … ou seja, as diferenças entre o desempenho matinal e nocturno nãoé igualnastrêsprovas. … ouseja,oefeitodotipodematerialdependedaalturadodiaem queaprovaé realizada. Output – gráficodemédias Interacçãoentremateriale fasedodia Acapacidadedememória paranúmeroseparaformas parecesemelhantenosdois momentosdeavaliação;a memóriaparaletrasparece sermaiseficazdurantea manhã.Paraverificara significânciadestaleitura,é precisoprocederaanálises post hoc. PairedSamplesTest ,367 1,608 ,294 -,234 ,967 1,249 29 ,222 1,700 1,119 ,204 1,282 2,118 8,323 29 ,000 ,133 ,819 ,150 -,173 ,439 ,891 29 ,380 manha_num-noite_numPair1 manha_let-noite_letPair2 manha_for-noite_forPair3 Mean Std.Deviation Std.Error Mean Lower Upper 95%Confidence Intervalofthe Difference PairedDifferences t df Sig.(2-tailed) Identificaçãodasdiferençassignificativas nainteracção(análisepost hoc) Acomparaçãopost hoc entreasmédiasdográficodeinteracçãopoderá ser feita recorrendoao teste tparaamostrasemparelhadas (comcorrecçãode Bonferroni,utilizando-seovalorα/3=0.05/3=0.0167,poisé realizadoum conjuntodetrêstestes). Aanálisepost hoc permite afirmar que apenas na prova dememória para letrasexistediferençasignificativaentremanhãenoite(t=8,3,gl =29,p= 0,000). Output – testedashipóteses(efeitos principais) Efeitodotipodematerial Rejeita-seH0 [F(1.1,32.3)=16,9,p=0,000],ouseja,odesempenhodepelo menosumadasprovasé diferentedosrestantes. Comoestefactortemtrês modalidades,é precisoprocedera análisespost hoc paraidentificar quemodalidadessãodiferentes entresi(apenassabemosquepelo menosumadiferedasrestantes). 34 PairwiseComparisons Measure:MEASURE_1 1,933* ,659 ,019 ,260 3,607 3,150* ,656 ,000 1,483 4,817 -1,933* ,659 ,019 -3,607 -,260 1,217* ,179 ,000 ,762 1,671 -3,150* ,656 ,000 -4,817 -1,483 -1,217* ,179 ,000 -1,671 -,762 (J)material 2 3 1 3 1 2 (I)material 1 2 3 Mean Difference (I-J) Std.Error Sig.a LowerBound UpperBound 95%ConfidenceIntervalfor Differencea Basedonestimatedmarginalmeans Themeandifferenceissignificantatthe,05level.*. Adjustmentformultiplecomparisons:Bonferroni.a. Output – análisepost hoc Comparaçãoentremateriais Observam-sediferençassignificativasentreodesempenhonastrêsprovas,peloque sepodeafirmarque,independentementedahoradodia,acapacidadedememória paranúmerosé sempremelhordoqueacapacidadedememóriaparaletraseambas sãomelhoresdoqueacapacidadedememóriaparaformasgeométricas. Análisepost hoc através dométododeBonferroni Output – testedashipóteses(efeitos principais) Efeitodafasedodia Rejeita-seH0 [F(1,29)=34,9,p=0,000],ouseja,odesempenhogeralnas provasdememóriadependedafasedodiaemquefoiavaliado. Aanálisedasmédiasindicaqueo desempenhogeralnasprovasde memóriaduranteamanhãé superiorao desempenhoduranteanoite(neste caso,comoofactor“fasedodia” apenas temduasmodalidades,nãoé preciso procederaanálisespost hoc);no entanto,aanálisedainteracçãorevelou- nosqueessadiferençadeve-se sobretudoà provadeletras.. Conclusãogeral Embora o desempenho de provas de memória seja sistematicamentemelhorquandosetrabalhacomnúmerose pior quando se trabalha com formas geométricas, o desempenho em provas de memória que utilizem letras parecedependerdaalturadodiaemqueaprovaé realizada. C.ANOVAmista Testesdehipóteses Suaaplicaçõeselimites ANOVAcomplanoexperimentalmisto EXEMPLO Objectivo: avaliaroefeitodeumasessãode relaxamentonapressão arterialsistólica. Planoexperimental:Apósumaprovadeesforço(destinadaaaumentar apressãoarterial),30sujeitosforamaleatoriamentedistribuídospordois grupos: um grupo realizou uma sessão de relaxamento activo com duração de 10 minutos (grupo experimental) e o outro grupo ficou em repouso(grupodecontrolo).Mediu-seapressãoarterialantesedepois decadasessão.Pretende-seavaliarseasessãoderelaxamentoactivo teve mais efeito na redução da tensão arterial do que sessão de repouso. ANOVAcomplanoexperimentalmisto Planoexperimentalmisto Factores: Tempo:“antesdasessão” versus “depoisdasessão” (factor within subjects) Tipodesessão:relaxamentoactivoversus repouso (factorbetween subjects) Variáveldependente: Pressãoarterialsistólica Procedimentodeanálise:ANOVAcommedidasrepetidas 35 Hipóteses FactorTempo H0:Nãohá diferençasnapressãoarterialantesedepoisdassessões H1:Há diferençasnapressãoarterialantesedepoisdassessões FactorTipodeRelaxamento H0:Nãohá diferençasentreRelaxamentoActivoeRepouso H1:Há diferençasentreRelaxamentoActivoeRepouso Interacçãoentrefactores H0: A diferença na pressão antes e depois é independente do tipo de relaxamento H1:Adiferençanapressãoantesedepoisdependedotipoderelaxamento Estaé ahipótesequeinteressaexplorarnesta investigação,poispermiteaveriguarseotipode relaxamentoafectaadescidadapressãoarterial. Dados Trintasujeitosdistribuídosporduas condiçõesexperimentais Osvaloresreferemà pressãoarterial sistólica (PA)antesedepoisdo tratamento(sessãoderelaxamento/ repouso) Homogeneidadedevariâncias Homogeneidadedasvariâncias Comonestaanáliseexisteumfactorentre-sujeitos,é necessárioverificar se a variância das variáveis em estudo (PA_antes e PA_depois) é igual nosdoisgruposemcomparação. Verifica-se existir homogeneidade das variâncias para as duas variáveis (para ambas a variáveis, p > 0,050), pelo que se pode prosseguir a ANOVA. Levene'sTestofEqualityofErrorVariancesa ,119 1 28 ,732 ,285 1 28 ,597 PA_antes PA_depois F df1 df2 Sig. Teststhenullhypothesisthattheerrorvarianceofthe dependentvariableisequalacrossgroups. Design:Intercept+Sessão WithinSubjectsDesign:tempo a. Esfericidade Testedaesfericidade Comoofactorwithin temapenasdoisníveis(“antes” e“depois”)nãofaz sentidotestaraesfericidadedamatrizdascovariâncias.Mauchly'sTestofSphericityb Measure:MEASURE_1 1,000 ,000 0 . 1,000 1,000 1,000 WithinSubjectsEffect tempo Mauchly'sW Approx. Chi-Square df Sig. Greenhous e-Geisser Huynh-Feldt Lower-bound Epsilona Teststhenullhypothesisthattheerrorcovariancematrixoftheorthonormalizedtransformeddependentvariablesis proportionaltoanidentitymatrix. Maybeusedtoadjustthedegreesoffreedomfortheaveragedtestsofsignificance.Correctedtestsaredisplayedin theTestsofWithin-SubjectsEffectstable. a. Design:Intercept+Sessão WithinSubjectsDesign:tempo b. TestsofWithin-SubjectsEffects Measure:MEASURE_1 390,150 1 390,150 104,504 ,000 390,150 1,000 390,150 104,504 ,000 390,150 1,000 390,150 104,504 ,000 390,150 1,000 390,150 104,504 ,000 30,817 1 30,817 8,254 ,008 30,817 1,000 30,817 8,254 ,008 30,817 1,000 30,817 8,254 ,008 30,817 1,000 30,817 8,254 ,008 104,533 28 3,733 104,533 28,000 3,733 104,533 28,000 3,733 104,533 28,000 3,733 SphericityAssumed Greenhouse-Geisser Huynh-Feldt Lower-bound SphericityAssumed Greenhouse-Geisser Huynh-Feldt Lower-bound SphericityAssumed Greenhouse-Geisser Huynh-Feldt Lower-bound Source tempo tempo*Sessão Error(tempo) TypeIIISum ofSquares df MeanSquare F Sig. Testedashipóteses– factorwithin EfeitodoTempo(efeitowithin) Como seria de esperar (pois a pressão arterial deverá baixar naturalmente 10 minutosapósaconclusãodoexercício),rejeita-seH0 [F(1,28)=104,5,p=0,000], ouseja,há diferençasnapressãoarterialantesedepoisdassessões. Asignificânciado efeitodofactowithin (Tempo)lê-senesta linhapoisnãose colocaaexigênciada esfericidade. TestsofBetween-SubjectsEffects Measure:MEASURE_1 TransformedVariable:Average 596206,017 1 596206,017 1315,354 ,000 170,017 1 170,017 ,375 ,545 12691,467 28 453,267 Source Intercept Sessão Error TypeIIISum ofSquares df MeanSquare F Sig. Testedashipóteses– factorbetween EfeitodaSessão(efeitobetween) NãoserejeitaH0 [F(1,28)=0,4,p=0,545],ouseja,nãoexistediferença entresessões. Atenção:comosetratadeumfactorbetween,oSPSSapresentaoteste correspondentenumatabeladiferentedaanterior. 36 TestsofWithin-SubjectsEffects Measure:MEASURE_1 390,150 1 390,150 104,504 ,000 390,150 1,000 390,150 104,504 ,000 390,150 1,000 390,150 104,504 ,000 390,150 1,000 390,150 104,504 ,000 30,817 1 30,817 8,254 ,008 30,817 1,000 30,817 8,254 ,008 30,817 1,000 30,817 8,254 ,008 30,817 1,000 30,817 8,254 ,008 104,533 28 3,733 104,533 28,000 3,733 104,533 28,000 3,733 104,533 28,000 3,733 SphericityAssumed Greenhouse-Geisser Huynh-Feldt Lower-bound SphericityAssumed Greenhouse-Geisser Huynh-Feldt Lower-bound SphericityAssumed Greenhouse-Geisser Huynh-Feldt Lower-bound Source tempo tempo*Sessão Error(tempo) TypeIIISum ofSquares df MeanSquare F Sig. Testedashipóteses- interacção EfeitodainteracçãoTempoxSessão(efeitomisto) Existe interacçãoentreTempoeSessão [F(1,28)=8,3,p=0,008],ouseja,a reduçãodapressãoobservadaentreomomento“antes” e“depois” é diferenteno grupoquefezrelaxamentoenogrupoderepouso. Gráficodemédias InteracçãoTempox Sessão Adiminuiçãodatensão entreomomento“antes” e “depois” (efeitodoTempo) é distintanosdoisgrupos: taldiminuiçãoé mais marcadanogrupoque seguiuasessãode relaxamento. Identificaçãodasdiferenças significativasnainteracção Também aqui poderá ser necessário fazer comparações post hoc para identificarquemédiasdiferemumasdasoutras. Otesteaescolherdependeseseestá trabalharcomofactorintra-sujeitosou ofactorentre-sujeitos… É necessáriousarsempreacorrecçãodeBonferroni. Identificaçãodasdiferenças significativasnainteracção Duasalternativasdeanálise… Fazeranálisedofactorintra-sujeitos paracadagrupodefinidopelofactor entre-sujeitos. Fazeracomparaçãoentreosgrupos definidopelofactorentre-sujeitos para cadaumdosmomentosdefinidospelo factorintra-sujeitos. Identificaçãodasdiferenças significativasnainteracção GrupoSessão=repouso GrupoSessão=relaxamento Identificaçãodasdiferenças significativasnainteracção Verifica-sequeoefeitoentreoinícioeofimdasessãoé significativoparaos doistiposdesessão(repouso:t=9,49,df =14,p=0,000;relaxamento:t= 7,10, df = 14, p = 0,000). No entanto, a diminuição dos níveis médios de pressãoé maiornassessõesderelaxamento(diferençaentremédias=6,53) doquenassessõesderepouso(diferençaentremédias=3,67). Umasessão de relaxamento activo parece ter um efeito mais marcado na reduçãodapressãoarterialapósexercíciodoqueumasessãode repouso simples. 37 Conclusão Uma sessão de relaxamento activo parece ter um efeito mais marcado na redução da pressão arterial após exercício do que uma sessão de repouso simples. D.Situaçõesmais complexas Testesdehipóteses Suaaplicaçõeselimites ANOVAs maiscomplexas Podem surgir estudos mais complexos, dependendo do número de factores envolvidos e do número de modalidades presentes em cada factor: a) Estudos com dois factores, mas onde cada factor tem mais de duas modalidades(porexemplo,ANOVA3x4) b) Estudos com mais do que dois factores – análise de variância multifactorial (porexemplo,ANOVA2x3x2). Análisebifactorial commaisdeduas modalidades ANOVA3x2 O efeito da iluminação é diferente consoante o nível de experiência do sujeito: ser leitor experiente traz vantagens para a velocidade de leitura em condiçõesdepenumbra. 10 12 14 16 18 20 22 24 26 28 30 Luz Penumbra Sombra Condiçõesdeleitura Ve lo ci da de de le itu ra Experientes Inexperientes ANOVA3x4 O aumento do número de modalidades de cada factor dificulta a interpretação da interacção. A análise post-hoc desta interacção implica o recurso à ANOVA unifactorial e ao método de Tukey (para comparar, por exemplo, o desempenho dos três grupos ESS emcadaanodeescolaridade).10 11 12 13 14 15 16 17 18 19 20 1ºano 2ºano 3ºano 4ºano ESSbaixo ESSmédio ESSalto Análisemultifactorial Quanto existem três factores em jogo (A, B e C), para além dos factores principais(main effects)edainteracçãode2ª ordem(interacçãoentrepares defactores:AxB,AxC eBxC),existeaindaa interacçãode3ª ordementre ostrêsfactores(AxBxC). Adificuldadeem interpretarosefeitosde interacçãoaumenta rapidamente assimquesepassaparaanálisescommaisdoquetrêsfactores. 38 Análisetrifactorial Considere-sequesepretendeavaliarapresençademúsicanasessãode relaxamento(commúsicaousemmúsica)temefeitonareduçãodapressão sistólica (antes versus depois), procurando averiguar se esse feito é diferenteentrehomensemulheres. TemosumaANOVA2x2x2,comosseguintesfactores: Sexo(masculinovsfeminino) Momento(antesvsdepois) Condiçãoexperimental(commúsicavssemmúsica) Interacçãode3ª ordem Areduçãodapressãosistólica (antesversusdepois)é diferenteentresexos quandoo treinoé feitosemmúsica (asmulheres relaxammais)mas igual nosdoissexosquandootreinoé feitocommúsica. E.ANCOVA Testesdehipóteses Suaaplicaçõeselimites ANCOVA– Analysis of Covariance Covariáveis são variáveis de natureza quantitativa utilizadas em ANOVA para reduzir a variação devida ao erro residual, aumentandoassimapotênciadotesteparadetectardiferenças. No estudo sobre o efeito do ruído na compreensão de um texto podemos considerar que o resultado numa prova de Vocabulário (medida da vocabulário que o sujeito possui) está correlacionado comacompreensãodotexto,peloquepodeserusadoparatornar otestemaissensível(maispotente)poiscontrola-seoefeitodessa variável estranha no efeito que se pretende avaliar (efeito das condiçõesderuídonacompreensãodeumtexto). ANCOVA– Analysis of Covariance EXEMPLO Objectivo: avaliaroruídoambientalnacompreensãodeumtexto. Amostra: três grupos de 4 crianças cada foram expostos a três condições ambientais distintas (silêncio vs música de fundo vs ruídodefundo)ouviramaleituradeumtexto.Nofinal,foramfeitas
Compartilhar