Baixe o app para aproveitar ainda mais
Prévia do material em texto
Panorama do capítulo Na tentativa de explicar como utilizar e entender estatística, talvez seja melhor iniciar com o destaque dos principais tópicos para o delineamento de uma pesquisa. Descreveremos, então, os aspectos mais importantes de um projeto de pesquisa com o objetivo de mostrar como ele influencia o uso da estatística. Assim, neste capítulo queremos ensinar a você o seguinte: ■ variáveis contínuas, discretas e categóricas ■ variáveis dependentes e independentes ■ projetos correlacionais, experimentais e quase-experimentais ■ projetos entre e dentre participantes 1.1 Por que ensinar estatística sem fórmulas matemáticas? A estatística como um conteúdo tende a despertar medo em corações e mentes de muitos es- tudantes de ciências sociais e em muitos palestrantes* também. Entender os conceitos estatísticos não deve, no entanto, ser mais difícil do que compreender qualquer outro conceito teórico (por exemplo, o conceito de inteligência). De fato, alguém poderia pensar que entender um conceito bastante concreto tal como o de média aritmética seria mais fácil do que compreender o conceito psicológico, bem mais vago, de “uma atitude”. Ainda assim, a cada ano, parece que a maioria dos estudantes, que aparentemente percebem muitos conceitos não-estatísticos como um caso consumado, lutam para entender estatística. No nosso modo de ver, muitas pessoas temem a estatística porque os conceitos estão perdidos em meio às fórmulas matemáticas. Desta forma, procuramos explicar a estatística de um modo conceitual, sem confundir os estudantes com fórmulas matemáticas desnecessárias – isto é, desnecessárias hoje em dia, na era dos pacotes computacionais. Se o estudante quer aprender estas fórmulas para melhorar o seu conhecimento, que ponto de partida melhor do que um entendimento conceitual da estatística? A estatística tende a ter uma má reputação, como ilustra a máxima de Disraeli**: “Existem três tipos de mentiras: mentiras, mentiras deslavadas e estatísticas”. Entretanto, o problema não é da estatística, mas sim da forma como ela é utilizada. Com freqüência, particularmente na política, a estatística é utilizada fora de contexto. Esse problema é claramente ilustrado no seguinte trecho extraído de um artigo publicado, em 2002, no Guardian***: 1 Variáveis e Projeto de Pesquisa * N. de T. O termo no original é lecturer que é uma categoria de professor nas universidades inglesas. ** N. de T. Benjamin Disraeli (1804-1881), primeiro ministro britânico em 1868 e 1874 a 1880. *** N. de T. Jornal britânico fundado em Manchester em 1821. Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight 24 Christine P. Dancey & John Reidy O site do partido gira como o 1984, de Orwell* Por David Walker O partido dos trabalhadores tem sistematicamente manipulado dados em seu site para mos- trar melhorias na saúde, escolaridade e outros serviços, de acordo com um estudo não-publicado. Essa prática foi iniciada no correr das eleições do último ano e tem continuado desde então, com o partido dos trabalhadores apresentando ao público estatísticas tendenciosas de crimes e desem- prego, bem como de gastos com escolas e hospitais. Os números têm sido manipulados para fornecer uma melhor impressão sobre o desempenho do partido em nível local. Em um artigo de pesquisa circulando entre acadêmicos, após ter sido apresentado recente- mente em uma conferência de uma associação de estudos políticos, quatro renomados geógrafos se detiveram nos números publicados no site para áreas locais. Liderados pelos professores Danny Dorling da Universidade de Leeds e por Ron Johnston da Universidade de Bristol, a equipe verifi- cou que o partido consistentemente ajustou e manipulou dados sem conhecê-los. Em vez de fornecer a impressão de uma série de meias verdades ocasionais, está começando a parecer que este suprimento de valores distorcidos é uma estratégia de longo prazo do partido, disse o jornal. O webmaster do partido é comparado a Winston Smith, personagem do livro 1984 de George Orwel, que passava o seu tempo no ministério do abastecimento reescrevendo a história. Nenhum número individualmente é falso no sentido estrito da palavra. É a forma como são agrupados – mis- turando e emparelhando áreas e anos para dar a impressão de que as coisas melhoraram – que não é sincera como um todo. Por meio do código postal, os visitantes do site do partido podem, ao que parece, acessar informações detalhadas sobre o local onde vivem. No entanto, alguns dos números apresentados referem-se ao Reino Unido ou à Inglaterra como um todo, outros a regiões inteiras, alguns à área de uma cidade ou município, mas muitos poucos a uma área específica e muito menos à rua onde as pessoas vivem. Os visitantes do site são informados sobre o aumento de enfermeiras sem ser dito que os números se referem às regiões do NHS** em vez de hospitais específicos. Melhorias na educação são anunciadas sem que o público seja informado que se referem a toda uma área educacional – a qual pode conter até 20 regiões. As taxas de criminalidade no site não são específicas ao código postal, mas a toda uma área policial, algumas muito grandes ou até mesmo à Inglaterra e ao País de Gales como um todo. (Extraído do Guardian de 8 de outubro de 2002)1 O estudo mencionado nesta reportagem foi de fato publicado em 2002 no The Political Quarterly (Dorling et al., 2002). Este artigo ilustra claramente a importância de se colocar estatísticas em um contexto correto. Se for dito a você, por exemplo, que a altura média de um adulto é 173 cm, isto pode ser correto para um homem brasileiro, mas não necessariamente para um homem de uma tribo africana de pigmeus, na qual a altura média pode ser tão baixa quanto 145 cm. 1.2 Variáveis Explicamos um aspecto muito importante das estatísticas: elas só tem sentido em um contexto. Mas o que é que a estatística realmente faz? Essencialmente, a estatística nos for- nece informações sobre fatores que podemos medir. Na pesquisa, as coisas que medimos são denominadas variáveis. * N. de T. George Orwell (1903-1950), escritor inglês. ** N. de T. NHS (National Health Service) – Serviço Nacional de Saúde. 1 Veja página 55 do Guardian. Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Estatística sem Matemática para Psicologia 25 As variáveis são o foco principal da pesquisa em ciências. Uma variável é simplesmente algo que pode variar, isto é, pode assumir valores ou categorias diferentes. Alguns exemplos de variáveis são gênero (sexo), velocidade de digitação, velocidade máxima de um carro, número de sintomas registrados de uma doença, temperatura, público em um festival de rock, nível de ansiedade, número de gols em uma partida de futebol, inteligência, número de encontros sociais ao levar o cachorro para passear, quantidade de violência na televisão, ocupação e cores favoritas. Estes são exemplos de itens que se pode medir e registrar e que variam de uma situação ou pessoa para outra. Por que estamos interessados em variáveis? Geralmente nos interessamos por variáveis porque queremos entender o motivo da sua variação. De forma a compreender esta varia- ção, devemos ter capacidade de medir e registrar as alterações nestas variáveis em qualquer situação dada. 1.2.1 Características das variáveis Pode ser notado nos exemplos de variáveis dados que elas apresentam diferentes carac- terísticas. Enquanto se pode medir a temperatura em termos de graus Celsius ou Fahrenheit e atribuir um valor ao resultado, não se pode fazer o mesmo com o tipo de ocupação, por exem- plo. Isso representa uma característica importante das variáveis: o quão precisamente podem ser avaliadas. No topo, mais preciso, da escala uma variável é dita contínua, ou seja, ela pode assumir qualquer valorem um intervalo dado. Dito de outra forma, a variável não varia em passos discretos. Um exemplo de variável contínua é a temperatura. Ela é contínua porque se pode medir a temperatura, digamos, como sendo 40 oC ou, então, se pode medi-la de forma mais precisa como 40,2558 oC. Outro exemplo, menos óbvio, é a quantidade de violência na televisão. Pode-se medi-la em termos da quantidade de tempo que aparece na tela por dia. Se avaliada desta forma, isto é, em termos de tempo, a variável pode assumir qualquer valor em termos de segundos ou partes de segundo, como 1000 s ou 1000,1235672 s por dia. A única limitação na precisão da medida de tal tipo de variável é a acurácia do equipamento de me- dida. Com variáveis contínuas, existe a hipótese implícita de que seja contínua mesmo que a forma de medi-la não o seja. Dos exemplos fornecidos anteriormente, temperatura, nível de ansiedade, velocidade máxima de um carro, velocidade de digitação e inteligência podem ser consideradas contínuas, enquanto as demais não (veja Tabela 1.1). Uma variável pode, também, ser discreta, ou seja, ela pode assumir somente valores discretos dentro de um determinado intervalo. Um exemplo deste tipo de variável é o nú- mero de sintomas observados de uma doença que uma pessoa possui. Isso somente pode ser Tabela 1.1 Exemplos de variáveis contínuas, discretas e categóricas Contínuas Discretas Categóricas ■ Temperatura ■ Número de sintomas registrados de uma doença ■ Gênero (sexo) ■ Velocidade máxima de um carro ■ Número de carros possuídos ■ Ocupação ■ Velocidade de digitação ■ Número de gols em uma partida de futebol ■ Cor favorita ■ Inteligência ■ Número de encontros sociais enquanto passeia com o cachorro ■ Tipo de restaurante ■ Nível de ansiedade ■ Participantes de um festival de rock ■ Número de fi lhos de uma família Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight 26 Christine P. Dancey & John Reidy registrado em termos de presença ou não do sintoma. Outro exemplo seria se escolhêssemos medir a quantidade de violência na televisão de acordo com o número de incidentes violentos por semana. Não podemos medir esta variável em termos de frações de incidentes violentos por semana. Assim, o número de incidentes violentos semanais na televisão é uma variável discreta. Dos exemplos dados anteriormente, as variáveis discretas mais óbvias são o número de “sintomas registrados de uma doença”, o de “encontros sociais enquanto passeia com o cão”, o de “freqüentadores de um festival de rock”, o de “carros possuídos”, o de “filhos por família” e o de “gols em uma partida de futebol”. Quando estudamos variáveis discretas e contínuas, existe o perigo de confundir a variável subjacente – a variável propriamente dita – com a forma de mensurá-la. Uma variável pode ser teoricamente contínua, mas a forma de medi-la é sempre discreta, não importa o grau de precisão da medida utilizada. Poderíamos medir a ansiedade (uma variável teoricamente contínua) utilizando um questionário (p. ex., o Inventário das Características e Estados da Ansiedade,* Spielberger et al., 1983) no qual o escore total no questionário fornece uma indicação do nível de ansiedade de uma pessoa. O escore total pode aumentar somente em unidades, digamos de 38 para 39 ou de 61 para 62. Assim, a forma de mensuração da ansie- dade é discreta, enquanto a variável envolvida é de fato contínua. Ademais, na análise de variáveis discretas, é comum tratá-las como contínuas. Muitos dos testes estatísticos usados indicam que estamos tratando com variáveis contínuas. Freqüente- mente, quando uma variável discreta pode assumir um grande número de valores dentro de certo intervalo (p. ex., público de um festival de rock pesado), pode, para efeitos práticos, ser tratada como se fosse contínua na utilização do teste estatístico. Outro tipo de variável é a categórica: aquela em que os valores assumidos são catego- rias. Um bom exemplo é gênero, que pode ter apenas dois valores: masculino e feminino. Variáveis categóricas podem, algumas vezes, apresentar muitos valores possíveis, como o tipo de ocupação (p. ex., juiz, professor, advogado, engenheiro, etc.). Quando lidamos com dados categóricos temos um grande número de variáveis que gostaríamos de investigar. Po- deríamos, se desejássemos, categorizar pessoas com base em “se elas comeram ou não bolo de chocolate às 6h30min desta manhã’ ou talvez (ou pouco mais bizarro) ‘se elas deram ou não contribuições ao time de futebol Manchester United”. Os únicos exemplos óbvios de variáveis categóricas apresentadas na lista do início desta seção são ocupação, gênero e cor favorita. Tente se assegurar de que você entendeu os diferentes tipos de variáveis que está medin- do, pois isto é importante quando se decidir como analisar os dados. 1.2.2 Dicotomização de variáveis contínuas e discretas Existem casos em que os pesquisadores convertem variáveis discretas e contínuas em variáveis categóricas. Por exemplo, poderíamos querer comparar a habilidade espacial de pessoas altas e baixas. Podemos fazer isto comparando pessoas que são mais altas do que 193 cm com aquelas que são mais baixas do que 147 cm em um teste de habilidade espacial. Desta maneira, escolhemos pontos na escala contínua (altura) e decidimos comparar aqueles participantes que estão acima e abaixo destes pontos (veja Figura 1.1). Outro exemplo poderia ser a comparação da habilidade de memória de pessoas ansiosas e não-ansiosas. Pode-se medir os níveis de ansiedade utilizando um questionário, isto é, uma * N. de T. STAI (State-Trait Anxiety Inventory). Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Estatística sem Matemática para Psicologia 27 variável contínua medida em uma escala discreta. Por exemplo, a escala hospitalar de ansie- dade e depressão apresenta valores que variam de 0 a 21. Para convertê-la em uma variável categórica, iremos simplesmente comparar os escores superiores a certo valor (p. ex., diga- mos, 11) com aqueles abaixo deste mesmo valor. Essa dicotomização (divisão em duas categoriais) de variáveis discretas e contínuas é comum na psicologia e permite que se encontrem diferenças entre grupos que podem estar nos extremos de variáveis discretas ou contínuas, por exemplo, pessoas altas e baixas. No entanto, não recomendamos tal prática, pois ela reduz a sensibilidade da análise estatística. Existe uma boa discussão de tais problemas em Streiner (2002) e Maxwell e Delaney (1993). Mencionamos isto aqui para que você possa estar ciente do que ocorre na literatura científica e, assim, entenda o que o pesquisador fez. PONTO DE DISCUSSÃO: DICOTOMIZAÇÃO DE VARIÁVEIS CONTÍNUAS Por que os pesquisadores dicotomizam variáveis? Streiner (2002) ressalta o fato de que muitas decisões em psicologia, psiquiatria e medicina são binárias. Neste tipo de decisão, têm-se apenas duas escolhas, tais como se a pessoa apresenta ou não problema mental, se tem ou não uma determinadadoença, se precisa ou não ser hospitalizada, ou se deve ou não receber alta do hospital. O argumento utilizado é que, se estes profissionais precisam tomar decisões binárias, então é legítimo investigar estes tipos de variáveis. Tal raciocínio é utiliza- do para dar suporte à prática disseminada de dicotomizar variáveis contínuas. Streiner argumenta que não precisamos ver as decisões que os médicos tomam como binárias. Ele sugere que seria melhor pensar em uma doença mental, por exemplo, como um contínuo. Quantos mais sintomas alguém apresenta mais afetado está. Devemos medir tais Valores da variável categórica Valores da variável contínua Alto Baixo Altura (cm) 200 150 100 Figura 1.1 Ilustração da conversão de variáveis contínuas em categóricas. Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight 28 Christine P. Dancey & John Reidy constructos de forma contínua, e não dicotomizá-los. Assim, em vez de se utilizar questio- nários para categorizar pessoas, poderíamos usá-los para obter uma medida na qual estejam em um contínuo. Tal informação pode então ser utilizada na decisão de como tratar certas pessoas ou de alguma outra forma. Um exemplo pode ilustrar melhor a dicotomização. Foi sugerido anteriormente que é possível categorizar pessoas em ansiosas e não-ansiosas com base em escores obtidos num questionário. Pesquisadores investigando ansiedade utilizam regularmente questionários des- ta forma. Aqueles participantes que apresentam altos escores são classificados como de alta ansiedade, enquanto os que têm pouca pontuação são classificados como de baixa ansiedade. O método de divisão pela mediana é muitas vezes utilizado com este propósito, categorizando os que ficaram acima da mediana como ansiosos e os que ficaram abaixo como não-ansiosos (p. ex., Egloff e Hock, 2003). Streiner argumenta que a prática de dicotomizar variáveis contínuas tende a diminuir o poder da pesquisa (o poder de um teste será tratado nos Capítulos 4 e 7). A razão disto é que se perdem muitas informações sobre os participantes. Por exemplo, suponha que duas pessoas tenham os escores de 20 e 38 em um teste de ansiedade e que, quando a variável for dicotomizada, eles serão contados como de baixa ansiedade (os dois estão abaixo da media- na). Em qualquer análise subseqüente baseada na categorização feita, ambos serão tratados como se possuíssem o mesmo nível de ansiedade, isto é, serão considerados não-ansiosos. Entretanto, de acordo com os escores originais, o nível de ansiedade entre eles é bastante diferente. Tratar estas duas pessoas como idênticas em termos de níveis de ansiedade não pa- rece fazer sentido. Seria mais sensato tentar incluir os valores reais de ansiedade em qualquer análise estatística realizada. Além disso, pode-se observar uma diferença muito maior entre os níveis de ansiedade das duas pessoas classificadas como não-ansiosas do que entre uma classificada como ansiosa e a outra não. Por exemplo, suponha que a mediana fosse 39, então todos aqueles acima deste escore seriam classificados como ansiosos e todos os abaixo como não-ansiosos. Pode-se ver aqui que uma pessoa não-ansiosa que tenha um escore de 38 tem muito mais em comum com uma ansiosa cujo escore seja 41 do que com outra não-ansiosa cujo escore seja 20. Ainda em qualquer análise posterior, os participantes com escores de 20 e 38 são classificados como idênticos em termos de ansiedade, e estes são classificados como diferentes de uma pessoa que tenha um escore de 41. Isso não faz sentido. Streiner ainda ressalta pesquisas que mostram que análises utilizando variáveis dicotômi- cas apresentam aproximadamente 67% da eficiência das que utilizam as variáveis contínuas ou discretas originais. Isso é uma grande perda de sensibilidade do estudo. Significa que você tem apenas 67% de probabilidade de detectar relacionamentos entre variáveis se estiver utilizando variáveis contínuas ou discretas dicotomizadas. Isso é uma séria desvantagem na condução de uma pesquisa. Além do mais, a perda de poder não é o único problema que surge quando variáveis são dicotomizadas. Maxwell e Delaney (1993) mostraram que esta prática pode levar a achados espúrios na análise estatística. Conseqüentemente, aconselhamos a não dicotomizar variáveis contínuas. Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Estatística sem Matemática para Psicologia 29 Atividade 1.1 Quais das seguintes variáveis são categóricas, discretas ou contínuas? ■ Velocidade do vento ■ Tipos de títulos oferecidos por uma universidade ■ Nível de extroversão ■ Marcas de carros ■ Times de futebol ■ Número de peças de xadrez capturadas em um jogo ■ Peso de pandas gigantes ■ Número de pinturas expostas em galerias de arte As respostas corretas podem ser encontradas no final do livro. 1.3 Planejamento da pesquisa Existem muitas técnicas estatísticas que podem ser usadas para se analisar dados cole- tados em uma pesquisa. Neste livro serão apresentadas algumas das mais utilizadas. Muitas destas técnicas apresentam fórmulas matemáticas complexas para calcular as estatísticas en- volvidas. Estas fórmulas não serão abordadas, pois preferimos fornecer ajuda para que você entenda as técnicas a partir de um ponto de vista conceitual. Um dos principais fatores na determinação de qual teste estatístico será utilizado para analisar os dados é a forma como o estudo foi projetado ou planejado. Existem várias manei- ras de projetar ou planejar um estudo, e a forma como este é feito exercerá grande influência nos tipos de procedimentos estatísticos disponíveis. Algumas vezes, os pesquisadores querem observar diferenças entre dois grupos de participantes em uma variável particular. Em outra situação pode-se querer verificar se duas variáveis apresentam algum tipo de relacionamento. Um exemplo de procura de diferenças entre dois grupos pode ser a pesquisa relatada por Ni- cholas e Collis (2000). No estudo, eles compararam o número de encontros sociais que pessoas tinham enquanto levavam o cão para passear com a quantidade de encontros sociais sem o cão. Constataram que caminhar com o cão aumenta o número de encontros sociais. Um exemplo de pesquisa correlacional foi relatado por Walsh e Ugumba-Agwunobi (2002). Neste estudo, entre outras coisas, investigou-se o relacionamento entre ansiedade causada pelo estudo da estatís- tica e a procrastinação. Os autores verificaram que existem relações entre vários componentes da ansiedade causada pelo estudo da estatística (doravante denominada ansiedade estatística) (p. ex., temor do professor de estatística) e a procrastinação. Os testes estatísticos que seriam utilizados nestes exemplos são denominados de testes de diferenças e testes correlacionais, respectivamente. A forma de planejar o estudo influenciará a decisão de qual destes testes será utilizado. Nas seções seguintes serão apresentadas várias maneiras de se planejar estudos e os tipos de testes disponíveis para que o pesquisador analise os resultados. Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight 30 Christine P. Dancey & John Reidy 1.3.1 Variáveis de confusão* Caso se pense no exemplo da caminhada com o cão, percebe-se que existem outros fatores, além da posse do cachorro, que podem afetar o número de encontros sociais das pessoas enquan- to caminham. Alguns destes fatores incluem a timidez de quem está caminhando, a atratividade, o gênero, a raça do cão e diversas outras variáveis. Todossão fatores que o pesquisador não levou em consideração, mas que podem ter influenciado a interação social. Esses fatores são denomi- nados variáveis de confusão. Em qualquer situação de pesquisa, quer em química, física, quer em psicologia, deve-se levar em conta a influência destas variáveis. Se elas forem negligencia- das, as conclusões obtidas do estudo podem não ser confiáveis. Assim, no estudo da caminhada com o cachorro, se as variáveis de confusão não são controladas, não é possível dizer, ao certo, que as diferenças obtidas se devem à propriedade do cachorro. As diferenças podem ocorrer por quaisquer outras combinações das variáveis mencionadas. A principal razão para se fazer pes- quisa em condições de laboratório é tentar manter o controle sobre as variáveis de confusão tanto quanto possível. Poderá ser notado que muitas das questões de pesquisa abordadas neste capítulo foram projetadas com o objetivo de reduzir a influência das variáveis de confusão. Você deve estar ciente de que para cada variável medida existirão várias outras que po- dem estar relacionadas a ela (veja Figura 1.2, por exemplo). Quando um estudo como o da caminhada com o cachorro é conduzido, não é possível termos certeza se é a existência ou não do cão responsável pelas diferenças na interação social. Assim, precisamos tentar elimi- nar as outras variáveis (as de confusão) como possíveis razões para as alterações observadas. Fazemos isto tentando controlar estas variáveis, por exemplo, tentar combinar o máximo possível os participantes com e sem o cão nos aspectos timidez, atratividade e gênero. Ainda, pode-se assegurar que todos os participantes façam a caminhada com o mesmo tipo de cão e que caminhem nos mesmos horários e dias da semana. Uma vez que se tenha controlado estas variáveis, então é possível se ter mais confiança na conclusão de que caminhar com um cão exerce influência sobre o número de interações sociais que uma pessoa terá. Caminhar com ou sem o cão Gênero Atratividade Tipo de cão Dia da semana e hora do dia da caminhada Timidez Número de interações sociais em uma caminhada no parque Figura 1.2 Ilustração das variáveis que podem influenciar o número de interações sociais de uma pessoa. * N. de T. São também utilizados os termos variável de confundimento ou confundidora. Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Estatística sem Matemática para Psicologia 31 1.3.2 Delineamentos correlacionais Expusemos que o principal objetivo da ciência é o entendimento das variáveis. Mais especificamente, desejamos entender como e por que certas variáveis estão relacionadas. Tal- vez a forma mais simples de examinar o relacionamento entre variáveis seja a utilização de delineamentos correlacionais. Em tais projetos, medimos a variável de interesse e verificamos como cada variável se altera em relação às mudanças provocadas na variável de interesse. Um exemplo pode auxiliar a entender a situação. Anteriormente, nesta seção, descrevemos, de forma breve, o estudo de Walsh e Ugamba-Agwunobi (2002) investigando o relacionamento entre ansiedade estatística e procrastinação. Neste estudo, os pesquisadores mediram a ansie- dade estatística com a Escala de Ordenação da Ansiedade Estatística* (Cruise et al., 1985). A escala mede seis componentes da ansiedade estatística, incluindo medo do professor de estatística, autoconceito de habilidades computacionais, ansiedade em aulas e provas, medo de fazer perguntas, ansiedade de interpretação e valor da estatística. Os autores realizaram uma análise correlacional e descobriram que existem relações entre procrastinação e três componentes da ansiedade estatística (medo dos professores de estatística, medo de solicitar ajuda e ansiedade de interpretação). Os pesquisadores concluíram que as variáveis medo da estatística e procrastinação estavam correlacionadas. Isto é, se uma das variáveis mudar a outra também mudará, ou ainda as duas variáveis covariam. Deve-se notar que os termos “re- lacionar”, “correlacionar” e “covariar” são muitas vezes utilizados indistintamente. Outro exemplo excelente de pesquisa conduzida com a utilização de desenho correla- cional é a que verifica a relação entre o hábito de fumar e o câncer. Tem sido geralmente verificado que, à medida que aumenta o consumo de cigarros, o mesmo ocorre com a incidên- cia de câncer. Portanto, existe um relacionamento entre o número de cigarros consumidos e a chance de desenvolver câncer. Se você usar um delineamento correlacional, então o tipo de técnica estatística provavel- mente utilizada será o coeficiente de correlação momento-produto de Pearson** ou talvez o coeficiente de correlação rô de Spearman.*** Tais coeficientes serão abordados nos Capítulos 5 e 15, respectivamente. Oh, não! Acho que lerei isto amanhã. Estatís tica com matem ática Es tat íst ica co m ma tem áti ca Figura 1.3 Relação entre ansiedade estatística e procrastinação. * N. de T. STAR (Statistics Anxiety Ratings Scale, Cruise et al., 1985). ** N. de T. Karl Pearson (1857-1936). *** N. de T. Charles Edward Spearman (1863-1945). Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight Ana Patrícia Highlight 32 Christine P. Dancey & John Reidy 1.3.3 Causação A questão da causação é problemática em ciência, ainda mais quando utilizamos deli- neamentos correlacionais. Um dos principais objetivos da ciência, é descobrir a causa dos acontecimentos. Em todos os ramos da ciência pesquisadores estão tentando determinar relações causais entre variáveis. Por exemplo, Newton* produziu uma teoria elegante para explicar o que causa a queda de maçãs. Estabeleceu uma relação causal entre a queda das maçãs e a gravidade. Em muitas pesquisas psicológicas também tentamos estabelecer tal re- lação causal. Quando usamos delineamentos correlacionais, no entanto, é difícil estabelecer se a alteração em uma variável causa a mudança em outra variável. Isso ocorre porque em tais delineamentos estamos simplesmente observando e registrando mudanças em variáveis e tentando estabelecer se elas covariam de alguma forma que faça sentido. Em virtude de que estarmos apenas observando como as variáveis mudam, é difícil (para não dizer impossível) estabelecer a relação causal entre elas. Para sermos capazes de fazer isto de forma mais fácil, é necessário manipularmos uma das variáveis (mudá-la sistematicamente) e então observar o que acontece com a outra variável. Esta abordagem será discutida mais tarde nesta seção. Uma das regras de ouro do delineamento correlacional é não se poder inferir causação a partir de uma correlação. A indústria do tabaco tem se valido desta fraqueza da correlação para argumentar que não existe evidência de que o fumo cause câncer. Estritamente falando, isso pode estar correto, pois os estudos têm sido principalmente correlacionais. Todavia, con- siderado a quantidade de pesquisas feitas corroborando uma relação causal entre o hábito de fumar e o câncer, alguém seria tolo em ignorar as pesquisas e acreditar nas pessoas que estão tendo lucro com a venda de tabaco. Descobrir que ansiedade estatística e procrastinação estão relacionadas não nos infor- ma muito sobre a relação causal entre estas duas variáveis. Pode ser que o aumento na ansiedade estatística aumente a procrastinação, ou então que alterações na procrastinaçãocausem alterações na ansiedade estatística. De forma alternativa, podem existir outras va- riáveis, tais como uma neurose, que pode causar mudanças tanto na ansiedade estatística quanto na procrastinação (veja Figura 1.4). Você pode ver, portanto, que a existência de um relacionamento entre duas variáveis não nos informa, necessariamente, muita coisa sobre causa e efeito. Neurose Ansiedade estatística Procrastinação Figura 1.4 Possível relação causal entre neurose, ansiedade estatística e procrastinação. * N. de T. Isaac Newton (1642-1727). Estatística sem Matemática para Psicologia 33 Um outro exemplo da limitação do delineamento correlacional é o relacionamento entre ansiedade e depressão. Muitos estudos mostraram que ansiedade e depressão estão altamente relacionadas (veja Clark e Watson, 1991). Pessoas que apresentam altos níveis de ansiedade também apresentam altos níveis de depressão. Poderíamos dizer, então, que depressão causa ansiedade ou ansiedade causa depressão? Não, não podemos. É bastante provável que alguma variável interveniente esteja entre estes dois estados de humor. De fato, o que se tem verificado é que a ansiedade e a depressão apresentam um elemento angustiante geral em comum, e é ele que explica o alto valor do relacionamento entre as duas variáveis (veja Figura 1.5). É possível estabelecer relacionamento causal utilizando delineamentos correlacionais, mas estas situações são bem mais complexas do que os delineamentos indicados nesta seção e envolvem a medida das variáveis em vários pontos no tempo. Angústia Ansiedade Depressão Aqui não existe uma conexão causal direta Figura 1.5 Ilustração do elemento comum compartilhado por ansiedade e depressão e a ausência de uma conexão causal entre eles. 1.3.4 Projeto experimental Para estabelecermos relações causais entre variáveis com mais facilidade, precisamos manipular uma das variáveis de modo sistemático e ver qual o efeito obtido na outra variável. Tal processo é, essencialmente, o realizado no projeto experimental*. Um dos delineamentos ou projetos mais utilizado em ciência é o projeto de experimentos, também denominado de experimento verdadeiro. Se você lembrar de experimentos típicos que realizou, na escola, em química ou física, perceberá que eles representam o projeto de experi- mentos. Por exemplo, queremos ver o que ocorre com o sódio quando exposto ao ar e comparar isto com o resultado de sua exposição à água. Observaríamos uma reação lenta na condição “ar” (a superfície brilhante do sódio torna-se opaca) e uma reação rápida na condição “água” (o sódio torna-se efervescente e pode entrar em combustão). Em um experimento temos uma variável que estamos mensurando (o estado do sódio, denominada de variável dependente) e queremos descobrir que efeito sofrerá a outra variável, denominada de variável independente (por exem- plo, ao que o sódio está exposto). A variável manipulada pelo observador é denominada de variável independente, isto é, o seu valor não é dependente das outras variáveis investigadas. A outra variável do experimento é denominada de variável dependente. Ela é denominada de * N. de T. Os termos em inglês são DOE (Design Of Experiments) e experimental design (utilizado pelos autores). No Brasil são utilizadas as versões: projeto de experimentos, desenho de experimentos ou ainda delineamento de experimentos. 34 Christine P. Dancey & John Reidy dependente porque depende dos valores da variável independente. De fato, o propósito de um experimento é comprovar ou descartar tal dependência. Podemos conduzir tal pesquisa em psicologia, por exemplo, se quisermos verificar que caminhar com o cão de fato influencia o número de encontros sociais. Para conduzirmos tal estudo, tomamos um grupo de pessoas e aleatoriamente sorteamos alguns para caminhar com o cão, enquanto os demais caminham sem o cão. Poderíamos prever que caminhar com o cão acarretará mais encontros sociais do que caminhar sozinho. Dessa forma, estabelecemos uma hipótese que será testada por meio da estatística. Vamos supor que o experimento foi realizado e verificou-se que os que caminharam com o cão tiveram mais encontros sociais do que aqueles que caminharam sozinhos. Este resultado con- firmaria a nossa previsão. Entretanto, existem vários outros fatores que podem ter influenciado na verificação de uma diferença de encontros sociais entre as duas condições (veja Figura 1.2). Como saberemos que a diferença observada foi causada pela manipulação da variável independente em vez de uma das possíveis variáveis de confusão? Não sabemos. O que é possível fazer, neste caso, é tentar limitar o impacto das variáveis de confusão sobre o estudo, pela alocação aleatória dos participantes às condições da variável independente. Por meio da alocação aleatória dos partici- pantes às condições, pode-se reduzir a probabilidade de que os dois grupos difiram em aspectos como timidez, atratividade, gênero e, assim, eliminar estes fatores enquanto causas possíveis da diferença no número de encontros sociais entre os dois grupos. Se a alocação dos participantes às condições for feita de forma aleatória, então poderemos ter mais confiança na nossa habilidade para inferir um relacionamento causal entre a variável independente e a variável dependente (ca- minhar com ou sem cão e número de encontros sociais). É a alocação aleatória que torna o projeto de experimentos tão útil na determinação do relacionamento causal entre variáveis. Dessa forma, uma das principais características definidoras de um projeto de experimen- tos é a alocação aleatória dos participantes às condições. Para utilizar a alocação aleatória, no exemplo mencionado, atribui-se a cada participante um número, ao acaso, gerado em um computador. Pode-se, então, solicitar a todos aqueles cujo número seja inferior a um determi- nado valor que caminhem com o cão e aos demais que caminhem sozinhos. Assim, teremos alocado aleatoriamente os participantes a cada uma das duas condições do estudo. É claro que a alocação aleatória é mais útil para controlar fatores interpessoais, tais como timidez. Existem, entretanto, outros fatores relacionados ao projeto de experimentos que não podem ser controlados pela alocação aleatória dos participantes às condições. Dê uma nova olhada na Figura 1.2 e irá notar que variáveis de confusão, como a hora do dia e o tipo de cão, não serão controladas pela alocação aleatória dos participantes às condições da variável independente. Estas são questões que deverão ser tratadas por outros aspectos do projeto de experimentos, como assegurar que variados tipos de cão sejam utilizados no estudo e que as duas condições sejam realizadas na mesma hora do dia e no mesmo dia da semana. 1.3.5 Projetos quase-experimentais Muitas vezes em psicologia queremos trabalhar com variáveis que não podemos manipu- lar diretamente. Se quisermos comparar homens e mulheres de alguma forma, não podemos manipular o grupo ao qual cada participante pertence. Não é possível alocar aleatoriamente participantes às condições masculino e feminino. Assim, estritamente falando, não temos um projeto experimental. Para ressaltar o fato de que tais projetos não são estritamente experi- mentais, são denominados de projetos quase-experimentais. Como um exemplo, suponha que estejamos conduzindo o estudo da caminhada com o cão mencionado anteriormente e que desejemos remover o gênero como variável de con- fusão. Podemos conduzir um estudo no qual tentamos descobrir se as mulheres têm mais encontros sociais quando caminham sem cão do que os homens. Pode-se ver que neste estudo Estatística sem Matemática para Psicologia 35 os participantes não são alocados aleatoriamente às condições, pois já são homens ou mulhe- res. Assim, temos um projeto quase-experimental. Se for verificado que as mulheres têm mais encontrossociais do que os homens, então será possível argumentar que o fato de ser mulher encoraje mais a interação social. Um dos problemas com os projetos quase-experimentais é a alocação não-aleatória das várias condições que constituem a variável independente. Não podemos ter certeza de que a manipulação da variável independente (ou deveríamos dizer pseudomanipulação) é a res- ponsável pelas diferenças entre as várias condições. Assim, é mais difícil inferir relações causais de projetos quase-experimentais do que de projetos experimentais. Como ilustração, o exemplo anterior pode apresentar algum fator, além do gênero, que distingue os dois grupos (tamanho, por exemplo). Pode ser que as mulheres sejam vistas como menos ameaçadoras em virtude de serem menores do que os homens. Desta forma, uma variável de confusão impor- tante infiltrou-se em nosso estudo. Em virtude do aumento do risco das variáveis de confusão estarem associadas com estudos quase-experimentais, os estudos experimentais devem ser preferidos sempre que possível. Caso você não saiba se está lidando com um projeto experi- mental ou quase-experimental, observe a alocação aleatória dos participantes às condições. Se ela não for uma característica do estudo, então é mais provável que você esteja lidando com um estudo quase-experimental. Outra razão importante para preferir estudos experimentais é o fato de muitas das técni- cas estatísticas utilizadas indicarem que os participantes foram atribuídos aleatoriamente às condições. Se a alocação não foi ao acaso, pode-se ter uma redução na validade das conclu- sões baseadas nestas técnicas estatísticas. Na prática este não é um grande problema, mas você precisa estar ciente de que ele existe. Se você está utilizando um estudo experimental ou quase-experimental, então algumas das técnicas disponíveis para você são: o teste t, o teste U de Mann-Whitney*, o teste de Wilco- xon ** e a análise de variância (ANOVA). Todos eles serão abordados mais adiante no livro. 1.3.6 Panorama dos delineamentos de pesquisa Descrevemos três dos principais delineamentos de pesquisa e como eles influenciam os diferentes tipos de análises estatísticas que podemos utilizar. A Tabela 1.2 fornece um breve sumário das principais características destes delineamentos em conjunto com os testes esta- tísticos que seriam apropriados a cada tipo. Tabela 1.2 Panorama das principais características dos vários delineamentos de pesquisa Delineamento Características Teste estatístico Experimental ■ Manipulação da variável independente ■ Testes t ■ Alocação aleatória dos participantes aos diversos grupos ■ ANOVA ■ Análise por comparação entre os grupos ■ Teste U de Mann-Whitney Quase-experimental ■ Pseudomanipulação da variável independente ■ Testes t ■ Alocação não-aleatória dos participantes ■ ANOVA ■ Análise por comparação entre os grupos ■ Teste U de Mann-Whitney ■ Teste de Wilcoxon Correlacional ■ Investigar o grau com que as variáveis co-variam ■ Correlação de Pearson ■ Não se pode inferir causação a partir de correlação ■ ρ de Spearman ■ Analisar por meio de testes de correlação * N. de T. Henry Berthold Mann (1905-2000) e Donald Ransom Whitney (1915- ). ** N. de T. Frank Wilcoxon (1892-1965). 36 Christine P. Dancey & John Reidy Atividade 1.2 Classifique os seguintes estudos em correlacionais, experimentais ou quase-experimentais: (a) Relação entre o consumo de cafeína e a incidência de dor de cabeça (b) Diferença entre homens e mulheres na habilidade verbal (c) Efeito no desempenho em uma prova na qual participantes são alocados aleatoria- mente a condições sem ruído e com alto ruído (d) Diferenças na auto-estima de pessoas altas e baixas (e) Relacionamento entre estresse e horas gastas trabalhando (f) Diferença em escores de ansiedade entre dois grupos de participantes aleatoriamente alocados, considerando que um grupo aprendeu técnicas de relaxamento e o outro não 1.4 Delineamentos entre e dentre participantes Outra característica importante dos delineamentos de pesquisa é verificar se os partici- pantes fazem parte de mais de uma condição. Retomando o exemplo da caminhada com o cão e encontros sociais, temos um experimento no qual a variável independente é o participante estar caminhando com o cão, e a variável dependente é o número de encontros sociais. Como podemos alocar os participantes às condições neste experimento? ■ Você deve lembrar que se sugeriu como melhor alternativa alocar os participantes aleatoriamente às condições de caminhar com o cão e sem o cão. ■ Existe, no entanto, a alternativa de que cada participante tome parte nas duas condições. O primeiro procedimento é denominado de delineamento entre participantes (algumas vezes também denominado de delineamento independente ou não-correlacionado); o segun- do, de delineamento dentre participantes (algumas vezes denominado de medidas repetidas ou delineamento relacionado). Para decidir qual destes dois procedimentos utilizar, é preciso levar em consideração as vantagens e desvantagens de cada um. 1.4.1 Delineamentos dentre participantes A principal vantagem de utilizarmos o delineamento dentre participantes é podermos con- trolar muitas das variáveis de confusão interindividuais. Quando utilizamos grupos diferentes de pessoas em cada condição, corremos o risco de que exista alguma variável, além da variável independente, que influencie na diferença entre os grupos. Você terá, se isto acontecer, uma variável confundidora ou de confusão. Quando usamos o delineamento dentre participantes te- remos um controle, muito maior, sobre tais variáveis. Em virtude de termos as mesmas pessoas em todas as condições da variável independente, existirão muito menos variações externas entre as condições. Em geral a mesma pessoa trará os mesmos problemas ou vantagens para todas as condições da variável independente. Uma segunda vantagem da utilização deste tipo de delineamento é a necessidade de tra- balhar com menos participantes para realizar o experimento. Por exemplo, se existirem duas condições e necessitamos de um mínimo de 12 participantes por condição, o total necessário para completar o estudo é de 24 pessoas com o delineamento entre participantes, mas apenas 12 no delineamento dentre participantes. Se você estiver realizando um estudo em que os cus- tos envolvidos forem altos, então este delineamento deverá ser levado em consideração. Estatística sem Matemática para Psicologia 37 Entretanto, nem tudo são rosas no jardim do delineamento dentre participantes. Se você pensar um pouco sobre o estudo da caminhada com o cão, será capaz de identificar alguns possíveis problemas. Poderá ocorrer, se utilizadas as mesmas pessoas em ambos os casos, que a familiaridade com o caminho e com outras pessoas, já encontradas, encoraje a inte- ração. Assim, na segunda condição os participantes podem ter mais encontros sociais em virtude desta familiaridade do que pelo fato de ter o cachorro. Por outro lado, eles podem ficar aborrecidos ou cansados quando completarem a caminhada na segunda condição, e isto, talvez, afete o número de encontros sociais que teriam. Esses fatores serão variáveis de confusão e podem dificultar a interpretação dos dados. Qualquer diferença no número de encontros sociais detectada entre as duas condições poderá ter origem nesses fatores, em vez da manipulação experimental da variável independente. Esses fatores são denominados de efeitos de ordem. Uma forma de eliminar os efeitos de ordem é introduzir um contrabalanço no estudo. Para contrabalançar, pode-se fazer metade dos participantes completar a primeira condição e em seguida a segunda condição, enquanto a outra metade segue o mesmo procedimento, mas na ordem contrária. Como forma de introduzir o contrabalanço no estudo da caminhada com o cão, é preciso que a metade dos participantescaminhe primeiro com o cão e depois sem o mesmo, enquanto a outra metade faz o contrário. Qualquer efeito como fadiga ou tédio será, desta maneira, distribuído entre as duas condições da variável independente e não será mais variável de confusão (veja Figura 1.6). Você ainda verificará que cada participante caminhará sob as duas condições, retendo, assim, as vantagens da utilização do delineamento dentre participantes. Outra limitação do delineamento dentre participantes é a maior probabilidade de os par- ticipantes perceberem o objetivo do experimento por terem tomado parte nas duas condições. Trata-se de um problema porque os participantes podem querer fazer o que o experimentador deseja que façam, e não o que normalmente fariam. Isso é denominado de efeito de demanda. É mais provável que ocorra no delineamento dentre participantes porque cada participante é exposto a mais condições experimentais do que no delineamento equivalente entre parti- cipantes. Em certo sentido, o contrabalanceamento pode reduzir, mas não necessariamente eliminar, os efeitos de demanda. Um problema adicional associado ao delineamento dentre participantes é a impossibi- lidade de poder utilizá-lo em muitos projetos quase-experimentais. Por exemplo, se você Todos os participantes Delineamento dentre participantes sem contrabalanceamento Delineamento dentre participantes com contrabalanceamento Caminhando com o cão Caminhando sem o cão Todos os efeitos de ordem na condição “sem o cão” Metade dos participantes Caminhando sem o cão Caminhando com o cão Efeitos de ordem afetando igualmente as duas condições Metade dos participantes Caminhando com o cão Caminhando sem o cão Figura 1.6 Ilustração da forma de eliminar efeitos de ordem pela utilização de contrabalanceamento. 38 Christine P. Dancey & John Reidy quiser comparar encontros sociais de homens e mulheres enquanto estão caminhando, não será possível a utilização do delineamento dentre participantes. Não se pode ter uma pessoa que seja homem e mulher simultaneamente em duas ocasiões separadas, e uma pessoa não pode tomar parte nas duas condições (a menos, é claro, que faça uma mudança de sexo entre a participação nas duas condições). Atividade 1.3 Como você introduziria o contrabalanceamento no seguinte estudo? Um estudo é conduzido para testar os efeitos da motivação no desempenho na tarefa de desenhar sobre um espelho. Os participantes são solicitados a desenhar uma estrela utilizando o equipamento para desenho sobre o espelho. O tempo decorrido para desenhar a estrela e o número de erros são registrados. Os participantes devem, então, realizar a tarefa novamente, mas desta vez ganharão R$ 30,00 se completarem a tarefa mais rápido e com menos erros. 1.4.2 Delineamentos entre participantes Uma das mais importantes características positivas do delineamento entre participantes é, em virtude de se ter grupos diferentes em cada condição das VI, cada participante estar me- nos sujeito a ficar chateado, cansado ou frustrado com o experimento. Como conseqüência, há maior probabilidade de apresentarem desempenho ótimo. De modo semelhante, o experi- mento será menos suscetível a efeitos práticos, e os participantes estarão menos propensos a racionalizar sobre os objetivos do estudo. Esse tipo de delineamento, portanto, reduz os efei- tos de demanda e de ordem, e pode-se, de modo geral, eliminar do experimento esses fatores como variáveis de confusão. O fator negativo é a necessidade de um número maior de participantes do que em um experimento dentre participantes. Ainda, em virtude de cada uma das condições utilizar di- ferentes participantes, perde-se um certo grau de controle sobre as variáveis de confusão interparticipantes. Por exemplo, suponha que você está conduzindo o estudo sobre a cami- nhada com o cão descrito previamente como um delineamento entre participantes. O que ocorre se realmente constatarmos que caminhar com o cão leva a mais encontros sociais? An- tes de podermos aceitar isso como verdadeiro, precisamos nos assegurar de que não existem variáveis de confundimento. Uma variável confundidora importante, em tal estudo, talvez seja a timidez dos que estão caminhando. Pode acontecer, por acaso, de os caminhantes sem o cão serem mais tímidos, e, desta forma, o menor número de encontros se deve a esta variável. Se tivéssemos feito este experimento como um delineamento dentre participantes, teríamos condições de controlar essa variável de confusão, pois cada pessoa caminha com e sem o cão. Isso significa que o nível geral de timidez seria o mesmo sob as duas condições, e essa variável de confusão não existiria. Da discussão referida você pode ver que um problema do delineamento entre partici- pantes é pessoas diferentes trazerem características diferentes às condições do experimento. Quando estamos aleatoriamente alocando participantes às condições, podemos, por acaso, Estatística sem Matemática para Psicologia 39 alocar todos os participantes com uma determinada característica a um grupo, e isso talvez confunda ou mascare os resultados. As técnicas estatísticas que descrevemos neste livro darão indicações da probabilidade de tais circunstâncias aparecerem na nossa pesquisa. A Tabela 1.3 fornece um sumário das vantagens e desvantagens dos delineamentos entre e dentre participantes. Deve ficar claro que as vantagens do delineamento dentre participantes tendem a ser desvantagens no delineamento entre participantes e vice-versa. Tabela 1.3 Sumário das vantagens e desvantagens dos delineamentos entre e dentre participantes Delineamento Vantagens Desvantagens Entre participantes ■ Ausência relativa de efeitos práticos e de fadiga ■ Necessidade de um número menor de participantes ■ Participantes menos sujeitos a se com- portarem de acordo com os objetivos do estudo ■ Grande controle das variáveis de confu- são entre as condições Dentre participantes ■ Necessidade de um número maior de participantes ■ Aumento da probabilidade de efeitos práticos e de fadiga ■ Inexistência de muito controle das va- riáveis de confusão entre condições ■ Participantes com maior probabilidade de adivinhar os objetivos do estudo Atividade 1.4 Como você projetaria um estudo para investigar a possível relação entre cafeína e habili- dade matemática? SPSS para Windows (SPSSPW) Esta seção fornece uma breve introdução ao SPSS para Windows e explica como entrar e salvar dados em um arquivo. Explica ainda a diferença na entrada de dados para os deline- amentos entre e dentre participantes. O básico Primeiro você deve saber algumas coisas básicas sobre programas. O Windows é uma interface gráfica que permite ao usuário manipular ícones e informação textual na tela. Mui- tos programas, tais como o SPSS, apresentam diferentes janelas que você poderá manipular quando necessário. Quando você roda o SPSS para Windows versões 10, 11 e 12 (SPSSPW), verá uma janela perguntando o que quer fazer. 40 Christine P. Dancey & John Reidy Botões de minimizar e reduzir/ampliar* Barras e setas de rolagem A primeira decisão que você precisa tomar é se quer abrir um arquivo de dados já existente ou criar um novo (entrar com novos dados). Para abrir um arquivo existente, selecione a opção Open an existing data source (Abrir uma fonte de dados já existente) da caixa de diálogo (janela) What would you like to do? (O que você gostaria de fazer?). Você deve, então, selecionar o arqui- vo de interesse e clicar em OK para continuar. Se quiser inserir dados, então você deve selecionar a opção Type in data (digitar dados) e clicar em OK. Feito isso, aparecerá a seguinte tela: Painéis (orelhas): Data View (Ver Dados) e Variable View (Visualizar Variáveis) Participantes (casos) = linhas Variáveis = colunas* N. de T. Os autores não falam sobre o ícone , que fecha a janela ativa e também não mencionam que os botões de reduzir e am- pliar são um só e funcionam como uma chave liga/desliga. Estatística sem Matemática para Psicologia 41 Você pode pensar que a janela ativa é muito pequena para mostrar toda a informação disponível. É possível aumentar o tamanho da janela ativa clicando nos botões Minimizar, Re- duzir/Ampliar ( , ou ) no canto superior direito da janela ativa. Aqui, o botão minimiza a janela ativa; reduz uma janela ampliada, e aumenta uma janela reduzida. Minimizar a janela ativa consiste em reduzi-la a um ícone que aparecerá na parte inferior da tela. Se uma janela esti- ver reduzida, você poderá visualizar mais informações se clicar no botão . Se a janela já estiver em seu tamanho máximo, então, para se poder ver mais informações, ela deverá ser rolada (para cima ou para baixo) por meio da barra ou setas situadas no lado direito da janela. Entrada de dados Antes de executar qualquer análise, você precisa fornecer os dados. Note que existem células, que são o encontro das linhas com as colunas. Cada linha de dados que você fornecer representará os dados de um participante, e cada coluna representará os dados de uma variável. Por exemplo, suponha que você deseja rodar um estudo que esteja procurando relações da an- siedade estatística com a procrastinação. Digamos que temos os seguintes dados de entrada: Participantes: P1 P2 P3 P4 P5 P6 Ansiedade estatística: 55 59 48 60 62 50 Procrastinação: 125 132 94 110 140 96 A primeira coisa a fazer é declarar as variáveis no SPSSPW. Para determinar o nome e demais características das variáveis, é preciso selecionar o painel Variable View (Visualizar Variáveis) no final esquerdo da tela. A tela mudará para uma na qual você poderá caracterizar as variáveis do seu arquivo de dados. Painéis: Ver Dados e Visualizar Variáveis Uma célula Na tela de visualização de variáveis (Variable View), as linhas representam variáveis, e as colunas algum tipo de formatação da variável. Você precisa fornecer o nome de cada variável na primeira coluna, denominada de Name (Nome). Clique na primeira linha desta coluna e digite o nome da variável. Temos duas variáveis para serem declaradas, a ansiedade estatística 42 Christine P. Dancey & John Reidy e a procrastinação. Digite no nome da primeira variável: statsanxiety. Você precisa levar em conta as seguintes regras quando quiser nomear variáveis: ■ Não se usa mais do que 16 caracteres. Por exemplo, statsanxiety é válido, mas statisticsanxiety não. ■ Nas versões anteriores ao SPSS 12, o nome só pode ter até 8 caracteres. ■ Não é possível utilizar marcas de pontuação ou espaços. Por exemplo, statsanxiety é válido, mas stats anxiety não.* ■ Não é preciso se preocupar com letras maiúsculas, pois o SPSSPW converterá todo o nome para letras minúsculas. Uma vez que você tenha digitado statsanxiety na primeira célula, clique na próxima cé- lula abaixo e digite o nome da segunda variável. Lembre que ele só pode ter até 16 caracteres (8 para as versões anteriores ao SPSS 12). Você poderá denominá-la procrastination. Quando tiver digitado o nome da segunda variável, a tela deverá ser semelhante à seguinte. Nomes das variáveis As variáveis foram declaradas, então você pode agora entrar com os dados. Para fazer isso, você precisa selecionar o painel (no fundo esquerdo da tela) Data View (Visualizar Da- dos), obtendo a seguinte tela: * N. de T. Se quiser ou precisar separar o nome de uma variável, utilize o underscore ( _ ). Estatística sem Matemática para Psicologia 43 Os dados da ansiedade estatística devem ser digitados nesta coluna Os dados da procrastinação devem ser digitados nesta coluna Você poderá notar que as duas primeiras colunas estão rotuladas como statsanxiety e procrastination. Lembre-se que na tela de visualização de dados (Data View) as colunas são variáveis e as linhas são participantes. Desta forma, todos os dados da ansiedade estatística (statsanxiety) deverão ser digitados na primeira coluna, e os da variável procrastinação (pro- crastination), na segunda. Vá adiante e entre com os dados apresentados anteriormente. Uma vez feito isso, a tela deverá ser semelhante à seguinte: Menu File (Arquivo) Você pode visualizar aqui os dados que foram digitados. 44 Christine P. Dancey & John Reidy Salvando os dados Após ter fornecido os dados, é uma boa idéia salvá-los em um arquivo. Isso evitará que tenha de digitá-los novamente caso queira realizar outras análises no futuro. Para salvar os dados, é necessário colocar o ponteiro do mouse sobre o item de menu File (Arquivo) e clicar com o botão esquerdo do mouse. O seguinte menu será apresentado. Selecione a opção Save As (Salvar Como) Mova o ponteiro do mouse e clique na opção Save As... (Salvar Como) e então a se- guinte caixa de diálogo irá aparecer. Ela é denominada de caixa de diálogo porque é onde você diz ao SPSSPW o que ele deve fazer. Digite o nome do arquivo na linha (em branco) denominada File name (Nome do arquivo) e clique no botão OK. Seus dados estarão salvos neste arquivo. Convém lembrar que o nome de um arquivo deve obedecer às seguintes regras: ■ A primeira parte é um nome que faça sentido para você (p. ex., statsanxiety). ■ A segunda parte deve ser sempre SAV para um arquivo do SPSSPW (esta parte é denominada de extensão do arquivo). ■ A primeira e a segunda parte serão sempre separadas por um ponto.* Assim, o nome do nosso arquivo de dados será statsanxiety.sav. De fato, você não digitou .sav nem precisará fazê-lo, pois o SPSSPW faz isso automaticamente. Sempre que você visua- lizar um nome de arquivo terminando em .sav, poderá ter uma confiança razoável de que ele é um arquivo de dados do SPSSPW. Se você esquecer o nome do seu arquivo, procure entre os que apresentam a extensão .sav. * N. de T. Variáveis e projeto de pesquisa. Estatística sem Matemática para Psicologia 45 Digite o nome do arquivo aqui Entrando com os dados para os delineamentos dentre e entre participantes Descrevemos como fornecer e salvar dados no SPSSPW. No entanto, diferentes de- lineamentos requerem diferentes entradas de dados. A maneira recém descrita é para um delineamento correlacional. Se você quiser fornecer dados para os delineamentos entre par- ticipantes, então o procedimento é o seguinte. Digamos que você conduziu recentemente o estudo da caminhada com o cão com um delineamento entre participantes. Suponha que os dados obtidos para a variável “número de encontros sociais” sejam os seguintes: Caminhando com o cão: 9 7 10 12 6 8 Caminhando sem o cão: 4 5 3 6 5 1 Neste delineamento, caminhar com e sem o cão é a variável independente, e o número de encontros sociais, a variável dependente. Quando entrarmos com os dados no SPSSFW, precisamos determinar uma variável independente e uma variável dependente. A primeira coisa a ser feita é nomear as variáveis, na tela Variable View (Visualizar Variáveis). Quando se declarar a variável independente, é necessário prestar atenção, pois é aqui que a maioria dos erros ocorre. Quando tivermos grupos diferentes de pessoas em cada condição da variá- vel independente, precisamos definir uma variável de agrupamento (grouping variable) no SPSSPW. Devemos deixar o SPSSPW saber em qual dos dois grupos cada participante está. Defina a variável conforme a seguinte ilustração: 46 Christine P. Dancey & John Reidy Clique nas reticências Se você deixar as variáveis como definidas pelo software, poderá ter dificuldades para interpretá-las, uma vez que não haverá rótulos para identificá-las de acordo com as diferentes condições da VI. Assim, é uma boa idéia detalhar os nomes das condições da VI. Você deve notar que, quando clica na primeiracélula da coluna rotulada como Values (Valores), reticên- cias aparecem. Isso indica que você pode fornecer informações adicionais para esta coluna. Clique nas reticências e obterá a seguinte caixa de diálogo. Digite o número do primeiro grupo aqui Digite o nome do grupo aqui Clique em Add (Adicionar) para confirmar os detalhes Estatística sem Matemática para Psicologia 47 Temos duas condições para a variável independente, às quais precisamos atribuir núme- ros. Iremos rotular o grupo “caminhando com o cão” de grupo 1 e o grupo “caminhando sem o cão” como grupo 2 (ou vice-versa). Digite 1 na linha (caixa) Value (Valor) e “caminhando com o cão” (Walking with a dog) na linha (caixa) Value Label (Rótulo). Feito isso, clique em Add (Adicionar), e você verá que os detalhes aparecem na última linha (caixa). Agora digite 2 na linha Value e “caminhando sem o cão” (Walking without a dog) na linha Value Label e clique Add. A caixa de diálogo deverá ser semelhante a esta: Clique em OK para retornar à tela Data View (Ver Dados). Sempre que desejar que o SPSSPW saiba os nomes dos grupos, você pode fazer isso adicionando informações na colu- na Values (Valores). Agora vamos definir as variáveis. Para entrar com os valores reais dos dados, clique no painel Data View (Visualizar Dados). Quando os dados forem postos na coluna group (gru- po), digite 1 se a pessoa estiver no grupo com o cão e 2 se a pessoa estiver no grupo sem o cão. Assim, você poderá verificar que a primeira coluna conterá apenas os valores 1 ou 2. Na segunda coluna, você deverá entrar com o número de encontros sociais de cada pessoa, como está na sua variável dependente. Você deverá ser capaz, observando a tela de entrada, de ver que o participante número 4 está no grupo com o cão (grupo 1) e que ele teve 12 encontros sociais. Também verá que o participante numero 12 está no grupo sem o cão (grupo 2) e que teve uma caminhada solitária com apenas um encontro. 48 Christine P. Dancey & John Reidy Variável dependente Variável de agrupamento Delineamentos dentre participantes Quando há um delineamento dentre participantes, temos que entrar com os dados de uma maneira diferente. Se utilizarmos o exemplo anterior, no delineamento dentre participantes cada pessoa completará a caminhada, tanto na condição com o cão quanto sem o cão. Os dados para este estudo terão a aparência mostrada na tela seguinte: Cada pessoa tem um escore nas duas condições Estatística sem Matemática para Psicologia 49 Você pode estar se perguntando por que temos de entrar com os dados de forma dife- renciada para cada um dos diferentes delineamentos. É que cada linha da entrada de dados representa a informação de um participante. Se você tem um delineamento entre participan- tes, precisa informar ao SPSSPW qual o escore de cada participante e a qual grupo pertence. Quando o delineamento é dentre participantes, cada um atua sobre as duas condições, e desta forma, se tem dois escores. Você precisa fazer com que o SPSSPW saiba o que ambos estes escores significam. Em virtude de cada participante atuar nos dois grupos, não será neces- sário informar ao SPSSPW o grupo, por meio de uma variável de agrupamento. Você pode perceber, assim, a diferença dos delineamentos dentre e entre participantes através da variá- vel de agrupamento. Se esta variável existir, trata-se do delineamento entre participantes. Você deve notar, a partir do detalhe da tela, que definimos duas variáveis, uma para a condição com o cão e outra para a condição sem o cão. Ainda, em virtude de não haver a variável de agrupamento, não temos de atribuir rótulos de grupos para qualquer variável na tela Variable View (Visualizar Variável). Definir as variáveis para esse tipo de delineamento é, dessa forma, mais simples do que para o delineamento entre participantes. Utilizando as facilidades da ajuda (Help) do SPSSPW É uma boa idéia praticar utilizando as facilidades da ajuda do SPSS para Windows. Você pode iniciar rodando o tutorial que está disponível para você. O tutorial pode ser iniciado sempre que se iniciar o SPSSPW. Você pode notar que a primeira opção na primeira caixa de diálogo que você vê no SPSSPW é rodar o tutorial (Run the tutorial). Selecione esta opção para rodar o tutorial Você pode acessar o tutorial a qualquer hora durante uma sessão. Basta clicar no menu Ajuda (Help) e selecionar o tutorial (Tutorial) a partir daí. 50 Christine P. Dancey & John Reidy Botões de navegação Uma vez iniciado o tutorial, você estará na introdução às facilidades da ajuda do SPSSPW. Você irá notar quatro ícones no canto inferior direito da tela. Estes ícones permitem que você navegue da forma que desejar em torno dos tópicos do tutorial. O ícone com a lupa fornece um índice de tópicos. O ícone com a casa leva você aos conteúdos de cada tópico, enquanto os ícones com as setas à esquerda e à direita levam para as telas anteriores e posteriores, respec- tivamente. Quando você clica no ícone de conteúdo (casa), obtém uma lista de assuntos. Você deve então clicar no tópico desejado para que o tutorial possa ajudá-lo. Estatística sem Matemática para Psicologia 51 Clique no tópico para obter um tutorial sobre ele Lembre que você pode chamar o tutorial sempre que precisar. Resumo Neste primeiro capítulo expusemos os conceitos básicos para um entendimento da pes- quisa e do projeto de pesquisa. Você aprendeu que: ■ Variáveis se diferenciam em termos de precisão. Isto é, elas podem ser: – Contínuas quando assumem qualquer valor em dado intervalo (p. ex., 10 ou 10,2365) – Discretas quando assumem apenas certos valores especifi cados dentro de um de- terminado intervalo (p. ex., 9 ou 10) – Categóricas quando os valores assumidos são categorias, em vez de valores pura- mente numéricos (p. ex., gênero: masculino ou feminino). ■ Existem três principais delineamentos de pesquisa: – Delineamentos correlacionais, que examinam as relações entre variáveis e não apresentam, num sentido estrito, variáveis dependentes ou independentes. Você não pode inferir causação a partir de correlações. – Delineamentos experimentais, que envolvem alocação aleatória de participantes às condições de variável independente. – Delineamentos quase-experimentais, que envolvem investigar grupos fechados, tais como homens e mulheres, e, desta forma, não utilizam alocação aleatória de participantes às condições. ■ Nos experimentos, a variável independente é manipulada pelo pesquisador para veri- fi car como ela afeta a variável dependente. ■ Os delineamentos entre participantes são aqueles nos quais nós temos participantes diferentes para cada condição da variável independente. ■ Os delineamentos dentre participantes são aqueles nos quais cada participante é ava- liado sob todas as condições da variável independente. 52 Christine P. Dancey & John Reidy Exercícios para o SPSSPW As respostas de todos os exercícios e das questões de escolha múltipla podem ser encon- tradas em seção própria ao final do livro. Exercício 1 A Dra. Gênio realizou um estudo comparando a memorização de adjetivos com a de substantivos. Ela alocou aleatoriamente 20 participantes a duas condições. Então, apresentou a um dos grupos de 10 participantes uma lista de 20 adjetivos e ao outro grupo (também com 10 participantes) uma lista de 20 substantivos. Em seguida, solicitou a cada grupo que ten- tasse lembrar o número máximo possível de palavras apresentadas. Ela obteve os seguintes resultados: Adjetivos: 10, 6, 7, 9, 11, 9, 8, 6, 9, 8 Substantivos: 12, 13, 16, 15, 9, 7, 14, 12, 11, 13 1. Qual é a variável independente neste estudo? 2. Qual é a variável dependente? 3. Este é um delineamento dentre ou entre participantes? 4. É um projeto experimental, quase-experimental ou correlacional?5. Entre com os dados no SPSSPW de forma apropriada para o delineamento do expe- rimento e salve os dados em um arquivo. Exercício 2 Utilizando os dados do exercício 1: ■ Se você entrou com os dados como um delineamento dentre participantes, entre com os dados agora como um delineamento entre participantes. ■ Se você entrou com os dados como um delineamento entre participantes, entre com os dados agora como um delineamento dentre participantes. Salve os dados em um arquivo utilizando um nome diferente do anterior. Estatística sem Matemática para Psicologia 53 QUESTÕES DE MÚLTIPLA ESCOLHA 1. Qual das seguintes constitui uma variável contínua? (a) Número de vezes que um escore de 180 é al- cançado em um jogo de dardos (b) Gênero (c) Temperatura (d) Todas as anteriores 2. O projeto experimental é caracterizado por: (a) Menos do que duas condições (b) Sem controle das condições (c) Alocação aleatória dos participantes às condi- ções (d) Nenhuma das anteriores 3. Em um estudo no qual o gênero é a variável a ser manipulada, a VI é: (a) Dentre participantes (b) Correlacional (c) Entre participantes (d) Nenhuma das anteriores 4. Qual das seguintes assertivas é verdadeira para o delineamento correlacional? (a) Ele não apresenta variável independente nem variável dependente (b) Procura relacionamentos entre variáveis (c) Não se pode inferir causação a partir de cor- relação (d) Todas as anteriores 5. Qual das seguintes pode ser considerada uma va- riável categórica? (a) Gênero (b) Marca de carro (c) Cor do cabelo (d) Todas as anteriores 6. O delineamento dentre participantes pode ser: (a) Tanto quase-experimental quanto experimental (b) Somente experimental (c) Somente quase-experimental (d) Somente correlacional 7. Qual das seguintes declarações é verdadeira para experimentos? (a) A variável independente é manipulada pelo pesquisador (b) A variável dependente é assumida como de- pendente sobre a variável independente (c) Os experimentos são difíceis de serem reali- zados (d) Alternativas (a) e (b) 8. O projeto quase-experimental apresenta: (a) Uma variável independente e uma variável dependente (b) Alocação não-aleatória dos participantes às condições (c) Nem variável independente nem variável de- pendente (d) Alternativas (a) e (b) 9. Qual assertiva descreve uma variável contínua? (a) Pode assumir certos valores discretos em um faixa de valores (b) Pode assumir qualquer valor dentro de uma faixa de escores (c) Pode ser caracterizada por categorias (d) Nenhuma das anteriores 10. Quais dos seguintes são problemas associados com o delineamento dentre participantes? (a) Existe uma maior probabilidade de efeitos prá- ticos e de fadiga (b) Os participantes apresentam maior probabili- dade de perceber a natureza do estudo (c) Não pode ser utilizado com projetos quase- experimentais (d) Todas as anteriores 11. De acordo com Streiner (2002), qual a eficiência de estudos que dicotomizam variáveis quando compa- rados com estudos que não o fazem? (a) 100% (b) 95% (c) 67% (d) 50% 12. Certo pesquisador acabou de conduzir um estudo correlacional investigando o relacionamento da quantidade de álcool ingerida por fãs do time da casa antes de um jogo de futebol e o número de gols marcados pelo time. Constatou-se que existe um relacionamento entre as duas variáveis. Qual das seguintes afirmações é válida? (a) A quantidade de álcool ingerido está relacio- nada com a habilidade do time de fazer gols, mas não se pode afirmar que seja a causa dos gols marcados (b) A habilidade do time da casa de marcar gols não está relacionada com a quantidade de álcool ingerida, mas com a quantidade de in- centivo dada pelos fãs que bebem (c) Um aumento na quantidade ingerida de ál- cool causa um aumento no número de gols marcados (d) Todas as anteriores 13. Em um projeto dentre participantes com duas con- dições, se você não utilizar o contrabalanceamento das condições, seu estudo poderá sofrer: (a) Efeitos de ordem (b) Efeitos da hora do dia 54 Christine P. Dancey & John Reidy (c) Falta de participantes (d) Todas as anteriores 14. Você conduziu um estudo mostrando que, quanto mais cedo as pessoas levantam, mais tarefas elas conseguem executar. Qual das seguintes conclu- sões é válida? (a) Não existe necessariamente uma relação causal entre levantar cedo e a quantidade pro- duzida de trabalho (b) Pessoas que levantam cedo precisam trabalhar mais (c) Levantar cedo é a causa de mais trabalho ser produzido (d) As alternativas (b) e (c) 15. Com qual dos seguintes projetos (delineamentos) é menos provável que se possa estabelecer relacio- namentos causais entre variáveis? (a) Projeto experimental (b) Projeto quase-experimental (c) Projeto correlacional (d) Delineamento dentre participantes 16. Efeitos de demanda são possíveis variáveis de con- fusão nas quais: (a) Os participantes se comportam de acordo com o que o pesquisador quer (b) Os participantes apresentam baixo desempe- nho, pois estão cansados ou chateados (c) Os participantes apresentam bom desempenho, pois praticaram as tarefas do experimento (d) Nenhuma das anteriores 17. Suponha que você quer conduzir um estudo para verificar se pessoas depressivas roem mais as unhas do que pessoas não-depressivas. Qual dos seguintes será a melhor maneira de proceder? (a) Medir a depressão dos participantes com um questionário e então solicitar que atribuam um escore sobre o quanto roem as unhas. Após, classificar os participantes como “de- pressivos” e “não-depressivos” com base nos resultados do questionário. Podemos verificar, então, se existe ou não diferenças no quanto roem as unhas. (b) Como a situação (a) acima, mas sem dividir os participantes em dois grupos. Utilizar os escores de depressão obtidos e verificar se existe uma relação entre roer as unhas e de- pressão. (c) Este tipo de estudo é impossível de ser execu- tado; portanto não deve ser tentado. (d) Nenhuma das anteriores 18. Qual das seguintes seria a variável independente apropriada em um estudo quase-experimental? (a) Gênero (b) Se alguém apresenta ou não distúrbio de an- siedade generalizada (c) Estudantes versus não-estudantes (d) Todas as anteriores 19. Em um delineamento dentre participantes, os efei- tos de ordem ocorrem quando: (a) Os participantes ficam cansados nas últimas condições (b) Os participantes têm o mesmo desempenho em todas as condições (c) Os participantes têm problemas para obter be- bida no bar (d) Nenhuma das anteriores 20. Qual dos seguintes problemas está associado com a dicotomização de variáveis contínuas? (a) Perda de poder experimental (b) Ocorrência de efeitos espúrios (c) Existência de uma séria perda de informação (d) Todas as anteriores Referências AITKEN, M. A personality profile of the student procrastinator. Tese de doutorado não-publicada, Universidade de Pittsburg. (Dissertation Abstracts International, 43, p. 722-32 A), 1982. CLARK, L. A., WATSON, D. Tripartite model of anxiety and depression: psychometric evidence and taxonomic implications. Journal of Abnormal Psychology. v. 100, p. 316-36, 1991. CRUISE, R., CASH, R., BOLTON, D. Development and validation of an instrument to measure statistical anxiety. 1985. Artigo apresentado na reunião anual da Seção de Educação Estatística e reimpresso nas atas da Associação Americana de Estatística. DORLING, D. et al. A good place to bury bad news? Hiding the detail in the geography on the Labour Party’s website. The Political Quarterly. v. 73, p. 476-92, 2002. EGLOFF, B. HOCK, M. Assessing attention allocation toward threat-related stimuli: a comparison of the emotional Stroop task and the attentional probe task. Personality
Compartilhar