Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 As Variedades de Testes e Interpretações de Testes1 Lee J. Cronbach Stanford University 2A. Alguns testes são padronizados, alguns são objetivos, alguns possuem normas. Como diferem esses aspectos? Por que eles são importantes? 2B. Quais são as vantagens e os riscos potenciais numa avaliação impressionista? 2C. Como podemos reconhecer se um teste mede o desempenho máximo ou a resposta típica? . 2D. Como o computador pode ampliar o alcance e a exatidão da testagem? 2E. Às vezes, o tipo de comportamento obtido como amostra num teste é de interesse direto; outras vezes, ele é apenas uma base para a inferência de outras características. Que objetivos de mensuração levam a cada tipo de interpretação? Abreviações deste capítulo: ASVAB para Armed Services Vocalional Aplilude Battery; EFT para Teste das Figuras Inseridas (Embedded Figures Test). O QUE É UM TESTE? A palavra "teste" normalmente nos faz pensar numa série de perguntas-padrão para as quais o examinando dá respostas escritas ou orais. Mas o teste prático para tirar carteira de motorista não tem perguntas nem respostas, e o procedimento varia de um examinador para outro. A tarefa estabelecida para o motorista não pode ser padronizada, assim como o tráfego através do qual os motoristas devem manobrar irá variar de uma hora para outra. Talvez a seguinte definição seja suficientemente ampla para abranger os procedimentos com os quais este livro se ocupa: um teste é um procedimento sistemático para observar o comportamento e descrevê-lo com a ajuda de escalas numéricas ou categorias fixas. "20/100" localiza a acuidade visual numa escala numérica; "Cegueira para a cor vermelha/verde" refere-se a uma categoria. Por "sistemático" eu quero dizer que a examinadora coleta informações questionando ou observando da mesma maneira uma pessoa depois da outra, na mesma situação ou em situações comparáveis. Esta definição inclui questionários para obter relatos sobre a personalidade, procedimentos para observar o comportamento social, testes com aparelhos para medir a coordenação e, inclusive, registros de produção numa linha de montagem. Como foi dito no Capítulo 1, "avaliação" é uma palavra mais ampla do que "testagem" quando (como é comum) ela significa integrar e avaliar informações. A avaliação de um indivíduo normalmente irá considerar testes juntamente com uma história de caso e entrevistas. Mas o termo também tem sido aplicado a levantamentos estatísticos baseados unicamente em testes ("National Assessment of Educational Progress") e a medidas experimentais limitadas ("avaliação do medo de cobras"). Um teste pode constituir uma peça só, os escores para as respostas ou partes sendo ignorados quando o total é obtido. Em outros testes, os resultados parciais são transportados para interpretação. Quando vários resultados parciais são computados lado 1 PARA CITAR O TEXTO (ISO): CRONBACH, Lee. As Variedades de Testes e Interpretações de Testes In: CRONBACH, Lee. Fundamentos da Testagem Psicológica. Porto Alegre: Artes Médicas, 1996. Cap. 02. p. 50-69. ISBN: 85-7307-180-X 2 a lado em escalas comparáveis, este gráfico é chamado de "perfil". (As partes são às vezes referidas como "subtestes". As vezes, as partes são chamadas de "testes" e o todo é chamado de "bateria". Essas diferenças de terminologia não são importantes.) Os significados de teste de lápis-e-papel, teste com aparelhos, teste oral e assim por diante devem estar óbvios. Embora todos os dados comportamentais reflitam algum tipo de desempenho, um teste de desempenho normalmente se refere a uma tarefa que requer uma resposta física. Entre os testes de desempenho que têm sido utilizados estão consertar uma peça de um aparelho eletrônico, desenhar a figura de um homem, encadear contas e "inventar" um cabide com duas varetas longas e uma braçadeira em formato de C. Embora seja uma tarefa verbal, responder a uma entrevista em francês também é um teste de desempenho. Os testes de grupo permitem testar muitas pessoas ao mesmo tempo. Os testes individuais permitem a observação de reações e o seguimento de uma resposta indefinida. Muitos testes possuem versões individuais e grupais. A administração por computador obscurece essa antiga distinção no sentido de que a administração é individual, mas os exercícios normalmente são semelhantes aos de um teste de grupo. Os procedimentos de padronização de testes tornaram-se uma preocupação por volta de 1900. Naquela época, cada laboratório de psicologia tinha o seu próprio método para medir o intervalo de tempo da memória, tempo de reação e assim por diante. Conseqüentemente, era difícil comparar achados de pesquisa. Igualmente, quando cada professora usava um teste diferente, era difícil para os supervisores escolares avaliarem se os alunos estavam aprendendo a soletrar corretamente. Um teste é considerado padronizado quando as palavras e os atos da examinadora, o aparelho e as regras de avaliação foram fixados, de modo que os resultados coletados em momentos e lugares diferentes são inteiramente comparáveis. Se a padronização é completamente efetiva, todas as examinadoras "aplicam o mesmo teste". Como veremos mais tarde neste capítulo, esta declaração não significa necessariamente que todas se deparam com as mesmas perguntas. Se um procedimento é objetivo, todos os observadores de um desempenho chegam à mesma conclusão. Para atingir a objetividade, todos devem prestar atenção aos mesmos aspectos do desempenho, registrar as observações para eliminar erros de memória e avaliar os resultados através das mesmas regras. A objetividade pode ser julgada comparando-se os resultados assinalados por observadores independentes. Quanto mais subjetivas a observação e a avaliação, menos os juízes concordam. Os testes em que o examinando escolhe a melhor resposta (isto é, os testes de verdadeiro-ou-falso ou de múltipla escolha) possuem uma avaliação objetiva. Em contraste, um teste de redação normal ocasiona grande desacordo entre os avaliadores. Entretanto, através do uso de cuidadosas instruções ao observador ou examinador, os números atribuídos às respostas escritas e às observações podem ser tornados bastante objetivos. A objetividade e a padronização geralmente andam juntas, mas um teste com procedimentos livres pode ser pontuado por uma regra definida, e um procedimento padronizado pode ter uma pontuação baseada em julgamento. Uma tabela de normas informa como os escores se distribuem em alguma população relevante. Os testes que possuem normas às vezes são chamados de "testes padronizados". Não estou utilizando a palavra nesse sentido, porque desejo enfatizar a 3 padronização do procedimento. Um teste cujos procedimentos não são padronizados pode ter uma tabela de normas, mas as normas não significam muito. (Os termos "referendados na norma" e "referendados no critério" não designam tipos de testes; eles se referem a interpretações, como será explicado no Capítulo 4.) 1. Avalie cada uma dessas declarações como verdadeira ou falsa e justifique sua resposta: a. As médias de arremessos (no beisebol ou criquete) são objetiva mente determinadas. b. A corrida com barreiras de 220 jardas é um teste padronizado. c. A professora pede a todos os alunos de sua classe que leiam o mesmo artigo de uma revista atual. Depois de três minutos, o tempo termina e cada aluno marca o lugar em que está lendo. O aluno então conta o número de palavras lidas e computa sua velocidade de leitura de palavras por minuto. Este escore é comparado com uma tabela de velocidades médias de leitura de artigos típicos de revistas. Este teste é altamente objetivo. d. O teste descrito em c é padronizado. 2. Os testes psicológicos geralmente partem de procedimentos simples. A Dra.Glass julga que pode obter informações úteis colocando uma folha de papel numa mesa, ao alcance do braço do examinando, e lhe pedindo para tocar com o lápis exatamente no centro de um círculo impresso no papel. Pede-se à pessoa que retire sua mão e repita o movimento, tão rápida e exatamente quanto possível, até que lhe digam para parar. A Dra. Glass atribui uma nota de 1 a 10 a cada lima das seguintes qualidades: velocidade, cuidado e persistência. Que aspectos do procedimento precisaríamos levar em conta para padronizar o teste? 3. Levantamentos do moral nas fábricas podem utilizar perguntas criadas pelo chefe de pessoal da fábrica ou seus consultores. Que vantagens e desvantagens existiriam na utilização das mesmas perguntas em muitas companhias? 4. A tarefa de desenho com cubos (veja a Figura 3.1) é um dos procedimentos de testagem mais populares. A pessoa constrói um padrão com cubos coloridos, igual à amostra impressa. O teste é utilizado principalmente no aconselhamento de crianças, diagnóstico clínico e mensuração da capacidade geral de pessoas que se saem mal em testes verbais. Ele também é empregado nas pesquisas sobre a frustração e sobre as diferenças culturais. Muitas versões do teste (itens diferentes, diferentes regras de avaliação, etc.) são utilizadas em diferentes clínicas e países. Quais são as possíveis vantagens e desvantagens dessa diversidade? 5. Os membros dos departamentos de ensino de lima escola preparam um teste de múltipla escolha a ser utilizado em todos os departamentos. Este teste é "padronizado", conforme o termo é empregado aqui? Se apenas um professor prepara e utiliza o teste em todos os departamentos, ele é "padronizado"? 6. Um teste de redação pode ser um teste padronizado? 4 Estilos de Testagem Psicométrica e Impressionista Os métodos de coleta de informações variam de um extremo psicométrico a um extremo impressionista. O maior contraste está na ênfase colocada na padronização e na objetividade, que são máximas no extremo psicométrico. Existe uma diferença também na interpretação; algumas examinadoras querem "medir" o indivíduo, algumas querem "caracterizá-lo". A testagem psicométrica resume o desempenho em números. Seu ideal é expresso em dois famosos pronunciamentos antigos: - Se uma coisa existe, ela existe em certa quantidade. - Se existe em certa quantidade, ela pode ser medida. Observem a suposição de que a psicóloga se preocupa com "coisas", com elementos ou traços que de algum modo "existem". Considera-se que todas as pessoas possuem os mesmos traços (isto é, assertividade ou compreensão mecânica), mas em quantidades diferentes. Esta visão da investigação psicológica toma como exemplo a ciência física, que identifica aspectos comuns de objetos diferentes. Os números representando dimensões abstratas - peso, velocidade e intensidade de energia de um certo comprimento de onda - servem para descrever rochas e foguetes, velas e vaga-lumes. Uma abordagem psicométrica é mais proveitosa quando uma pergunta bem definida deve ser respondida, e quando o intérprete tem experiência suficiente para traduzir a mensuração numa estimativa do provável resultado de cada curso de ação disponível. Um estilo impressionista de avaliação busca a descrição individualizada. O psicólogo tenta ser um observador sensível que percebe as deixas através de todos os meios possíveis e cria uma interpretação integrada. Para este examinador, até um teste focalizado é uma oportunidade de estudar a pessoa como um todo. O impressionista não se satisfaz com uma estimativa numérica do nível de capacidade. Ele quer saber como a pessoa expressa sua capacidade, que tipos de erros comete e por quê. Para avaliar o background de uma pessoa, o examinador psicométrico apresentaria uma lista de verificação abrangendo experiências que muitas pessoas têm (por exemplo, “Você foi líder de seu grupo de escoteiros ou bandeirantes?”. Ele contaria os itens verificados para conseguir escores para, digamos, "interesse por esportes" e "experiência de liderança". O impressionista, por outro lado, talvez não estabelecesse tarefas mais definidas do que "Por favor, escreva a história da sua vida em 2.500 palavras". Ele observaria aquilo que a pessoa considera importante relatar e também seu tom emocional. A resposta livre fornece informações não - sistemáticas, mas abrange questões que a lista de verificação ignora. O estilo psicométrico é marcado pela qualidade definida da tarefa, objetividade dos registros, rigor na avaliação e nos dados combinantes e ênfase na validação. Ao salientar essas características do estilo psicométrico, não quero dizer que a testagem psicométrica necessariamente possui todas essas características simultaneamente. 5 A maioria das aplicações de testes é psicométrica em certos aspectos e impressionista em outros. O mensurador precisa recorrer ao julgamento quando aplica informações de escores no ensino, terapia ou supervisão de empregados. E o retratista deve prestar atenção aos fatos da mensuração. Quanto mais excepcional a pessoa sendo estudada, ou quanto mais sem precedentes a decisão a ser tomada, maior a necessidade de estruturar perguntas e procedimentos que se ajustem ao caso. Este livro é primariamente uma apresentação das idéias e métodos da tradição psicométrica, mas o examinador impressionista precisa compreendê-los, ainda que apenas como um ponto de partida. Vamos examinar os contrastes com mais detalhes, começando com a estrutura da tarefa. O examinando pode receber uma tarefa definida ou uma tarefa vaga. Aquele que vai escrever um ensaio autobiográfico está livre para empregar qualquer estilo e introduzir qualquer conteúdo. Isso não acontece quando ele é solicitado a assinalar atividades numa lista impressa. Diz-se que uma tarefa é estruturada quando todas as pessoas a interpretam da mesma maneira. A estruturação obtém uma resposta definida para uma pergunta formulada antecipadamente. O criador do teste pode pedir aos examinandos para construírem suas próprias respostas, ou pode oferecer uma escolha entre alternativas de respostas fixas. Nós podemos falar, então, de testes de resposta-de-escolha e resposta-construída ("resposta-livre"). Os examinadores psicométricos geralmente optam pela resposta de escolha, de modo a tornar o teste mais estruturado. Um entrevistador poderia perguntar: "Você fica à vontade em reuniões sociais?". Um examinador mais psicométrico oferece alternativas como SEMPRE, MUITAS VEZES, ÀS VEZES, NUNCA. Um item de conclusão de séries numéricas (7 5 8 6 9 ...) pode ser de resposta com final aberto ou apresentar escolhas de resposta. O formato de escolha facilita a avaliação, mas o comportamento apresentado é menos rico. Até num item de série de números podem aparecer diferenças. Uma pessoa diz "Sete" diretamente; outra, hesitantemente, diz "Bem, poderia ser sete. Acho que está certo". Os psicólogos que preferem respostas com final aberto valorizam as observações suplementares. A professora de inglês prefere avaliar um aluno a partir de uma amostra de redação livre e não através de testes em que ele meramente identifica erros. A professora de matemática quer que seus alunos resolvam problemas, não apenas selecionem a melhor de várias alternativas. No Capítulo 9, eu apresento as evidências sobre o grau de sobreposição desses dois tipos de teste, assim como as considerações relativas à escolha entre eles. A testagem psicométrica preocupa-se mais com o produto do que com o processo. O produto é claramente observável - a resposta dada, a torre de cubos construída, ou a redação escrita. Quando um examinador psicométrico presta atenção ao processo, ele se arma com uma folha de registro para tabular o que vê e seleciona antecipadamente os aspectos específicos de estilode resposta que irá registrar. Listar as variáveis antecipadamente é uma restrição inaceitável para o psicólogo impressionista. Ele prefere procurar o que é significativo no comportamento de cada examinando, conforme o observa trabalhando. Conseqüentemente, prefere as tarefas que as pessoas abordam de modos diferentes. 6 Quando uma decisão precisa ser tomada, podemos combinar os fatos registra dos através de uma regra formal ou podemos combiná-los impressionisticamente. Por exemplo, uma professora atribui notas em um curso através das médias dos testes. Uma outra utiliza impressões globais: este aluno está "fazendo um trabalho que merece B, mesmo que tenha piorado no final", enquanto aquele outro "não é realmente tão bom quanto seus testes sugerem". O examinador psicométrico prefere um método uniforme, impessoal, ao passo que o impressionista prefere a flexibilidade. Finalmente, chegamos à validação. Os examinadores psicométricos confiam nas interpretações feitas através de uma regra derivada estatisticamente de grupos anteriores; eles desconfiam de interpretações mais subjetivas, individualizadas. Um examinador psicométrico acompanha cada resultado numérico com um alerta referente ao erro de mensuração, e gostaria de poder agregar um índice de incerteza a cada predição. O impressionista preocupa-se menos com a validação formal. Se não existem dois casos iguais, as interpretações não se repetem, e as tabelas de experiência não podem ser acumuladas. Validar "retratos" é muito mais difícil do que validar predições numéricas. Com efeito, isso requer que se valide o intérprete, ou retratista. O intérprete impressionista quer ser um artista, sensível ao observar e hábil ao transmitir impressões. Alguns psicólogos possivelmente são melhores juízes da personalidade do que outros. O método psicométrico busca procedimentos que todos podem utilizar igualmente bem. O teste objetivo é uma câmera apontada numa direção fixa; todos os fotógrafos competentes devem tirar a mesma fotografia com ela. Assim, a testagem psicométrica busca reduzir a mensuração a um procedimento técnico. Na extensão em que isso tem sucesso, fica diminuída a necessidade de um psicólogo "sábio". As abordagens psicométrica e impressionista diferem mais nitidamente na questão da confiança no psicólogo. Os defensores do rigor consideram o examinador como um instrumento errático cujas interpretações não-reguladas misturam a verdade com especulações. Os impressionistas consideram o observador como um instrumento sensível e inclusive indispensável. O impressionista não nega o perigo de tendenciosidades e erros. Mas ele não está disposto a ignorar a história da pessoa e sua presente situação - e os significados que lhe atribui. 7. "A testagem psicométrica confia no julgamento do criador do teste, ao mesmo tempo em que não está disposta a confiar no examinador como observador. " Esta é uma declaração defensável? 8. Diferencie estruturado de padronizado. 9. Em que aspectos os seguintes procedimentos são não estruturados? a. No teste de caligrafia de Ayres, os alunos devem escrever o Discurso de Gettysburg primorosamente, fazendo o máximo possível num tempo determinado. b. Num teste de desenvolvimento intelectual, pede-se à criança que "faça o melhor desenho possível de um homem". c. Num teste de discriminação de altura de som, o sujeito ouve dois tons e responde A, B ou N, se o segundo som parece mais alto, mais baixo ou não diferente do primeiro. 7 CLASSIFICAÇÃO DE PROCEDIMENTOS Por uma questão de conveniência, este livro separa os procedimentos em duas amplas classes: os que buscam medir o desempenho máximo e os que buscam medir respostas típicas. O desempenho apresentado por uma pessoa cooperativa solicitada a fazer o melhor possível indica "capacidade". O desempenho máximo é uma ficção conveniente. O conceito ajuda a organizar a minha discussão, mas observar o máximo é tão difícil quanto localizar o final do arco-íris. O melhor tempo de uma pessoa numa corrida de uma milha é apenas o melhor que ela pode fazer mo momento; ela pode quebrar o recorde amanhã. Ericsson (1987) fala sobre uma pessoa cuja capacidade máxima de lembrar séries de números chegava a sete dígitos. Depois de seis semanas de prática com uma técnica especial, ela era capaz de lembrar 80 dígitos! Ela melhorou sua capacidade aproveitando sua facilidade em associar eventos. Ela atribuía significados a grupos de dígitos, ficando com menos "itens" para lembrar. Dada uma série contendo 3-4-9-2, por exemplo, ele pensava em três minutos, 49,2 segundos - um desempenho magnífico na corrida de uma milha (Posner, em Chi e colaboradores, 1988, p. XXX). Segundo, existem procedimentos para descobrir o que a pessoa faz ou sente mais freqüentemente, numa situação ou tipo de situação recorrente. As medidas das respostas típicas abrangem aspectos de personalidade, hábitos, interesses e caráter2. Aqui, a "resposta" pode referir-se a ações manifestas corno assumir a liderança (ou permanecer quieto) num grupo social, ou a declarações que a pessoa faz, ou ao encobrimento de pensamentos e sentimentos. Martin tipicamente age corno se estivesse interessado nas estórias que sua esposa conta a respeito de seu dia no escritório, e talvez costume dizer que está interessado, mesmo quando não está. Ambas estão na esfera das respostas típicas. (Mas fazer com que ela acredite - isso sim é capacidade!) A resposta típica e a capacidade não são verdadeiramente separáveis. O recorde de uma pessoa em testes de datilografia estabelece que sua capacidade atingiu determinado nível, mas o escore também reflete sua disposição de se esforçar naquele tipo de situação. Em outras palavras, a minha distinção não leva em consideração os propósitos. Os propósitos são importantes, mas recebem pouca consideração na psicologia das diferenças individuais (Snow & Farr, 1987). Os psicólogos empenhados na modificação do comportamento fazem uma distinção muito semelhante à minha. Com relação a algum comportamento desejado, eles primeiro perguntam se a resposta (isto é, uma habilidade social) "faz parte do repertório da pessoa". Quando confirmam que a capacidade está presente, eles passam a investigar com que freqüência a pessoa responde daquela maneira em várias situações recorrentes. As instruções dos testes quase nunca dizem ao examinando corno abordar a tarefa. Teoricamente, o estilo de desempenho enquadra-se na categoria de resposta típica; mas 2 'Em edições anteriores deste livro, referi-me à segunda categoria como "testes de comportamento típico". Isso era consistente com a tendência a falar sobre uma pessoa como tipicamente cautelosa, ou responsável. ou ansiosa. Mas a teoria moderna da personalidade enfatiza o papel da situação na determinação das ações e dos sentimentos da pessoa, e a terminologia "resposta típica" pretende sugerir a pergunta "resposta a quê?". 8 as variações de estilo afetam os escores de "capacidade". O labirinto de Porteus (Figura 2.1) é uma técnica de observação em que a examinadora procura evidências de planejamento e antecipação, ao mesmo tempo em que é um teste de capacidade que avalia a velocidade e a exatidão. Figura 2.1. Dois dos labirintos de Porteus. O testando deve traçar o caminho mais curto através do labirinto. Uma tentativa é avaliada como um fracasso sempre que o lápis entra num caminho sem saída. Ele então pode fazer novas tentativas no mesmo labirinto. Quando ele acerta um dos labirintos, passa para outro mais difícil, continuando até fracassar em várias tentativas num mesmo labirinto. (Fonte: Esses labirintos têm o copyright de 1933, 1953, 1955, The Psychological Corporation e são reproduzidos com permissão.) 10. "Um teste de capacidadeé um teste em que a pessoa não pode receber um escore melhor do que o merecido; em medidas de ajustamento emocional e atitudes sociais, a pessoa pode dar respostas que causam uma boa impressão, mesmo que as respostas sejam falsas." Essa distinção é equivalente à distinção entre o desempenho máximo e a resposta típica? 9 Testes de Desempenho Máximo O aspecto característico de um teste de capacidade é que o testando é encorajado a conseguir o melhor escore que puder. O objetivo da examinadora é o de eliciar o melhor desempenho possível (dentro das regras), e isso significa que o testando deve querer sair-se bem e precisa compreender o que é considerado um bom desempenho. Para que ele dê o melhor de si, as instruções precisam ser claras e explícitas, incluindo a explicação de como os vários tipos de erros serão penalizados. Alguns testes de capacidade propõem tarefas conhecidas; outros requerem que a pessoa faça alguma coisa desconhecida. No Teste de Coordenação Complexa (Figura 2.2), uma pessoa que nunca pilotou um avião opera uma "alavanca de comando" e um "leme de direção". Luzes piscando assinalam que devem ser feitos determinados movimentos; respostas rápidas e coordenadas recebem um escore elevado. Um grande grupo de testes inclui o EFT e os labirintos, como também testes de raciocínio verbal; eu me refiro a eles como medidas de "capacidade intelectual geral". Este termo se refere a uma série de capacidades importantes em quase qualquer tipo de pensamento. Testes desse tipo freqüentem ente são chamados de "testes de inteligência", mas a interpretação do teste é mais correta se evitamos os mitos associados à palavra "inteligência". Juntamente com as capacidades gerais estão aquelas pertinentes a uma variedade limitada de tarefas: compreensão mecânica, sensibilidade à tonalidade dos sons, destreza manual e assim por diante. O desempenho numa tarefa importante em si mesma proporciona evidências de proficiência ou competência. Podemos medir a proficiência em falar o francês, num aconselhamento via telefone, no conserto de uma torneira. O termo mais limitado teste de realização se refere ao teste que abrange alguma coisa que a escola presumivelmente ensinou diretamente - a leitura, por exemplo, ou o conhecimento do sistema solar. Um "teste de maestria" é um teste de realização relativo a algum tópico ou habilidade limitados, destinado a estabelecer se um estudante domina aquele assunto. O termo "competência mínima" passou a ser empregado na década de setenta. Os críticos das escolas haviam se queixado de que muitos alunos com o segundo grau completo não eram adequadamente instruídos e empregáveis. Um teste utilizado para identificar esses alunos (quer como um alerta precoce ou um último obstáculo) passou a ser conhecido como um teste de competência mínima (Jaeger, em Linn, 1989a). Um teste de aptidão é um teste destinado a predizer o sucesso - existem testes de aptidão para a engenharia, aptidão musical, aptidão para a álgebra e assim por diante. Esses testes não têm formas distintas. Um teste de aptidão para a engenharia pode incluir seções medindo a capacidade intelectual geral, o raciocínio mecânico e espacial e a proficiência em matemática. O contraste realização/aptidão é de ponto de vista, 10 mais do que de conteúdo de teste. Qualquer teste é um teste de realização na medida em que é um relato sobre o desenvolvimento e a aprendizagem até aquele momento; é um teste de aptidão na medida em que diz alguma coisa sobre o futuro. Flaugher (1978) sugere que muitos daqueles que pedem uma testagem de "aptidão" consideram as diferenças individuais nas capacidades como fixas e contam com a seleção ou classificação para combinar as pessoas com as responsabilidades. Aqueles que pedem uma testagem de "realização", diz ele, pensam nas diferenças individuais como refletindo experiências passadas e esperam que o treinamento possa preparar o candidato com um escore baixo para futuras responsabilidades. Medidas de Resposta Típica Para a maioria das perguntas sobre sentimentos e hábitos, nenhuma resposta específica pode ser destacada como "boa". Não existe nada de bom ou de mau no interesse pela engenharia. Igualmente, não podemos dizer que um certo grau de dominação é melhor; o mundo oferece papéis adequados para as pessoas ao longo de toda a escala. Aqueles que estão empregando um executivo cujo sucesso anterior garante sua capacidade também querem saber como ele funciona habitualmente. Ele supervisiona cuidadosamente, prestando atenção aos mínimos detalhes? Ou delineia uma tarefa geral e dá liberdade aos seus subordinados? Ele se preocupa igualmente com produção, problemas humanos e finanças? Ele prefere um planejamento de longo alcance ou uma rápida adaptação? Conhecer o seu padrão ajuda a colocá-lo adequadamente na organização. As informações sobre os hábitos têm um valor preditivo; o que a pessoa faz uma vez provavelmente fará novamente. Mas a maioria dos psicólogos negaria que os hábitos observados de uma pessoa são a sua personalidade. Uma pessoa nem sempre age como agiu em ocasiões anteriores. Nós não desejamos considerar as reações excepcionais como caprichosas e inexplicáveis. Conseqüentemente, supomos que as respostas são geradas por uma estrutura de personalidade ou sistema de crenças consistente, que é sensível às diferenças situacionais. A estrutura tem de ser inferida a partir das observações do comportamento e relatos sobre atos, opiniões e fantasias. Nas semanas que antecederam o casamento do príncipe Charles, a imprensa britânica buscou os mínimos fragmentos de informação sobre a futura princesa. Ela ensinara num jardim de infância, e um repórter entrevistou um de seus alunos e perguntou: "Como ela era?". O garotinho respondeu: "Não sei. Ela nunca me disse." A maioria dos psicólogos está na posição dessa criança - 90 por cento das informações coletadas sobre a personalidade, interesses e atitudes originam-se dos relatos do sujeito. Quase todos os outros psicólogos estão na posição do repórter, dependendo de impressões de segunda- mão. A observação direta e sistemática por parte do psicólogo e seus auxiliares é comparativamente incomum - mas uma fonte de dados potencialmente superior. Observação. A observação padronizada requer que cada pessoa seja colocada essencialmente na mesma situação. A personalidade pode ser observada durante um teste intelectual, durante uma discussão de grupo ou quando a pessoa é desafiada a caminhar sobre uma trave com os olhos vendados. Foram planejadas tarefas especiais - testes de desempenho de personalidade - para proporcionar uma boa oportunidade de observação. 11 A observação padronizada permite-nos comparar pessoas que normalmente não são vistas em circunstâncias semelhantes. Além disso, ela elicia respostas que poderiam ser vistas apenas ocasionalmente na vida cotidiana. Por exemplo, para examinar reações à frustração, a pessoa é iniciada em alguma atividade e então impedida de atingir seu objetivo. Em um estudo, pré-escolares receberam a oportunidade de brincar com brinquedos comuns, razoavelmente interessantes. Depois, foram levados para uma sala adjacente, com brinquedos imensamente atraentes. Depois de um período de brincadeiras nessa sala, eles foram levados novamente para a primeira sala, e uma tela de arame foi colocada entre eles e os lindos brinquedos. As crianças reagiram de várias maneiras: dando pontapés na tela, voltando ao brinquedo simples com pedras, tentando passar por baixo da tela ou fingindo tirar uma soneca. Em geral, os jogos após a frustração foram menos maduros e menos construtivos do que antes. Se queremos o comportamento típico, o sujeito não deve saber o que está sendo observado. O observador pode estar escondido, ou a pessoa pode ser levada a acreditarque está sendo testada em relação a uma determinada característica enquanto alguma outra coisa está sendo observada. Quando estamos estudando a reação à frustração, pode-se dizer ao testando que sua capacidade intelectual está sendo observada. Quando ele ficar frustrado por perguntas difíceis, suas respostas provavelmente não serão dissimuladas. O comportamento típico também pode ser observado em amostras tomadas "no campo". As crianças no playground revelam muito sobre seus hábitos e personalidade; o mesmo acontece com um não-combatente liderando um pelotão e os funcionários no escritório. A média de arremessos no beisebol resume as observações de campo registra das sistematicamente. As avaliações de mérito feitas por um supervisor também são baseadas na observação, mas são quase sempre assistemáticas. As situações referidas no parágrafo anterior são padronizadas até certo ponto. No playground, cada criança está reagindo aos atos não-padronizados de seus companheiros de brincadeiras. Na quadra de beisebol, os arremessos executados mudam de um rebatedor para o próximo. Quando o examinador se propõe a disfarçar seu propósito ou a observar sem o conhecimento do seu alvo, surgem questões éticas. Os princípios éticos criados para a conduta na pesquisa também têm implicações na testagem (American Psychological Association, 1973; em sumário, 1981). A "invasão de privacidade" está sendo interpretada de forma cada vez mais rígida: práticas consideradas normais numa década são desaconselhadas na próxima. Todos os laboratórios de psicologia possuem um espelho de observação que permite a um observador enxergar a sala de entrevistas ou de brinquedos sem ser visto. Em épocas anteriores, o sujeito não ficaria sabendo que estava sendo observado. Hoje, uma prática comum é mostrar ao sujeito (ou aos pais, caso o sujeito seja uma criança pequena) o posto do observador e a visão através do espelho, explicando casualmente que esse arranjo pretende eliminar distrações. Uma vez absorvido numa tarefa e especialmente depois de várias sessões, não é provável que o sujeito continue preocupado com o espelho. Uma outra prática adequada é dar uma indicação generalizada: "Estaremos observando como você interage com seu filho, de vez em quando, mesmo quando não lhe dissermos que estamos mantendo um registro. Às vezes, essas observações vão nos ajudar a orientá-la. Naturalmente, se você não quiser ser observada deve nos dizer, e se 12 num dia específico acontecer alguma coisa que você não quer que conste desse arquivo, pode nos pedir para rasgar este registro, que nós iremos rasgá-lo". A franqueza não pode avançar além dos limites do bom senso. O terapeuta da fala não diz: "Eu vou contar quantas vezes você gagueja"; a psicóloga infantil não diz à mãe: "Eu vou contar às vezes em que você parece insegura de si mesma". Auto-Relato. Cada pessoa conhece bastante o seu próprio comportamento. Os questionários - freqüentemente chamados de "inventários" - são usados para obter auto- descrições. Existem inventários sobre os hábitos de estudo, inventários de interesses, inventários de atitudes sociais e assim por diante. O inventário biográfico pode tratar de qualquer coisa, da história conjugal aos sentimentos em relação ao pai da pessoa, ou dos passatempos passados e atuais. O título dos questionários deve evitar a palavra "teste", de modo a evitar sugerir (por exemplo) que a dominação é mensurada diretamente. Ao passo que o inventário tradicional faz perguntas generalizadas -"Você bebe muito?" - uma outra abordagem pede que a pessoa observe seu próprio comportamento em determinados momentos. A pessoa pode ser solicitada a registrar todas as noites a sua ingestão de álcool naquele dia, talvez juntamente com uma anotação sobre as circunstâncias em que bebeu cada drinque. A virtude da auto-observação é a exatidão da informação. O procedimento é intrusivo e tende a alterar o próprio comportamento – uma vantagem quando o ato de registrar reforça o processo terapêutico, mas uma desvantagem quando estamos tentando investigar o comportamento típico. A auto-observação direta das ações deveria dizer-nos algo muito semelhante àquilo que um segundo observador relataria. A auto-observação direta de pensamentos e sentimentos, entretanto, captura informações de outra forma não disponíveis. Um procedimento de mensuração estruturado - o Experience Sampling Method (Método de Amostragem da Experiência) - foi desenvolvido por Csikszentmihalyi e Larson (1984), para as pesquisas sobre a adolescência. Os respondentes, recrutados como co- investigadores júnior, sabiam que as informações coletadas não iriam afetá-los de modo nenhum. Cada participante recebia um aparelho transmissor e um bloco dos formulários ilustrados na Figura 2.3. Durante a semana de coleta de dados, eram enviados sinais - cerca de 80 no total - através do aparelho transmissor, em intervalos espaçados, irregulares, desde as 7 horas da manhã até as 10 e meia da noite (até mais tarde na sexta e no sábado). O participante deveria preencher o formulário imediatamente quando o aparelho sinalizava, mas não se exigia uma obediência perfeita. O índice de respostas de 69 por cento foi baixo principalmente por causa do mau funcionamento dos transmissores; não parece ter havido muita censura. Muitas respostas, incluindo as da Figura 2.3, obviamente foram espontâneas. (Incidentalmente, a mãe citada nesta resposta pareceu ao investigador uma pessoa sensível e razoável; R. Larson, comunicação pessoal, 1989.) 13 Figura 2.3. Um auto-relato sobre o humor e o comportamento num momento amostra (fonte: De Begin Adolescent: Conflict and Growth in the Teenage Years, de Mihaly Csikzentmihalyi e Reed Larson, Coprygth 1984 da Basic Books, Inc. Reimpresso com a permissão do editor). A principal virtude dessa técnica era o formulário padrão de relato que parecia se ajustar a todas as pessoas e eventos. Isso permitiu uma comparação estatística entre os indivíduos e tipos de ambientes. Os dados mostraram algumas associações surpreendentes; por exemplo, um claro aumento na excitação nos finais de noite do fim-de-semana, combinado com uma diminuição consciente do autocontrole. 11. Classifique cada uma das seguintes situações como um teste de capacidade, um auto-relato, uma observação numa situação padronizada, ou uma observação numa situação não-padronizada: a. Um entrevistador do Instituto Gallup pergunta a um cidadão como ele votará nas próximas eleições. b. Uma produtora de televisão quer saber que características atraem diferentes tipos de espectadores. Ela apresenta um show para uma pequena audiência, que pressiona botões sinalizadores para indicar se eles gostam ou não do que estão vendo em cada momento. c. Um teste de "aptidão vocacional" pergunta o quanto o sujeito gosta de atividades, tais como vendas, marcenaria e xadrez. 14 d. Um teste de ortografia é aplicado a candidatos a um emprego de escritório. e. Inspetores em roupas comuns (não uniformizados) andam de ônibus para determinar se os motoristas e cobradores estão obedecendo às regras da companhia. f. Durante um teste de labirinto, o examinador busca evidências de autoconfiança ou da sua ausência. g. Os estudantes são informados sobre uma proposta para reduzir o crescimento populacional num subúrbio: serão autorizadas poucas ligações novas à rede de esgotos. Pede-se a eles que digam o que o conselho municipal deve fazer e que dêem razões para justificar suas escolhas. h. Um inspetor de uma fábrica de meias deve detectar todas as meias com falhas na malha. Como uma verificação da eficiência, em certos momentos algumas meias defeituosas que haviam sido marcadas com uma tinta fluorescente são misturadas com o lote a ser inspecionado. A tinta é invisível para o funcionário,mas ao utilizar uma lâmpada ultravioleta sobre as meias depois da inspeção, o supervisor pode localizar facilmente quaisquer meias defeituosas que o inspetor deixou passar. 12. Classifique cada um dos seguintes testes, empregando os termos descritivos discutidos no texto, tantos quanto forem claramente aplicáveis. a. O Estudo dos Valores consiste em perguntas impressas, tais como: Na sua opinião, qual é a melhor maneira de um homem que trabalha no ramo de negócios a semana toda passar o domingo: 1. tentando instruir-se, lendo livros sé rios? 2. tentando vencer no golfe, ou em corridas? 3. assistindo a um concerto de uma orquestra? 4. escutando um sermão realmente bom? O respondente escolhe a resposta preferida. Um gabarito numérico calcula a importância que atribui aos valores "estéticos", "religiosos" ou outros. b. Num determinado teste de "aptidão mecânica", a pessoa assinala as ilustrações de ferramentas e outros objetos que são usados juntos (por exemplo, martelo e bigorna). c. Um item de Arranjo de Figuras apresenta quatro figuras que, arranjadas na ordem correta, contam uma história, como numa tira de cartum (veja a Figura 7.2). Cada figura está num cartão separado. Os cartões são apresentados num arranjo aleatório, e o testando os organiza de modo que formem uma história inteligível. d. O Short lmaginal Processes lnventory consiste em 45 itens, tais como: - Eu tendo a me aborrecer facilmente. - Meus devaneios diurnos são geralmente estimulantes e recompensa dores. - Em meus sonhos, eu manifesto raiva em relação aos meus inimigos. A pessoa responde segundo uma escala de 5 pontos, variando de "é uma forte característica minha" ao oposto. São computados três resultados: Devaneios Diurnos 15 Positivo-Construtivos, Devaneios Diurnos de Culpa e Medo do Fracasso e Controle da Atenção. A TESTAGEM NA ERA DO COMPUTADOR O computador desempenha muitos papéis por trás do cenário da testagem e pode fazer o papel de astro como aplicador de testes. O tópico é introduzido aqui porque o computador está mudando as idéias sobre aquilo que os testes podem e devem ser (Roid, em Plake & Witt, 1986). Em virtude de sua consistência, o computador leva a padronização a um extremo; entretanto, ele pode realizar uma mensuração padronizada ao mesmo tempo em que apresenta perguntas diferentes (e uma devolução personalizada) a cada testando. A devolução pode ser notavelmente complexa, quase como uma conferência pessoal. No aconselhamento profissional, por exemplo, o computador pode fazer perguntas, que ajudam a pessoa a refletir sobre seus interesses e experiência de trabalho, e pode sugerir onde obter informações sobre ocupações adequadas. Bancos de Itens O tipo de teste mais conhecido é um folheto impresso cheio de perguntas. Atualmente, um teste impresso que se ajuste a determinadas exigências locais pode ser produzido rapidamente através de um "banco de itens" - um arquivo de itens classificados por conteúdo e nível de dificuldade. Um sistema escolar pode solicitar a um fornecedor um teste para estudos sociais cuja mescla de tópicos seja adequada ao seu currículo. Atualmente, é prático armazenar localmente bancos de itens e montar testes com um microcomputador (F. Baker, em Linn, 1989a). Um número infinito de testes equivalentes pode ser criado selecionando-se conjuntos de itens de acordo com o mesmo planejamento. O governo federal certa vez planejou computadorizar grande parte da testagem dos funcionários públicos (Urry, 1977). Os planos foram engavetados antes de serem concluídos - não, aparentemente, por uma questão de plausibilidade e custo. O fato de o computador poder criar um teste novo para cada pessoa é a sua principal atração para o serviço público. Mês após mês, chegam candidatos a serem testados para o mesmo tipo de cargo, e as perguntas acabam vazando depois que um teste é utilizado repetidas vezes. Uma equipe humana não pode montar mais do que alguns formulários de teste para cada cargo. Com numerosos itens num disquete, o computador pode montar um formulário diferente para cada candidato e adaptar todos os resultados a uma escala comum. As vantagens tornam-se consideravelmente maiores quando o teste abrange problemas que o computador é capaz de resolver. Candidatos a funcionário da alfândega poderiam ser solicitados a calcular o imposto a ser pago sobre um carregamento de produtos importados, utilizando uma complexa tabela de impostos. Essa tarefa pode ser estruturada de uma maneira geral. Para cada examinando, o computador pode alterar arbitrariamente os impostos, regras ou as mercadorias do carregamento. Diante desse tipo de teste, o candidato não tem alternativa além de aprender a aplicar tabelas de impostos. Ele não ganha nada ao descobrir as regras que um amigo aplicou na semana anterior. 16 O desejo de manter a segurança dos testes motivou o Departamento de Defesa a levar cinco anos replanejando a administração do teste de qualificação (ASV AB) para recrutas potenciais, para que fosse aplicado por computadores. O serviço público não quer encorajar candidatos de capacidade limitada, mas os recrutadores que recrutam candidatos estão ansiosos por recrutar o máximo possível de pessoas. Conhecendo os itens do teste, alguns recrutadores orientam os candidatos fracos que de outra forma não passariam no teste (ou, pelo menos, é do que desconfiamos). Com o teste computadorizado infinitamente variável, essa orientação seria impossível. Finalmente, os planos para o ASV AB computadorizado foram engavetados sem terem sido usados, porque alguém com um lápis bem apontado calculou o custo da instalação do hardware necessário em todo o país (Bunderson, Inouye & Olsen, em Linn, 1980a, p. 383). Aplicação Automatizada Os computadores são bons em apresentar testes diretamente aos indivíduos - um teste audiométrico, por exemplo. No diagnóstico de transtornos auditivos e na adaptação de aparelhos auditivos, a examinadora ajusta tons puros para volumes mais altos e mais baixos, a fim de determinar o volume mais baixo que a pessoa consegue ouvir. Um examinador humano diria ao testando para pressionar um botão quando ele ouvisse o tom em seus fones de ouvido. Ele ajustaria o botão de freqüência em (por exemplo) 800 hertz (ciclos por segundo), ajustaria o botão de volume num nível mediano (por exemplo, 5) e pressionaria por 0,5 segundos o interruptor que produz o som. Depois da resposta, o examinador assinalaria a resposta numa folha de registro. Mais tentativas na mesma freqüência - sem outras orientações audíveis, mas com uma luz indicando "já" - poderiam utilizar níveis 4 (eliciando uma resposta positiva codificada como +), 3 (+), 0 (-); uma tentativa de testar respostas falsas), 2 (-), 3 (-), 2 (-), 3 (+) e assim por diante. Em certo momento, o examinador determinaria uma estimativa (algo perto de 3 neste caso) do limiar auditivo da pessoa em 800 hertz e, então, passaria para outra freqüência. O computador pode fazer as mesmas coisas, economizando o tempo remunerado do profissional. O computador dá instruções visualmente ou através de fones de ouvido, modifica os sinais sem erro e os sinais de tempo com precisão. Diferentemente de um botão de controle giratório, ele pode fixar valores de 3,1 ou 3,05. O computador pode determinar o limiar com maior rapidez e, segundos depois da última resposta, pode imprimir imediatamente um perfil de resultados em função dos tons. A transmissão através de satélites torna possível enviar instantaneamente a informação para o outro lado do mundo. Entre os talentos do computador observados neste exemplo estão os seguintes: - Adesão precisa a esquemas e planos. Controle delicado dos estímulos. - Escolha de itens de teste sucessivos à luz do desempenho até o momento ("testagem adaptativa").- Imunidade ao cansaço, aborrecimento, lapso de atenção e erros inadvertidos de pontuação. - Pontuação instantânea e exata. 17 - Registros legíveis, com cópias múltiplas e transmissão a distância. Naturalmente, computadorizar um teste traz algumas perdas, especialmente ao eliminar as observações não-padronizadas que um clínico experiente faz durante um teste individual tradicional. Interagir com um computador fascina os testandos (pelo menos atualmente, enquanto a experiência ainda é nova). Quando problemas de raciocínio foram apresentados a estudantes universitários por um computador e por um examinador humano, o relato foi o seguinte: Os sujeitos testados pelo computador são mais capazes de fazer pausas por períodos mais longos de tempo sem digitar nada no computador. Os sujeitos testados por uma pessoa podem sentir-se pressionados a responder logo, mesmo com o risco de fazer alguma coisa errada. Os sujeitos testados por computador gritaram de alegria, praguejaram, bateram nas paredes e cantaram (podiam ser escutados através das paredes à semi-prova de som de seus cubículos), certamente formas de expressão que um sujeito típico evita na presença de um experimentador. Johnson & Baker, 1972, p. 31; para um relato formal, veja Johnson & Baker, 1973). Vocês poderiam pensar que o computador adaptar-se-ia somente aos sujeitos instruídos e emocionalmente estáveis. Mas crianças pré-escolares e pacientes com doença mental respondem bem às apresentações automatizadas. A paciência do computador é interminável. Se o esquizofrênico deteriorado não faz nenhum movimento por 4 horas, o monitor simplesmente espera. Se a criança desatenta só pode ser levada a fazer o teste depois de quatro sessões preliminares de desenhos animados, o computador os providencia sem impaciência. Muitos testes e inventários têm versões para testagem computadorizada através de um microcomputador na escola ou no consultório da psicóloga. O software pode não apenas administrar o teste sem nenhum examinador humano na sala, como também preparar um relatório de resultados para impressão imediata. A versão computadorizada de um teste originalmente desenvolvido em forma impressa ou oral normalmente é muito semelhante à versão original. Parece que as versões convencional ou computadorizada de um teste realmente costumam medir às mesmas variáveis, mas a dificuldade ou confiabilidade pode mudar facilmente. Se a versão computadorizada é "o mesmo teste" é algo que deve ser questionado com cada instrumento em termos psicológicos. Talvez seja mais difícil ler diagramas no monitor do que na página impressa. Os testandos não-familiarizados com o teclado podem ter dificuldade se as ações requeridas (por exemplo, revisar um item e mudar a resposta) forem complicadas. Mesmo quando o teste em si não é modificado, interagir com uma máquina pode ser psicologicamente diferente de responder a um examinador humano. Quando a tecnologia do computador permite uma mudança na tarefa - introduzindo exposições de tempo controlado, por exemplo - aquilo que o teste mede irá mudar. O teste computadorizado de habilidades de manejo dos pacientes classifica os candidatos à certificação de forma bem diferente da dos testes de lápis e papel planejados para o mesmo propósito (Melnick, 1988). Testagem Adaptativa. Uma característica muito importante é a capacidade do computador de escolher itens de teste à luz dos prévios sucessos e fracassos do 18 testando. Isso se chama testagem seqüencial ou adaptativa ou sob medida. Os examinadores audiométricos sempre escolheram os estímulos do teste à luz de respostas anteriores. No exemplo dado acima, foi sensato apresentar sinais nos níveis 2 e 3 depois que o respondente havia detectado sinais de potência 4; se a pessoa cometeu erros nos 4, sinais levemente mais altos seriam apropriados. Técnicas" derivativas" são especialmente úteis para testar habilidades intelectuais complexas, sendo um exemplo o teste para os médicos descrito na página 13. Depois que o testando responde a uma exposição inicial de informações sobre o paciente, são fornecidas novas informações. Passo a passo, o testando propõe uma ação ou solicita novas informações específicas, e é informado sobre os achados do laboratório ou as observações da enfermeira, ou algo parecido. Ajustar a dificuldade de modo que o examinando trabalhe principalmente com itens que não são nem difíceis demais nem fáceis demais para ele deve melhorar a motivação. Também é fácil para o computador indicar imediatamente se uma resposta está certa ou errada, e isso pode aumentar a motivação (embora esta não seja uma característica comum dos testes adaptativos utilizados na avaliação). Um achado ilustrativo: sem um feedback instantâneo, os jovens negros de uma escola de segundo grau de zona urbana pobre omitiram muitos itens e obtiveram escores mais baixos do que seus colegas de classe brancos. Quando o computador ofereceu um feedback depois de cada item, os negros omitiram poucos itens e alcançaram os estudantes brancos (Betz, 1975; para outros estudos, veja Betz & Weiss, 1976a, 1976b; Prestwood & Weiss, 1978). Entretanto, uma declaração geral seria arriscada; o que encoraja uma pessoa perturba outra. A aprendizagem auxiliada pelo computador incorpora muitos aspectos da testagem adaptativa. Quando o aluno acessa o seu programa hoje, o computador lembra não apenas do nível de desempenho de ontem, mas também das tarefas em que o aluno não se saiu tão bem; os exercícios de hoje são escolhidos de acordo com isso. Os próprios exercícios servem como um teste. Assim, o registro do computador torna-se uma descrição multidimensional atualizada do indivíduo, mais diferenciada do que um teste comum e mais exata do que as percepções do professor. Existem possibilidades semelhantes na terapia da fala, exploração das carreiras e outras atividades desenvolvimentais. Exposições Geradas por Computador. A nova tecnologia está aumentando imensamente a variedade possível de estímulos de teste. Para testar médicos, uma exposição apresentada por um disco de vídeo mostra fotografias a serem interpretadas (um raio X ou um slide de microscópio, por exemplo). Simuladores para astronautas possuem um arranjo realístico de estímulos, um equipamento realístico para ser manipulado e contínuo feedback dos resultados das ações. Embora planejados para treinamento, os aparelhos medem o progresso do treinando e portanto são testes. . O equipamento Micropat na Figura 2.4 apresenta um teste moderno de coordenação complexa que as forças armadas britânicas estão investigando. Os pedais são semelhantes aos antigos, mas a alavanca de controle foi substituída por uma menor. Atualmente, o manejo das informações é considerado muito mais significativo do que a coordenação dos grandes músculos. A parte importante deste teste, naturalmente, é o software que gera as exposições sempre em mutação. O antigo teste era inflexível. O novo - com estímulos que podem ser interminavelmente alterados e com velocidade controlada - permite milhares de variações. Muitas pesquisas serão necessárias para 19 determinar que padrões de estímulo proporcionam as melhores informações preditivas. (Para um exemplo dessa pesquisa "paramétrica", que é um passo rumo à "engenharia" de testes psicológicos, veja Bartram e colaboradores, 1985). O Micropat é um sistema de fornecimento ao invés de um teste. Muitas funções - tempo de reação, controle da velocidade motora, raciocínio espacial - podem ser programadas para serem avaliadas com o mesmo equipamento. 13. Seria possível colocar um teste audiométrico numa fita de som. A fita, digamos, falaria o número do item, depois apresentaria um tom ou um período de silêncio; o respondente verificaria itens durante os quais ele ouve um tom em seus fonesde ouvido. Quais seriam as vantagens e desvantagens desse procedimento? Compare com os procedimentos descritos no texto para: a. o examinador humano b. o computador INFERÊNCIAS A CURTO E LONGO PRAZOS Alguns intérpretes estão dispostos - e alguns relutantes - a fazer inferências relativas a futuras circunstâncias. Para alguns propósitos, o examinador praticamente não precisa ir além do tempo e local de observação. Ele observa que uma criança comete erros como" As vacas é" na composição de hoje; este fato não poderia ser ampliado além de "Esta semana ela não está manejando corretamente as concordâncias de singular e plural". Uma ousada inferência a longo prazo é ilustrada quando uma mãe amorosa, observando que seu filho geralmente reproduz o tom certo de uma canção depois de ouvi-Ia pela primeira vez, diz: "Ele tem uma verdadeira aptidão para a música". Isso é uma generalização para uma ampla classe de tarefas, para daqui a muitos anos. A abordagem mais conservadora à inferência é supor que a pessoa será no futuro aquilo que foi no passado (ou, considerando-se o crescimento, irá manter sua posição relativa entre seus companheiros). Uma avaliação de competência numa tarefa ou papel prático tende a ser válida por bastante tempo (McClelland, 1973; Wernimont & Campbell, 1968). Na ausência de declínio físico, mesmo a competência que diminui com a falta de uso pode ser recuperada com a prática renovada. Os hábitos também tendem mais a persistir do que a mudar. A história de acidentes e multas de trânsito de um motorista é uma base sólida para as inferências de uma companhia de seguros. O principal negócio das profissões de ajuda, entretanto, é promover a mudança. Para as partes interessadas, as predições conservadoras são inerentemente pessimistas ou limitadoras. O profissional deve fazer inferências mais a longo prazo para ajudar a pessoa a estabelecer objetivos de mudança e para avaliar o auxílio que mais irá beneficiá-Ia. As inferências a longo prazo normalmente são uma interpretação impressionista; elas tentam sugerir corno a pessoa irá responder às mudanças de condições. Algumas interpretações psicométricas também têm um longo alcance, corno quando certos erros cometidos ao copiar desenhos geométricos são identificados (probabilisticamente) como um tipo específico de dano cerebral, ou quando testes terrestres são utilizados para selecionar pessoas que se tornarão astronautas. 20 Figura 2.4. O sistema Micropat para a produção de testes perceptuais e motores. A pequena "alavanca de controle" à direita controla os movimentos para cima e para baixo. Pedais não vistos aqui controlam a inclinação, e o controle deslizante à esquerda controla o tamanho ou, em algumas tarefas, a velocidade. Na tarefa de coordenação apresentada, o quadrado move-se irregularmente, e o examinando tenta manter a cruz centrada no quadrado e combinada com ele em tamanho e inclinação. O segundo monitor pode apresentar informações ou instruções. O teclado tem dez letras, dez dígitos, quatro flechas, mais SIM e NÃO. (Fonte:D. Bartram. Reproduzido com permissão. Os designs, software, documentação e exposições do teste Micropat possuem copyright U.K. Crown 1985, 1987, 1988. O Micropat é distribuído através de licença obtida com o Ministério de Defesa do Reino Unido, por Bartdale (Human Factors Specialists) Lld. Applegarth, Leconfield, Beverly, N. Humberside, HU 17 7NQ, Reino Unido). Uma observação afirma um fato relacionado a um momento (ou uma impressão do observador que ele considera factual). Por exemplo: "Hoje, Sam levou 4 minutos e meio para datilografar 200 palavras". Mas os fatos são registrados com perguntas mais amplas em vista. No mínimo, esse desempenho é considerado como representando Sam neste ponto de seu treinamento. E uma amostra do trabalho deste dia, ou desta semana. Se o examinador está realizando uma pesquisa sobre a fadiga, e este resultado ocorre na quinta página de cópia que Sam datilografou na mesma sessão, o resultado resume o desempenho neste momento; o investigador não considera o resultado nem corno representativo da sessão. Entretanto, o investigador está supondo que o declínio no desempenho que acompanhou a fadiga hoje representa aquilo que seria encontrado em outros dias. Todos os testes, então, são amostras. Às vezes, o comportamento amostrado não é de interesse direto; em vez disso, ele é tomado como um sinal ou indicador de outros comportamentos ou estados internos. O teste do labirinto é de interesse como um sinal, não como uma amostra. Nenhum animal ou pessoa costuma ter de encontrar seu caminho através de um labirinto, exceto em um teste psicológico. O número de tentativas necessárias para aprender o caminho no labirinto é tomado como um indicador de uma capacidade mais ampla. É muito mais difícil estudar a aprendizagem na ecologia natural do que na situação de teste, e o índice de aprendizagem de alguma coisa com a qual os aprendizes já estão parcialmente familiarizados seria mais difícil de interpretar do que o índice de aprendizagem em tarefas desconhecidas, artificiais. Inferir dano cerebral a partir de erros ao copiar diagramas é um outro exemplo de raciocinar a partir de um sinal. Traços, Estados e Atos. Os psicólogos investigam tanto os "traços" quanto os "estados". Em relação à ansiedade, por exemplo, a intensidade dos sentimentos ansiosos (o presente estado da pessoa) muda dia a dia. O nível de traço da pessoa normalmente é 21 concebido como uma média ou estado típico; se é assim, ele reflete não apenas as suas características, mas também os estresses habitualmente presentes em seu ambiente. A "capacidade" é quase sempre considerada como um traço moderadamente estável, mas o nível de desempenho é transitório. Um corredor pode estar "pronto" para um páreo, ou "fora de forma". Estes são estados. Conceitos como "ansiedade" e "capacidade" são construtos ("construtos"). Eles descrevem não uma ação, mas a organização ou eficiência características dos pensamentos e das ações. As interpretações dos construtos evoluem. Uma antiga hipótese era a de que o resultado no labirinto indicava a "inteligência pura e simples". Essa idéia teve de ser substituída por descrições mais específicas. Uma linhagem de ratos cuidadosamente criada que se saiu bem em labirintos não apresentou outras evidências de "inteligência" superior. Conforme as pesquisas prosseguiam, o construto mais limitado de "aptidão para a aprendizagem no labirinto" também caiu por terra. A experimentação de uma variedade de condições de teste levou a uma conclusão restrita: "Esta linhagem tem aptidão para aprender labirintos altos quando é mantida com fome e recebe comida no box de chegada". Esta conclusão ainda é uma generalização, mas com um alcance curto. Um construto formal é invocado quando a inferência atinge diversas situações. O "talento musical" é uma dimensão mais conveniente do que o "talento para instrumentos de corda". Este, por sua vez, é mais fácil de manejar, mas menos definitivo do que "destreza em rápidos movimentos dos dedos" e "discriminação de tons". O construto amplo não é verdadeiro nem falso; ele é adequado para alguns propósitos e inadequado para outros. Os construtos que vão mais fundo na psique obviamente são hipóteses mais ousadas. (Comparem "E incapaz de aceitar seus próprios impulsos hostis" com "A resposta às perguntas desafiadoras é moderada, formal, polida"). As interpretações mais profundas baseiam-se numa teoria complexa sobre as origens do comportamento, e poucas dessas teorias foram bem-substanciadas. O quanto é apropriado oferecer uma análise profunda um tanto especulativa, um tanto artística, constitui uma questão polêmica. Apenas duas conclusões precisam ser tiradas nesse ponto. Aqueles que se apegam a relatos literaisde fatos deixam para os outros a carga da interpretação; esses outros poderiam (ou não) estar mais bem servidos se o psicólogo tivesse oferecido uma interpretação. Aqueles que oferecem hipóteses imaginativas como se fossem relatórios científicos levam seus clientes para a areia movediça. Desde a época em que a frenologia foi denunciada como falaciosa, os psicólogos têm tentado escapar da noção de que os traços são objetos, comparáveis à glândula pituitária e ao cromossomo X. Nós achamos natural falar sobre a "timidez". Mas a timidez não é uma entidade; a palavra é um resumo de respostas. Dizer que uma pessoa é tímida significa apenas que, em muitas situações, ela apresentou ações associadas a esse construto. Situar uma pessoa numa escala ou rotular ações é algo que funde diversos atos e, assim, encobre a textura do comportamento. Uma pessoa pode ser tímida em festas e não num debate, com estranhos e não com conhecidos, com mulheres e não com homens. A timidez pode ser totalmente interna: a pessoa confidencia sentimentos de embaraço social para um conselheiro, sentimentos esses que as pessoas com quem convive em seu cotidiano desconhecem. A inibição e o retraimento de uma outra pessoa podem estar aparentes para todos. 22 Análise de Comportamento. A tradição comportamental minimiza referências a estados mentais, categorias de transtornos e traços globais de personalidade. Entretanto, o comportamentalista ainda tem de categorizar situações e atos. Ao avaliar como as mensagens relativas à doença cardíaca afetam a alimentação, ele poderia pedir a cada sujeito para registrar sua ingestão diária de alimentos numa lista de verificação. Um item seria "ovos". Não seria melhor perguntar se os ovos eram cozidos ou fritos? E, se fritos, em banha ou em óleo de açafrão-da-terra? As categorias mais refinadas ajustam as informações mais cuidadosamente ao problema. E até uma mensuração tão concreta, então, é enquadrada por construtos ("colesterol alto", "poliinsaturado"). O refinamento das categorias dependerá do propósito da investigação, mas deve haver categorias. Aqueles empenhados na modificação do comportamento e em outras aplicações orientadas pela situação distinguem nitidamente a descrição de inferência breve dos rótulos atribuídos, resumindo respostas em resultados de "traços", ou explicando em termos dos motivos inferidos. No livro que inspirou a escola de pensamento neocomportamentalista, Walter Mischel (1968, p. 10) declarou a idéia central: "Na análise comportamental, a ênfase está naquilo que a pessoa faz e não nas inferências sobre os atributos que possui mais globalmente". O que a pessoa faz numa situação definida pode ser descrito por uma simples contagem de ações em várias ocasiões. Dizer "como a pessoa é" exigiria que o psicólogo fosse além da contagem de ações, até uma linguagem descritiva e, além disso, até uma construção imaginativa de uma explicação. Ao planejar o tratamento, ao avaliar o progresso e ao avaliar métodos de tratamento alternativos, os comportamentalistas têm tantas ocasiões para testar quanto outros psicólogos aplicados. Na verdade, os testes desempenham um papel especial de monitorização em seu trabalho, porque o cliente aprende a regular a si mesmo pela observação de suas respostas. Ele é ensinado, por exemplo, a observar se realmente fala muito alto sempre que fica descontente com algo que sua esposa diz. Os comportamentalistas preocupam-se especialmente com a freqüência de atos significativos no contexto e com as mudanças no padrão. Assim como as professoras acompanham o progresso e a confusão de um aluno de lição para lição ou de semana para semana, os psicólogos, tentando reformular o comportamento, monitoram o processo e modificam suas táticas conforme necessário. Os comportamentalistas não sentem nenhuma necessidade de investigar as origens de um padrão de resposta; eles buscam as circunstâncias atuais que desencadeiam a resposta. Quando uma pessoa com dificuldades emocionais busca ajuda, o psicólogo dessa escola tenta identificar os tipos de situação que o paciente tipicamente maneja com dificuldade ou que despertam sentimentos desagradáveis. Os comportamentalistas minimizam a inferência. Os dados que utilizam estão estreitamente ligados às dificuldades do paciente - nada de testes de manchas para eles. O tratamento comportamental volta-se diretamente para os atos que precisam ser reformulados (e não para tentativas de desenvolver o insight dos pacientes ou de resolver seus conflitos internos). Quando alguém está tentando aumentar a auto-afirmação, a repetida contagem de atos de auto-afirmação é um teste que complementa as "lições". Os comportamentalistas continuam a preferir as inferências breves, mas a antiga oposição generalizada à "testagem" diminuiu bastante. Os comportamentalistas reconhecem que seus procedimentos focalizados precisam ser julgados pelos mesmos 23 padrões psicométricos dos testes convencionais. Igualmente, eles estão percebendo que os testes convencionais são importantes em seu trabalho (Hersen, em Goldstein & Hersen, 1984; Strohsahl & Linehan, em Ciminero e colaboradores, 1986; Turkat, 1985). 14. Em quais desses aspectos você esperaria que os analistas do comportamento seguissem a tradição da mensuração psicométrica? a. Expressando /numericamente a força de uma tendência de resposta. b. Agrupando em uma categoria ou resultado dois tipos de comportamento, tais como a submissão e a timidez, que tendem a ser encontrado juntos. c. Especificando uma tarefa ou situação definida na qual coleta de dados sobre muitas pessoas. d. Utilizando normas para avaliar a freqüência de um comportamento-problema. 15. Qual testagem, se é que alguma, desempenharia um papel na abordagem do analista de comportamento a uma criança de dez anos que está progredindo muito pouco na aprendizagem da leitura? 16. "Compreende o que lê" é um construto amplo. Que construtos mais limitados poderiam descrever tipos diferentes de compreensão? 17. Anastasi (1988, p. 510) observa que o comportamentalista emprega construtos até mesmo quando fala sobre algo tão definido quanto o "medo de cachorros", Ela diz que as fronteiras do construto precisam ser examinadas para que a generalização não seja ampla demais. Como poderíamos examinar essas fronteiras? Elas seriam semelhantes para todas as pessoas que se perturbam diante de cães?
Compartilhar