Buscar

medidas_texto2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
As Variedades de Testes e Interpretações de Testes1 
 
Lee J. Cronbach 
Stanford University 
 
2A. Alguns testes são padronizados, alguns são objetivos, alguns possuem normas. 
Como diferem esses aspectos? Por que eles são importantes? 
2B. Quais são as vantagens e os riscos potenciais numa avaliação impressionista? 
2C. Como podemos reconhecer se um teste mede o desempenho máximo ou a resposta 
típica? . 
2D. Como o computador pode ampliar o alcance e a exatidão da testagem? 
2E. Às vezes, o tipo de comportamento obtido como amostra num teste é de interesse 
direto; outras vezes, ele é apenas uma base para a inferência de outras características. 
Que objetivos de mensuração levam a cada tipo de interpretação? 
Abreviações deste capítulo: ASVAB para Armed Services Vocalional Aplilude Battery; EFT para 
Teste das Figuras Inseridas (Embedded Figures Test). 
 
O QUE É UM TESTE? 
A palavra "teste" normalmente nos faz pensar numa série de perguntas-padrão para as 
quais o examinando dá respostas escritas ou orais. Mas o teste prático para tirar carteira 
de motorista não tem perguntas nem respostas, e o procedimento varia de um 
examinador para outro. A tarefa estabelecida para o motorista não pode ser padronizada, 
assim como o tráfego através do qual os motoristas devem manobrar irá variar de uma 
hora para outra. 
 
Talvez a seguinte definição seja suficientemente ampla para abranger os procedimentos 
com os quais este livro se ocupa: um teste é um procedimento sistemático para observar 
o comportamento e descrevê-lo com a ajuda de escalas numéricas ou categorias fixas. 
"20/100" localiza a acuidade visual numa escala numérica; "Cegueira para a cor 
vermelha/verde" refere-se a uma categoria. Por "sistemático" eu quero dizer que a 
examinadora coleta informações questionando ou observando da mesma maneira uma 
pessoa depois da outra, na mesma situação ou em situações comparáveis. Esta definição 
inclui questionários para obter relatos sobre a personalidade, procedimentos para 
observar o comportamento social, testes com aparelhos para medir a coordenação e, 
inclusive, registros de produção numa linha de montagem. 
 
Como foi dito no Capítulo 1, "avaliação" é uma palavra mais ampla do que "testagem" 
quando (como é comum) ela significa integrar e avaliar informações. A avaliação de um 
indivíduo normalmente irá considerar testes juntamente com uma história de caso e 
entrevistas. Mas o termo também tem sido aplicado a levantamentos estatísticos 
baseados unicamente em testes ("National Assessment of Educational Progress") e a 
medidas experimentais limitadas ("avaliação do medo de cobras"). 
Um teste pode constituir uma peça só, os escores para as respostas ou partes sendo 
ignorados quando o total é obtido. Em outros testes, os resultados parciais são 
transportados para interpretação. Quando vários resultados parciais são computados lado 
 
1 PARA CITAR O TEXTO (ISO): 
CRONBACH, Lee. As Variedades de Testes e Interpretações de Testes In: CRONBACH, Lee. Fundamentos 
da Testagem Psicológica. Porto Alegre: Artes Médicas, 1996. Cap. 02. p. 50-69. ISBN: 85-7307-180-X 
 
 2 
a lado em escalas comparáveis, este gráfico é chamado de "perfil". (As partes são às 
vezes referidas como "subtestes". As vezes, as partes são chamadas de "testes" e o todo 
é chamado de "bateria". Essas diferenças de terminologia não são importantes.) 
 
Os significados de teste de lápis-e-papel, teste com aparelhos, teste oral e assim por 
diante devem estar óbvios. Embora todos os dados comportamentais reflitam algum tipo 
de desempenho, um teste de desempenho normalmente se refere a uma tarefa que 
requer uma resposta física. Entre os testes de desempenho que têm sido utilizados estão 
consertar uma peça de um aparelho eletrônico, desenhar a figura de um homem, 
encadear contas e "inventar" um cabide com duas varetas longas e uma braçadeira em 
formato de C. Embora seja uma tarefa verbal, responder a uma entrevista em francês 
também é um teste de desempenho. 
 
Os testes de grupo permitem testar muitas pessoas ao mesmo tempo. Os testes 
individuais permitem a observação de reações e o seguimento de uma resposta 
indefinida. Muitos testes possuem versões individuais e grupais. A administração por 
computador obscurece essa antiga distinção no sentido de que a administração é 
individual, mas os exercícios normalmente são semelhantes aos de um teste de grupo. 
 
Os procedimentos de padronização de testes tornaram-se uma preocupação por volta de 
1900. Naquela época, cada laboratório de psicologia tinha o seu próprio método para 
medir o intervalo de tempo da memória, tempo de reação e assim por diante. 
Conseqüentemente, era difícil comparar achados de pesquisa. Igualmente, quando cada 
professora usava um teste diferente, era difícil para os supervisores escolares avaliarem 
se os alunos estavam aprendendo a soletrar corretamente. 
 
Um teste é considerado padronizado quando as palavras e os atos da examinadora, o 
aparelho e as regras de avaliação foram fixados, de modo que os resultados coletados 
em momentos e lugares diferentes são inteiramente comparáveis. Se a padronização é 
completamente efetiva, todas as examinadoras "aplicam o mesmo teste". Como veremos 
mais tarde neste capítulo, esta declaração não significa necessariamente que todas se 
deparam com as mesmas perguntas. 
 
Se um procedimento é objetivo, todos os observadores de um desempenho chegam à 
mesma conclusão. Para atingir a objetividade, todos devem prestar atenção aos mesmos 
aspectos do desempenho, registrar as observações para eliminar erros de memória e 
avaliar os resultados através das mesmas regras. A objetividade pode ser julgada 
comparando-se os resultados assinalados por observadores independentes. Quanto mais 
subjetivas a observação e a avaliação, menos os juízes concordam. Os testes em que o 
examinando escolhe a melhor resposta (isto é, os testes de verdadeiro-ou-falso ou de 
múltipla escolha) possuem uma avaliação objetiva. Em contraste, um teste de redação 
normal ocasiona grande desacordo entre os avaliadores. Entretanto, através do uso de 
cuidadosas instruções ao observador ou examinador, os números atribuídos às respostas 
escritas e às observações podem ser tornados bastante objetivos. A objetividade e a 
padronização geralmente andam juntas, mas um teste com procedimentos livres pode ser 
pontuado por uma regra definida, e um procedimento padronizado pode ter uma 
pontuação baseada em julgamento. 
 
Uma tabela de normas informa como os escores se distribuem em alguma população 
relevante. Os testes que possuem normas às vezes são chamados de "testes 
padronizados". Não estou utilizando a palavra nesse sentido, porque desejo enfatizar a 
 3 
padronização do procedimento. Um teste cujos procedimentos não são padronizados 
pode ter uma tabela de normas, mas as normas não significam muito. (Os termos 
"referendados na norma" e "referendados no critério" não designam tipos de testes; eles 
se referem a interpretações, como será explicado no Capítulo 4.) 
 
1. Avalie cada uma dessas declarações como verdadeira ou falsa e justifique sua 
resposta: 
 
a. As médias de arremessos (no beisebol ou criquete) são objetiva mente determinadas. 
 
b. A corrida com barreiras de 220 jardas é um teste padronizado. 
 
c. A professora pede a todos os alunos de sua classe que leiam o mesmo artigo de uma 
revista atual. Depois de três minutos, o tempo termina e cada aluno marca o lugar em que 
está lendo. O aluno então conta o número de palavras lidas e computa sua velocidade de 
leitura de palavras por minuto. Este escore é comparado com uma tabela de velocidades 
médias de leitura de artigos típicos de revistas. Este teste é altamente objetivo. 
 
d. O teste descrito em c é padronizado. 
 
2. Os testes psicológicos geralmente partem de procedimentos simples. A Dra.Glass 
julga que pode obter informações úteis colocando uma folha de papel numa mesa, ao 
alcance do braço do examinando, e lhe pedindo para tocar com o lápis exatamente no 
centro de um círculo impresso no papel. Pede-se à pessoa que retire sua mão e repita o 
movimento, tão rápida e exatamente quanto possível, até que lhe digam para parar. A 
Dra. Glass atribui uma nota de 1 a 10 a cada lima das seguintes qualidades: velocidade, 
cuidado e persistência. Que aspectos do procedimento precisaríamos levar em conta para 
padronizar o teste? 
 
3. Levantamentos do moral nas fábricas podem utilizar perguntas criadas pelo chefe de 
pessoal da fábrica ou seus consultores. Que vantagens e desvantagens existiriam na 
utilização das mesmas perguntas em muitas companhias? 
 
4. A tarefa de desenho com cubos (veja a Figura 3.1) é um dos procedimentos de 
testagem mais populares. A pessoa constrói um padrão com cubos coloridos, igual à 
amostra impressa. O teste é utilizado principalmente no aconselhamento de crianças, 
diagnóstico clínico e mensuração da capacidade geral de pessoas que se saem mal em 
testes verbais. Ele também é empregado nas pesquisas sobre a frustração e sobre as 
diferenças culturais. Muitas versões do teste (itens diferentes, diferentes regras de 
avaliação, etc.) são utilizadas em diferentes clínicas e países. Quais são as possíveis 
vantagens e desvantagens dessa diversidade? 
 
5. Os membros dos departamentos de ensino de lima escola preparam um teste de 
múltipla escolha a ser utilizado em todos os departamentos. Este teste é "padronizado", 
conforme o termo é empregado aqui? Se apenas um professor prepara e utiliza o teste 
em todos os departamentos, ele é "padronizado"? 
 
6. Um teste de redação pode ser um teste padronizado? 
 
 
 
 4 
Estilos de Testagem Psicométrica e Impressionista 
 
Os métodos de coleta de informações variam de um extremo psicométrico a um extremo 
impressionista. O maior contraste está na ênfase colocada na padronização e na 
objetividade, que são máximas no extremo psicométrico. Existe uma diferença também na 
interpretação; algumas examinadoras querem "medir" o indivíduo, algumas querem 
"caracterizá-lo". 
 
A testagem psicométrica resume o desempenho em números. Seu ideal é expresso em 
dois famosos pronunciamentos antigos: 
 
- Se uma coisa existe, ela existe em certa quantidade. 
 
- Se existe em certa quantidade, ela pode ser medida. 
 
Observem a suposição de que a psicóloga se preocupa com "coisas", com elementos ou 
traços que de algum modo "existem". Considera-se que todas as pessoas possuem os 
mesmos traços (isto é, assertividade ou compreensão mecânica), mas em quantidades 
diferentes. Esta visão da investigação psicológica toma como exemplo a ciência física, 
que identifica aspectos comuns de objetos diferentes. Os números representando 
dimensões abstratas - peso, velocidade e intensidade de energia de um certo 
comprimento de onda - servem para descrever rochas e foguetes, velas e vaga-lumes. 
 
Uma abordagem psicométrica é mais proveitosa quando uma pergunta bem definida deve 
ser respondida, e quando o intérprete tem experiência suficiente para traduzir a 
mensuração numa estimativa do provável resultado de cada curso de ação disponível. 
 
Um estilo impressionista de avaliação busca a descrição individualizada. O psicólogo 
tenta ser um observador sensível que percebe as deixas através de todos os meios 
possíveis e cria uma interpretação integrada. Para este examinador, até um teste 
focalizado é uma oportunidade de estudar a pessoa como um todo. O impressionista não 
se satisfaz com uma estimativa numérica do nível de capacidade. Ele quer saber como a 
pessoa expressa sua capacidade, que tipos de erros comete e por quê. 
 
Para avaliar o background de uma pessoa, o examinador psicométrico apresentaria uma 
lista de verificação abrangendo experiências que muitas pessoas têm (por exemplo, “Você 
foi líder de seu grupo de escoteiros ou bandeirantes?”. Ele contaria os itens verificados 
para conseguir escores para, digamos, "interesse por esportes" e "experiência de 
liderança". O impressionista, por outro lado, talvez não estabelecesse tarefas mais 
definidas do que "Por favor, escreva a história da sua vida em 2.500 palavras". 
 
Ele observaria aquilo que a pessoa considera importante relatar e também seu tom 
emocional. A resposta livre fornece informações não - sistemáticas, mas abrange questões 
que a lista de verificação ignora. 
 
O estilo psicométrico é marcado pela qualidade definida da tarefa, objetividade dos 
registros, rigor na avaliação e nos dados combinantes e ênfase na validação. Ao salientar 
essas características do estilo psicométrico, não quero dizer que a testagem psicométrica 
necessariamente possui todas essas características simultaneamente. 
 
 5 
A maioria das aplicações de testes é psicométrica em certos aspectos e impressionista 
em outros. O mensurador precisa recorrer ao julgamento quando aplica informações de 
escores no ensino, terapia ou supervisão de empregados. E o retratista deve prestar 
atenção aos fatos da mensuração. Quanto mais excepcional a pessoa sendo estudada, 
ou quanto mais sem precedentes a decisão a ser tomada, maior a necessidade de 
estruturar perguntas e procedimentos que se ajustem ao caso. Este livro é primariamente 
uma apresentação das idéias e métodos da tradição psicométrica, mas o examinador 
impressionista precisa compreendê-los, ainda que apenas como um ponto de partida. 
 
Vamos examinar os contrastes com mais detalhes, começando com a estrutura da tarefa. 
O examinando pode receber uma tarefa definida ou uma tarefa vaga. Aquele que vai 
escrever um ensaio autobiográfico está livre para empregar qualquer estilo e introduzir 
qualquer conteúdo. Isso não acontece quando ele é solicitado a assinalar atividades numa 
lista impressa. 
 
Diz-se que uma tarefa é estruturada quando todas as pessoas a interpretam da mesma 
maneira. A estruturação obtém uma resposta definida para uma pergunta formulada 
antecipadamente. 
 
O criador do teste pode pedir aos examinandos para construírem suas próprias respostas, 
ou pode oferecer uma escolha entre alternativas de respostas fixas. Nós podemos falar, 
então, de testes de resposta-de-escolha e resposta-construída ("resposta-livre"). Os 
examinadores psicométricos geralmente optam pela resposta de escolha, de modo a 
tornar o teste mais estruturado. 
 
Um entrevistador poderia perguntar: "Você fica à vontade em reuniões sociais?". Um 
examinador mais psicométrico oferece alternativas como SEMPRE, MUITAS VEZES, ÀS 
VEZES, NUNCA. Um item de conclusão de séries numéricas (7 5 8 6 9 ...) pode ser de 
resposta com final aberto ou apresentar escolhas de resposta. 
 
O formato de escolha facilita a avaliação, mas o comportamento apresentado é menos 
rico. Até num item de série de números podem aparecer diferenças. Uma pessoa diz 
"Sete" diretamente; outra, hesitantemente, diz "Bem, poderia ser sete. Acho que está 
certo". Os psicólogos que preferem respostas com final aberto valorizam as observações 
suplementares. A professora de inglês prefere avaliar um aluno a partir de uma amostra 
de redação livre e não através de testes em que ele meramente identifica erros. A 
professora de matemática quer que seus alunos resolvam problemas, não apenas 
selecionem a melhor de várias alternativas. No Capítulo 9, eu apresento as evidências 
sobre o grau de sobreposição desses dois tipos de teste, assim como as considerações 
relativas à escolha entre eles. 
 
A testagem psicométrica preocupa-se mais com o produto do que com o processo. O 
produto é claramente observável - a resposta dada, a torre de cubos construída, ou a 
redação escrita. Quando um examinador psicométrico presta atenção ao processo, ele se 
arma com uma folha de registro para tabular o que vê e seleciona antecipadamente os 
aspectos específicos de estilode resposta que irá registrar. Listar as variáveis 
antecipadamente é uma restrição inaceitável para o psicólogo impressionista. Ele prefere 
procurar o que é significativo no comportamento de cada examinando, conforme o 
observa trabalhando. Conseqüentemente, prefere as tarefas que as pessoas abordam de 
modos diferentes. 
 
 6 
Quando uma decisão precisa ser tomada, podemos combinar os fatos registra dos 
através de uma regra formal ou podemos combiná-los impressionisticamente. Por 
exemplo, uma professora atribui notas em um curso através das médias dos testes. Uma 
outra utiliza impressões globais: este aluno está "fazendo um trabalho que merece B, 
mesmo que tenha piorado no final", enquanto aquele outro "não é realmente tão bom 
quanto seus testes sugerem". O examinador psicométrico prefere um método uniforme, 
impessoal, ao passo que o impressionista prefere a flexibilidade. Finalmente, chegamos à 
validação. Os examinadores psicométricos confiam nas interpretações feitas através de 
uma regra derivada estatisticamente de grupos anteriores; eles desconfiam de 
interpretações mais subjetivas, individualizadas. Um examinador psicométrico acompanha 
cada resultado numérico com um alerta referente ao erro de mensuração, e gostaria de 
poder agregar um índice de incerteza a cada predição. O impressionista preocupa-se 
menos com a validação formal. Se não existem dois casos iguais, as interpretações não 
se repetem, e as tabelas de experiência não podem ser acumuladas. Validar "retratos" é 
muito mais difícil do que validar predições numéricas. Com efeito, isso requer que se 
valide o intérprete, ou retratista. 
 
O intérprete impressionista quer ser um artista, sensível ao observar e hábil ao transmitir 
impressões. Alguns psicólogos possivelmente são melhores juízes da personalidade do 
que outros. O método psicométrico busca procedimentos que todos podem utilizar 
igualmente bem. O teste objetivo é uma câmera apontada numa direção fixa; todos os 
fotógrafos competentes devem tirar a mesma fotografia com ela. Assim, a testagem 
psicométrica busca reduzir a mensuração a um procedimento técnico. Na extensão em 
que isso tem sucesso, fica diminuída a necessidade de um psicólogo "sábio". 
 
As abordagens psicométrica e impressionista diferem mais nitidamente na questão da 
confiança no psicólogo. Os defensores do rigor consideram o examinador como um 
instrumento errático cujas interpretações não-reguladas misturam a verdade com 
especulações. Os impressionistas consideram o observador como um instrumento 
sensível e inclusive indispensável. O impressionista não nega o perigo de 
tendenciosidades e erros. Mas ele não está disposto a ignorar a história da pessoa e sua 
presente situação - e os significados que lhe atribui. 
 
7. "A testagem psicométrica confia no julgamento do criador do teste, ao mesmo tempo 
em que não está disposta a confiar no examinador como observador. " Esta é uma 
declaração defensável? 
 
8. Diferencie estruturado de padronizado. 
 
9. Em que aspectos os seguintes procedimentos são não estruturados? 
 
a. No teste de caligrafia de Ayres, os alunos devem escrever o Discurso de Gettysburg 
primorosamente, fazendo o máximo possível num tempo determinado. 
 
b. Num teste de desenvolvimento intelectual, pede-se à criança que "faça o melhor 
desenho possível de um homem". 
 
c. Num teste de discriminação de altura de som, o sujeito ouve dois tons e responde A, B 
ou N, se o segundo som parece mais alto, mais baixo ou não diferente do primeiro. 
 
 
 7 
CLASSIFICAÇÃO DE PROCEDIMENTOS 
 
Por uma questão de conveniência, este livro separa os procedimentos em duas amplas 
classes: os que buscam medir o desempenho máximo e os que buscam medir respostas 
típicas. 
 
O desempenho apresentado por uma pessoa cooperativa solicitada a fazer o melhor 
possível indica "capacidade". O desempenho máximo é uma ficção conveniente. O 
conceito ajuda a organizar a minha discussão, mas observar o máximo é tão difícil quanto 
localizar o final do arco-íris. O melhor tempo de uma pessoa numa corrida de uma milha é 
apenas o melhor que ela pode fazer mo momento; ela pode quebrar o recorde amanhã. 
Ericsson (1987) fala sobre uma pessoa cuja capacidade máxima de lembrar séries de 
números chegava a sete dígitos. Depois de seis semanas de prática com uma técnica 
especial, ela era capaz de lembrar 80 dígitos! Ela melhorou sua capacidade aproveitando 
sua facilidade em associar eventos. Ela atribuía significados a grupos de dígitos, ficando 
com menos "itens" para lembrar. Dada uma série contendo 3-4-9-2, por exemplo, ele 
pensava em três minutos, 49,2 segundos - um desempenho magnífico na corrida de uma 
milha (Posner, em Chi e colaboradores, 1988, p. XXX). 
 
Segundo, existem procedimentos para descobrir o que a pessoa faz ou sente mais 
freqüentemente, numa situação ou tipo de situação recorrente. As medidas das respostas 
típicas abrangem aspectos de personalidade, hábitos, interesses e caráter2. Aqui, a 
"resposta" pode referir-se a ações manifestas corno assumir a liderança (ou permanecer 
quieto) num grupo social, ou a declarações que a pessoa faz, ou ao encobrimento de 
pensamentos e sentimentos. Martin tipicamente age corno se estivesse interessado nas 
estórias que sua esposa conta a respeito de seu dia no escritório, e talvez costume dizer 
que está interessado, mesmo quando não está. Ambas estão na esfera das respostas 
típicas. (Mas fazer com que ela acredite - isso sim é capacidade!) 
 
A resposta típica e a capacidade não são verdadeiramente separáveis. O recorde de uma 
pessoa em testes de datilografia estabelece que sua capacidade atingiu determinado 
nível, mas o escore também reflete sua disposição de se esforçar naquele tipo de 
situação. Em outras palavras, a minha distinção não leva em consideração os propósitos. 
Os propósitos são importantes, mas recebem pouca consideração na psicologia das 
diferenças individuais (Snow & Farr, 1987). 
 
Os psicólogos empenhados na modificação do comportamento fazem uma distinção muito 
semelhante à minha. Com relação a algum comportamento desejado, eles primeiro 
perguntam se a resposta (isto é, uma habilidade social) "faz parte do repertório da 
pessoa". Quando confirmam que a capacidade está presente, eles passam a investigar 
com que freqüência a pessoa responde daquela maneira em várias situações recorrentes. 
 
As instruções dos testes quase nunca dizem ao examinando corno abordar a tarefa. 
Teoricamente, o estilo de desempenho enquadra-se na categoria de resposta típica; mas 
 
2 'Em edições anteriores deste livro, referi-me à segunda categoria como "testes de comportamento típico". 
Isso era consistente com a tendência a falar sobre uma pessoa como tipicamente cautelosa, ou responsável. 
ou ansiosa. Mas a teoria moderna da personalidade enfatiza o papel da situação na determinação das ações 
e dos sentimentos da pessoa, e a terminologia "resposta típica" pretende sugerir a pergunta "resposta a 
quê?". 
 
 8 
as variações de estilo afetam os escores de "capacidade". O labirinto de Porteus (Figura 
2.1) é uma técnica de observação em que a examinadora procura evidências de 
planejamento e antecipação, ao mesmo tempo em que é um teste de capacidade que 
avalia a velocidade e a exatidão. 
 
 
 
 
 
Figura 2.1. Dois dos labirintos de Porteus. O testando deve traçar o caminho mais curto através do 
labirinto. Uma tentativa é avaliada como um fracasso sempre que o lápis entra num caminho sem 
saída. Ele então pode fazer novas tentativas no mesmo labirinto. Quando ele acerta um dos 
labirintos, passa para outro mais difícil, continuando até fracassar em várias tentativas num mesmo 
labirinto. (Fonte: Esses labirintos têm o copyright de 1933, 1953, 1955, The Psychological 
Corporation e são reproduzidos com permissão.) 
 
10. "Um teste de capacidadeé um teste em que a pessoa não pode receber um escore 
melhor do que o merecido; em medidas de ajustamento emocional e atitudes sociais, a 
pessoa pode dar respostas que causam uma boa impressão, mesmo que as respostas 
sejam falsas." Essa distinção é equivalente à distinção entre o desempenho máximo e a 
resposta típica? 
 
 
 9 
Testes de Desempenho Máximo 
 
O aspecto característico de um teste de capacidade é que o testando é encorajado a 
conseguir o melhor escore que puder. O objetivo da examinadora é o de eliciar o melhor 
desempenho possível (dentro das regras), e isso significa que o testando deve querer 
sair-se bem e precisa compreender o que é considerado um bom desempenho. Para que 
ele dê o melhor de si, as instruções precisam ser claras e explícitas, incluindo a 
explicação de como os vários tipos de erros serão penalizados. 
 
Alguns testes de capacidade propõem tarefas conhecidas; outros requerem que a pessoa 
faça alguma coisa desconhecida. No Teste de Coordenação Complexa (Figura 2.2), uma 
pessoa que nunca pilotou um avião opera uma "alavanca de comando" e um "leme de 
direção". Luzes piscando assinalam que devem ser feitos determinados movimentos; 
respostas rápidas e coordenadas recebem um escore elevado. 
 
Um grande grupo de testes inclui o EFT e os labirintos, como também testes de raciocínio 
verbal; eu me refiro a eles como medidas de "capacidade intelectual geral". Este termo se 
refere a uma série de capacidades importantes em quase qualquer tipo de pensamento. 
Testes desse tipo freqüentem ente são chamados de "testes de inteligência", mas a 
interpretação do teste é mais correta se evitamos os mitos associados à palavra 
"inteligência". Juntamente com as capacidades gerais estão aquelas pertinentes a uma 
variedade limitada de tarefas: compreensão mecânica, sensibilidade à tonalidade dos 
sons, destreza manual e assim por diante. 
 
O desempenho numa tarefa importante em si mesma proporciona evidências de 
proficiência ou competência. Podemos medir a proficiência em falar o francês, num 
aconselhamento via telefone, no conserto de uma torneira. O termo mais limitado teste de 
realização se refere ao teste que abrange alguma coisa que a escola presumivelmente 
ensinou diretamente - a leitura, por exemplo, ou o conhecimento do sistema solar. Um 
"teste de maestria" é um teste de realização relativo a algum tópico ou habilidade 
limitados, destinado a estabelecer se um estudante domina aquele assunto. O termo 
"competência mínima" passou a ser empregado na 
década de setenta. Os críticos das escolas haviam 
se queixado de que muitos alunos com o segundo 
grau completo não eram adequadamente 
instruídos e empregáveis. Um teste utilizado para 
identificar esses alunos (quer como um alerta 
precoce ou um último obstáculo) passou a ser 
conhecido como um teste de competência mínima 
(Jaeger, em Linn, 1989a). 
 
Um teste de aptidão é um teste destinado a 
predizer o sucesso - existem testes de aptidão 
para a engenharia, aptidão musical, aptidão para a 
álgebra e assim por diante. Esses testes não têm 
formas distintas. Um teste de aptidão para a 
engenharia pode incluir seções medindo a 
capacidade intelectual geral, o raciocínio mecânico 
e espacial e a proficiência em matemática. 
 
O contraste realização/aptidão é de ponto de vista, 
 10
mais do que de conteúdo de teste. Qualquer teste é um teste de realização na medida em 
que é um relato sobre o desenvolvimento e a aprendizagem até aquele momento; é um 
teste de aptidão na medida em que diz alguma coisa sobre o futuro. Flaugher (1978) 
sugere que muitos daqueles que pedem uma testagem de "aptidão" consideram as 
diferenças individuais nas capacidades como fixas e contam com a seleção ou 
classificação para combinar as pessoas com as responsabilidades. Aqueles que pedem 
uma testagem de "realização", diz ele, pensam nas diferenças individuais como refletindo 
experiências passadas e esperam que o treinamento possa preparar o candidato com um 
escore baixo para futuras responsabilidades. 
 
Medidas de Resposta Típica 
 
Para a maioria das perguntas sobre sentimentos e hábitos, nenhuma resposta específica 
pode ser destacada como "boa". Não existe nada de bom ou de mau no interesse pela 
engenharia. Igualmente, não podemos dizer que um certo grau de dominação é melhor; o 
mundo oferece papéis adequados para as pessoas ao longo de toda a escala. Aqueles 
que estão empregando um executivo cujo sucesso anterior garante sua capacidade 
também querem saber como ele funciona habitualmente. Ele supervisiona 
cuidadosamente, prestando atenção aos mínimos detalhes? Ou delineia uma tarefa geral 
e dá liberdade aos seus subordinados? Ele se preocupa igualmente com produção, 
problemas humanos e finanças? Ele prefere um planejamento de longo alcance ou uma 
rápida adaptação? Conhecer o seu padrão ajuda a colocá-lo adequadamente na 
organização. 
 
As informações sobre os hábitos têm um valor preditivo; o que a pessoa faz uma vez 
provavelmente fará novamente. Mas a maioria dos psicólogos negaria que os hábitos 
observados de uma pessoa são a sua personalidade. Uma pessoa nem sempre age como 
agiu em ocasiões anteriores. Nós não desejamos considerar as reações excepcionais 
como caprichosas e inexplicáveis. Conseqüentemente, supomos que as respostas são 
geradas por uma estrutura de personalidade ou sistema de crenças consistente, que é 
sensível às diferenças situacionais. A estrutura tem de ser inferida a partir das 
observações do comportamento e relatos sobre atos, opiniões e fantasias. 
 
Nas semanas que antecederam o casamento do príncipe Charles, a imprensa britânica 
buscou os mínimos fragmentos de informação sobre a futura princesa. Ela ensinara num 
jardim de infância, e um repórter entrevistou um de seus alunos e perguntou: "Como ela 
era?". O garotinho respondeu: "Não sei. Ela nunca me disse." A maioria dos psicólogos 
está na posição dessa criança - 90 por cento das informações coletadas sobre a 
personalidade, interesses e atitudes originam-se dos relatos do sujeito. Quase todos os 
outros psicólogos estão na posição do repórter, dependendo de impressões de segunda-
mão. A observação direta e sistemática por parte do psicólogo e seus auxiliares é 
comparativamente incomum - mas uma fonte de dados potencialmente superior. 
 
Observação. A observação padronizada requer que cada pessoa seja colocada 
essencialmente na mesma situação. A personalidade pode ser observada durante um 
teste intelectual, durante uma discussão de grupo ou quando a pessoa é desafiada a 
caminhar sobre uma trave com os olhos vendados. Foram planejadas tarefas especiais - 
testes de desempenho de personalidade - para proporcionar uma boa oportunidade de 
observação. 
 
 11
A observação padronizada permite-nos comparar pessoas que normalmente não são 
vistas em circunstâncias semelhantes. Além disso, ela elicia respostas que poderiam ser 
vistas apenas ocasionalmente na vida cotidiana. Por exemplo, para examinar reações à 
frustração, a pessoa é iniciada em alguma atividade e então impedida de atingir seu 
objetivo. Em um estudo, pré-escolares receberam a oportunidade de brincar com 
brinquedos comuns, razoavelmente interessantes. Depois, foram levados para uma sala 
adjacente, com brinquedos imensamente atraentes. Depois de um período de 
brincadeiras nessa sala, eles foram levados novamente para a primeira sala, e uma tela 
de arame foi colocada entre eles e os lindos brinquedos. As crianças reagiram de várias 
maneiras: dando pontapés na tela, voltando ao brinquedo simples com pedras, tentando 
passar por baixo da tela ou fingindo tirar uma soneca. Em geral, os jogos após a 
frustração foram menos maduros e menos construtivos do que antes. 
 
Se queremos o comportamento típico, o sujeito não deve saber o que está sendo 
observado. O observador pode estar escondido, ou a pessoa pode ser levada a acreditarque está sendo testada em relação a uma determinada característica enquanto alguma 
outra coisa está sendo observada. Quando estamos estudando a reação à frustração, 
pode-se dizer ao testando que sua capacidade intelectual está sendo observada. Quando 
ele ficar frustrado por perguntas difíceis, suas respostas provavelmente não serão 
dissimuladas. 
 
O comportamento típico também pode ser observado em amostras tomadas "no campo". 
As crianças no playground revelam muito sobre seus hábitos e personalidade; o mesmo 
acontece com um não-combatente liderando um pelotão e os funcionários no escritório. A 
média de arremessos no beisebol resume as observações de campo registra das 
sistematicamente. As avaliações de mérito feitas por um supervisor também são 
baseadas na observação, mas são quase sempre assistemáticas. 
 
As situações referidas no parágrafo anterior são padronizadas até certo ponto. No 
playground, cada criança está reagindo aos atos não-padronizados de seus 
companheiros de brincadeiras. Na quadra de beisebol, os arremessos executados mudam 
de um rebatedor para o próximo. 
 
Quando o examinador se propõe a disfarçar seu propósito ou a observar sem o 
conhecimento do seu alvo, surgem questões éticas. Os princípios éticos criados para a 
conduta na pesquisa também têm implicações na testagem (American Psychological 
Association, 1973; em sumário, 1981). 
 
A "invasão de privacidade" está sendo interpretada de forma cada vez mais rígida: 
práticas consideradas normais numa década são desaconselhadas na próxima. Todos os 
laboratórios de psicologia possuem um espelho de observação que permite a um 
observador enxergar a sala de entrevistas ou de brinquedos sem ser visto. Em épocas 
anteriores, o sujeito não ficaria sabendo que estava sendo observado. Hoje, uma prática 
comum é mostrar ao sujeito (ou aos pais, caso o sujeito seja uma criança pequena) o 
posto do observador e a visão através do espelho, explicando casualmente que esse 
arranjo pretende eliminar distrações. Uma vez absorvido numa tarefa e especialmente 
depois de várias sessões, não é provável que o sujeito continue preocupado com o 
espelho. Uma outra prática adequada é dar uma indicação generalizada: "Estaremos 
observando como você interage com seu filho, de vez em quando, mesmo quando não 
lhe dissermos que estamos mantendo um registro. Às vezes, essas observações vão nos 
ajudar a orientá-la. Naturalmente, se você não quiser ser observada deve nos dizer, e se 
 12
num dia específico acontecer alguma coisa que você não quer que conste desse arquivo, 
pode nos pedir para rasgar este registro, que nós iremos rasgá-lo". 
 
A franqueza não pode avançar além dos limites do bom senso. O terapeuta da fala não 
diz: "Eu vou contar quantas vezes você gagueja"; a psicóloga infantil não diz à mãe: "Eu 
vou contar às vezes em que você parece insegura de si mesma". 
 
Auto-Relato. Cada pessoa conhece bastante o seu próprio comportamento. Os 
questionários - freqüentemente chamados de "inventários" - são usados para obter auto-
descrições. Existem inventários sobre os hábitos de estudo, inventários de interesses, 
inventários de atitudes sociais e assim por diante. O inventário biográfico pode tratar de 
qualquer coisa, da história conjugal aos sentimentos em relação ao pai da pessoa, ou dos 
passatempos passados e atuais. O título dos questionários deve evitar a palavra "teste", 
de modo a evitar sugerir (por exemplo) que a dominação é mensurada diretamente. 
 
Ao passo que o inventário tradicional faz perguntas generalizadas -"Você bebe muito?" - 
uma outra abordagem pede que a pessoa observe seu próprio comportamento em 
determinados momentos. A pessoa pode ser solicitada a registrar todas as noites a sua 
ingestão de álcool naquele dia, talvez juntamente com uma anotação sobre as 
circunstâncias em que bebeu cada drinque. A virtude da auto-observação é a exatidão da 
informação. O procedimento é intrusivo e tende a alterar o próprio comportamento – uma 
vantagem quando o ato de registrar reforça o processo terapêutico, mas uma 
desvantagem quando estamos tentando investigar o comportamento típico. 
 
A auto-observação direta das ações deveria dizer-nos algo muito semelhante àquilo que 
um segundo observador relataria. A auto-observação direta de pensamentos e 
sentimentos, entretanto, captura informações de outra forma não disponíveis. Um 
procedimento de mensuração estruturado - o Experience Sampling Method (Método de 
Amostragem da Experiência) - foi desenvolvido por Csikszentmihalyi e Larson (1984), 
para as pesquisas sobre a adolescência. Os respondentes, recrutados como co-
investigadores júnior, sabiam que as informações coletadas não iriam afetá-los de modo 
nenhum. 
 
Cada participante recebia um aparelho transmissor e um bloco dos formulários ilustrados 
na Figura 2.3. Durante a semana de coleta de dados, eram enviados sinais - cerca de 80 
no total - através do aparelho transmissor, em intervalos espaçados, irregulares, desde as 
7 horas da manhã até as 10 e meia da noite (até mais tarde na sexta e no sábado). O 
participante deveria preencher o formulário imediatamente quando o aparelho sinalizava, 
mas não se exigia uma obediência perfeita. O índice de respostas de 69 por cento foi 
baixo principalmente por causa do mau funcionamento dos transmissores; não parece ter 
havido muita censura. Muitas respostas, incluindo as da Figura 2.3, obviamente foram 
espontâneas. (Incidentalmente, a mãe citada nesta resposta pareceu ao investigador uma 
pessoa sensível e razoável; R. Larson, comunicação pessoal, 1989.) 
 
 13
 
Figura 2.3. Um auto-relato sobre o humor e o comportamento num momento amostra (fonte: De 
Begin Adolescent: Conflict and Growth in the Teenage Years, de Mihaly Csikzentmihalyi e Reed 
Larson, Coprygth 1984 da Basic Books, Inc. Reimpresso com a permissão do editor). 
 
A principal virtude dessa técnica era o formulário padrão de relato que parecia se ajustar a 
todas as pessoas e eventos. Isso permitiu uma comparação estatística entre os indivíduos 
e tipos de ambientes. Os dados mostraram algumas associações surpreendentes; por 
exemplo, um claro aumento na excitação nos finais de noite do fim-de-semana, 
combinado com uma diminuição consciente do autocontrole. 
 
11. Classifique cada uma das seguintes situações como um teste de capacidade, um 
auto-relato, uma observação numa situação padronizada, ou uma observação numa 
situação não-padronizada: 
 
a. Um entrevistador do Instituto Gallup pergunta a um cidadão como ele votará nas 
próximas eleições. 
 
b. Uma produtora de televisão quer saber que características atraem diferentes tipos de 
espectadores. Ela apresenta um show para uma pequena audiência, que pressiona 
botões sinalizadores para indicar se eles gostam ou não do que estão vendo em cada 
momento. 
 
c. Um teste de "aptidão vocacional" pergunta o quanto o sujeito gosta de atividades, tais 
como vendas, marcenaria e xadrez. 
 
 14
d. Um teste de ortografia é aplicado a candidatos a um emprego de escritório. 
 
e. Inspetores em roupas comuns (não uniformizados) andam de ônibus para determinar 
se os motoristas e cobradores estão obedecendo às regras da companhia. 
 
f. Durante um teste de labirinto, o examinador busca evidências de autoconfiança ou da 
sua ausência. 
 
g. Os estudantes são informados sobre uma proposta para reduzir o crescimento 
populacional num subúrbio: serão autorizadas poucas ligações novas à rede de esgotos. 
Pede-se a eles que digam o que o conselho municipal deve fazer e que dêem razões para 
justificar suas escolhas. 
 
h. Um inspetor de uma fábrica de meias deve detectar todas as meias com falhas na 
malha. Como uma verificação da eficiência, em certos momentos algumas meias 
defeituosas que haviam sido marcadas com uma tinta fluorescente são misturadas com o 
lote a ser inspecionado. A tinta é invisível para o funcionário,mas ao utilizar uma lâmpada 
ultravioleta sobre as meias depois da inspeção, o supervisor pode localizar facilmente 
quaisquer meias defeituosas que o inspetor deixou passar. 
 
12. Classifique cada um dos seguintes testes, empregando os termos descritivos 
discutidos no texto, tantos quanto forem claramente aplicáveis. 
 
a. O Estudo dos Valores consiste em perguntas impressas, tais como: 
 
Na sua opinião, qual é a melhor maneira de um homem que trabalha no ramo de negócios 
a semana toda passar o domingo: 
 
1. tentando instruir-se, lendo livros sé rios? 
2. tentando vencer no golfe, ou em corridas? 
3. assistindo a um concerto de uma orquestra? 
4. escutando um sermão realmente bom? 
 
O respondente escolhe a resposta preferida. Um gabarito numérico calcula a importância 
que atribui aos valores "estéticos", "religiosos" ou outros. 
 
b. Num determinado teste de "aptidão mecânica", a pessoa assinala as ilustrações de 
ferramentas e outros objetos que são usados juntos (por exemplo, martelo e bigorna). 
 
c. Um item de Arranjo de Figuras apresenta quatro figuras que, arranjadas na ordem 
correta, contam uma história, como numa tira de cartum (veja a Figura 7.2). Cada figura 
está num cartão separado. Os cartões são apresentados num arranjo aleatório, e o 
testando os organiza de modo que formem uma história inteligível. d. O Short lmaginal 
Processes lnventory consiste em 45 itens, tais como: 
 
- Eu tendo a me aborrecer facilmente. 
- Meus devaneios diurnos são geralmente estimulantes e recompensa dores. 
- Em meus sonhos, eu manifesto raiva em relação aos meus inimigos. 
 
A pessoa responde segundo uma escala de 5 pontos, variando de "é uma forte 
característica minha" ao oposto. São computados três resultados: Devaneios Diurnos 
 15
Positivo-Construtivos, Devaneios Diurnos de Culpa e Medo do Fracasso e Controle da 
Atenção. 
 
A TESTAGEM NA ERA DO COMPUTADOR 
 
O computador desempenha muitos papéis por trás do cenário da testagem e pode fazer o 
papel de astro como aplicador de testes. O tópico é introduzido aqui porque o computador 
está mudando as idéias sobre aquilo que os testes podem e devem ser (Roid, em Plake & 
Witt, 1986). Em virtude de sua consistência, o computador leva a padronização a um 
extremo; entretanto, ele pode realizar uma mensuração padronizada ao mesmo tempo em 
que apresenta perguntas diferentes (e uma devolução personalizada) a cada testando. 
 
A devolução pode ser notavelmente complexa, quase como uma conferência pessoal. No 
aconselhamento profissional, por exemplo, o computador pode fazer perguntas, que 
ajudam a pessoa a refletir sobre seus interesses e experiência de trabalho, e pode sugerir 
onde obter informações sobre ocupações adequadas. 
 
Bancos de Itens 
 
O tipo de teste mais conhecido é um folheto impresso cheio de perguntas. Atualmente, 
um teste impresso que se ajuste a determinadas exigências locais pode ser produzido 
rapidamente através de um "banco de itens" - um arquivo de itens classificados por 
conteúdo e nível de dificuldade. Um sistema escolar pode solicitar a um fornecedor um 
teste para estudos sociais cuja mescla de tópicos seja adequada ao seu currículo. 
Atualmente, é prático armazenar localmente bancos de itens e montar testes com um 
microcomputador (F. Baker, em Linn, 1989a). Um número infinito de testes equivalentes 
pode ser criado selecionando-se conjuntos de itens de acordo com o mesmo 
planejamento. 
 
O governo federal certa vez planejou computadorizar grande parte da testagem dos 
funcionários públicos (Urry, 1977). Os planos foram engavetados antes de serem 
concluídos - não, aparentemente, por uma questão de plausibilidade e custo. O fato de o 
computador poder criar um teste novo para cada pessoa é a sua principal atração para o 
serviço público. Mês após mês, chegam candidatos a serem testados para o mesmo tipo 
de cargo, e as perguntas acabam vazando depois que um teste é utilizado repetidas 
vezes. Uma equipe humana não pode montar mais do que alguns formulários de teste 
para cada cargo. Com numerosos itens num disquete, o computador pode montar um 
formulário diferente para cada candidato e adaptar todos os resultados a uma escala 
comum. 
 
As vantagens tornam-se consideravelmente maiores quando o teste abrange problemas 
que o computador é capaz de resolver. Candidatos a funcionário da alfândega poderiam 
ser solicitados a calcular o imposto a ser pago sobre um carregamento de produtos 
importados, utilizando uma complexa tabela de impostos. Essa tarefa pode ser 
estruturada de uma maneira geral. Para cada examinando, o computador pode alterar 
arbitrariamente os impostos, regras ou as mercadorias do carregamento. Diante desse 
tipo de teste, o candidato não tem alternativa além de aprender a aplicar tabelas de 
impostos. Ele não ganha nada ao descobrir as regras que um amigo aplicou na semana 
anterior. 
 
 16
O desejo de manter a segurança dos testes motivou o Departamento de Defesa a levar 
cinco anos replanejando a administração do teste de qualificação (ASV AB) para recrutas 
potenciais, para que fosse aplicado por computadores. O serviço público não quer 
encorajar candidatos de capacidade limitada, mas os recrutadores que recrutam 
candidatos estão ansiosos por recrutar o máximo possível de pessoas. Conhecendo os 
itens do teste, alguns recrutadores orientam os candidatos fracos que de outra forma não 
passariam no teste (ou, pelo menos, é do que desconfiamos). Com o teste 
computadorizado infinitamente variável, essa orientação seria impossível. Finalmente, os 
planos para o ASV AB computadorizado foram engavetados sem terem sido usados, 
porque alguém com um lápis bem apontado calculou o custo da instalação do hardware 
necessário em todo o país (Bunderson, Inouye & Olsen, em Linn, 1980a, p. 383). 
 
 
Aplicação Automatizada 
 
Os computadores são bons em apresentar testes diretamente aos indivíduos - um teste 
audiométrico, por exemplo. No diagnóstico de transtornos auditivos e na adaptação de 
aparelhos auditivos, a examinadora ajusta tons puros para volumes mais altos e mais 
baixos, a fim de determinar o volume mais baixo que a pessoa consegue ouvir. Um 
examinador humano diria ao testando para pressionar um botão quando ele ouvisse o tom 
em seus fones de ouvido. Ele ajustaria o botão de freqüência em (por exemplo) 800 hertz 
(ciclos por segundo), ajustaria o botão de volume num nível mediano (por exemplo, 5) e 
pressionaria por 0,5 segundos o interruptor que produz o som. Depois da resposta, o 
examinador assinalaria a resposta numa folha de registro. Mais tentativas na mesma 
freqüência - sem outras orientações audíveis, mas com uma luz indicando "já" - poderiam 
utilizar níveis 4 (eliciando uma resposta positiva codificada como +), 3 (+), 0 (-); uma 
tentativa de testar respostas falsas), 2 (-), 3 (-), 2 (-), 3 (+) e assim por diante. Em certo 
momento, o examinador determinaria uma estimativa (algo perto de 3 neste caso) do 
limiar auditivo da pessoa em 800 hertz e, então, passaria para outra freqüência. 
 
O computador pode fazer as mesmas coisas, economizando o tempo remunerado do 
profissional. O computador dá instruções visualmente ou através de fones de ouvido, 
modifica os sinais sem erro e os sinais de tempo com precisão. Diferentemente de um 
botão de controle giratório, ele pode fixar valores de 3,1 ou 3,05. O computador pode 
determinar o limiar com maior rapidez e, segundos depois da última resposta, pode 
imprimir imediatamente um perfil de resultados em função dos tons. A transmissão 
através de satélites torna possível enviar instantaneamente a informação para o outro 
lado do mundo. 
 
Entre os talentos do computador observados neste exemplo estão os seguintes: 
 
- Adesão precisa a esquemas e planos. Controle delicado dos estímulos. 
 
- Escolha de itens de teste sucessivos à luz do desempenho até o momento ("testagem 
adaptativa").- Imunidade ao cansaço, aborrecimento, lapso de atenção e erros inadvertidos de 
pontuação. 
 
- Pontuação instantânea e exata. 
 
 17
- Registros legíveis, com cópias múltiplas e transmissão a distância. 
 
Naturalmente, computadorizar um teste traz algumas perdas, especialmente ao eliminar 
as observações não-padronizadas que um clínico experiente faz durante um teste 
individual tradicional. 
 
Interagir com um computador fascina os testandos (pelo menos atualmente, enquanto a 
experiência ainda é nova). Quando problemas de raciocínio foram apresentados a 
estudantes universitários por um computador e por um examinador humano, o relato foi o 
seguinte: 
 
Os sujeitos testados pelo computador são mais capazes de fazer pausas por 
períodos mais longos de tempo sem digitar nada no computador. Os sujeitos 
testados por uma pessoa podem sentir-se pressionados a responder logo, 
mesmo com o risco de fazer alguma coisa errada. Os sujeitos testados por 
computador gritaram de alegria, praguejaram, bateram nas paredes e 
cantaram (podiam ser escutados através das paredes à semi-prova de som de 
seus cubículos), certamente formas de expressão que um sujeito típico evita 
na presença de um experimentador. Johnson & Baker, 1972, p. 31; para um 
relato formal, veja Johnson & Baker, 1973). 
 
Vocês poderiam pensar que o computador adaptar-se-ia somente aos sujeitos instruídos 
e emocionalmente estáveis. Mas crianças pré-escolares e pacientes com doença mental 
respondem bem às apresentações automatizadas. A paciência do computador é 
interminável. Se o esquizofrênico deteriorado não faz nenhum movimento por 4 horas, o 
monitor simplesmente espera. Se a criança desatenta só pode ser levada a fazer o teste 
depois de quatro sessões preliminares de desenhos animados, o computador os 
providencia sem impaciência. 
 
Muitos testes e inventários têm versões para testagem computadorizada através de um 
microcomputador na escola ou no consultório da psicóloga. O software pode não apenas 
administrar o teste sem nenhum examinador humano na sala, como também preparar um 
relatório de resultados para impressão imediata. A versão computadorizada de um teste 
originalmente desenvolvido em forma impressa ou oral normalmente é muito semelhante 
à versão original. 
 
Parece que as versões convencional ou computadorizada de um teste realmente 
costumam medir às mesmas variáveis, mas a dificuldade ou confiabilidade pode mudar 
facilmente. Se a versão computadorizada é "o mesmo teste" é algo que deve ser 
questionado com cada instrumento em termos psicológicos. Talvez seja mais difícil ler 
diagramas no monitor do que na página impressa. Os testandos não-familiarizados com o 
teclado podem ter dificuldade se as ações requeridas (por exemplo, revisar um item e 
mudar a resposta) forem complicadas. Mesmo quando o teste em si não é modificado, 
interagir com uma máquina pode ser psicologicamente diferente de responder a um 
examinador humano. Quando a tecnologia do computador permite uma mudança na 
tarefa - introduzindo exposições de tempo controlado, por exemplo - aquilo que o teste 
mede irá mudar. O teste computadorizado de habilidades de manejo dos pacientes 
classifica os candidatos à certificação de forma bem diferente da dos testes de lápis e 
papel planejados para o mesmo propósito (Melnick, 1988). 
 
Testagem Adaptativa. Uma característica muito importante é a capacidade do 
computador de escolher itens de teste à luz dos prévios sucessos e fracassos do 
 18
testando. Isso se chama testagem seqüencial ou adaptativa ou sob medida. Os 
examinadores audiométricos sempre escolheram os estímulos do teste à luz de respostas 
anteriores. No exemplo dado acima, foi sensato apresentar sinais nos níveis 2 e 3 depois 
que o respondente havia detectado sinais de potência 4; se a pessoa cometeu erros nos 
4, sinais levemente mais altos seriam apropriados. 
 
Técnicas" derivativas" são especialmente úteis para testar habilidades intelectuais 
complexas, sendo um exemplo o teste para os médicos descrito na página 13. Depois que 
o testando responde a uma exposição inicial de informações sobre o paciente, são 
fornecidas novas informações. Passo a passo, o testando propõe uma ação ou solicita 
novas informações específicas, e é informado sobre os achados do laboratório ou as 
observações da enfermeira, ou algo parecido. 
 
Ajustar a dificuldade de modo que o examinando trabalhe principalmente com itens que 
não são nem difíceis demais nem fáceis demais para ele deve melhorar a motivação. 
Também é fácil para o computador indicar imediatamente se uma resposta está certa ou 
errada, e isso pode aumentar a motivação (embora esta não seja uma característica 
comum dos testes adaptativos utilizados na avaliação). Um achado ilustrativo: sem um 
feedback instantâneo, os jovens negros de uma escola de segundo grau de zona urbana 
pobre omitiram muitos itens e obtiveram escores mais baixos do que seus colegas de 
classe brancos. Quando o computador ofereceu um feedback depois de cada item, os 
negros omitiram poucos itens e alcançaram os estudantes brancos (Betz, 1975; para 
outros estudos, veja Betz & Weiss, 1976a, 1976b; Prestwood & Weiss, 1978). Entretanto, 
uma declaração geral seria arriscada; o que encoraja uma pessoa perturba outra. 
 
A aprendizagem auxiliada pelo computador incorpora muitos aspectos da testagem 
adaptativa. Quando o aluno acessa o seu programa hoje, o computador lembra não 
apenas do nível de desempenho de ontem, mas também das tarefas em que o aluno não 
se saiu tão bem; os exercícios de hoje são escolhidos de acordo com isso. Os próprios 
exercícios servem como um teste. Assim, o registro do computador torna-se uma 
descrição multidimensional atualizada do indivíduo, mais diferenciada do que um teste 
comum e mais exata do que as percepções do professor. Existem possibilidades 
semelhantes na terapia da fala, exploração das carreiras e outras atividades 
desenvolvimentais. 
 
Exposições Geradas por Computador. A nova tecnologia está aumentando imensamente 
a variedade possível de estímulos de teste. Para testar médicos, uma exposição 
apresentada por um disco de vídeo mostra fotografias a serem interpretadas (um raio X 
ou um slide de microscópio, por exemplo). Simuladores para astronautas possuem um 
arranjo realístico de estímulos, um equipamento realístico para ser manipulado e contínuo 
feedback dos resultados das ações. Embora planejados para treinamento, os aparelhos 
medem o progresso do treinando e portanto são testes. . 
 
O equipamento Micropat na Figura 2.4 apresenta um teste moderno de coordenação 
complexa que as forças armadas britânicas estão investigando. Os pedais são 
semelhantes aos antigos, mas a alavanca de controle foi substituída por uma menor. 
Atualmente, o manejo das informações é considerado muito mais significativo do que a 
coordenação dos grandes músculos. A parte importante deste teste, naturalmente, é o 
software que gera as exposições sempre em mutação. O antigo teste era inflexível. O 
novo - com estímulos que podem ser interminavelmente alterados e com velocidade 
controlada - permite milhares de variações. Muitas pesquisas serão necessárias para 
 19
determinar que padrões de estímulo proporcionam as melhores informações preditivas. 
(Para um exemplo dessa pesquisa "paramétrica", que é um passo rumo à "engenharia" de 
testes psicológicos, veja Bartram e colaboradores, 1985). 
 
O Micropat é um sistema de fornecimento ao invés de um teste. Muitas funções - tempo 
de reação, controle da velocidade motora, raciocínio espacial - podem ser programadas 
para serem avaliadas com o mesmo equipamento. 
 
13. Seria possível colocar um teste audiométrico numa fita de som. A fita, digamos, falaria 
o número do item, depois apresentaria um tom ou um período de silêncio; o respondente 
verificaria itens durante os quais ele ouve um tom em seus fonesde ouvido. Quais seriam 
as vantagens e desvantagens desse procedimento? Compare com os procedimentos 
descritos no texto para: 
 
a. o examinador humano 
b. o computador 
 
 
INFERÊNCIAS A CURTO E LONGO PRAZOS 
 
Alguns intérpretes estão dispostos - e alguns relutantes - a fazer inferências relativas a 
futuras circunstâncias. Para alguns propósitos, o examinador praticamente não precisa ir 
além do tempo e local de observação. Ele observa que uma criança comete erros como" 
As vacas é" na composição de hoje; este fato não poderia ser ampliado além de "Esta 
semana ela não está manejando corretamente as concordâncias de singular e plural". 
Uma ousada inferência a longo prazo é ilustrada quando uma mãe amorosa, observando 
que seu filho geralmente reproduz o tom certo de uma canção depois de ouvi-Ia pela 
primeira vez, diz: "Ele tem uma verdadeira aptidão para a música". Isso é uma 
generalização para uma ampla classe de tarefas, para daqui a muitos anos. 
 
A abordagem mais conservadora à inferência é supor que a pessoa será no futuro aquilo 
que foi no passado (ou, considerando-se o crescimento, irá manter sua posição relativa 
entre seus companheiros). Uma avaliação de competência numa tarefa ou papel prático 
tende a ser válida por bastante tempo (McClelland, 1973; Wernimont & Campbell, 1968). 
Na ausência de declínio físico, mesmo a competência que diminui com a falta de uso 
pode ser recuperada com a prática renovada. Os hábitos também tendem mais a persistir 
do que a mudar. A história de acidentes e multas de trânsito de um motorista é uma base 
sólida para as inferências de uma companhia de seguros. 
 
O principal negócio das profissões de ajuda, entretanto, é promover a mudança. Para as 
partes interessadas, as predições conservadoras são inerentemente pessimistas ou 
limitadoras. O profissional deve fazer inferências mais a longo prazo para ajudar a pessoa 
a estabelecer objetivos de mudança e para avaliar o auxílio que mais irá beneficiá-Ia. 
 
As inferências a longo prazo normalmente são uma interpretação impressionista; elas 
tentam sugerir corno a pessoa irá responder às mudanças de condições. Algumas 
interpretações psicométricas também têm um longo alcance, corno quando certos erros 
cometidos ao copiar desenhos geométricos são identificados (probabilisticamente) como 
um tipo específico de dano cerebral, ou quando testes terrestres são utilizados para 
selecionar pessoas que se tornarão astronautas. 
 
 20
Figura 2.4. O sistema Micropat para a 
produção de testes perceptuais e motores. 
A pequena "alavanca de controle" à direita 
controla os movimentos para cima e para 
baixo. Pedais não vistos aqui controlam a 
inclinação, e o controle deslizante à 
esquerda controla o tamanho ou, em 
algumas tarefas, a velocidade. Na tarefa de 
coordenação apresentada, o quadrado 
move-se irregularmente, e o examinando 
tenta manter a cruz centrada no quadrado 
e combinada com ele em tamanho e 
inclinação. O segundo monitor pode 
apresentar informações ou instruções. O 
teclado tem dez letras, dez dígitos, quatro 
flechas, mais SIM e NÃO. (Fonte:D. 
Bartram. Reproduzido com permissão. Os 
designs, software, documentação e 
exposições do teste Micropat possuem 
copyright U.K. Crown 1985, 1987, 1988. O Micropat é distribuído através de licença obtida com o 
Ministério de Defesa do Reino Unido, por Bartdale (Human Factors Specialists) Lld. Applegarth, 
Leconfield, Beverly, N. Humberside, HU 17 7NQ, Reino Unido). 
 
Uma observação afirma um fato relacionado a um 
momento (ou uma impressão do observador que 
ele considera factual). Por exemplo: 
 
"Hoje, Sam levou 4 minutos e meio para datilografar 200 palavras". Mas os fatos são 
registrados com perguntas mais amplas em vista. No mínimo, esse desempenho é 
considerado como representando Sam neste ponto de seu treinamento. E uma amostra 
do trabalho deste dia, ou desta semana. Se o examinador está realizando uma pesquisa 
sobre a fadiga, e este resultado ocorre na quinta página de cópia que Sam datilografou na 
mesma sessão, o resultado resume o desempenho neste momento; o investigador não 
considera o resultado nem corno representativo da sessão. Entretanto, o investigador está 
supondo que o declínio no desempenho que acompanhou a fadiga hoje representa aquilo 
que seria encontrado em outros dias. Todos os testes, então, são amostras. 
 
Às vezes, o comportamento amostrado não é de interesse direto; em vez disso, ele é 
tomado como um sinal ou indicador de outros comportamentos ou estados internos. O 
teste do labirinto é de interesse como um sinal, não como uma amostra. Nenhum animal 
ou pessoa costuma ter de encontrar seu caminho através de um labirinto, exceto em um 
teste psicológico. O número de tentativas necessárias para aprender o caminho no 
labirinto é tomado como um indicador de uma capacidade mais ampla. É muito mais difícil 
estudar a aprendizagem na ecologia natural do que na situação de teste, e o índice de 
aprendizagem de alguma coisa com a qual os aprendizes já estão parcialmente 
familiarizados seria mais difícil de interpretar do que o índice de aprendizagem em tarefas 
desconhecidas, artificiais. Inferir dano cerebral a partir de erros ao copiar diagramas é um 
outro exemplo de raciocinar a partir de um sinal. 
 
Traços, Estados e Atos. Os psicólogos investigam tanto os "traços" quanto os "estados". 
Em relação à ansiedade, por exemplo, a intensidade dos sentimentos ansiosos (o 
presente estado da pessoa) muda dia a dia. O nível de traço da pessoa normalmente é 
 21
concebido como uma média ou estado típico; se é assim, ele reflete não apenas as suas 
características, mas também os estresses habitualmente presentes em seu ambiente. A 
"capacidade" é quase sempre considerada como um traço moderadamente estável, mas 
o nível de desempenho é transitório. Um corredor pode estar "pronto" para um páreo, ou 
"fora de forma". Estes são estados. 
 
Conceitos como "ansiedade" e "capacidade" são construtos ("construtos"). Eles 
descrevem não uma ação, mas a organização ou eficiência características dos 
pensamentos e das ações. As interpretações dos construtos evoluem. Uma antiga 
hipótese era a de que o resultado no labirinto indicava a "inteligência pura e simples". 
Essa idéia teve de ser substituída por descrições mais específicas. Uma linhagem de 
ratos cuidadosamente criada que se saiu bem em labirintos não apresentou outras 
evidências de "inteligência" superior. Conforme as pesquisas prosseguiam, o construto 
mais limitado de "aptidão para a aprendizagem no labirinto" também caiu por terra. A 
experimentação de uma variedade de condições de teste levou a uma conclusão restrita: 
"Esta linhagem tem aptidão para aprender labirintos altos quando é mantida com fome e 
recebe comida no box de chegada". Esta conclusão ainda é uma generalização, mas com 
um alcance curto. 
 
Um construto formal é invocado quando a inferência atinge diversas situações. O "talento 
musical" é uma dimensão mais conveniente do que o "talento para instrumentos de 
corda". Este, por sua vez, é mais fácil de manejar, mas menos definitivo do que "destreza 
em rápidos movimentos dos dedos" e "discriminação de tons". O construto amplo não é 
verdadeiro nem falso; ele é adequado para alguns propósitos e inadequado para outros. 
 
Os construtos que vão mais fundo na psique obviamente são hipóteses mais ousadas. 
(Comparem "E incapaz de aceitar seus próprios impulsos hostis" com "A resposta às 
perguntas desafiadoras é moderada, formal, polida"). As interpretações mais profundas 
baseiam-se numa teoria complexa sobre as origens do comportamento, e poucas dessas 
teorias foram bem-substanciadas. O quanto é apropriado oferecer uma análise profunda 
um tanto especulativa, um tanto artística, constitui uma questão polêmica. Apenas duas 
conclusões precisam ser tiradas nesse ponto. Aqueles que se apegam a relatos literaisde 
fatos deixam para os outros a carga da interpretação; esses outros poderiam (ou não) 
estar mais bem servidos se o psicólogo tivesse oferecido uma interpretação. Aqueles que 
oferecem hipóteses imaginativas como se fossem relatórios científicos levam seus 
clientes para a areia movediça. 
 
Desde a época em que a frenologia foi denunciada como falaciosa, os psicólogos têm 
tentado escapar da noção de que os traços são objetos, comparáveis à glândula pituitária 
e ao cromossomo X. Nós achamos natural falar sobre a "timidez". Mas a timidez não é 
uma entidade; a palavra é um resumo de respostas. Dizer que uma pessoa é tímida 
significa apenas que, em muitas situações, ela apresentou ações associadas a esse 
construto. 
 
Situar uma pessoa numa escala ou rotular ações é algo que funde diversos atos e, assim, 
encobre a textura do comportamento. Uma pessoa pode ser tímida em festas e não num 
debate, com estranhos e não com conhecidos, com mulheres e não com homens. A 
timidez pode ser totalmente interna: a pessoa confidencia sentimentos de embaraço 
social para um conselheiro, sentimentos esses que as pessoas com quem convive em 
seu cotidiano desconhecem. A inibição e o retraimento de uma outra pessoa podem estar 
aparentes para todos. 
 22
 
Análise de Comportamento. A tradição comportamental minimiza referências a estados 
mentais, categorias de transtornos e traços globais de personalidade. Entretanto, o 
comportamentalista ainda tem de categorizar situações e atos. Ao avaliar como as 
mensagens relativas à doença cardíaca afetam a alimentação, ele poderia pedir a cada 
sujeito para registrar sua ingestão diária de alimentos numa lista de verificação. Um item 
seria "ovos". Não seria melhor perguntar se os ovos eram cozidos ou fritos? E, se fritos, 
em banha ou em óleo de açafrão-da-terra? As categorias mais refinadas ajustam as 
informações mais cuidadosamente ao problema. E até uma mensuração tão concreta, 
então, é enquadrada por construtos ("colesterol alto", "poliinsaturado"). O refinamento das 
categorias dependerá do propósito da investigação, mas deve haver categorias. 
 
Aqueles empenhados na modificação do comportamento e em outras aplicações 
orientadas pela situação distinguem nitidamente a descrição de inferência breve dos 
rótulos atribuídos, resumindo respostas em resultados de "traços", ou explicando em 
termos dos motivos inferidos. No livro que inspirou a escola de pensamento 
neocomportamentalista, Walter Mischel (1968, p. 10) declarou a idéia central: "Na análise 
comportamental, a ênfase está naquilo que a pessoa faz e não nas inferências sobre os 
atributos que possui mais globalmente". O que a pessoa faz numa situação definida pode 
ser descrito por uma simples contagem de ações em várias ocasiões. Dizer "como a 
pessoa é" exigiria que o psicólogo fosse além da contagem de ações, até uma linguagem 
descritiva e, além disso, até uma construção imaginativa de uma explicação. 
 
Ao planejar o tratamento, ao avaliar o progresso e ao avaliar métodos de tratamento 
alternativos, os comportamentalistas têm tantas ocasiões para testar quanto outros 
psicólogos aplicados. Na verdade, os testes desempenham um papel especial de 
monitorização em seu trabalho, porque o cliente aprende a regular a si mesmo pela 
observação de suas respostas. Ele é ensinado, por exemplo, a observar se realmente fala 
muito alto sempre que fica descontente com algo que sua esposa diz. Os 
comportamentalistas preocupam-se especialmente com a freqüência de atos significativos 
no contexto e com as mudanças no padrão. Assim como as professoras acompanham o 
progresso e a confusão de um aluno de lição para lição ou de semana para semana, os 
psicólogos, tentando reformular o comportamento, monitoram o processo e modificam 
suas táticas conforme necessário. 
 
Os comportamentalistas não sentem nenhuma necessidade de investigar as origens de 
um padrão de resposta; eles buscam as circunstâncias atuais que desencadeiam a 
resposta. Quando uma pessoa com dificuldades emocionais busca ajuda, o psicólogo 
dessa escola tenta identificar os tipos de situação que o paciente tipicamente maneja com 
dificuldade ou que despertam sentimentos desagradáveis. 
 
Os comportamentalistas minimizam a inferência. Os dados que utilizam estão 
estreitamente ligados às dificuldades do paciente - nada de testes de manchas para eles. 
O tratamento comportamental volta-se diretamente para os atos que precisam ser 
reformulados (e não para tentativas de desenvolver o insight dos pacientes ou de resolver 
seus conflitos internos). Quando alguém está tentando aumentar a auto-afirmação, a 
repetida contagem de atos de auto-afirmação é um teste que complementa as "lições". 
 
Os comportamentalistas continuam a preferir as inferências breves, mas a antiga 
oposição generalizada à "testagem" diminuiu bastante. Os comportamentalistas 
reconhecem que seus procedimentos focalizados precisam ser julgados pelos mesmos 
 23
padrões psicométricos dos testes convencionais. Igualmente, eles estão percebendo que 
os testes convencionais são importantes em seu trabalho (Hersen, em Goldstein & 
Hersen, 1984; Strohsahl & Linehan, em Ciminero e colaboradores, 1986; Turkat, 1985). 
 
14. Em quais desses aspectos você esperaria que os analistas do comportamento 
seguissem a tradição da mensuração psicométrica? 
 
a. Expressando /numericamente a força de uma tendência de resposta. 
 
b. Agrupando em uma categoria ou resultado dois tipos de comportamento, tais como a 
submissão e a timidez, que tendem a ser encontrado juntos. 
 
c. Especificando uma tarefa ou situação definida na qual coleta de dados sobre muitas 
pessoas. 
 
d. Utilizando normas para avaliar a freqüência de um comportamento-problema. 
 
15. Qual testagem, se é que alguma, desempenharia um papel na abordagem do analista 
de comportamento a uma criança de dez anos que está progredindo muito pouco na 
aprendizagem da leitura? 
 
16. "Compreende o que lê" é um construto amplo. Que construtos mais limitados 
poderiam descrever tipos diferentes de compreensão? 
 
17. Anastasi (1988, p. 510) observa que o comportamentalista emprega construtos até 
mesmo quando fala sobre algo tão definido quanto o "medo de cachorros", Ela diz que as 
fronteiras do construto precisam ser examinadas para que a generalização não seja 
ampla demais. Como poderíamos examinar essas fronteiras? Elas seriam semelhantes 
para todas as pessoas que se perturbam diante de cães?

Outros materiais