medidas_texto2

•

UNIFACS

Késia Rebouças

22/09/2014

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística e Métodos de Medidas em Psicologia

18 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

1
As Variedades de Testes e Interpretações de Testes1

Lee J. Cronbach
Stanford University

2A. Alguns testes são padronizados, alguns são objetivos, alguns possuem normas.
Como diferem esses aspectos? Por que eles são importantes?
2B. Quais são as vantagens e os riscos potenciais numa avaliação impressionista?
2C. Como podemos reconhecer se um teste mede o desempenho máximo ou a resposta
típica? .
2D. Como o computador pode ampliar o alcance e a exatidão da testagem?
2E. Às vezes, o tipo de comportamento obtido como amostra num teste é de interesse
direto; outras vezes, ele é apenas uma base para a inferência de outras características.
Que objetivos de mensuração levam a cada tipo de interpretação?
Abreviações deste capítulo: ASVAB para Armed Services Vocalional Aplilude Battery; EFT para
Teste das Figuras Inseridas (Embedded Figures Test).

O QUE É UM TESTE?
A palavra "teste" normalmente nos faz pensar numa série de perguntas-padrão para as
quais o examinando dá respostas escritas ou orais. Mas o teste prático para tirar carteira
de motorista não tem perguntas nem respostas, e o procedimento varia de um
examinador para outro. A tarefa estabelecida para o motorista não pode ser padronizada,
assim como o tráfego através do qual os motoristas devem manobrar irá variar de uma
hora para outra.

Talvez a seguinte definição seja suficientemente ampla para abranger os procedimentos
com os quais este livro se ocupa: um teste é um procedimento sistemático para observar
o comportamento e descrevê-lo com a ajuda de escalas numéricas ou categorias fixas.
"20/100" localiza a acuidade visual numa escala numérica; "Cegueira para a cor
vermelha/verde" refere-se a uma categoria. Por "sistemático" eu quero dizer que a
examinadora coleta informações questionando ou observando da mesma maneira uma
pessoa depois da outra, na mesma situação ou em situações comparáveis. Esta definição
inclui questionários para obter relatos sobre a personalidade, procedimentos para
observar o comportamento social, testes com aparelhos para medir a coordenação e,
inclusive, registros de produção numa linha de montagem.

Como foi dito no Capítulo 1, "avaliação" é uma palavra mais ampla do que "testagem"
quando (como é comum) ela significa integrar e avaliar informações. A avaliação de um
indivíduo normalmente irá considerar testes juntamente com uma história de caso e
entrevistas. Mas o termo também tem sido aplicado a levantamentos estatísticos
baseados unicamente em testes ("National Assessment of Educational Progress") e a
medidas experimentais limitadas ("avaliação do medo de cobras").
Um teste pode constituir uma peça só, os escores para as respostas ou partes sendo
ignorados quando o total é obtido. Em outros testes, os resultados parciais são
transportados para interpretação. Quando vários resultados parciais são computados lado

1 PARA CITAR O TEXTO (ISO):
CRONBACH, Lee. As Variedades de Testes e Interpretações de Testes In: CRONBACH, Lee. Fundamentos
da Testagem Psicológica. Porto Alegre: Artes Médicas, 1996. Cap. 02. p. 50-69. ISBN: 85-7307-180-X

2
a lado em escalas comparáveis, este gráfico é chamado de "perfil". (As partes são às
vezes referidas como "subtestes". As vezes, as partes são chamadas de "testes" e o todo
é chamado de "bateria". Essas diferenças de terminologia não são importantes.)

Os significados de teste de lápis-e-papel, teste com aparelhos, teste oral e assim por
diante devem estar óbvios. Embora todos os dados comportamentais reflitam algum tipo
de desempenho, um teste de desempenho normalmente se refere a uma tarefa que
requer uma resposta física. Entre os testes de desempenho que têm sido utilizados estão
consertar uma peça de um aparelho eletrônico, desenhar a figura de um homem,
encadear contas e "inventar" um cabide com duas varetas longas e uma braçadeira em
formato de C. Embora seja uma tarefa verbal, responder a uma entrevista em francês
também é um teste de desempenho.

Os testes de grupo permitem testar muitas pessoas ao mesmo tempo. Os testes
individuais permitem a observação de reações e o seguimento de uma resposta
indefinida. Muitos testes possuem versões individuais e grupais. A administração por
computador obscurece essa antiga distinção no sentido de que a administração é
individual, mas os exercícios normalmente são semelhantes aos de um teste de grupo.

Os procedimentos de padronização de testes tornaram-se uma preocupação por volta de
1900. Naquela época, cada laboratório de psicologia tinha o seu próprio método para
medir o intervalo de tempo da memória, tempo de reação e assim por diante.
Conseqüentemente, era difícil comparar achados de pesquisa. Igualmente, quando cada
professora usava um teste diferente, era difícil para os supervisores escolares avaliarem
se os alunos estavam aprendendo a soletrar corretamente.

Um teste é considerado padronizado quando as palavras e os atos da examinadora, o
aparelho e as regras de avaliação foram fixados, de modo que os resultados coletados
em momentos e lugares diferentes são inteiramente comparáveis. Se a padronização é
completamente efetiva, todas as examinadoras "aplicam o mesmo teste". Como veremos
mais tarde neste capítulo, esta declaração não significa necessariamente que todas se
deparam com as mesmas perguntas.

Se um procedimento é objetivo, todos os observadores de um desempenho chegam à
mesma conclusão. Para atingir a objetividade, todos devem prestar atenção aos mesmos
aspectos do desempenho, registrar as observações para eliminar erros de memória e
avaliar os resultados através das mesmas regras. A objetividade pode ser julgada
comparando-se os resultados assinalados por observadores independentes. Quanto mais
subjetivas a observação e a avaliação, menos os juízes concordam. Os testes em que o
examinando escolhe a melhor resposta (isto é, os testes de verdadeiro-ou-falso ou de
múltipla escolha) possuem uma avaliação objetiva. Em contraste, um teste de redação
normal ocasiona grande desacordo entre os avaliadores. Entretanto, através do uso de
cuidadosas instruções ao observador ou examinador, os números atribuídos às respostas
escritas e às observações podem ser tornados bastante objetivos. A objetividade e a
padronização geralmente andam juntas, mas um teste com procedimentos livres pode ser
pontuado por uma regra definida, e um procedimento padronizado pode ter uma
pontuação baseada em julgamento.

Uma tabela de normas informa como os escores se distribuem em alguma população
relevante. Os testes que possuem normas às vezes são chamados de "testes
padronizados". Não estou utilizando a palavra nesse sentido, porque desejo enfatizar a
3
padronização do procedimento. Um teste cujos procedimentos não são padronizados
pode ter uma tabela de normas, mas as normas não significam muito. (Os termos
"referendados na norma" e "referendados no critério" não designam tipos de testes; eles
se referem a interpretações, como será explicado no Capítulo 4.)

1. Avalie cada uma dessas declarações como verdadeira ou falsa e justifique sua
resposta:

a. As médias de arremessos (no beisebol ou criquete) são objetiva mente determinadas.

b. A corrida com barreiras de 220 jardas é um teste padronizado.

c. A professora pede a todos os alunos de sua classe que leiam o mesmo artigo de uma
revista atual. Depois de três minutos, o tempo termina e cada aluno marca o lugar em que
está lendo. O aluno então conta o número de palavras lidas e computa sua velocidade de
leitura de palavras por minuto. Este escore é comparado com uma tabela de velocidades
médias de leitura de artigos típicos de revistas. Este teste é altamente objetivo.

d. O teste descrito em c é padronizado.

2. Os testes psicológicos geralmente partem de procedimentos simples. A Dra.Glass
julga que pode obter informações úteis colocando uma folha de papel numa mesa, ao
alcance do braço do examinando, e lhe pedindo para tocar com o lápis exatamente no
centro de um círculo impresso no papel. Pede-se à pessoa que retire sua mão e repita o
movimento, tão rápida e exatamente quanto possível, até que lhe digam para parar. A
Dra. Glass atribui uma nota de 1 a 10 a cada lima das seguintes qualidades: velocidade,
cuidado e persistência. Que aspectos do procedimento precisaríamos levar em conta para
padronizar o teste?

3. Levantamentos do moral nas fábricas podem utilizar perguntas criadas pelo chefe de
pessoal da fábrica ou seus consultores. Que vantagens e desvantagens existiriam na
utilização das mesmas perguntas em muitas companhias?

4. A tarefa de desenho com cubos (veja a Figura 3.1) é um dos procedimentos de
testagem mais populares. A pessoa constrói um padrão com cubos coloridos, igual à
amostra impressa. O teste é utilizado principalmente no aconselhamento de crianças,
diagnóstico clínico e mensuração da capacidade geral de pessoas que se saem mal em
testes verbais. Ele também é empregado nas pesquisas sobre a frustração e sobre as
diferenças culturais. Muitas versões do teste (itens diferentes, diferentes regras de
avaliação, etc.) são utilizadas em diferentes clínicas e países. Quais são as possíveis
vantagens e desvantagens dessa diversidade?

5. Os membros dos departamentos de ensino de lima escola preparam um teste de
múltipla escolha a ser utilizado em todos os departamentos. Este teste é "padronizado",
conforme o termo é empregado aqui? Se apenas um professor prepara e utiliza o teste
em todos os departamentos, ele é "padronizado"?

6. Um teste de redação pode ser um teste padronizado?

4
Estilos de Testagem Psicométrica e Impressionista

Os métodos de coleta de informações variam de um extremo psicométrico a um extremo
impressionista. O maior contraste está na ênfase colocada na padronização e na
objetividade, que são máximas no extremo psicométrico. Existe uma diferença também na
interpretação; algumas examinadoras querem "medir" o indivíduo, algumas querem
"caracterizá-lo".

A testagem psicométrica resume o desempenho em números. Seu ideal é expresso em
dois famosos pronunciamentos antigos:

- Se uma coisa existe, ela existe em certa quantidade.

- Se existe em certa quantidade, ela pode ser medida.

Observem a suposição de que a psicóloga se preocupa com "coisas", com elementos ou
traços que de algum modo "existem". Considera-se que todas as pessoas possuem os
mesmos traços (isto é, assertividade ou compreensão mecânica), mas em quantidades
diferentes. Esta visão da investigação psicológica toma como exemplo a ciência física,
que identifica aspectos comuns de objetos diferentes. Os números representando
dimensões abstratas - peso, velocidade e intensidade de energia de um certo
comprimento de onda - servem para descrever rochas e foguetes, velas e vaga-lumes.

Uma abordagem psicométrica é mais proveitosa quando uma pergunta bem definida deve
ser respondida, e quando o intérprete tem experiência suficiente para traduzir a
mensuração numa estimativa do provável resultado de cada curso de ação disponível.

Um estilo impressionista de avaliação busca a descrição individualizada. O psicólogo
tenta ser um observador sensível que percebe as deixas através de todos os meios
possíveis e cria uma interpretação integrada. Para este examinador, até um teste
focalizado é uma oportunidade de estudar a pessoa como um todo. O impressionista não
se satisfaz com uma estimativa numérica do nível de capacidade. Ele quer saber como a
pessoa expressa sua capacidade, que tipos de erros comete e por quê.

Para avaliar o background de uma pessoa, o examinador psicométrico apresentaria uma
lista de verificação abrangendo experiências que muitas pessoas têm (por exemplo, “Você
foi líder de seu grupo de escoteiros ou bandeirantes?”. Ele contaria os itens verificados
para conseguir escores para, digamos, "interesse por esportes" e "experiência de
liderança". O impressionista, por outro lado, talvez não estabelecesse tarefas mais
definidas do que "Por favor, escreva a história da sua vida em 2.500 palavras".

Ele observaria aquilo que a pessoa considera importante relatar e também seu tom
emocional. A resposta livre fornece informações não - sistemáticas, mas abrange questões
que a lista de verificação ignora.

O estilo psicométrico é marcado pela qualidade definida da tarefa, objetividade dos
registros, rigor na avaliação e nos dados combinantes e ênfase na validação. Ao salientar
essas características do estilo psicométrico, não quero dizer que a testagem psicométrica
necessariamente possui todas essas características simultaneamente.

5
A maioria das aplicações de testes é psicométrica em certos aspectos e impressionista
em outros. O mensurador precisa recorrer ao julgamento quando aplica informações de
escores no ensino, terapia ou supervisão de empregados. E o retratista deve prestar
atenção aos fatos da mensuração. Quanto mais excepcional a pessoa sendo estudada,
ou quanto mais sem precedentes a decisão a ser tomada, maior a necessidade de
estruturar perguntas e procedimentos que se ajustem ao caso. Este livro é primariamente
uma apresentação das idéias e métodos da tradição psicométrica, mas o examinador
impressionista precisa compreendê-los, ainda que apenas como um ponto de partida.

Vamos examinar os contrastes com mais detalhes, começando com a estrutura da tarefa.
O examinando pode receber uma tarefa definida ou uma tarefa vaga. Aquele que vai
escrever um ensaio autobiográfico está livre para empregar qualquer estilo e introduzir
qualquer conteúdo. Isso não acontece quando ele é solicitado a assinalar atividades numa
lista impressa.

Diz-se que uma tarefa é estruturada quando todas as pessoas a interpretam da mesma
maneira. A estruturação obtém uma resposta definida para uma pergunta formulada
antecipadamente.

O criador do teste pode pedir aos examinandos para construírem suas próprias respostas,
ou pode oferecer uma escolha entre alternativas de respostas fixas. Nós podemos falar,
então, de testes de resposta-de-escolha e resposta-construída ("resposta-livre"). Os
examinadores psicométricos geralmente optam pela resposta de escolha, de modo a
tornar o teste mais estruturado.

Um entrevistador poderia perguntar: "Você fica à vontade em reuniões sociais?". Um
examinador mais psicométrico oferece alternativas como SEMPRE, MUITAS VEZES, ÀS
VEZES, NUNCA. Um item de conclusão de séries numéricas (7 5 8 6 9 ...) pode ser de
resposta com final aberto ou apresentar escolhas de resposta.

O formato de escolha facilita a avaliação, mas o comportamento apresentado é menos
rico. Até num item de série de números podem aparecer diferenças. Uma pessoa diz
"Sete" diretamente; outra, hesitantemente, diz "Bem, poderia ser sete. Acho que está
certo". Os psicólogos que preferem respostas com final aberto valorizam as observações
suplementares. A professora de inglês prefere avaliar um aluno a partir de uma amostra
de redação livre e não através de testes em que ele meramente identifica erros. A
professora de matemática quer que seus alunos resolvam problemas, não apenas
selecionem a melhor de várias alternativas. No Capítulo 9, eu apresento as evidências
sobre o grau de sobreposição desses dois tipos de teste, assim como as considerações
relativas à escolha entre eles.

A testagem psicométrica preocupa-se mais com o produto do que com o processo. O
produto é claramente observável - a resposta dada, a torre de cubos construída, ou a
redação escrita. Quando um examinador psicométrico presta atenção ao processo, ele se
arma com uma folha de registro para tabular o que vê e seleciona antecipadamente os
aspectos específicos de estilode resposta que irá registrar. Listar as variáveis
antecipadamente é uma restrição inaceitável para o psicólogo impressionista. Ele prefere
procurar o que é significativo no comportamento de cada examinando, conforme o
observa trabalhando. Conseqüentemente, prefere as tarefas que as pessoas abordam de
modos diferentes.

6
Quando uma decisão precisa ser tomada, podemos combinar os fatos registra dos
através de uma regra formal ou podemos combiná-los impressionisticamente. Por
exemplo, uma professora atribui notas em um curso através das médias dos testes. Uma
outra utiliza impressões globais: este aluno está "fazendo um trabalho que merece B,
mesmo que tenha piorado no final", enquanto aquele outro "não é realmente tão bom
quanto seus testes sugerem". O examinador psicométrico prefere um método uniforme,
impessoal, ao passo que o impressionista prefere a flexibilidade. Finalmente, chegamos à
validação. Os examinadores psicométricos confiam nas interpretações feitas através de
uma regra derivada estatisticamente de grupos anteriores; eles desconfiam de
interpretações mais subjetivas, individualizadas. Um examinador psicométrico acompanha
cada resultado numérico com um alerta referente ao erro de mensuração, e gostaria de
poder agregar um índice de incerteza a cada predição. O impressionista preocupa-se
menos com a validação formal. Se não existem dois casos iguais, as interpretações não
se repetem, e as tabelas de experiência não podem ser acumuladas. Validar "retratos" é
muito mais difícil do que validar predições numéricas. Com efeito, isso requer que se
valide o intérprete, ou retratista.

O intérprete impressionista quer ser um artista, sensível ao observar e hábil ao transmitir
impressões. Alguns psicólogos possivelmente são melhores juízes da personalidade do
que outros. O método psicométrico busca procedimentos que todos podem utilizar
igualmente bem. O teste objetivo é uma câmera apontada numa direção fixa; todos os
fotógrafos competentes devem tirar a mesma fotografia com ela. Assim, a testagem
psicométrica busca reduzir a mensuração a um procedimento técnico. Na extensão em
que isso tem sucesso, fica diminuída a necessidade de um psicólogo "sábio".

As abordagens psicométrica e impressionista diferem mais nitidamente na questão da
confiança no psicólogo. Os defensores do rigor consideram o examinador como um
instrumento errático cujas interpretações não-reguladas misturam a verdade com
especulações. Os impressionistas consideram o observador como um instrumento
sensível e inclusive indispensável. O impressionista não nega o perigo de
tendenciosidades e erros. Mas ele não está disposto a ignorar a história da pessoa e sua
presente situação - e os significados que lhe atribui.

7. "A testagem psicométrica confia no julgamento do criador do teste, ao mesmo tempo
em que não está disposta a confiar no examinador como observador. " Esta é uma
declaração defensável?

8. Diferencie estruturado de padronizado.

9. Em que aspectos os seguintes procedimentos são não estruturados?

a. No teste de caligrafia de Ayres, os alunos devem escrever o Discurso de Gettysburg
primorosamente, fazendo o máximo possível num tempo determinado.

b. Num teste de desenvolvimento intelectual, pede-se à criança que "faça o melhor
desenho possível de um homem".

c. Num teste de discriminação de altura de som, o sujeito ouve dois tons e responde A, B
ou N, se o segundo som parece mais alto, mais baixo ou não diferente do primeiro.

7
CLASSIFICAÇÃO DE PROCEDIMENTOS

Por uma questão de conveniência, este livro separa os procedimentos em duas amplas
classes: os que buscam medir o desempenho máximo e os que buscam medir respostas
típicas.

O desempenho apresentado por uma pessoa cooperativa solicitada a fazer o melhor
possível indica "capacidade". O desempenho máximo é uma ficção conveniente. O
conceito ajuda a organizar a minha discussão, mas observar o máximo é tão difícil quanto
localizar o final do arco-íris. O melhor tempo de uma pessoa numa corrida de uma milha é
apenas o melhor que ela pode fazer mo momento; ela pode quebrar o recorde amanhã.
Ericsson (1987) fala sobre uma pessoa cuja capacidade máxima de lembrar séries de
números chegava a sete dígitos. Depois de seis semanas de prática com uma técnica
especial, ela era capaz de lembrar 80 dígitos! Ela melhorou sua capacidade aproveitando
sua facilidade em associar eventos. Ela atribuía significados a grupos de dígitos, ficando
com menos "itens" para lembrar. Dada uma série contendo 3-4-9-2, por exemplo, ele
pensava em três minutos, 49,2 segundos - um desempenho magnífico na corrida de uma
milha (Posner, em Chi e colaboradores, 1988, p. XXX).

Segundo, existem procedimentos para descobrir o que a pessoa faz ou sente mais
freqüentemente, numa situação ou tipo de situação recorrente. As medidas das respostas
típicas abrangem aspectos de personalidade, hábitos, interesses e caráter2. Aqui, a
"resposta" pode referir-se a ações manifestas corno assumir a liderança (ou permanecer
quieto) num grupo social, ou a declarações que a pessoa faz, ou ao encobrimento de
pensamentos e sentimentos. Martin tipicamente age corno se estivesse interessado nas
estórias que sua esposa conta a respeito de seu dia no escritório, e talvez costume dizer
que está interessado, mesmo quando não está. Ambas estão na esfera das respostas
típicas. (Mas fazer com que ela acredite - isso sim é capacidade!)

A resposta típica e a capacidade não são verdadeiramente separáveis. O recorde de uma
pessoa em testes de datilografia estabelece que sua capacidade atingiu determinado
nível, mas o escore também reflete sua disposição de se esforçar naquele tipo de
situação. Em outras palavras, a minha distinção não leva em consideração os propósitos.
Os propósitos são importantes, mas recebem pouca consideração na psicologia das
diferenças individuais (Snow & Farr, 1987).

Os psicólogos empenhados na modificação do comportamento fazem uma distinção muito
semelhante à minha. Com relação a algum comportamento desejado, eles primeiro
perguntam se a resposta (isto é, uma habilidade social) "faz parte do repertório da
pessoa". Quando confirmam que a capacidade está presente, eles passam a investigar
com que freqüência a pessoa responde daquela maneira em várias situações recorrentes.

As instruções dos testes quase nunca dizem ao examinando corno abordar a tarefa.
Teoricamente, o estilo de desempenho enquadra-se na categoria de resposta típica; mas

2 'Em edições anteriores deste livro, referi-me à segunda categoria como "testes de comportamento típico".
Isso era consistente com a tendência a falar sobre uma pessoa como tipicamente cautelosa, ou responsável.
ou ansiosa. Mas a teoria moderna da personalidade enfatiza o papel da situação na determinação das ações
e dos sentimentos da pessoa, e a terminologia "resposta típica" pretende sugerir a pergunta "resposta a
quê?".

8
as variações de estilo afetam os escores de "capacidade". O labirinto de Porteus (Figura
2.1) é uma técnica de observação em que a examinadora procura evidências de
planejamento e antecipação, ao mesmo tempo em que é um teste de capacidade que
avalia a velocidade e a exatidão.

Figura 2.1. Dois dos labirintos de Porteus. O testando deve traçar o caminho mais curto através do
labirinto. Uma tentativa é avaliada como um fracasso sempre que o lápis entra num caminho sem
saída. Ele então pode fazer novas tentativas no mesmo labirinto. Quando ele acerta um dos
labirintos, passa para outro mais difícil, continuando até fracassar em várias tentativas num mesmo
labirinto. (Fonte: Esses labirintos têm o copyright de 1933, 1953, 1955, The Psychological
Corporation e são reproduzidos com permissão.)

10. "Um teste de capacidadeé um teste em que a pessoa não pode receber um escore
melhor do que o merecido; em medidas de ajustamento emocional e atitudes sociais, a
pessoa pode dar respostas que causam uma boa impressão, mesmo que as respostas
sejam falsas." Essa distinção é equivalente à distinção entre o desempenho máximo e a
resposta típica?

9
Testes de Desempenho Máximo

O aspecto característico de um teste de capacidade é que o testando é encorajado a
conseguir o melhor escore que puder. O objetivo da examinadora é o de eliciar o melhor
desempenho possível (dentro das regras), e isso significa que o testando deve querer
sair-se bem e precisa compreender o que é considerado um bom desempenho. Para que
ele dê o melhor de si, as instruções precisam ser claras e explícitas, incluindo a
explicação de como os vários tipos de erros serão penalizados.

Alguns testes de capacidade propõem tarefas conhecidas; outros requerem que a pessoa
faça alguma coisa desconhecida. No Teste de Coordenação Complexa (Figura 2.2), uma
pessoa que nunca pilotou um avião opera uma "alavanca de comando" e um "leme de
direção". Luzes piscando assinalam que devem ser feitos determinados movimentos;
respostas rápidas e coordenadas recebem um escore elevado.

Um grande grupo de testes inclui o EFT e os labirintos, como também testes de raciocínio
verbal; eu me refiro a eles como medidas de "capacidade intelectual geral". Este termo se
refere a uma série de capacidades importantes em quase qualquer tipo de pensamento.
Testes desse tipo freqüentem ente são chamados de "testes de inteligência", mas a
interpretação do teste é mais correta se evitamos os mitos associados à palavra
"inteligência". Juntamente com as capacidades gerais estão aquelas pertinentes a uma
variedade limitada de tarefas: compreensão mecânica, sensibilidade à tonalidade dos
sons, destreza manual e assim por diante.

O desempenho numa tarefa importante em si mesma proporciona evidências de
proficiência ou competência. Podemos medir a proficiência em falar o francês, num
aconselhamento via telefone, no conserto de uma torneira. O termo mais limitado teste de
realização se refere ao teste que abrange alguma coisa que a escola presumivelmente
ensinou diretamente - a leitura, por exemplo, ou o conhecimento do sistema solar. Um
"teste de maestria" é um teste de realização relativo a algum tópico ou habilidade
limitados, destinado a estabelecer se um estudante domina aquele assunto. O termo
"competência mínima" passou a ser empregado na
década de setenta. Os críticos das escolas haviam
se queixado de que muitos alunos com o segundo
grau completo não eram adequadamente
instruídos e empregáveis. Um teste utilizado para
identificar esses alunos (quer como um alerta
precoce ou um último obstáculo) passou a ser
conhecido como um teste de competência mínima
(Jaeger, em Linn, 1989a).

Um teste de aptidão é um teste destinado a
predizer o sucesso - existem testes de aptidão
para a engenharia, aptidão musical, aptidão para a
álgebra e assim por diante. Esses testes não têm
formas distintas. Um teste de aptidão para a
engenharia pode incluir seções medindo a
capacidade intelectual geral, o raciocínio mecânico
e espacial e a proficiência em matemática.

O contraste realização/aptidão é de ponto de vista,
10
mais do que de conteúdo de teste. Qualquer teste é um teste de realização na medida em
que é um relato sobre o desenvolvimento e a aprendizagem até aquele momento; é um
teste de aptidão na medida em que diz alguma coisa sobre o futuro. Flaugher (1978)
sugere que muitos daqueles que pedem uma testagem de "aptidão" consideram as
diferenças individuais nas capacidades como fixas e contam com a seleção ou
classificação para combinar as pessoas com as responsabilidades. Aqueles que pedem
uma testagem de "realização", diz ele, pensam nas diferenças individuais como refletindo
experiências passadas e esperam que o treinamento possa preparar o candidato com um
escore baixo para futuras responsabilidades.

Medidas de Resposta Típica

Para a maioria das perguntas sobre sentimentos e hábitos, nenhuma resposta específica
pode ser destacada como "boa". Não existe nada de bom ou de mau no interesse pela
engenharia. Igualmente, não podemos dizer que um certo grau de dominação é melhor; o
mundo oferece papéis adequados para as pessoas ao longo de toda a escala. Aqueles
que estão empregando um executivo cujo sucesso anterior garante sua capacidade
também querem saber como ele funciona habitualmente. Ele supervisiona
cuidadosamente, prestando atenção aos mínimos detalhes? Ou delineia uma tarefa geral
e dá liberdade aos seus subordinados? Ele se preocupa igualmente com produção,
problemas humanos e finanças? Ele prefere um planejamento de longo alcance ou uma
rápida adaptação? Conhecer o seu padrão ajuda a colocá-lo adequadamente na
organização.

As informações sobre os hábitos têm um valor preditivo; o que a pessoa faz uma vez
provavelmente fará novamente. Mas a maioria dos psicólogos negaria que os hábitos
observados de uma pessoa são a sua personalidade. Uma pessoa nem sempre age como
agiu em ocasiões anteriores. Nós não desejamos considerar as reações excepcionais
como caprichosas e inexplicáveis. Conseqüentemente, supomos que as respostas são
geradas por uma estrutura de personalidade ou sistema de crenças consistente, que é
sensível às diferenças situacionais. A estrutura tem de ser inferida a partir das
observações do comportamento e relatos sobre atos, opiniões e fantasias.

Nas semanas que antecederam o casamento do príncipe Charles, a imprensa britânica
buscou os mínimos fragmentos de informação sobre a futura princesa. Ela ensinara num
jardim de infância, e um repórter entrevistou um de seus alunos e perguntou: "Como ela
era?". O garotinho respondeu: "Não sei. Ela nunca me disse." A maioria dos psicólogos
está na posição dessa criança - 90 por cento das informações coletadas sobre a
personalidade, interesses e atitudes originam-se dos relatos do sujeito. Quase todos os
outros psicólogos estão na posição do repórter, dependendo de impressões de segunda-
mão. A observação direta e sistemática por parte do psicólogo e seus auxiliares é
comparativamente incomum - mas uma fonte de dados potencialmente superior.

Observação. A observação padronizada requer que cada pessoa seja colocada
essencialmente na mesma situação. A personalidade pode ser observada durante um
teste intelectual, durante uma discussão de grupo ou quando a pessoa é desafiada a
caminhar sobre uma trave com os olhos vendados. Foram planejadas tarefas especiais -
testes de desempenho de personalidade - para proporcionar uma boa oportunidade de
observação.

11
A observação padronizada permite-nos comparar pessoas que normalmente não são
vistas em circunstâncias semelhantes. Além disso, ela elicia respostas que poderiam ser
vistas apenas ocasionalmente na vida cotidiana. Por exemplo, para examinar reações à
frustração, a pessoa é iniciada em alguma atividade e então impedida de atingir seu
objetivo. Em um estudo, pré-escolares receberam a oportunidade de brincar com
brinquedos comuns, razoavelmente interessantes. Depois, foram levados para uma sala
adjacente, com brinquedos imensamente atraentes. Depois de um período de
brincadeiras nessa sala, eles foram levados novamente para a primeira sala, e uma tela
de arame foi colocada entre eles e os lindos brinquedos. As crianças reagiram de várias
maneiras: dando pontapés na tela, voltando ao brinquedo simples com pedras, tentando
passar por baixo da tela ou fingindo tirar uma soneca. Em geral, os jogos após a
frustração foram menos maduros e menos construtivos do que antes.

Se queremos o comportamento típico, o sujeito não deve saber o que está sendo
observado. O observador pode estar escondido, ou a pessoa pode ser levada a acreditarque está sendo testada em relação a uma determinada característica enquanto alguma
outra coisa está sendo observada. Quando estamos estudando a reação à frustração,
pode-se dizer ao testando que sua capacidade intelectual está sendo observada. Quando
ele ficar frustrado por perguntas difíceis, suas respostas provavelmente não serão
dissimuladas.

O comportamento típico também pode ser observado em amostras tomadas "no campo".
As crianças no playground revelam muito sobre seus hábitos e personalidade; o mesmo
acontece com um não-combatente liderando um pelotão e os funcionários no escritório. A
média de arremessos no beisebol resume as observações de campo registra das
sistematicamente. As avaliações de mérito feitas por um supervisor também são
baseadas na observação, mas são quase sempre assistemáticas.

As situações referidas no parágrafo anterior são padronizadas até certo ponto. No
playground, cada criança está reagindo aos atos não-padronizados de seus
companheiros de brincadeiras. Na quadra de beisebol, os arremessos executados mudam
de um rebatedor para o próximo.

Quando o examinador se propõe a disfarçar seu propósito ou a observar sem o
conhecimento do seu alvo, surgem questões éticas. Os princípios éticos criados para a
conduta na pesquisa também têm implicações na testagem (American Psychological
Association, 1973; em sumário, 1981).

A "invasão de privacidade" está sendo interpretada de forma cada vez mais rígida:
práticas consideradas normais numa década são desaconselhadas na próxima. Todos os
laboratórios de psicologia possuem um espelho de observação que permite a um
observador enxergar a sala de entrevistas ou de brinquedos sem ser visto. Em épocas
anteriores, o sujeito não ficaria sabendo que estava sendo observado. Hoje, uma prática
comum é mostrar ao sujeito (ou aos pais, caso o sujeito seja uma criança pequena) o
posto do observador e a visão através do espelho, explicando casualmente que esse
arranjo pretende eliminar distrações. Uma vez absorvido numa tarefa e especialmente
depois de várias sessões, não é provável que o sujeito continue preocupado com o
espelho. Uma outra prática adequada é dar uma indicação generalizada: "Estaremos
observando como você interage com seu filho, de vez em quando, mesmo quando não
lhe dissermos que estamos mantendo um registro. Às vezes, essas observações vão nos
ajudar a orientá-la. Naturalmente, se você não quiser ser observada deve nos dizer, e se
12
num dia específico acontecer alguma coisa que você não quer que conste desse arquivo,
pode nos pedir para rasgar este registro, que nós iremos rasgá-lo".

A franqueza não pode avançar além dos limites do bom senso. O terapeuta da fala não
diz: "Eu vou contar quantas vezes você gagueja"; a psicóloga infantil não diz à mãe: "Eu
vou contar às vezes em que você parece insegura de si mesma".

Auto-Relato. Cada pessoa conhece bastante o seu próprio comportamento. Os
questionários - freqüentemente chamados de "inventários" - são usados para obter auto-
descrições. Existem inventários sobre os hábitos de estudo, inventários de interesses,
inventários de atitudes sociais e assim por diante. O inventário biográfico pode tratar de
qualquer coisa, da história conjugal aos sentimentos em relação ao pai da pessoa, ou dos
passatempos passados e atuais. O título dos questionários deve evitar a palavra "teste",
de modo a evitar sugerir (por exemplo) que a dominação é mensurada diretamente.

Ao passo que o inventário tradicional faz perguntas generalizadas -"Você bebe muito?" -
uma outra abordagem pede que a pessoa observe seu próprio comportamento em
determinados momentos. A pessoa pode ser solicitada a registrar todas as noites a sua
ingestão de álcool naquele dia, talvez juntamente com uma anotação sobre as
circunstâncias em que bebeu cada drinque. A virtude da auto-observação é a exatidão da
informação. O procedimento é intrusivo e tende a alterar o próprio comportamento – uma
vantagem quando o ato de registrar reforça o processo terapêutico, mas uma
desvantagem quando estamos tentando investigar o comportamento típico.

A auto-observação direta das ações deveria dizer-nos algo muito semelhante àquilo que
um segundo observador relataria. A auto-observação direta de pensamentos e
sentimentos, entretanto, captura informações de outra forma não disponíveis. Um
procedimento de mensuração estruturado - o Experience Sampling Method (Método de
Amostragem da Experiência) - foi desenvolvido por Csikszentmihalyi e Larson (1984),
para as pesquisas sobre a adolescência. Os respondentes, recrutados como co-
investigadores júnior, sabiam que as informações coletadas não iriam afetá-los de modo
nenhum.

Cada participante recebia um aparelho transmissor e um bloco dos formulários ilustrados
na Figura 2.3. Durante a semana de coleta de dados, eram enviados sinais - cerca de 80
no total - através do aparelho transmissor, em intervalos espaçados, irregulares, desde as
7 horas da manhã até as 10 e meia da noite (até mais tarde na sexta e no sábado). O
participante deveria preencher o formulário imediatamente quando o aparelho sinalizava,
mas não se exigia uma obediência perfeita. O índice de respostas de 69 por cento foi
baixo principalmente por causa do mau funcionamento dos transmissores; não parece ter
havido muita censura. Muitas respostas, incluindo as da Figura 2.3, obviamente foram
espontâneas. (Incidentalmente, a mãe citada nesta resposta pareceu ao investigador uma
pessoa sensível e razoável; R. Larson, comunicação pessoal, 1989.)

Figura 2.3. Um auto-relato sobre o humor e o comportamento num momento amostra (fonte: De
Begin Adolescent: Conflict and Growth in the Teenage Years, de Mihaly Csikzentmihalyi e Reed
Larson, Coprygth 1984 da Basic Books, Inc. Reimpresso com a permissão do editor).

A principal virtude dessa técnica era o formulário padrão de relato que parecia se ajustar a
todas as pessoas e eventos. Isso permitiu uma comparação estatística entre os indivíduos
e tipos de ambientes. Os dados mostraram algumas associações surpreendentes; por
exemplo, um claro aumento na excitação nos finais de noite do fim-de-semana,
combinado com uma diminuição consciente do autocontrole.

11. Classifique cada uma das seguintes situações como um teste de capacidade, um
auto-relato, uma observação numa situação padronizada, ou uma observação numa
situação não-padronizada:

a. Um entrevistador do Instituto Gallup pergunta a um cidadão como ele votará nas
próximas eleições.

b. Uma produtora de televisão quer saber que características atraem diferentes tipos de
espectadores. Ela apresenta um show para uma pequena audiência, que pressiona
botões sinalizadores para indicar se eles gostam ou não do que estão vendo em cada
momento.

c. Um teste de "aptidão vocacional" pergunta o quanto o sujeito gosta de atividades, tais
como vendas, marcenaria e xadrez.

14
d. Um teste de ortografia é aplicado a candidatos a um emprego de escritório.

e. Inspetores em roupas comuns (não uniformizados) andam de ônibus para determinar
se os motoristas e cobradores estão obedecendo às regras da companhia.

f. Durante um teste de labirinto, o examinador busca evidências de autoconfiança ou da
sua ausência.

g. Os estudantes são informados sobre uma proposta para reduzir o crescimento
populacional num subúrbio: serão autorizadas poucas ligações novas à rede de esgotos.
Pede-se a eles que digam o que o conselho municipal deve fazer e que dêem razões para
justificar suas escolhas.

h. Um inspetor de uma fábrica de meias deve detectar todas as meias com falhas na
malha. Como uma verificação da eficiência, em certos momentos algumas meias
defeituosas que haviam sido marcadas com uma tinta fluorescente são misturadas com o
lote a ser inspecionado. A tinta é invisível para o funcionário,mas ao utilizar uma lâmpada
ultravioleta sobre as meias depois da inspeção, o supervisor pode localizar facilmente
quaisquer meias defeituosas que o inspetor deixou passar.

12. Classifique cada um dos seguintes testes, empregando os termos descritivos
discutidos no texto, tantos quanto forem claramente aplicáveis.

a. O Estudo dos Valores consiste em perguntas impressas, tais como:

Na sua opinião, qual é a melhor maneira de um homem que trabalha no ramo de negócios
a semana toda passar o domingo:

1. tentando instruir-se, lendo livros sé rios?
2. tentando vencer no golfe, ou em corridas?
3. assistindo a um concerto de uma orquestra?
4. escutando um sermão realmente bom?

O respondente escolhe a resposta preferida. Um gabarito numérico calcula a importância
que atribui aos valores "estéticos", "religiosos" ou outros.

b. Num determinado teste de "aptidão mecânica", a pessoa assinala as ilustrações de
ferramentas e outros objetos que são usados juntos (por exemplo, martelo e bigorna).

c. Um item de Arranjo de Figuras apresenta quatro figuras que, arranjadas na ordem
correta, contam uma história, como numa tira de cartum (veja a Figura 7.2). Cada figura
está num cartão separado. Os cartões são apresentados num arranjo aleatório, e o
testando os organiza de modo que formem uma história inteligível. d. O Short lmaginal
Processes lnventory consiste em 45 itens, tais como:

- Eu tendo a me aborrecer facilmente.
- Meus devaneios diurnos são geralmente estimulantes e recompensa dores.
- Em meus sonhos, eu manifesto raiva em relação aos meus inimigos.

A pessoa responde segundo uma escala de 5 pontos, variando de "é uma forte
característica minha" ao oposto. São computados três resultados: Devaneios Diurnos
15
Positivo-Construtivos, Devaneios Diurnos de Culpa e Medo do Fracasso e Controle da
Atenção.

A TESTAGEM NA ERA DO COMPUTADOR

O computador desempenha muitos papéis por trás do cenário da testagem e pode fazer o
papel de astro como aplicador de testes. O tópico é introduzido aqui porque o computador
está mudando as idéias sobre aquilo que os testes podem e devem ser (Roid, em Plake &
Witt, 1986). Em virtude de sua consistência, o computador leva a padronização a um
extremo; entretanto, ele pode realizar uma mensuração padronizada ao mesmo tempo em
que apresenta perguntas diferentes (e uma devolução personalizada) a cada testando.

A devolução pode ser notavelmente complexa, quase como uma conferência pessoal. No
aconselhamento profissional, por exemplo, o computador pode fazer perguntas, que
ajudam a pessoa a refletir sobre seus interesses e experiência de trabalho, e pode sugerir
onde obter informações sobre ocupações adequadas.

Bancos de Itens

O tipo de teste mais conhecido é um folheto impresso cheio de perguntas. Atualmente,
um teste impresso que se ajuste a determinadas exigências locais pode ser produzido
rapidamente através de um "banco de itens" - um arquivo de itens classificados por
conteúdo e nível de dificuldade. Um sistema escolar pode solicitar a um fornecedor um
teste para estudos sociais cuja mescla de tópicos seja adequada ao seu currículo.
Atualmente, é prático armazenar localmente bancos de itens e montar testes com um
microcomputador (F. Baker, em Linn, 1989a). Um número infinito de testes equivalentes
pode ser criado selecionando-se conjuntos de itens de acordo com o mesmo
planejamento.

O governo federal certa vez planejou computadorizar grande parte da testagem dos
funcionários públicos (Urry, 1977). Os planos foram engavetados antes de serem
concluídos - não, aparentemente, por uma questão de plausibilidade e custo. O fato de o
computador poder criar um teste novo para cada pessoa é a sua principal atração para o
serviço público. Mês após mês, chegam candidatos a serem testados para o mesmo tipo
de cargo, e as perguntas acabam vazando depois que um teste é utilizado repetidas
vezes. Uma equipe humana não pode montar mais do que alguns formulários de teste
para cada cargo. Com numerosos itens num disquete, o computador pode montar um
formulário diferente para cada candidato e adaptar todos os resultados a uma escala
comum.

As vantagens tornam-se consideravelmente maiores quando o teste abrange problemas
que o computador é capaz de resolver. Candidatos a funcionário da alfândega poderiam
ser solicitados a calcular o imposto a ser pago sobre um carregamento de produtos
importados, utilizando uma complexa tabela de impostos. Essa tarefa pode ser
estruturada de uma maneira geral. Para cada examinando, o computador pode alterar
arbitrariamente os impostos, regras ou as mercadorias do carregamento. Diante desse
tipo de teste, o candidato não tem alternativa além de aprender a aplicar tabelas de
impostos. Ele não ganha nada ao descobrir as regras que um amigo aplicou na semana
anterior.

16
O desejo de manter a segurança dos testes motivou o Departamento de Defesa a levar
cinco anos replanejando a administração do teste de qualificação (ASV AB) para recrutas
potenciais, para que fosse aplicado por computadores. O serviço público não quer
encorajar candidatos de capacidade limitada, mas os recrutadores que recrutam
candidatos estão ansiosos por recrutar o máximo possível de pessoas. Conhecendo os
itens do teste, alguns recrutadores orientam os candidatos fracos que de outra forma não
passariam no teste (ou, pelo menos, é do que desconfiamos). Com o teste
computadorizado infinitamente variável, essa orientação seria impossível. Finalmente, os
planos para o ASV AB computadorizado foram engavetados sem terem sido usados,
porque alguém com um lápis bem apontado calculou o custo da instalação do hardware
necessário em todo o país (Bunderson, Inouye & Olsen, em Linn, 1980a, p. 383).

Aplicação Automatizada

Os computadores são bons em apresentar testes diretamente aos indivíduos - um teste
audiométrico, por exemplo. No diagnóstico de transtornos auditivos e na adaptação de
aparelhos auditivos, a examinadora ajusta tons puros para volumes mais altos e mais
baixos, a fim de determinar o volume mais baixo que a pessoa consegue ouvir. Um
examinador humano diria ao testando para pressionar um botão quando ele ouvisse o tom
em seus fones de ouvido. Ele ajustaria o botão de freqüência em (por exemplo) 800 hertz
(ciclos por segundo), ajustaria o botão de volume num nível mediano (por exemplo, 5) e
pressionaria por 0,5 segundos o interruptor que produz o som. Depois da resposta, o
examinador assinalaria a resposta numa folha de registro. Mais tentativas na mesma
freqüência - sem outras orientações audíveis, mas com uma luz indicando "já" - poderiam
utilizar níveis 4 (eliciando uma resposta positiva codificada como +), 3 (+), 0 (-); uma
tentativa de testar respostas falsas), 2 (-), 3 (-), 2 (-), 3 (+) e assim por diante. Em certo
momento, o examinador determinaria uma estimativa (algo perto de 3 neste caso) do
limiar auditivo da pessoa em 800 hertz e, então, passaria para outra freqüência.

O computador pode fazer as mesmas coisas, economizando o tempo remunerado do
profissional. O computador dá instruções visualmente ou através de fones de ouvido,
modifica os sinais sem erro e os sinais de tempo com precisão. Diferentemente de um
botão de controle giratório, ele pode fixar valores de 3,1 ou 3,05. O computador pode
determinar o limiar com maior rapidez e, segundos depois da última resposta, pode
imprimir imediatamente um perfil de resultados em função dos tons. A transmissão
através de satélites torna possível enviar instantaneamente a informação para o outro
lado do mundo.

Entre os talentos do computador observados neste exemplo estão os seguintes:

- Adesão precisa a esquemas e planos. Controle delicado dos estímulos.

- Escolha de itens de teste sucessivos à luz do desempenho até o momento ("testagem
adaptativa").- Imunidade ao cansaço, aborrecimento, lapso de atenção e erros inadvertidos de
pontuação.

- Pontuação instantânea e exata.

17
- Registros legíveis, com cópias múltiplas e transmissão a distância.

Naturalmente, computadorizar um teste traz algumas perdas, especialmente ao eliminar
as observações não-padronizadas que um clínico experiente faz durante um teste
individual tradicional.

Interagir com um computador fascina os testandos (pelo menos atualmente, enquanto a
experiência ainda é nova). Quando problemas de raciocínio foram apresentados a
estudantes universitários por um computador e por um examinador humano, o relato foi o
seguinte:

Os sujeitos testados pelo computador são mais capazes de fazer pausas por
períodos mais longos de tempo sem digitar nada no computador. Os sujeitos
testados por uma pessoa podem sentir-se pressionados a responder logo,
mesmo com o risco de fazer alguma coisa errada. Os sujeitos testados por
computador gritaram de alegria, praguejaram, bateram nas paredes e
cantaram (podiam ser escutados através das paredes à semi-prova de som de
seus cubículos), certamente formas de expressão que um sujeito típico evita
na presença de um experimentador. Johnson & Baker, 1972, p. 31; para um
relato formal, veja Johnson & Baker, 1973).

Vocês poderiam pensar que o computador adaptar-se-ia somente aos sujeitos instruídos
e emocionalmente estáveis. Mas crianças pré-escolares e pacientes com doença mental
respondem bem às apresentações automatizadas. A paciência do computador é
interminável. Se o esquizofrênico deteriorado não faz nenhum movimento por 4 horas, o
monitor simplesmente espera. Se a criança desatenta só pode ser levada a fazer o teste
depois de quatro sessões preliminares de desenhos animados, o computador os
providencia sem impaciência.

Muitos testes e inventários têm versões para testagem computadorizada através de um
microcomputador na escola ou no consultório da psicóloga. O software pode não apenas
administrar o teste sem nenhum examinador humano na sala, como também preparar um
relatório de resultados para impressão imediata. A versão computadorizada de um teste
originalmente desenvolvido em forma impressa ou oral normalmente é muito semelhante
à versão original.

Parece que as versões convencional ou computadorizada de um teste realmente
costumam medir às mesmas variáveis, mas a dificuldade ou confiabilidade pode mudar
facilmente. Se a versão computadorizada é "o mesmo teste" é algo que deve ser
questionado com cada instrumento em termos psicológicos. Talvez seja mais difícil ler
diagramas no monitor do que na página impressa. Os testandos não-familiarizados com o
teclado podem ter dificuldade se as ações requeridas (por exemplo, revisar um item e
mudar a resposta) forem complicadas. Mesmo quando o teste em si não é modificado,
interagir com uma máquina pode ser psicologicamente diferente de responder a um
examinador humano. Quando a tecnologia do computador permite uma mudança na
tarefa - introduzindo exposições de tempo controlado, por exemplo - aquilo que o teste
mede irá mudar. O teste computadorizado de habilidades de manejo dos pacientes
classifica os candidatos à certificação de forma bem diferente da dos testes de lápis e
papel planejados para o mesmo propósito (Melnick, 1988).

Testagem Adaptativa. Uma característica muito importante é a capacidade do
computador de escolher itens de teste à luz dos prévios sucessos e fracassos do
18
testando. Isso se chama testagem seqüencial ou adaptativa ou sob medida. Os
examinadores audiométricos sempre escolheram os estímulos do teste à luz de respostas
anteriores. No exemplo dado acima, foi sensato apresentar sinais nos níveis 2 e 3 depois
que o respondente havia detectado sinais de potência 4; se a pessoa cometeu erros nos
4, sinais levemente mais altos seriam apropriados.

Técnicas" derivativas" são especialmente úteis para testar habilidades intelectuais
complexas, sendo um exemplo o teste para os médicos descrito na página 13. Depois que
o testando responde a uma exposição inicial de informações sobre o paciente, são
fornecidas novas informações. Passo a passo, o testando propõe uma ação ou solicita
novas informações específicas, e é informado sobre os achados do laboratório ou as
observações da enfermeira, ou algo parecido.

Ajustar a dificuldade de modo que o examinando trabalhe principalmente com itens que
não são nem difíceis demais nem fáceis demais para ele deve melhorar a motivação.
Também é fácil para o computador indicar imediatamente se uma resposta está certa ou
errada, e isso pode aumentar a motivação (embora esta não seja uma característica
comum dos testes adaptativos utilizados na avaliação). Um achado ilustrativo: sem um
feedback instantâneo, os jovens negros de uma escola de segundo grau de zona urbana
pobre omitiram muitos itens e obtiveram escores mais baixos do que seus colegas de
classe brancos. Quando o computador ofereceu um feedback depois de cada item, os
negros omitiram poucos itens e alcançaram os estudantes brancos (Betz, 1975; para
outros estudos, veja Betz & Weiss, 1976a, 1976b; Prestwood & Weiss, 1978). Entretanto,
uma declaração geral seria arriscada; o que encoraja uma pessoa perturba outra.

A aprendizagem auxiliada pelo computador incorpora muitos aspectos da testagem
adaptativa. Quando o aluno acessa o seu programa hoje, o computador lembra não
apenas do nível de desempenho de ontem, mas também das tarefas em que o aluno não
se saiu tão bem; os exercícios de hoje são escolhidos de acordo com isso. Os próprios
exercícios servem como um teste. Assim, o registro do computador torna-se uma
descrição multidimensional atualizada do indivíduo, mais diferenciada do que um teste
comum e mais exata do que as percepções do professor. Existem possibilidades
semelhantes na terapia da fala, exploração das carreiras e outras atividades
desenvolvimentais.

Exposições Geradas por Computador. A nova tecnologia está aumentando imensamente
a variedade possível de estímulos de teste. Para testar médicos, uma exposição
apresentada por um disco de vídeo mostra fotografias a serem interpretadas (um raio X
ou um slide de microscópio, por exemplo). Simuladores para astronautas possuem um
arranjo realístico de estímulos, um equipamento realístico para ser manipulado e contínuo
feedback dos resultados das ações. Embora planejados para treinamento, os aparelhos
medem o progresso do treinando e portanto são testes. .

O equipamento Micropat na Figura 2.4 apresenta um teste moderno de coordenação
complexa que as forças armadas britânicas estão investigando. Os pedais são
semelhantes aos antigos, mas a alavanca de controle foi substituída por uma menor.
Atualmente, o manejo das informações é considerado muito mais significativo do que a
coordenação dos grandes músculos. A parte importante deste teste, naturalmente, é o
software que gera as exposições sempre em mutação. O antigo teste era inflexível. O
novo - com estímulos que podem ser interminavelmente alterados e com velocidade
controlada - permite milhares de variações. Muitas pesquisas serão necessárias para
19
determinar que padrões de estímulo proporcionam as melhores informações preditivas.
(Para um exemplo dessa pesquisa "paramétrica", que é um passo rumo à "engenharia" de
testes psicológicos, veja Bartram e colaboradores, 1985).

O Micropat é um sistema de fornecimento ao invés de um teste. Muitas funções - tempo
de reação, controle da velocidade motora, raciocínio espacial - podem ser programadas
para serem avaliadas com o mesmo equipamento.

13. Seria possível colocar um teste audiométrico numa fita de som. A fita, digamos, falaria
o número do item, depois apresentaria um tom ou um período de silêncio; o respondente
verificaria itens durante os quais ele ouve um tom em seus fonesde ouvido. Quais seriam
as vantagens e desvantagens desse procedimento? Compare com os procedimentos
descritos no texto para:

a. o examinador humano
b. o computador

INFERÊNCIAS A CURTO E LONGO PRAZOS

Alguns intérpretes estão dispostos - e alguns relutantes - a fazer inferências relativas a
futuras circunstâncias. Para alguns propósitos, o examinador praticamente não precisa ir
além do tempo e local de observação. Ele observa que uma criança comete erros como"
As vacas é" na composição de hoje; este fato não poderia ser ampliado além de "Esta
semana ela não está manejando corretamente as concordâncias de singular e plural".
Uma ousada inferência a longo prazo é ilustrada quando uma mãe amorosa, observando
que seu filho geralmente reproduz o tom certo de uma canção depois de ouvi-Ia pela
primeira vez, diz: "Ele tem uma verdadeira aptidão para a música". Isso é uma
generalização para uma ampla classe de tarefas, para daqui a muitos anos.

A abordagem mais conservadora à inferência é supor que a pessoa será no futuro aquilo
que foi no passado (ou, considerando-se o crescimento, irá manter sua posição relativa
entre seus companheiros). Uma avaliação de competência numa tarefa ou papel prático
tende a ser válida por bastante tempo (McClelland, 1973; Wernimont & Campbell, 1968).
Na ausência de declínio físico, mesmo a competência que diminui com a falta de uso
pode ser recuperada com a prática renovada. Os hábitos também tendem mais a persistir
do que a mudar. A história de acidentes e multas de trânsito de um motorista é uma base
sólida para as inferências de uma companhia de seguros.

O principal negócio das profissões de ajuda, entretanto, é promover a mudança. Para as
partes interessadas, as predições conservadoras são inerentemente pessimistas ou
limitadoras. O profissional deve fazer inferências mais a longo prazo para ajudar a pessoa
a estabelecer objetivos de mudança e para avaliar o auxílio que mais irá beneficiá-Ia.

As inferências a longo prazo normalmente são uma interpretação impressionista; elas
tentam sugerir corno a pessoa irá responder às mudanças de condições. Algumas
interpretações psicométricas também têm um longo alcance, corno quando certos erros
cometidos ao copiar desenhos geométricos são identificados (probabilisticamente) como
um tipo específico de dano cerebral, ou quando testes terrestres são utilizados para
selecionar pessoas que se tornarão astronautas.

20
Figura 2.4. O sistema Micropat para a
produção de testes perceptuais e motores.
A pequena "alavanca de controle" à direita
controla os movimentos para cima e para
baixo. Pedais não vistos aqui controlam a
inclinação, e o controle deslizante à
esquerda controla o tamanho ou, em
algumas tarefas, a velocidade. Na tarefa de
coordenação apresentada, o quadrado
move-se irregularmente, e o examinando
tenta manter a cruz centrada no quadrado
e combinada com ele em tamanho e
inclinação. O segundo monitor pode
apresentar informações ou instruções. O
teclado tem dez letras, dez dígitos, quatro
flechas, mais SIM e NÃO. (Fonte:D.
Bartram. Reproduzido com permissão. Os
designs, software, documentação e
exposições do teste Micropat possuem
copyright U.K. Crown 1985, 1987, 1988. O Micropat é distribuído através de licença obtida com o
Ministério de Defesa do Reino Unido, por Bartdale (Human Factors Specialists) Lld. Applegarth,
Leconfield, Beverly, N. Humberside, HU 17 7NQ, Reino Unido).

Uma observação afirma um fato relacionado a um
momento (ou uma impressão do observador que
ele considera factual). Por exemplo:

"Hoje, Sam levou 4 minutos e meio para datilografar 200 palavras". Mas os fatos são
registrados com perguntas mais amplas em vista. No mínimo, esse desempenho é
considerado como representando Sam neste ponto de seu treinamento. E uma amostra
do trabalho deste dia, ou desta semana. Se o examinador está realizando uma pesquisa
sobre a fadiga, e este resultado ocorre na quinta página de cópia que Sam datilografou na
mesma sessão, o resultado resume o desempenho neste momento; o investigador não
considera o resultado nem corno representativo da sessão. Entretanto, o investigador está
supondo que o declínio no desempenho que acompanhou a fadiga hoje representa aquilo
que seria encontrado em outros dias. Todos os testes, então, são amostras.

Às vezes, o comportamento amostrado não é de interesse direto; em vez disso, ele é
tomado como um sinal ou indicador de outros comportamentos ou estados internos. O
teste do labirinto é de interesse como um sinal, não como uma amostra. Nenhum animal
ou pessoa costuma ter de encontrar seu caminho através de um labirinto, exceto em um
teste psicológico. O número de tentativas necessárias para aprender o caminho no
labirinto é tomado como um indicador de uma capacidade mais ampla. É muito mais difícil
estudar a aprendizagem na ecologia natural do que na situação de teste, e o índice de
aprendizagem de alguma coisa com a qual os aprendizes já estão parcialmente
familiarizados seria mais difícil de interpretar do que o índice de aprendizagem em tarefas
desconhecidas, artificiais. Inferir dano cerebral a partir de erros ao copiar diagramas é um
outro exemplo de raciocinar a partir de um sinal.

Traços, Estados e Atos. Os psicólogos investigam tanto os "traços" quanto os "estados".
Em relação à ansiedade, por exemplo, a intensidade dos sentimentos ansiosos (o
presente estado da pessoa) muda dia a dia. O nível de traço da pessoa normalmente é
21
concebido como uma média ou estado típico; se é assim, ele reflete não apenas as suas
características, mas também os estresses habitualmente presentes em seu ambiente. A
"capacidade" é quase sempre considerada como um traço moderadamente estável, mas
o nível de desempenho é transitório. Um corredor pode estar "pronto" para um páreo, ou
"fora de forma". Estes são estados.

Conceitos como "ansiedade" e "capacidade" são construtos ("construtos"). Eles
descrevem não uma ação, mas a organização ou eficiência características dos
pensamentos e das ações. As interpretações dos construtos evoluem. Uma antiga
hipótese era a de que o resultado no labirinto indicava a "inteligência pura e simples".
Essa idéia teve de ser substituída por descrições mais específicas. Uma linhagem de
ratos cuidadosamente criada que se saiu bem em labirintos não apresentou outras
evidências de "inteligência" superior. Conforme as pesquisas prosseguiam, o construto
mais limitado de "aptidão para a aprendizagem no labirinto" também caiu por terra. A
experimentação de uma variedade de condições de teste levou a uma conclusão restrita:
"Esta linhagem tem aptidão para aprender labirintos altos quando é mantida com fome e
recebe comida no box de chegada". Esta conclusão ainda é uma generalização, mas com
um alcance curto.

Um construto formal é invocado quando a inferência atinge diversas situações. O "talento
musical" é uma dimensão mais conveniente do que o "talento para instrumentos de
corda". Este, por sua vez, é mais fácil de manejar, mas menos definitivo do que "destreza
em rápidos movimentos dos dedos" e "discriminação de tons". O construto amplo não é
verdadeiro nem falso; ele é adequado para alguns propósitos e inadequado para outros.

Os construtos que vão mais fundo na psique obviamente são hipóteses mais ousadas.
(Comparem "E incapaz de aceitar seus próprios impulsos hostis" com "A resposta às
perguntas desafiadoras é moderada, formal, polida"). As interpretações mais profundas
baseiam-se numa teoria complexa sobre as origens do comportamento, e poucas dessas
teorias foram bem-substanciadas. O quanto é apropriado oferecer uma análise profunda
um tanto especulativa, um tanto artística, constitui uma questão polêmica. Apenas duas
conclusões precisam ser tiradas nesse ponto. Aqueles que se apegam a relatos literaisde
fatos deixam para os outros a carga da interpretação; esses outros poderiam (ou não)
estar mais bem servidos se o psicólogo tivesse oferecido uma interpretação. Aqueles que
oferecem hipóteses imaginativas como se fossem relatórios científicos levam seus
clientes para a areia movediça.

Desde a época em que a frenologia foi denunciada como falaciosa, os psicólogos têm
tentado escapar da noção de que os traços são objetos, comparáveis à glândula pituitária
e ao cromossomo X. Nós achamos natural falar sobre a "timidez". Mas a timidez não é
uma entidade; a palavra é um resumo de respostas. Dizer que uma pessoa é tímida
significa apenas que, em muitas situações, ela apresentou ações associadas a esse
construto.

Situar uma pessoa numa escala ou rotular ações é algo que funde diversos atos e, assim,
encobre a textura do comportamento. Uma pessoa pode ser tímida em festas e não num
debate, com estranhos e não com conhecidos, com mulheres e não com homens. A
timidez pode ser totalmente interna: a pessoa confidencia sentimentos de embaraço
social para um conselheiro, sentimentos esses que as pessoas com quem convive em
seu cotidiano desconhecem. A inibição e o retraimento de uma outra pessoa podem estar
aparentes para todos.
22

Análise de Comportamento. A tradição comportamental minimiza referências a estados
mentais, categorias de transtornos e traços globais de personalidade. Entretanto, o
comportamentalista ainda tem de categorizar situações e atos. Ao avaliar como as
mensagens relativas à doença cardíaca afetam a alimentação, ele poderia pedir a cada
sujeito para registrar sua ingestão diária de alimentos numa lista de verificação. Um item
seria "ovos". Não seria melhor perguntar se os ovos eram cozidos ou fritos? E, se fritos,
em banha ou em óleo de açafrão-da-terra? As categorias mais refinadas ajustam as
informações mais cuidadosamente ao problema. E até uma mensuração tão concreta,
então, é enquadrada por construtos ("colesterol alto", "poliinsaturado"). O refinamento das
categorias dependerá do propósito da investigação, mas deve haver categorias.

Aqueles empenhados na modificação do comportamento e em outras aplicações
orientadas pela situação distinguem nitidamente a descrição de inferência breve dos
rótulos atribuídos, resumindo respostas em resultados de "traços", ou explicando em
termos dos motivos inferidos. No livro que inspirou a escola de pensamento
neocomportamentalista, Walter Mischel (1968, p. 10) declarou a idéia central: "Na análise
comportamental, a ênfase está naquilo que a pessoa faz e não nas inferências sobre os
atributos que possui mais globalmente". O que a pessoa faz numa situação definida pode
ser descrito por uma simples contagem de ações em várias ocasiões. Dizer "como a
pessoa é" exigiria que o psicólogo fosse além da contagem de ações, até uma linguagem
descritiva e, além disso, até uma construção imaginativa de uma explicação.

Ao planejar o tratamento, ao avaliar o progresso e ao avaliar métodos de tratamento
alternativos, os comportamentalistas têm tantas ocasiões para testar quanto outros
psicólogos aplicados. Na verdade, os testes desempenham um papel especial de
monitorização em seu trabalho, porque o cliente aprende a regular a si mesmo pela
observação de suas respostas. Ele é ensinado, por exemplo, a observar se realmente fala
muito alto sempre que fica descontente com algo que sua esposa diz. Os
comportamentalistas preocupam-se especialmente com a freqüência de atos significativos
no contexto e com as mudanças no padrão. Assim como as professoras acompanham o
progresso e a confusão de um aluno de lição para lição ou de semana para semana, os
psicólogos, tentando reformular o comportamento, monitoram o processo e modificam
suas táticas conforme necessário.

Os comportamentalistas não sentem nenhuma necessidade de investigar as origens de
um padrão de resposta; eles buscam as circunstâncias atuais que desencadeiam a
resposta. Quando uma pessoa com dificuldades emocionais busca ajuda, o psicólogo
dessa escola tenta identificar os tipos de situação que o paciente tipicamente maneja com
dificuldade ou que despertam sentimentos desagradáveis.

Os comportamentalistas minimizam a inferência. Os dados que utilizam estão
estreitamente ligados às dificuldades do paciente - nada de testes de manchas para eles.
O tratamento comportamental volta-se diretamente para os atos que precisam ser
reformulados (e não para tentativas de desenvolver o insight dos pacientes ou de resolver
seus conflitos internos). Quando alguém está tentando aumentar a auto-afirmação, a
repetida contagem de atos de auto-afirmação é um teste que complementa as "lições".

Os comportamentalistas continuam a preferir as inferências breves, mas a antiga
oposição generalizada à "testagem" diminuiu bastante. Os comportamentalistas
reconhecem que seus procedimentos focalizados precisam ser julgados pelos mesmos
23
padrões psicométricos dos testes convencionais. Igualmente, eles estão percebendo que
os testes convencionais são importantes em seu trabalho (Hersen, em Goldstein &
Hersen, 1984; Strohsahl & Linehan, em Ciminero e colaboradores, 1986; Turkat, 1985).

14. Em quais desses aspectos você esperaria que os analistas do comportamento
seguissem a tradição da mensuração psicométrica?

a. Expressando /numericamente a força de uma tendência de resposta.

b. Agrupando em uma categoria ou resultado dois tipos de comportamento, tais como a
submissão e a timidez, que tendem a ser encontrado juntos.

c. Especificando uma tarefa ou situação definida na qual coleta de dados sobre muitas
pessoas.

d. Utilizando normas para avaliar a freqüência de um comportamento-problema.

15. Qual testagem, se é que alguma, desempenharia um papel na abordagem do analista
de comportamento a uma criança de dez anos que está progredindo muito pouco na
aprendizagem da leitura?

16. "Compreende o que lê" é um construto amplo. Que construtos mais limitados
poderiam descrever tipos diferentes de compreensão?

17. Anastasi (1988, p. 510) observa que o comportamentalista emprega construtos até
mesmo quando fala sobre algo tão definido quanto o "medo de cachorros", Ela diz que as
fronteiras do construto precisam ser examinadas para que a generalização não seja
ampla demais. Como poderíamos examinar essas fronteiras? Elas seriam semelhantes
para todas as pessoas que se perturbam diante de cães?