Avaliacao Psicológica - SALVIA e YSSELDYKE - Cap I e II

•

UNISAL

Rocha .

04.11.2017

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

CAP.I TEXTO SALVIA.pdf
CAPII A SALVIA e Ysseldyke.pdf
CAP.II B TEXTO SALVIA.pdf
J
E
O
L
EDITORA
MANOLE
LTDA
«M
Dados Internacionais de Cataloga na Publicação (CIP)
Câmara Brasileira do Livro, SP, Brasil)
Salvia, John.
Avaliação em educação especial e corretiva /
John Salvia, James E. Ysseldyke ; [tradução Doris Sanches
Pinheiro]. 4. ed. São Paulo : Manole, 1991
1. Avaliação educacional 2. Educação - Testes e medidas 3.
Educação especial 4. Ensino corretivo I. Ysseldyke, James E. II.
Título.
ISBN 85-204-0007-8
CDD-371.26
-371.9
91-2284 -374.012
índices para catálogo sistemático:
1. Avaliação : Medidas : Educação 37.1.26
2. Educação corretiva 374.012
3. Educação especial 371.9
4. Medidas e testes : Educação 371.26
5. Testes educacionais 371.26
Traduzido do original americano:
ASSESSMENT IN SPECIAL AND REMEDIAL EDUCATION
Fourth Edition
COPYRIGHT© HOUGHTON MIFFLIN COMPANY
Tradução:
Dr® Doris Sanches Pinheiro
Produção Editorial:
MIR Assessoria Editorial Ltda.
Nenhuma parte deste livro poderá ser reproduzida, por qualquer
processo sem a permissão dos editores.
Direitos adquiridos para a língua portuguesa pela
EDITORA MANOLE LTDA.
Rua Conselheiro Ramalho, 516 - Bela Vista
CEP 01325 - São Paulo - SP
FONE (011) 283-5866 - FAX (011) 287-2853
Impresso no Brasil
Printed in Brazil
4
CAPíTULO I
A AVALIAÇÃO DOS ALUNOS
Todos nós já passamos por testes em nossas vidas. Na escola primária e
secundária os testes foram aplicados para medir nossa aptidão escolástica, ou
inteligência, ou para avaliar o quanto aproveitamos da instrução. Podemos ter
feito testes de personalidade, testes de interesses ou testes que nos auxilia¬
ram na seleção da vocação e no planejamento da carreira. Ao tentarmos
conseguir um emprego, podemos ter feito concursos públicos ou testes de
habilidades específicas, como datilografia ou destreza manual. O alistamento
militar significou a realização de diversos testes. A matrícula em uma facul¬
dade implicou a realização dos exames vestibulares. Os que decidiram ir para
uma escola técnica normalmente tiveram que fazer um teste de aptidão; muitos
dos que se tomaram professores realizaram um concurso p blico para ingres¬
sar no magistério. Médicos, advogados, psicólogos e muitas outras pessoas
tiveram que fazer testes para demonstrar sua competência, antes de serem
licenciados para a prática da profissão. Estima-se que os alunos matriculados
nas escolas p blicas americanas fazem mais de 250 milhões de testes padroni¬
zados por ano.
Durante toda a sua carreira profissional, professores, orientadores, assisten¬
tes sociais de escola, psicólogos educacionais e administradores de escolas
devem aplicar, avaliar e interpretar uma ampla variedade de testes. Como os
funcionários de escolas profissionais recebem, rotineiramente de seus colegas
de outras escolas e de órgãos e empresas, informações obtidas através de
testes, eles necessitam de um conhecimento prático dos aspectos importantes
dos testes.
De acordo com o comité adjunto da American Psychological Association
(APA), da American Educational Research Association (AERA) e do National
Council on Measurement in Education (NCME), um teste pode ser conside¬
rado um conjunto de tarefas ou questões concebidas para determinar tipos
particulares de comportamentos quando apresentados sob condições padroni¬
zadas e para fornecer escores que possuam as propriedades psicométricas
convenientes... (1974, p. 2). TESTAR, portanto, significa expor uma pessoa
a um conjunto específico de questões com o intuito de obter um escore. Tal
escore é o produto final do teste.
rocha
Highlight
rocha
Highlight
5
Áreas de
Problemas
Tipos de Decisões
Encaminhamento Triagem Classificação PlanejamentoEducacional
Avaliação do
Progresso do
Aluno
Acadêmica
Comportamental
Física
FIGURA 1.1 A avaliação é a coleta de dados para especificar e verificar problemas
e para auxiliar na tomada de decisão.
A aplicação de testes pode ser parte de um processo mais amplo conhecido
como AVALIAÇÃO; contudo, teste e avaliação não são sinónimos. A avaliação,
em meios educacionais, é um processo multifacetado que envolve mais do que
a aplicação de um teste. Quando avaliamos alunos, consideramos a maneira
como eles executam uma variedade de tarefas em uma variedade de meios ou
contextos, o significado de seus desempenhos em termos do funcionamento
total do indivíduo e as prováveis explicações para tais desempenhos. Bons
procedimentos de avaliação levam em consideração o fato de que o desem¬
penho de alguém, em qualquer tarefa, é influenciado pelas exigências da própria
tarefa, pela história e pelas características que o indivíduo traz para a tarefa
e pelos fatores inerentes ao meio em que é realizada a avaliação.
A avaliação é o processo de coletar informação. Parte da informação cole¬
tada pode constituir-se de dados de testes; mas a maior parte consistirá, pro¬
vavelmente, em outras formas de informação. Entretanto, a avaliação é mais
do que simplesmente a coleta de informação; é a coleta com um objetivo. A
avaliação é o processo de coletar dados com o objetivo de (1 ) especificar e
verificar problemas e (2 ) tomar decisões sobre os alunos. Como nos mostra
a Figura 1.1, cinco1 tipos gerais de decisões são tomadas: encaminhamento,
triagem, classificação, planejamento educacional e avaliação do progresso do
aluno. Como também nos mostra a Figura 1.1, nas escolas, especificamos e
verificamos problemas em três áreas: acadêmica, comportamental e física.
1. Na verdade, há, pelo menos, mais três razões para a avaliação. Os indivíduos podem ser
avaliados porque estão curiosos sobre si mesmos, porque participam de estudos de pesquisa ou
porque um distrito escolar está avaliando os programas educacionais.
rocha
Highlight
rocha
Highlight
rocha
Highlight
TIPOS DE DECISÕES
Decisões de Encaminhamento
Decisões de encaminhamento são decisões sobre a necessidade de buscar as¬
sistência adicional de outros profissionais da educação. Embora qualquer pes¬
soa possa encaminhar alunos (por exemplo, os pais, os próprios alunos ou
outros indivíduos), geralmente quem faz o encaminhamento é o professor. Os
professores regularmente encaminham alunos para outros profissionais da
escola e, algumas vezes, para profissionais ou órgãos fora do âmbito escolar.
Estudos recentes mostraram que 3 a 5% dos alunos em escolas públicas, nos
Estados Unidos, são encaminhados todos os anos para avaliação psicológica
e educacional. Cerca de 92% dos alunos encaminhados são submetidos a
testes e aproximadamente 73% dos que são testados são encaminhados para
a educação especial (Algozzine, Christenson, & Ysseldyke, 1982).
Quem os professores encaminham para avaliação? Esta questão pode ser
respondida de uma maneira muito simples: eles encaminham os alunos que os
incomodam. Embora a questão possa ser respondida de uma maneira simples,
não é fácil dizer se um aluno deve ou não ser encaminhado. Professores
diferentes são perturbados por comportamentos diferentes, embora alguns com¬
portamentos e características provavelmente incomodem a maior parte (senão
todos) dos professores.
Decisões de Triagem
Visto que há alguma variabilidade na tolerância e no grau de compreensão dos
professores com relação a vários problemas, pode haver alunos excepcionais
em salas de aula normais e que não estão tendo suas necessidades atendidas.
Como os distritos escolares desejam encontrar esses alunos e providenciar
serviços especiais para eles, iniciam-se programas de triagem. Portanto, as
decisões de triagem são de natureza essencialmente administrativa. Em todos
os alunos em escolas particulares ou p blicas são feitos exames rápidos para
descobrir se algum dos alunos necessita de uma avaliação mais intensiva,
mais acurada. Os testes podem ser aplicados para identificar alunos que dife¬
rem, de maneira significativa,
de seus colegas de mesma idade (tanto em um
sentido positivo como negativo) e que, portanto, requerem serviços de edu¬
cação especiais. Assim como testes de visão e audição são rotineiramente
aplicados para identificar alunos com problemas visuais ou auditivos, os testes
de inteligência são administrados para identificar alunos que possam necessi¬
tar de atenção especial, seja devido a uma capacidade intelectual limitada, seja
devido a uma habilidade intelectual extremamente superior. Testes de rendi¬
mento, medidas do que tem sido ensinado aos alunos e do que eles aprendem,
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
7
são rotineiramente dados para identificar alunos que estejam enfrentando uma
dificuldade na área acadêmica e para os quais pode ser apropriada uma avaliação
suplementar.
A triagem é um estágio inicial, durante o qual aqueles que apresentam um
problema particular, dist rbio, incapacidade ou doença são distinguidos da
população geral. A triagem iniciou-se na medicina e usa a terminologia das
práticas médicas de triagem. Fala-se de indivíduos que apresentam um desem¬
penho pobre, segundo os testes de triagem, como sendo de risco ; indivíduos
que têm um desempenho pobre nos testes de triagem, mas que, mais tarde,
saem-se bem em avaliações posteriores são descritos como falsos positivos”.
Por vezes os alunos não demonstram nenhum problema no momento da tria¬
gem e são selecionados como normais” . Posteriormente, esses mesmos alu¬
nos podem apresentar exatamente os mesmos problemas que foram avaliados
pela triagem; tais alunos são chamados de “ falsos negativos” . Finalmente,
quando se fala da exatidão das decisões de triagem, freqiientemente se fala de
“ índice de acertos” (proporção de decisões positivas exatas) para a triagem.
Decisões de Classificação
As decisões de classificação podem assumir diversas formas. Nas escolas, tais
decisões referem-se ao grau de necessidade de um aluno com relação aos
serviços especiais: serviços de educação especial, serviços de educação cor¬
retiva, serviços de fonoaudiologia e assim por diante. Neste livro, preocu¬
pamo-nos, essencialmente, com a necessidade de serviços de educação espe¬
cial. Assim sendo, interessamo-nos pelo problema de se saber se um aluno é
excepcional. Normalmente, os serviços especiais são muito mais caros que os
serviços oferecidos aos alunos na educação geral. Além disso, esses custos
extras (às vezes chamados de custos de excesso) são pagos, em parte, pelos
governos federal e estadual. Os governos querem assegurar-se de que o di¬
nheiro dos impostos seja aplicado em programas para indivíduos que real¬
mente necessitam de serviços custeados pelo governo.
Além do sistema de classificação empregado pelo governo federal, cada
Estado possui um código de educação que especifica os tipos de alunos consi¬
derados deficientes. Os Estados têm nomes diferentes para a mesma deficiên¬
cia. Por exemplo, na Califórnia, alguns alunos são chamados de educacional¬
mente deficientes; em outros Estados, como o Texas, esses mesmos alunos
são chamados de incapazes para o aprendizado. Estados diferentes têm pa¬
drões diferentes para classificação da mesma deficiência. Na Pensilvânia, o QI
máximo para os indivíduos mentalmente deficientes é 80; em Minnesota, o Q1
máximo é 70; na Califórnia, um aluno negro não pode ser testado com um
teste individual de inteligência para classificação como mentalmente defi¬
ciente. Alguns Estados consideram alunos superdotados como excepcionais e
com direito aos serviços de educação especial; outros Estados não o fazem.
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
8
Em alguns Estados, alunos com lesões cerebrais são considerados exceptio¬
nal; em outros, não há qualquer regulamentação para uma categoria de alunos
com lesões cerebrais. Cada Estado possui seu próprio critério para cada tipo
de deficiência assistida pela educação especial. Na maior parte dos Estados,
os alunos devem ser avaliados por especialistas em diagnóstico, antes de terem
direito a serviços de educação especial. A Lei Pública 94-142, o Ato de 1975
para a Educação de todas as Crianças Deficientes, especifica que a neces¬
sidade, a classificação e ou as decisões de enquadramento devem ser tomadas
por uma equipe de profissionais, com a concorrência dos pais do aluno.
Na avaliação para classificação, as pessoas responsáveis pela determinação
da necessidade do aluno desenvolvem um plano para esclarecer e verificar se
o aluno é deficiente. Os dados são, então, reunidos (isto é, os testes são
aplicados, são feitas observações sistemáticas, realizadas entrevistas etc.) para
esclarecer e especificar em que medida os alunos preenchem os requisitos
para ter direito aos serviços para pessoas deficientes. Embora existam muitos
problemas, aparentes no uso de testes, para tomar decisões de classificação,
a maior parte da legislação federal e estadual exige que as decisões sejam
baseadas em testes. Tal exigência existe para proteção dos alunos. Se os
professores, diagnosticadores e administradores tivessem permissão para tomar
decisões de classificação e enquadramento baseados em impressões subjetivas,
a classificação seria desordenada e parcial.
Decisões de Planejamento Educacional
Os dados de avaliação são freqiientemente utilizados para esclarecer e espe¬
cificar como e onde um aluno déve ser ensinado. Portanto, os testes são
aplicados numa tentativa de auxiliar professores e administradores a planejar
programas de educação para indivíduos ou grupos de alunos. A informação
dos testes pode ser usada para decidir sobre a inserção do aluno em grupos de
leitura ou sobre sua designação para programas compensatórios ou corretivos
específicos. As observações e entrevistas podem ser utilizadas para decidir
se os serviços especiais devem ser realizados em uma sala de aula comum ou
em um ambiente especial de educação. Os resultaaos dos testes são também
usados para decidir que metas devem ser reforçadas, que objetivos devem ser
ensinados, e como ensiná-lo, tanto para indivíduos como para grupos.
Com o aumento da atenção às incapacidades de aprendizagem e com os
requisitos federais e estaduais para programas de educação individualizados
para alunos excepcionais, presenciou-se uma expansão na utilização de pro¬
cedimentos de avaliação, baseados no currículo, no planejamento de esforços
educacionais. Os méritos e limitações no uso de testes no planejamento de
programas específicos de educação são discutidos em diversos capítulos das
partes 3 e 4 desta obra. O capítulo 25 é dedicado, em grande parte, à discussão
e ilustração desse objetivo dos testes.
rocha
Highlight
rocha
Highlight
9
Decisões sobre o Progresso do Aluno
Finalmente, os dados de avaliação são utilizados para verificar se o aluno fez
progressos e para especificar os objetivos particulares que tenham (ou não)
sido atingidos no currículo educacional prescrito. Vários tipos de dados de
avaliação são usados para se monitorar o progresso diário de um aluno, de
modo que o professor possa aperfeiçoar os programas educacionais. Outros
espécies de dados de avaliação são utilizadas para dizer aos professores, aos
pais e aos próprios alunos qual a amplitude dos progressos feitos durante
períodos de tempo mais longos (por exemplo, por um semestre). Os graus, nos
testes feitos por professores, e os escores, nos testes padronizados de rendi¬
mento, são os indicadores usuais do progresso acadêmico. Alguns testes
mostram aos professores e pais que objetivos educacionais específicos foram
ou não atingidos. A avaliação do progresso do aluno está intimamente re¬
lacionada ao prográma particular em que o estudante está envolvido. É abso¬
lutamente essencial que o conte do da
avaliação seja exatamente igual ao
programa escolar. Se isso não ocorrer, as decisões sobre o progresso serão,
muito provavelmente, incorretas. Portanto, deve-se distinguir entre aquisição
e rendimento. Aquisição é o que um indivíduo aprendeu, não importando onde
foi aprendido. Rendimento é o que foi aprendido como um resultado da
instrução nas escolas. Qualquer teste de informação fatual mede a aquisição;
contudo, um teste de informação fatual é um teste de rendimento apenas se
medir o que foi diretamente ensinado. Somente os testes de rendimento podem
ser utilizados para se monitorar o progresso do aluno. Seria inútil usar um
teste que não avaliasse o que um professor ensinou.
ÁREAS DE PROBLEMAS
PARA ESPECIFICAÇÃO E VERIFICAÇÃO
A avaliação é um processo de coleta de dados com os propósitos de (1)
especificar e verificar problemas e (2) tomar decisões sobre os alunos. Apenas
descrevemos os tipos de decisões que são tomadas nos meios educacionais.
Agora, descreveremos os três tipos de problemas aos quais normalmente a
avaliação se relaciona: problemas acadêmicos, de comportamento e físicos.
Ao fazermos isso, descreveremos a especificação e verificação de problemas
com o intuito de tomar diferentes tipos de decisões.
Problemas Acadêmicos
A razão mais comum pela qual os alunos são encaminhados para avaliação
psicológica ou educacional é a de que um professor ou pai acredita que eles
não estão apresentando um desempenho tão bom quanto o esperado academi-
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
10
camente. Os professores normalmente tomam essa decisão baseados em suas
observações do desempenho do aluno em áreas do programa acadêmico: lei¬
tura, matemática, ortografia, ciências, estudos sociais etc. Quando os alunos
são encaminhados para avaliação, é necessário que os professores especi¬
fiquem suas preocupações. Os professores que encaminham alunos para ava¬
liação devido a problemas de leitura fornecem, aos especialistas em diag¬
nóstico, informações limitadas. Na medida em que os professores descrevem
e especificam a natureza dos problemas de um aluno (por exemplo, Richy é
o leitor mais fraco da classe e, consistentemente, apresenta dificuldades para
associar letras e sons ), auxiliam os diagnosticadores. Alguns professores muito
eficientes recolhem, regularmente, informações sobre o progresso dos alunos
em áreas do programa acadêmico e usam tais dados para tomar decisões de
encaminhamento.
O desempenho acadêmico é, quase sempre, avaliado quando se tomam
decisões de classificação. Por exemplo, a um aluno encaminhado devido a
problemas de leitura pode ser aplicado um teste de leitura que forneça uma
comparação do desenvolvimento das habilidades de leitura com relação a
outros alunos da escola ou, mesmo, da nação. Os resultados do teste seriam
utilizados para verificar a existência de um problema.
O desempenho acadêmico é quase sempre avaliado quando se tomam de¬
cisões educacionais. Para se decidir o que ensinar a um aluno é necessário
especificar as habilidades que o aluno já possui e as que ainda não adquiriu.
Problemas de Comportamento
Os alunos são, freqiientemente, encaminhados para avaliação psicológica ou
educacional porque demonstram problemas de comportamento. Os alunos em
que podem ser especificados e verificados sérios problemas de comportamento
são, com frequência, indicados para serviços de educação especial.
Os problemas de comportamento incluem falta de relacionamento com os
colegas, atividades delinquentes e isolamento excessivo, bem como compor¬
tamento desordeiro e desrespeitoso. Por exemplo, a Sra. Swanson, professora,
percebe que Larry é muito quieto e isola-se de seus colegas. Ela pode, então,
começar a verificar se esse é realmente o problema através da contagem da
frequência das interações de Larry com os colegas. Uma baixa contagem não
indicaria, por si só, um problema. Por isso, a Sra. Swanson seleciona um outro
garoto cujo comportamento ela julga ser apropriado e conta a frequência de
suas interações com os colegas. Ela pode, então, verificar que Larry interage
muito menos freqiientemente do que um garoto sem problemas de interação.
A Sra. Swanson pode, então planejar um programa de modificação de
comportamento para Larry, para aumentar o número de interações positivas
com os colegas de classe. Ela pode sistematicamente coletar dados sobre a
eficácia desse novo programa e tomar algumas decisões sobre o progresso de
Larry.
rocha
Highlight
rocha
Highlight
11
Problemas Físicos
Problemas físicos incluem deficiências sensoriais (visão e audição), proble¬
mas de estrutura física (por exemplo, espinha bífida ou paralisia cerebral) e
problemas crónicos de saúde (diabetes ou asma).
Sérios problemas físicos são os primeiros assinalados, pelos médicos, aos
pais de uma criança antes de sua entrada na escola. Quando uma criança com
um sério problema físico entra na escola, os pais devem fornecer informações
específicas dos médicos que confirmem e especifiquem a natureza física do
problema da criança. Problemas menores, mas igualmente importantes, que
não tenham sido percebidos pelos pais, são normalmente descobertos durante
a triagem rotineira. Por exemplo, a White Haven Area Schools pode solicitar
à enfermeira da escola (a Sra. Slique) que aplique, regularmente, testes de
audição (por exemplo, um teste audiométrico de tons puros para audição dentro
da frequência da fala). Quando os alunos da primeira série são examinados,
a Sra. Slique nota que Jane tem uma perda de 65 decibéis em seu melhor
ouvido. Uma perda de audição de tal magnitude, se confirmada, teria sérias
implicações educacionais e necessitaria de substanciais modificações educa¬
cionais para que Jane pudesse aproveitar sua educação. Contudo, a avaliação
de triagem foi realizada na enfermaria, que é à prova de som, e com um
equipamento que não foi recentemente checado com relação à precisão. Por
isso, a Sra. Slique decide que será melhor chamar um audiologista para
examinar Jane e diagnosticar seu problema auditivo.
SUMÁRIO
A aplicação de testes faz parte de um conceito mais amplo: a avaliação. Na
avaliação, a informação é reunida por duas razões. Em primeiro lugar, os
dados de avaliação são utilizados para esclarecer e verificar a existência de
problemas educacionais nas áreas de funcionamento acadêmico, adaptação
comportamental e social e desenvolvimento físico. Em segundo lugar, a
avaliação fornece dados para facilitar a tomada de decisões. Cinco tipos de
decisões são especialmente pertinentes na avaliação em educação especial: de
encaminhamento, de triagem, de classificação, de planejamento educacional e
de avaliação do progresso do aluno.
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
13
CAPITULO 2
CONSIDERAÇÕES BÁSICAS EM
AVALIAÇÃO
A avaliação é um processo de coleta de dados com dois propósitos: (1)
especificação e verificação de problemas e (2) tomada de decisões sobre e
pelos alunos. Os dados de avaliação são utilizados para se tomarem muitos
tipos diferentes de decisões sobre alunos, como mostra o primeiro capítulo.
As pessoas que avaliam alunos devem estar atentas aos diversos pressupos¬
tos inerentes à avaliação e ao modo como o fracasso para satisfazer tais
pressupostos afeta diretamente a validade dos resultados obtidos. Elas devem
considerar muitos fatores na avaliação, indo além dos alunos para reunir tipos
adicionais de informação. Neste capítulo, descrevemos os fatores a serem
considerados e as várias espécies de informação coletadas no processo de
avaliação. Também fazemos a distinção entre avaliação formal e informal.
Os que avaliam os alunos precisam identificar um ponto de partida para a
avaliação e decidir que tipos específicos
de dados serão coletados. Colocamos
diversas perguntas comumente feitas quando se decide como os alunos serão
avaliados. Finalizamos o capítulo com uma série de regras para a aplicação,
pelos professores, de testes padronizados.
PRESSUPOSTOS SUBJACENTES À AVALIAÇÃO
Certo n mero de pressupostos subjaz à correta avaliação dos alunos. Na medida
em que tais pressupostos não são satisfeitos, os resultados e as interpretações
do teste perdem a validade. Newland (1973) identificou e discutiu os seguintes
cinco pressupostos subjacentes à avaliação.
A Pessoa que Aplica o Teste É Capacitada
Quando os alunos são testados, presume-se que a pessoa que está aplicando
o teste tenha o treinamento adequado ao objetivo do teste. Presume-se, tam¬
bém, que o aplicador saiba como e realmente consiga estabelecer uma
relação com os alunos, que, em geral, apresentam um melhor desempenho em
rocha
Highlight
rocha
Highlight
rocha
Highlight
14
uma atmosfera de confiança e segurança. Além disso, presume-se que o
aplicador saiba como administrar corretamente o teste. A aplicação de testes
consiste em uma apresentação padronizada de estímulos. Se a pessoa que
aplica o teste não apresenta corretamente as perguntas ou materiais, os escores
obtidos perderão a validade.
Presume-se, também, que a pessoa que aplica um teste saiba como julgar
os escores. Uma correta atribuição de pontos é um pré-requisito para se
conseguir um retrato significativo de um aluno. Finalmente, presume-se que
uma interpretação precisa pode e será feita.
A aplicação de testes, a atribuição de escores e a interpretação requerem
diferentes graus de treinamento e perícia, que dependem da espécie de teste
aplicado e do grau de interpretação requerido para se estabelecer um signifi¬
cado para o desempenho da pessoa testada. Embora a maioria dos professores
possa facilmente aplicar ou aprender a aplicar, a grupos, testes de rendimento
e de inteligência, uma pessoa deve ter passado por um considerável trei¬
namento para atribuir escores e interpretar grande parte dos testes individuais
de inteligência e personalidade. Atualmente, a maior parte dos Estados exige
que a pessoa possua um certificado ou seja licenciada como psicóloga, a fim
de aplicar esses tipos de teste. A licença ou o certificado, por sua vez, de¬
pendem, com frequência, da demonstração de competência.
Obviamente, há um ponto extremamente importante implícito neste pri¬
meiro pressuposto. Os profissionais deveriam aplicar somente os testes para
os quais estão qualificados. Infelizmente, muitas vezes, fica-se sabendo de
pessoas sem treinamento em testes individuais de inteligência que, contudo,
aplicam tais testes; ou, então, pessoas sem um treinamento formal na apli¬
cação ou interpretação de testes de personalidade aplicando-os. Esses testes
podem parecer fáceis de se aplicar; no entanto, a aplicação, a atribuição de
escores e a interpretação corretas são complexas. Visto que os testes são
usados muito freqiientemente para se tomarem decisões que afetarão o futuro
de uma criança, este pressuposto, de um observador ou aplicador capacitado,
reveste-se de especial importância.
O Erro Estará Presente
Nenhuma medida psicológica ou educacional está livre de erros. Certa quantia
de erros está sempre presente quando aplicamos um teste. Embora os erros
de medida sejam tratados amplamente no capítulo 7, alguns pontos são apro¬
priados aqui. Nunnally (1978) distingue dois tipos de erros em qualquer
esforço de medida: o erro sistemático, ou desvio, e o erro aleatório. Ele
ilustra o erro sistemático com o exemplo de um químico que utiliza um
termómetro inexato, que sempre mostra 2 graus a mais do que a temperatura
real de um líquido. Todas as leituras feitas pelo químico apresentarão um
desvio, mas isso será sistemático; ou seja, todas as leituras terão um erro de
2 graus.
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
15
No processo de medida, o erro aleatório ocorre de duas maneiras. Em
primeiro lugar, a pessoa que faz a medida pode ser inconsistente. A ilustração
que Nunnally dá para isso é a de um químico míope que lê um termómetro
de precisão de maneira incorreta. As leituras sempre apresentarão erros, mas
o valor e a direção do erro serão aleatórios. Em alguns casos, o químico pode
ler o termómetro com 5 graus a mais; em outros, com 4 graus amenos. Um
valor indeterminado de erro, então, afeta as medidas obtidas. Em segundo
lugar, os instrumentos de medida podem produzir resultados inconsistentes.
Por exemplo, uma régua de borracha elástica produz medidas de comprimento
inconsistentes.
A confiabilidade depende de quão livre do erro aleatório esteja o instru¬
mento de medida. Um teste com muito pouco erro aleatório, um teste de
precisão, é considerado confiável, enquanto um teste com um considerável
erro aleatório, um teste impreciso, não é confiável. Os testes diferem conside¬
ravelmente no grau de confiabilidade. Na medida em que instrumentos não-
cònfiáveis (instrumentos com um considerável erro aleatório) são utilizados
para se tomarem decisões sobre alunos, tais decisões podem, de fato, ser
erróneas. Os fatores que contribuem para a falta de confiabilidade do teste são
discutidos no capítulo 7.
A Aculturação É Comparável
Cada aluno possui um conjunto particular de experiências anteriores em
ambientes educacionais, sociais e culturais. Quando testamos alunos usando
um instrumento padronizado e os comparamos a um conjunto de normas
para extrair um índice de sua posição relativa, presumimos que os alunos
testados sejam semelhantes àqueles pelos quais o teste foi padronizado; ou
seja, presumimos que sua aculturação seja comparável, mas não necessa¬
riamente idêntica à dos alunos que constituíram a amostra normativa para o
teste.
Quando as experiências gerais de uma criança diferem das crianças em
cima das quais um teste foi padronizado, então, o uso das normas desse teste,
como um índice para avaliar o desempenho atual da criança ou para prognos¬
ticar seus futuros desempenhos, pode ser inadequado. Também podem ser
tomadas decisões educacionais incorretas. Devem-se assinalar que a acultu¬
ração é muito mais uma questão de antecedentes de experiências do que de
antecedentes étnicos, raciais ou de cor de pele. Quando se diz que a acultu¬
ração de uma criança difere da do grupo usado como norma, diz-se que os
antecedentes experimentais diferem, e não simplesmente que a criança é de
uma origem étnica diferente, por exemplo, da das crianças que constituíram
o padrão de teste.
Infelizmente, muitos psicólogos, orientadores, terapeutas e outras pessoas
que selecionam testes para serem aplicados a alunos frequentemente fazem-no
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
16
dando pouca importância às características dos alunos que constituem as
amostras normativas. Muitos administradores de escola rotineiramente com¬
pram testes mais interessados nos preços do que na adequação técnica e
adaptabilidade de tais testes.
O Teste Rápido (Quick Test), por exemplo, foi padronizado em crianças
brancas de Missoula, em Montana; contudo, é usado, cotidianamente, para se
medir a inteligência de crianças negras que vivem no gueto, crianças cujos
antecedentes educacionais, sociais e culturais podem diferir amplamente dos
antecedentes das crianças que constituíram a amostra normativa.
A seção de desempenho da Escala Wechsler de Inteligência para Crianças-
Revista (Wechsler Intelligence Scale for Children-Revised WISC-R ) con¬
siste em diversos testes (em sua maioria, de manipulação, como combinar as
peças de um quebra-cabeça para formar objetos) que não exigem qualquer
resposta verbal da criança. O fato de a criança não ter que falar, tem encora¬
jado os psicólogos a utilizarem o teste em uma
tentativa para testar crianças
surdas. Levine (1974), em um estudo sobre as práticas de aplicação de testes
usados por psicólogos que trabalham com surdos, relatou que o teste mais
freqiientemente utilizado para se medir a inteligência das crianças surdas é a
?eção de desempenho da WISC: normas totalmente baseadas no desempenho
de jovens que podem ouvir são usadas para interpretar os desempenhos de
crianças surdas! A aplicação correta das normas supõe que a criança avaliada
possa ouvir as instruções e tenha tido uma aculturação comparável à das
crianças da amostra normativa. Diversos subtestes não-verbais das escalas de
Wechsler (por exemplo, conclusão de um Desenho e Ordenação de um De¬
senho) exigem competência verbal.
A Amostragem de Comportamento É Adequada
Um quarto pressuposto subjacente à avaliação psicoeducacional é o de que a
amostragem de comportamento é adequada com relação à quantia e represen¬
tativa em área. Todo teste é uma amostra de comportamento. Se se desejam
informações sobre as habilidades matemáticas de um aluno, dá-se-lhe uma
amostra de problemas matemáticos para serem resolvidos. Da mesma forma,
se se quer saber a respeito de habilidades de ortografia, pede-se que o aluno
soletre um n mero representativo de palavras. Quando se aplica um teste de
matemática ou de ortografia, supõe-se que se tem uma amostra de itens ampla
o suficiente para permitir que sejam feitas declarações referentes ao completo
desenvolvimento da habilidade de um aluno na área. Poucos professores pe¬
diriam a um aluno para resolver somente dois problemas aritméticos e supo¬
riam que os resultados trariam muita informação sobre o desenvolvimento da
habilidade desse aluno em aritmética. A aplicação de testes requer uma
amostragem adequada de comportamento para auxiliar nos processos de tomada
de decisão.
rocha
Highlight
rocha
Highlight
rocha
Highlight
17
Não somente se presume que a amostragem de comportamento é adequada
em quantia, como também se supõe que o teste mede o que seus autores de¬
claram que mede. Presume-se que um teste de inteligência meça a inteligência
e que um teste de ortografia meça as habilidades em ortografia. Um teste de
adição seria uma medida deficiente da habilidade total em matemática, porque
a matemática abarca muito mais que a adição. Da mesma forma, uma medida
da habilidade de um aluno em adição de n meros de apenas um dígito fornece
apenas uma parte de um teste da habilidade daquele aluno em adição. Não se
pode confiar no nome de um teste quando se tenta definir os comportamentos
amostrados por ele. Muitos testes, por exemplo, são chamados testes de
leitura . No entanto, a leitura possui diversos subcomponentes, tais como
reconhecimento, compreensão e análise fonética. Como se demonstra no
capítulo 17, nenhum teste de leitura avalia a leitura per se” . Cada teste
examina um ou mais comportamentos de leitura. O usuário dos testes de
leitura ou de quaisquer testes, aliás deve ir além dos nomes dos testes,
em uma tentativa de verificar os comportamentos que os testes avaliam.
Na medida em que os testes utilizados para medir os desempenhos dos
alunos são incompletos ou não conseguem medir o que dizem que medem, as
decisões baseadas nos escores dos alunos nesses testes podem muito bem estar
erradas.
Observa-se o Comportamento Atual, Infere-se o
Comportamento Futuro
Quando se aplica um teste, observa-se apenas o desempenho da pessoa em
uma amostragem de comportamento, em um determinado momento, sob
determinadas condições de aplicação de teste e em uma determinada situação.
Observa-se o que uma pessoa faz; pode-se ou não observar o que essa pessoa
é capaz de fazer. Examina-se um n mero limitado de comportamentos e gene-
raliza-se o desempenho do indivíduo em outros comportamentos semelhantes.
Por exemplo, como Heathcote resolve corretamente todos os dez problemas
de adição de números com um dígito, infere-se que ele poderia fazer o mesmo
com números de dois dígitos. Além disso, podem ser feitos julgamentos ou
prognósticos sobre o comportamento de um indivíduo no futuro. Tais prog¬
nósticos são inferências a que se podem atribuir graus variáveis de confiança.
Pode-se confiar mais nas inferências feitas sobre o desempenho futuro se se
checou se os outros pressupostos sobre a avaliação foram satisfeitos. Se foi
aplicado um teste que é adequado em sua amostragem de comportamento e
representativo em área, que está relativamente livre de erros e que foi apli¬
cado, avaliado e interpretado com precisão, usando-se, como normas, alunos
que possuem antecedentes comparáveis aos dos que foram testados, então
pode-se confiar razoavelmente na adequação dos dados observados. Dados
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
18
obtidos dessa forma podem ser usados com mais segurança ao se fazerem
prognósticos do que dados obtidos sob condições em que qualquer um dos
pressupostos não é satisfeito. O comportamento humano é extremamente
complexo e devemos lembrar que qualquer prognóstico sobre o comportamento
futuro é uma inferência.
FATORES CONSIDERADOS NA AVALIAÇÃO
Circunstâncias Atuais de Vida
O desempenho de um indivíduo, em qualquer tarefa, deve ser compreendido
à luz das circunstâncias atuais desse indivíduo. Deve-se compreender tais
circunstâncias para se ter consciência do que a pessoa traz para uma tarefa.
Em avaliação educacional, a saúde é uma circunstância significativa da
vida diária. A saúde e o estado nutricional podem ter um importante papel no
desempenho das crianças em grande número de tarefas. Crianças doentes ou
desnutridas tendem a ser letárgicas, desatentas e, talvez, irritadiças.
As atitudes e os valores das crianças também devem contribuir em nossa
avaliação de seu desempenho. A vontade de cooperar com um adulto relati¬
vamente estranho, a vontade de fazer esforços substanciais nas tarefas e a
crença na validade da tarefa ou da educação influenciam no desempenho.
Finalmente, o nível de aculturação que as crianças trazem para uma tarefa
é da maior importância. O conhecimento de uma criança, a aceitação dos
costumes e valores sancionados socialmente, o uso da linguagem-padrão e a
base de informação cultural geral ou específica influenciam o desempenho das
tarefas relacionadas à escola.
História do Desenvolvimento
As circunstâncias da vida atual de uma pessoa são moldadas pelos eventos
que constituem sua história de desenvolvimento. Acontecimentos prejudiciais,
em especial, podem ter efeitos profundos no desenvolvimento físico e psi¬
cológico. Limitações físicas e sensoriais podem restringir as oportunidades
de um aluno para adquirir diversas habilidades e competências. Uma história
de má saúde ou nutrição pode resultar em oportunidades perdidas para ad¬
quirir diversas habilidades e competências. A história de recompensas e
punições de um indivíduo molda o que essa pessoa irá realizar e como ela
reagirá com outras. Em suma, não basta avaliar o nível atual de desempenho
de um aluno; os avaliadores devem também compreender o que moldou esse
desempenho atual.
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
19
Fatores Extrapessoais
Além da competência, características e habilidades que um aluno traz para
qualquer tarefa, outros fatores afetam o processo de avaliação. A maneira pela
qual uma outra pessoa interpreta ou reage a vários comportamentos ou carac¬
terísticas pode até mesmo determinar se um indivíduo será avaliado. Alguns
professores, por exemplo, não compreendem que certa porcentagem de agressão
física é típica de crianças pequenas ou que a agressão verbal é típica de alunos
mais velhos. Tais professores podem encaminhar crianças normalmente agres¬
sivas para avaliação porque interpretaram a agressão como um sintoma
de
algum problema subjacente.
A orientação teórica do diagnosticador (a pessoa responsável pela reali¬
zação da avaliação) também tem um importante papel no processo de avaliação.
Os antecedentes e o treinamento dos diagnosticadores podem predispô-los a
procurar certos tipos de patologias. Assim como os freudianos podem procurar
conflitos não resolvidos, enquanto os behavioristas buscarão os antecedentes
e as consequências de determinados comportamentos, os diagnosticadores
podem deixar que sua orientação teórica influencie sua interpretação de
determinada informação.
Enfim, as condições sob as quais um aluno é observado ou as condições
sob as quais determinados comportamentos são descobertos podem influenciar
o desempenho desse aluno. Por exemplo, o nível de linguagem utilizado em
uma pergunta ou a presença de estímulos competitivos no ambiente imediato
podem afetar as respostas de um aluno.
Interpretação do Desempenho
Depois que o comportamento e as características de um indivíduo forem con¬
siderados à luz das circunstâncias atuais de vida, da história de desenvolvimento
e dos fatores extrapessoais que podem influenciar o desempenho, a informação
é sintetizada. Isso, freqiientemente, resulta na classificação e na rotulagem do
indivíduo avaliado. O avaliador chega à opinião de que, quando tudo é con¬
siderado, a criança “ encaixa-se” em determinada categoria. Uma criança pode,
por exemplo, ser julgada como deficiente mental, emocionalmente perturbada,
incapaz de aprendizagem, educacionalmente deficiente, cultural ou socialmente
prejudicada, atrasada, normal, superdotada ou um dos melhores alunos do
grupo de leitura da escola.
Os avaliadores, especialmente quando apontam classificações negativas,
tentam, com frequência, atribuir uma causa à situação do indivíduo. A clas¬
sificação de acordo com a causa (etiologia) é comum em medicina, mas me¬
nos comum em educação e psicologia. Em alguns casos, a causa da condição
é altamente provável. Por exemplo, Kevin pode ter se desenvolvido nor-
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
20
malmente até sofrer um grave traumatismo craniano, após o que seu desem¬
penho e desenvolvimento são medidos como retardados. Contudo, na maioria
dos casos, as causas são ilusórias e especulativas.
Prognose
Todas as avaliações e classificações dos alunos contêm uma prognose ex¬
plícita ou implícita, uma previsão do desempenho futuro. Um prognóstico
pode ser oferecido a alunos tanto em seu ambiente e circunstâncias de vida
normais, como em alguns ambientes terapêuticos ou corretivos. Por exemplo:
Se Rachel for deixada em seu atual ambiente educacional, ela provavelmente
apresentará um atraso cada vez maior em relação às outras crianças e desen¬
volverá comportamentos problemáticos. Se for colocada em um ambiente onde
receberá uma atenção mais individualizada, fará mais progresso, social e
academicamente . Tais prognoses são feitas, espera-se, com base mais em
dados concretos que em especulações.
TIPOS DE INFORMAÇÃO DE AVALIAÇÃO
Embora este livro se refira, principalmente, aos testes e à sua aplicação, é
sempre bom lembrar que um teste é apenas uma das diversas técnicas ou
procedimentos de avaliação disponíveis para se reunirem informações. A Figura
2.1 mostra que há seis classes gerais de fontes de informação para o diag¬
nóstico; a classificação exibida na figura depende do momento em que a
informação é coletada (atual ou histórico) e de como a informação é coletada
(através de observação, testes ou opiniões).
Informação Atual vs. Histórica
A informação diagnóstica pode ser categorizada de acordo com a atualidade
da informação: informações que descrevem como uma pessoa está agindo no
presente e informações que descrevem como essa pessoa agiu no passado.
Obviamente, a distinção entre a informação atual e a histórica é obscura, e o
ponto em que a informação atual se toma histórica depende, em parte, de
determinado fato ou trecho de informação. Por exemplo, se Johnny teve seu
apêndice removido há três anos, sabe-se que, atualmente, ele não tem apêndice.
Por outro lado, se Jane, de 9 anos, pesava 27 quilos há três anos, não se pode
concluir que ela apresenta o mesmo peso atualmente.
Há diversas vantagens em se ter e usar a informação atual. A primeira é a
mais óbvia: a informação atual descreve os atuais comportamentos e carac-
terísticas de uma pessoa. Oferece também duas vantagens mais sutis: (1) o
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
rocha
Highlight
TIPOS
DE
INFORMA
ÇÕ
ES
21
MOMENTO EM QUE É RECOLHIDA A INFORMAÇÃO
ATUAL HISTÓRICO
Observações
Testes
Opiniões
FIGURA 2.1 Fontes de informação de diagnóstico classificadas de acordo com o
tipo de informações e momento em que a informação é coletada.
diagnosticador pode selecionar a informação a ser coletada e (2) a informação
pode ser verificada. Contudo, a informação atual, por si só, não pode fornecer
um quadro completo do atual nível de funcionamento de uma pessoa, porque
os antecedentes desse funcionamento não são considerados. Eis a vantagem da
informação histórica. Os diagnosticadores escolares não podem voltar no tempo
para observar características, comportamentos e situações anteriores. O
especialista em diagnóstico que deseja incorporar a história de um aluno ao
procedimento de avaliação deve basear-se na informação coletada anteriormente
ou na memória de indivíduos que conheceram o aluno.
A informação histórica apresenta quatro limitações a que devem estar atentos
os diagnosticadores. Em primeiro lugar, o especialista em diagnóstico não
pode controlar que tipo de informação foi coletado no passado; pode ser que
trechos cruciais de informação nunca tenham sido coletados. Em segundo
Contagens da frequência de
ocorrência de um determinado
comportamento
Antecedentes de comportamento
Incidentes críticos
Resultados de um teste de
inteligência aplicado durante a
avaliação
Resultados do teste de ortografia
dado pelo professor
Avaliações dos pais de como a
criança relaciona-se com a
família, os vizinhos, etc.
Escalas de classificação
elaboradas por professores,
assistentes sociais, etc.
A razão do professor para o
encaminhamento
Peso ao nascer
Registros anedóticos
Observações feitas pelo
professor do ano anterior
Resultados de uma bateria
de testes de rendimentos
padronizados dada no final
do ano anterior
Diagnósticos médicos,
psicológicos ou educacion¬
ais anteriores
Fichas pessoais anteriores
Rememoração dos pais so¬
bre a história do desenvol¬
vimento, doenças não diag¬
nosticadas da infância, etc.
rocha
Highlight
rocha
Highlight
rocha
Highlight
22
lugar, a informação passada é difícil e, por vezes, impossível de ser verifi¬
cada. Em terceiro, as condições sob as quais a informação foi coletada são,
com frequência, difíceis de serem avaliadas. Em quarto, as observações
rememoradas podem não ser tão confiáveis como as observações atuais.
Tipos de Informação
A informação diagnóstica pode também ser categorizada de acordo com o tipo
de informação: observações, testes e opiniões. Cada um desses três tipos de
informação apresenta tanto vantagens como desvantagens. Cada tipo pode ser
coletado por um diagnosticador (neste caso, os dados tomam-se informação
direta) ou por uma outra pessoa (informação indireta ). Os especialistas em
diagnóstico não têm tempo, competência ou oportunidade para coletar todos
os tipos possíveis de informação. Nos casos em que se faz necessária a infor¬
mação especializada, eles devem basear-se nas observações, testes e opiniões
de outros. Se um comportamento ocorre com pouca frequência ou apenas fora
da escola, o diagnosticador pode ter que se basear nas observações e opiniões
de outras pessoas que têm
mais oportunidade de coletar a informação: os pais,
talvez, ou os responsáveis pela custódia em meios institucionais. Por exemplo,
o fato de urinar na cama não acontece na escola, mas poucos especialistas
questionariam a veracidade dos relatos dos pais sobre isso. Além disso, se
uma criança apresenta uma enurese intermitente, o diagnosticador teria que
passar diversas noites na casa dessa criança a fim de observar o compor¬
tamento diretamente. Em tais casos, normalmente, a informação indireta é
adequada.
As observações podem fornecer uma informação altamente precisa, de¬
talhada e verificável não somente sobre a pessoa que está sendo avaliada, mas
também sobre os contextos em que as observações estão sendo feitas. Há dois
tipos de observações: não-sistemática e sistemática. Na observação não-sis-
temática, o especialista simplesmente observa um indivíduo em seu ambiente
e toma nota dos comportamentos, características e interações pessoais que
pareçam significativos. A observação não-sistemática tende a ser anedótica e
subjetiva. Na observação sistemática, o especialista decide observar um ou
mais comportamentos. O observador especifica ou define os comportamentos
a serem observados e, então, normalmente conta ou mede, de alguma forma,
a frequência, a duração, a magnitude ou a latência dos comportamentos. A
maior desvantagem da observação sistemática é que ela pode fazer com que
sejam ignorados outros comportamentos e características importantes.
Há duas dificuldades principais na coleta de dados através da observação
sistemática e não-sistemática. A primeira é que essa observação consome
muito tempo; o diagnosticador paga a informação altamente precisa e específica
fornecida pela observação com a impossibilidade de coletar outras informa¬
ções. O segundo problema é que a própria presença de um observador pode
rocha
Highlight
rocha
Highlight
23
distorcer ou, de certa forma, alterar tanto a situação que o comportamento de
um indivíduo observado também se alterará.
Os testes são um conjunto predeterminado de perguntas ou tarefas para as
quais se esperam tipos predeterminados de respostas comportamentais. Os
testes são particularmente úteis porque permitem que as tarefas e perguntas
sejam apresentadas exatamente da mesma maneira para cada pessoa testada.
Como o examinador obtém e julga o comportamento de um modo predeter¬
minado e consistente, os desempenhos das diversas pessoas testadas podem
ser comparados, não importando quem aplicou o teste. Portanto, os testes
tendem a tornar consistentes muitos fatores extrapessoais na avaliação de
todas as pessoas testadas. Basicamente, dois tipos de informação, quantitativa
e qualitativa, podem ser obtidas através da aplicação de um teste. Os dados
quantitativos referem-se aos escores reais obtidos no teste. Exemplos de dados
quantitativos incluem afirmações como: Lee obteve um escore de 80 em seu
teste de matemática ou “ Henry teve um percentual de 83 em uma medida de
aptidão escolástica . A informação qualitativa consiste em observações não-
sistemática feitas enquanto uma criança é testada, e nos diz como essa criança
obteve o escore. Por exemplo, para obter uma escore de 80 em seu teste de
matemática, Lee deve ter resolvido todos os problemas de adição e subtração,
à exceção daqueles que requeriam um reagrupamento. Henry deve ter tido um
desempenho melhor nas medidas de sua habilidade para definir palavras e
deve ter demonstrado certa dificuldade para compreender afirmações verbais.
Quando se utilizam testes na avaliação, não basta simplesmente saber os escores
que um aluno obteve em um determinado teste; é importante saber como o
aluno obteve tais escores.
As opiniões e avaliações feitas por outras pessoas podem desempenhar um
importante papel na avaliação. Em casos em que um diagnosticador não possui
a competência necessária para emitir uma opinião, as opiniões daqueles que
possuem tal competência são essenciais. Os especialistas em diagnóstico pro¬
curam outros profissionais para complementar suas próprias habilidades e seu
preparo. Dessa forma, encaminhar um aluno a vários especialistas (especia¬
listas em audição e em visão, professores de leitura etc.) é uma prática comum
e conveniente em avaliação. As opiniões de professores, orientadores, psicólo¬
gos e quaisquer outros funcionários da escola podem ser teis em determina¬
das circunstâncias. A perícia para se emitirem opiniões depende, freqiiente-
mente, da familiaridade com o aluno que está sendo avaliado. Os professores
regularmente expressam opiniões profissionais; por exemplo, as notas do
boletim escolar representam a opinião do professor sobre o progresso aca¬
dêmico de um aluno durante o período de tempo assinalado; os encaminha¬
mentos para avaliação psicológica representam um tipo diferente de opinião
baseado na experiência com muitos alunos e nas observações de um aluno em
especial. As opiniões representam tanto os melhores como os piores dados de
avaliação. As opiniões feitas por indivíduos conscienciosos, capazes e objeti¬
vos podem ser um auxílio incalculável no processo de avaliação. Opiniões
24
imprecisas, preconceituosas e subjetivas podem ser, no melhor dos casos,
enganosas e, no pior, nocivas. Finalmente, toda avaliação requer, em ltima
instância, opiniões.
Integração da Informação de Avaliação
Para vermos como os vários tipos de informação podem entrar em jogo em
uma avaliação, consideremos o exemplo seguinte. Mary, tem 6 anos, está
atrasada em leitura, segundo o relato de sua professora (opinião atual). A
professora também declara que Mary não escuta, não presta atenção e tampouco
associa sons com letras (observações atuais). Uma inspeção nos registros do
jardim de infância de Mary indica que ela esteve ausente durante trinta e um
dias em janeiro e fevereiro (observação passada). Os escores de Mary no teste
de destreza em leitura, aplicado em junho, no jardim de infância, foram sufi¬
cientemente elevados para que a professora recomendasse sua promoção para
o primeiro ano (opinião passada). Uma entrevista com os pais de Mary revelou
que ela tem, em sua história, o tratamento de infecções do ouvido médio
(observações e opiniões passadas) durante os invernos. De acordo com seus
pais, ela atualmente tem uma infecção de ouvido que está sendo tratada pelo
médico da família (observação atual). Ao reunir todas essas informações, as
autoridades da escola emitem a hipótese de que Mary está tendo problemas
auditivos. Obtém-se um exame de audição (teste atual), que indica que Mary
está, atualmente, sofrendo de uma perda moderada de audição, de magnitude
suficiente para afetar, de maneira adversa, seu progresso em leitura (opinião
atual). Com a informação atual e com os antecedentes, é possível, agora,
avaliar (compreender e interpretar) o comportamento de Mary em sala de
aula. Com tratamento médico para seu problema de ouvido e com alguma
intervenção na sala de aula por parte da professora, Mary poderá ter um
melhor desempenho na escola.
Avaliação Formal vs. Informal
Cada vez mais, os educadores estão advogando a avaliação informal em detri¬
mento da formal, especialmente na tomada de decisões educacionais e na
avaliação do progresso do aluno. Quando tal distinção é feita, qualquer avaliação
que envolve a coleta de dados através de algo que não seja um teste baseado
em uma norma (teste padronizado) é geralmente considerada como avaliação
informal. A coleta de informação através da observação é, freqiientemente,
encarada como uma avaliação informal, bem como a informação reunida através
de entrevistas e por meio de testes elaborados por professores.
Durante a década passada, houve um aumento significativo na avaliação
baseada no currículo. Esta inclui (1) a observação direta e a análise do am-
25
biente de aprendizagem, (2) a análise dos processos utilizados por alunos na
abordagem das tarefas, (3) o exame da produção dos alunos e (4)
o controle
e planejamento de tarefas para os alunos. Dá-se relevância à avaliação do
desempenho contínuo de um aluno dentro do currículo existente.
A observação do ambiente de aprendizagem envolve o exame dos tipos de
materiais educacionais que estão sendo utilizados com os alunos, bem como
dos fundamentos para a seleção dos materiais. As técnicas específicas de
observação incluem a análise sistemática do modo como a instrução é organi¬
zada e seqiienciada, dando especial atenção às possíveis armadilhas existentes
na organização educacional; envolvem também o exame da adequação das
maneiras através das quais a instrução está sendo apresentada (leitura, livro de
exercícios, instrução programada etc.); e o período de tempo que deve ser
alocado para a instrução, bem como até que ponto o aluno está ativamente
envolvido na resposta ao conteúdo acadêmico.
Também fazem parte da avaliação baseada no currículo a análise das
maneiras pelas quais os alunos abordam tarefas, o exame do comportamento
do aluno, da atenção que ele dispensa às tarefas e até que ponto ele lê e segue
instruções. Os professores que seguem a avaliação baseada no currículo
examinam cuidadosamente a produção dos alunos numa tentativa de analisar
os tipos específicos de erros cometidos por alunos. Por exemplo, os profes¬
sores podem examinar os erros contidos nos exercícios de matemática com
o intuito de determinar padrões de dificuldades. A avaliação baseada no
currículo é freqiientemente chamada de ensino diagnóstico, porque os profes¬
sores ou os especialistas em diagnóstico têm a oportunidade de modificar
diversos aspectos da instrução e estudar o impacto de tais adaptações no
desempenho do aluno.
Progressivamente, os funcionários das escolas têm usado os tipos de
estratégias de avaliação informal especificados acima. Nesta obra, decidimos
nos concentrar na avaliação formal. Em nossa opinião, o tópico de avaliação
informal requer um tratamento adequado em um livro separado.
ABORDAGENS PARA A AVALIAÇÃO
Há três abordagens diferentes para avaliar alunos e que diferem, principalmente,
no que é avaliado e onde o avaliador inicia a avaliação. Cada abordagem é
descrita a seguir.
Avaliação do Aluno
Mais freqiientemente, quando os alunos são encaminhados para avaliação
porque estão enfrentando problemas acadêmicos ou de comportamento, os
funcionários da escola utilizam uma abordagem em que avaliam o aluno. Este
26
tipo de avaliação faz a pergunta O que está errado com o aluno? . Os testes
são aplicados em uma tentativa de identificar as deficiências ou incapacidades
inerentes ao aluno, ou de encontrar pontos fracos ou fatores no desenvolvimento
de habilidades específicas.
Como se pode perceber, a avaliação do aluno é a abordagem mais freqiien-
temente utilizada e também é a mais ensinada nos cursos de magistério e
universitários. Esta abordagem é baseada em diversos pressupostos. Presume-
se que os alunos que enfrentam dificuldades acadêmicas apresentam con¬
dições internas (chamadas déficits, distúrbios, incapacidades ou disfunções )
que causam suas dificuldades acadêmicas. Presume-se que os testes podem e
devem ser utilizados na identificação dos déficits dos alunos, que os déficits
podem ser identificados de uma maneira válida e confiável e que podem ser
selecionadas abordagens educacionais baseadas no desempenho do aluno nos
testes. Dessa forma, os especialistas em educação se dedicam à avaliação de
habilidades de percepção, perceptivo-motoras, psicolingiiísticas e outras, e
tentam corrigir tais habilidades.
A abordagem que inicia a avaliação através do diagnóstico do aluno tem
sido criticada contínua e intensamente. Demonstrou-se que os pressupostos
subjacentes à abordagem não podem ser satisfeitos (Ysseldyke & Salvia, 1974),
que a abordagem é tecnicamente inadequada (Ysseldyke & Marston, 1982) e
que raramente leva a uma instrução afetiva (Alter & Jenkins, 1979; Engelmann,
Granzin & Severson, 1979).
Diagnóstico da Instrução
Engelmann, Granzin e Severson (1979) recomendam que a avaliação seja
iniciada com a diagnose da instrução, cujo propósito é determinar aspectos
da instrução que são inadequados, descobrir, de maneira precisa, como eles
são inadequados e sugerir o que deve ser feito para corrigir a inadequação”
(p. 361). Em tal abordagem, deve-se iniciar a avaliação com a pergunta: Em
que medida os problemas do aluno são causados por fraca instrução?”
Este tipo de diagnose consiste na análise sistemática da instrução e da
adequação desta ao aluno. Inclui o envolvimento em atividades descritas an-
teriormente na discussão sobre a avaliação baseada no currículo: observação
do ambiente de aprendizagem, avaliação das maneiras através das quais os
alunos abordam tarefas, exame da produção da instrução e ensino diagnóstico.
Avaliação do Ambiente Educacional
Até recentemente, a maioria das atividades de avaliação nos meios escolares
consistia em tentativas de se avaliar o aluno ou de se diagnosticar a instrução.
Entretanto, os funcionários das escolas têm, freqiientemente, dificuldade para
27
desenvolver as recomendações educacionais baseados apenas na informação
sobre as características dos alunos. É óbvio, também, que a instrução envolve
mais do que o currículo. Ela é uma atividade complexa e seus resultados
dependem de uma complexa interação de muitos fatores. Apenas alguns desses
fatores estão relacionados às características do aluno ou são específicos das
tarefas instrucionais. O reconhecimento desse fato tem levado a tentativas de
se avaliar a natureza qualitativa dos meios educacionais dos alunos.
A avaliação do ambiente educacional consiste em se analisar sistema¬
ticamente em que medida esses fatores, que produzem diferenças na aprendi¬
zagem, estão presentes na instrução que os alunos recebem. Por exemplo, há
um consenso sobre o fato de que é necessário que estejam presentes amplas
quantias de duas espécies de práticas controlada (guiada) e independente
(individual) para que o aluno apresente um rendimento ideal. Da mesma
forma é óbvio que os alunos aprendem mais quando recebem um retomo
corretivo de seu trabalho. Os pesquisadores que coletam dados sobre a quali¬
dade dos ambientes acadêmicos dos alunos analisam diversos fatores para
saber até que ponto é dada, aos alunos, oportunidade adequada para praticar
com materiais apropriados, em que medida a repetição e a prática prosseguem
até que as habilidades tomem-se automáticas, se os alunos recebem uma
informação imediata e específica sobre seu desempenho ou comportamento e
se são ou não corrigidos quando cometem erros.
CONSIDERAÇÕES NA SELEÇÃO DE TESTES
Quem Deve Ser Testado?
Ao responder a pergunta Quem deve ser testado? devemos considerar dois
pontos importantes. Em primeiro lugar, devemos decidir se queremos testar
um nico aluno ou um grupo de alunos. Em segundo lugar, devemos deter¬
minar em que medida o aluno (ou qualquer aluno do grupo) demonstra limi¬
tações especiais que devam ser consideradas na aplicação do teste.
Testes Coletivos vs. Individuais
A distinção entre um teste coletivo e um teste individual é, ao mesmo tempo,
óbvia e sutil. Os testes coletivos podem ser aplicados a uma pessoa ou a
diversas pessoas simultaneamente; os testes individuais devem ser administra¬
dos a apenas uma pessoa por vez. Qualquer teste coletivo pode ser aplicado
a um indivíduo; nenhum teste individual deve ser aplicado a mais de uma
pessoa ao mesmo tempo. Esta é uma distinção óbvia. No entanto, há diversas
distinções sutis.
28
Em um teste individual, as perguntas e instruções são dadas, em geral,
oralmente por um examinador que também observa as respostas do indivíduo
e, em muitos casos, registra-as. O examinador pode controlar o tempo e o
ritmo do teste e, freqiientemente, pode refazer ou esclarecer perguntas, bem
como sondar respostas a fim de obter um melhor desempenho. Se um aluno
que está sendo submetido a um
teste apresentar cansaço, o examinador pode
interromper ou finalizar o teste. Se o aluno se confundir no teste, o examina¬
dor pode auxiliá-lo; se ele demorar demais para responder, o examinador pode
apressá-lo; se lhe faltar confiança, o examinador pode encorajá-lo. Os testes
individuais normalmente permitem que o examinador estimule os melhores
esforços da pessoa testada e reúna uma considerável quantia de informação
qualitativa. Dessa forma, o examinador pode inferir pontos fortes e fracos
tanto em termos de informação quantitativa como qualitativa.
Com um teste coletivo, o examinador pode fornecer instruções orais para
as crianças pequenas, mas para as crianças que estão acima da quarta série,
as intruções são normalmente escritas. Os alunos escrevem ou assinalam suas
próprias respostas e o examinador deve monitorar o progresso deles simulta¬
neamente. Em geral, o examinador não pode reformular, sondar ou propiciar
respostas. Mesmo quando um teste coletivo é dado a um único aluno, é muito
difícil, senão impossível, obter a informação qualitativa.
A escolha entre um teste individual e um coletivo é determinada, em parte,
pela decisão a ser tomada e pela eficiência com que esse objetivo pode ser
atingido. Basicamente, quando testamos com vistas à avaliação do programa,
triagem e alguns tipos de planejamento curricular (por exemplo, para seguir
alunos classificados em grupos segundo as habilidades), é mais apropriada a
utilização de testes coletivos. Os testes individuais poderiam ser utilizados,
mas o tempo e os gastos não se jústificariam em termos da informação dese¬
jada. Quando planejamos programas individuais, os testes individuais são mais
apropriados. Normalmente, quando um aluno deve ser colocado sob um
programa de educação especial, a lei requer que um teste seja aplicado indi¬
vidualmente.
Limitações e Considerações Especiais
Um determinado aluno pode ter limitações especiais que fazem com que um
teste coletivo seja inadequado. Como foi discutido anteriormente, a maioria
dos testes aplicados em grupo é limitado em sua aplicabilidade devido à
maneira como suas perguntas são apresentadas (ou seja, requerem que as
pessoas testadas sejam capazes de ler) e à forma como as respostas devem ser
dadas (geralmente, por escrito ou com a assinalação de um x ). O senso
comum nos diz que, se um aluno não pode ler as instruções ou escrever as
respostas, um teste que requeira tais habilidades é inadequado. Em tais casos,
o teste mede muito mais a incapacidade para ler instruções ou escrever res-
29
postas do que a capacidade ou habilidade no conteúdo do teste. Uma criança
sem braços pode saber o conteúdo do teste, mas pode não responder a nenhu¬
ma pergunta porque não pode escrever. Da mesma forma, crianças mudas ou
com sérios problemas de linguagem podem saber as respostas de um teste,
mas ser incapazes ou não querer responder mesmo ao teste individual aplicado
da forma mais sensível possível, mas que requer respostas orais. Crianças com
deficiências físicas ou sensoriais podem ter um desempenho mais lento do que
crianças normais simplesmente devido a suas deficiências. Um teste que
concede pontos para a velocidade, assim como para a precisão da resposta
não seria um teste válido sobre o domínio que tais crianças têm do conteúdo.
Um outro problema é a relação entre o nível funcional e a maturidade so¬
cial de uma pessoa. Frequentemente, avaliam-se indivíduos mais velhos com
níveis relativamente baixos de desenvolvimento de habilidades. Em tais casos,
o examinador deve ter o cuidado de selecionar materiais de teste que reflitam
a maturidade social da pessoa a ser testada. Um adolescente que está começando
a aprender a ler pode ressentir-se com o uso de materiais de teste elaborados
para crianças de 6 anos. A utilização de materiais inadequados em termos da
maturidade social de um indivíduo mais velho pode reduzir ou eliminar o
interesse e, dessa forma, comprometer a exatidão dos resultados do teste.
Que Comportamentos Devem Ser Testados?
Todo teste é uma amostra de comportamento. Ao decidir que comportamentos
devem ser testados, o examinador deve considerar três subquestões: Que
exigências de estímulo e resposta serão feitas? Que domínio (conteúdo) será
medido? Quantos domínios serão testados?
Exigências de Estímulo e Resposta
Um teste, ou um item individual de um teste mede a habilidade de um in¬
divíduo para receber um estímulo e, então, fornecer uma resposta. Tais exi¬
gências estão presentes em todos os testes. A habilidade no conteúdo de um
teste não pode ser medida de maneira precisa se as exigências de estímulo e
resposta de uma pergunta estiverem além das capacidades da pessoa exami¬
nada. Como foi assinalado anteriormente, os testes podem ser aplicados oral
ou visualmente: um examinador pode mostrar materiais escritos a um aluno
enquanto simultaneamente os lê. Há poucas razões pelas quais um teste não
possa ser aplicado de maneira tátil também, de modo que alunos com limi¬
tações especiais possam compreender suas exigências básicas de estímulo.
As exigências de respostas também podem variar. As instruções do teste
podem requerer uma resposta oral sim ou não ou uma definição ou elaboração
orais. Os testes podem também requerer respostas escritas que variam desde
30
um simples sim-não, verdadeiro-falso ou respostas de m ltipla escolha até um
elaborado ensaio escrito.
O examinador deve ser sensível a qualquer limitação que um aluno possa
apresentar. As limitações são especialmente importantes com relação às exi¬
gências de estímulo e resposta dos testes. O examinador deve também ter
intenções bem específicas ao medir uma determinada habilidade ou caracterís-
tica. Deve-se considerar o modo de se medir, assim como o que vai ser
medido. Por exemplo, nem todos os testes de ortografia são iguais. Escrever
palavras a partir de um ditado é um tipo de teste de ortografia diferente de se
reconhecer uma palavra grifada correta ou incorretamente em um formato de
mútipla escolha.
O Domínio
O domínio do conteúdo que é testado é o que geralmente se denomina tipo
de teste. Há muitos tipos de teste, muitos traços ou características que podem
ser medidos: inteligência, personalidade, aptidão, interesses, desenvolvimento
perceptivo-motor, habilidade linguística, etc. A maioria dos traços ou caracte¬
rísticas gerais pode subdividir-se. Por exemplo, a inteligência pode ser di¬
vidida em habilidades de desempenho e habilidades verbais, ou fracionada em
até 120 habilidades diferentes (Guilford,1967). Há também muitas habilidades
e áreas do conhecimento que podem ser medidas: leituras, matemática, estu¬
dos sociais e anatomia são apenas algumas delas. Alguns testes foram con¬
cebidos para medir o desenvolvimento de habilidades em uma área de con¬
teúdo específica (por exemplo, leitura), enquanto outros testes medem o de¬
senvolvimento de habilidades em diversas áreas diferentes. Os primeiros são
conhecidos como testes de habilidade individual e os outros são baterias de
habilidades múltiplas.
Muitas vezes, um item de um teste presta-se facilmente para apenas um
domínio. Teríamos problemas para utilizar a pergunta Você gosta de si mes¬
mo? em um teste que não fosse de personalidade. Contudo, geralmente,
determinados itens de um teste são identificados com determinados domínios,
dependendo da idade e da experiência do aluno. Por exemplo, a pergunta
“ Quanto são 3 mais 5?” pode ser utilizada para medir diversos domínios
diferentes, dependendo do aluno em questão. Se uma criança acabou de receber
instrução sistemática a respeito da adição de números de um dígito, a pergunta
seria apropriada em um teste de rendimento. Se a pergunta fosse feita a uma
criança que não recebeu instrução formal em adição (uma criança de 4 anos,
por exemplo), a pergunta seria apropriada em um teste de inteligência. Se a
mesma pergunta fosse feita a uma criança que tivesse recebido, por
diversos
anos, instrução sistemática, ela seria apropriada em um teste de aptidão
matemática. Em suma, o tipo de teste em que é colocado um item depende
mais das características da pessoa que deve ser testada ou do uso que se
pretende fazer do teste do que do conteúdo desse item.
31
Quais São os Dados Interpretativos Desejados?
O processo para decidir que dados interpretativos o examinador quer obter
inclui, necessariamente, a resposta a diversas subquestões: (1) 0 examinador
está interessado no atual nível de domínio do aluno ou em um índice da
posição relativa do aluno? Em outras palavras, o examinador usará uma
avaliação baseada em critérios ou em normas? (2) O examinador está interes¬
sado no desempenho máximo do aluno ou no nível de desempenho que o
aluno pode atingir em um determinado período de tempo? Em outras palavras,
o examinador utilizará testes de resistência (testes sem limite de tempo) ou
testes de velocidade (testes cronometrados)?
Testes Baseados em Normas vs. Testes Baseados em Critérios
A maioria dos testes não-educacionais são dispositivos baseados em normas,
que comparam o desempenho de um indivíduo ao desempenho de seus colegas.
Na avaliação baseada em normas, a aprendizagem de um determinado conteúdo
ou de determinadas habilidades só é importante na medida em que a
aprendizagem diferencial permite que o examinador classifique os indivíduos
em ordem, desde os que aprenderam muitas habilidades até os que aprenderam
poucas. A ênfase é dada muito mais à posição relativa dos indivíduos do que
ao domínio absoluto do conteúdo.
Os testes baseados em normas são de dois tipos: escalas de pontos e escalas
de idade. Tais escalas diferem em sua construção. As escalas de idade são
menos comuns atualmente do que no passado, devido a limitações estatísticas
e conceituais. As escalas de idade são elaboradas, através da atribuição de
graus aos itens de teste, em termos de porcentagens das crianças de diferentes
idades que respondem corretamente a cada item. Por exemplo, um item deve
ser colocado no nível de 6 anos de 25% das crianças de cinco anos, 50% das
crianças de seis anos e 75% das crianças de sete anos responderam-no correta¬
mente. Quando uma pergunta de um teste está corretamente colocada em uma
escala de idade, as crianças mais novas falham nesse item e as mais velhas o
resolvem. As limitações estatísticas e conceituais das escalas de idade são
discutidas no capítulo 5, nas seções que tratam dos escores e quocientes de
desenvolvimento. Devemos advertir o leitor para o fato de que alguns testes,
tais como a revisão de 1972 da Stanford-Binet, parecem ser escalas de idade,
mas são considerados, mais corretamente, como escalas de pontos (comparar
Salvia, Ysseldyke & Lee, 1975).
Uma escala de pontos é construída através da seleção e ordenação dos itens
de diferentes níveis de dificuldade. Os níveis de dificuldade não são asso¬
ciados com as idades. Nas escalas de pontos, as respostas corretas (isto é, os
pontos) são somadas e o escore total bruto é transformado em várias escalas
derivadas (ver capítulo 5).
32
Normalmente, os dispositivos baseados em normas são concebidos para
fazer apenas uma coisa: separar os desempenhos dos indivíduos de modo que
haja uma distribuição de escores. Eles permitem que o examinador discrimine
entre os desempenhos de certo n mero de indivíduos e interprete como o
desempenho de uma pessoa pode ser comparado com o de outros indivíduos
com características semelhantes. Na aplicação de testes baseados em normas,
o desempenho de uma pessoa em um teste é medido com relação ou com
referência aos desempenhos de outros indivíduos que, presumivelmente, são
semelhantes ao dessa pessoa. Os testes baseados em normas são padronizados
a partir de grupos de indivíduos e obtêm-se desempenhos típicos para alunos
de certas idades ou de certas séries. O escore bruto que um aluno consegue
em um teste é comparado aos escores obtidos por outros alunos e utiliza-se
um escore transformado (por exemplo, uma classe de percentil) para expressar
a posição de determinado aluno no grupo.
Todos os testes baseados em normas e critérios são objetivos. Os testes
objetivos são os que possuem respostas e padrões predeterminados para
qualificar uma resposta. São objetivos no sentido de que atitudes, opiniões e
idiossincrasias do examinador não afetam os escores; dois examinadores
quaisquer atribuiriam, a uma resposta, o mesmo escore1. A atribuição objetiva
de escores não implica uma pontuação justa ou justificável; implica somen¬
te critérios predeterminados e procedimentos padronizados de qualificação.
Suponha que um examinador mostre a uma criança fotografias de um navio,
um automóvel, o vagão de um trem de passageiros e um ônibus e, então, lhe
pergunte “ Qual é diferente?” A resposta considerada adequada (a resposta
objetiva) é navio; o navio é o único transporte aquático. Se a criança racioci¬
nar que somente um automóvel é um meio de transporte particular e der a
resposta carro, tal resposta será qualificada como incorreta.
Da mesma forma, se a criança raciocinar que o vagão do trem de pas¬
sageiros é o nico veículo que não tem propulsão própria ou o único que
requer trilhos e responder de acordo com esse raciocínio, a resposta será
qualificada como incorreta. “ Ser justo” não tem nada a ver com uma atribuição
objetiva de escores.
Os dispositivos baseados em normas apresentam uma vantagem em relação
aos baseados em critérios quando o objetivo do teste é a triagem ou a ava¬
liação do programa: fornecem um meio de se comparar o desempenho de um
aluno ao desempenho obtido por outros. Assim, com muita frequência, as
decisões de posicionamento são tomadas após a aplicação de dispositivos
baseados em normas, que possibilitam que a equipe encarregada do posicio-
1. Um teste subjetivo, em contrapartida, é um teste para o qual uma resposta predeterminada não
existe. Por conseguinte, os julgamentos subjetivos, as atitudes e as opiniões do examinador
podem afetar a atribuição do escore. Muitas pessoas, erroneamente, definem o teste em que se
deve escrever um ensaio como um teste subjetivo. Tal teste poderia ser objetivo se houvesse
critérios explícitos e predeterminados para as respostas corretas; então, à mesma resposta, seria
dado o mesmo escore por dois ou mais examinadores.
33
namento de um aluno observe onde este se situa em relação aos outros alunos.
De fato, na maioria dos estados, a avaliação com testes baseados em normas
deve ocorrer em qualquer decisão de posicionamento. Além disso, os testes
baseados em normas são teis, na triagem de classes inteiras de alunos, para
Identificar aqueles que demonstram tipos particulares de dificuldades. Con¬
tudo, os testes baseados em normas possuem muitas limitações.
Os testes baseados em critérios representam um desenvolvimento recente
na educação e na psicologia behaviorista. Mais do que indicar a posição relativa
de uma pessoa no desenvolvimento de habilidades, os testes baseados em
critérios medem o desenvolvimento de habilidades particulares de uma pessoa
em termos de níveis absolutos de domínio. Assim sendo, tais testes fornecem
respostas a perguntas específicas, tais como Maureen escreve a palavra
cachorro corretamente? .
Quando os testes são aplicados com o objetivo de auxiliar o professor a
planejar programas adequados às crianças, recomendam-se os testes baseados
em critérios. Ao planejar um programa para um único aluno, o professor deve
preocupar-se mais em identificar as habilidades específicas que o aluno tem
ou não do que em saber como o aluno pode comparar-se com outros. Na
medida baseada em critérios, a ênfase é dada à avaliação de comportamentos
específicos e relevantes que tenham o aluno como um indivíduo, em vez de
simplesmente fornecer índices numéricos sobre a posição do aluno em uma
variedade de contínuos subtestes.
Os itens dos testes baseados em critérios estão, com frequência,