Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
CAP.I TEXTO SALVIA.pdf CAPII A SALVIA e Ysseldyke.pdf CAP.II B TEXTO SALVIA.pdf J E O L EDITORA MANOLE LTDA «M Dados Internacionais de Cataloga na Publicação (CIP) Câmara Brasileira do Livro, SP, Brasil) Salvia, John. Avaliação em educação especial e corretiva / John Salvia, James E. Ysseldyke ; [tradução Doris Sanches Pinheiro]. 4. ed. São Paulo : Manole, 1991 1. Avaliação educacional 2. Educação - Testes e medidas 3. Educação especial 4. Ensino corretivo I. Ysseldyke, James E. II. Título. ISBN 85-204-0007-8 CDD-371.26 -371.9 91-2284 -374.012 índices para catálogo sistemático: 1. Avaliação : Medidas : Educação 37.1.26 2. Educação corretiva 374.012 3. Educação especial 371.9 4. Medidas e testes : Educação 371.26 5. Testes educacionais 371.26 Traduzido do original americano: ASSESSMENT IN SPECIAL AND REMEDIAL EDUCATION Fourth Edition COPYRIGHT© HOUGHTON MIFFLIN COMPANY Tradução: Dr® Doris Sanches Pinheiro Produção Editorial: MIR Assessoria Editorial Ltda. Nenhuma parte deste livro poderá ser reproduzida, por qualquer processo sem a permissão dos editores. Direitos adquiridos para a língua portuguesa pela EDITORA MANOLE LTDA. Rua Conselheiro Ramalho, 516 - Bela Vista CEP 01325 - São Paulo - SP FONE (011) 283-5866 - FAX (011) 287-2853 Impresso no Brasil Printed in Brazil 4 CAPíTULO I A AVALIAÇÃO DOS ALUNOS Todos nós já passamos por testes em nossas vidas. Na escola primária e secundária os testes foram aplicados para medir nossa aptidão escolástica, ou inteligência, ou para avaliar o quanto aproveitamos da instrução. Podemos ter feito testes de personalidade, testes de interesses ou testes que nos auxilia¬ ram na seleção da vocação e no planejamento da carreira. Ao tentarmos conseguir um emprego, podemos ter feito concursos públicos ou testes de habilidades específicas, como datilografia ou destreza manual. O alistamento militar significou a realização de diversos testes. A matrícula em uma facul¬ dade implicou a realização dos exames vestibulares. Os que decidiram ir para uma escola técnica normalmente tiveram que fazer um teste de aptidão; muitos dos que se tomaram professores realizaram um concurso p blico para ingres¬ sar no magistério. Médicos, advogados, psicólogos e muitas outras pessoas tiveram que fazer testes para demonstrar sua competência, antes de serem licenciados para a prática da profissão. Estima-se que os alunos matriculados nas escolas p blicas americanas fazem mais de 250 milhões de testes padroni¬ zados por ano. Durante toda a sua carreira profissional, professores, orientadores, assisten¬ tes sociais de escola, psicólogos educacionais e administradores de escolas devem aplicar, avaliar e interpretar uma ampla variedade de testes. Como os funcionários de escolas profissionais recebem, rotineiramente de seus colegas de outras escolas e de órgãos e empresas, informações obtidas através de testes, eles necessitam de um conhecimento prático dos aspectos importantes dos testes. De acordo com o comité adjunto da American Psychological Association (APA), da American Educational Research Association (AERA) e do National Council on Measurement in Education (NCME), um teste pode ser conside¬ rado um conjunto de tarefas ou questões concebidas para determinar tipos particulares de comportamentos quando apresentados sob condições padroni¬ zadas e para fornecer escores que possuam as propriedades psicométricas convenientes... (1974, p. 2). TESTAR, portanto, significa expor uma pessoa a um conjunto específico de questões com o intuito de obter um escore. Tal escore é o produto final do teste. rocha Highlight rocha Highlight 5 Áreas de Problemas Tipos de Decisões Encaminhamento Triagem Classificação PlanejamentoEducacional Avaliação do Progresso do Aluno Acadêmica Comportamental Física FIGURA 1.1 A avaliação é a coleta de dados para especificar e verificar problemas e para auxiliar na tomada de decisão. A aplicação de testes pode ser parte de um processo mais amplo conhecido como AVALIAÇÃO; contudo, teste e avaliação não são sinónimos. A avaliação, em meios educacionais, é um processo multifacetado que envolve mais do que a aplicação de um teste. Quando avaliamos alunos, consideramos a maneira como eles executam uma variedade de tarefas em uma variedade de meios ou contextos, o significado de seus desempenhos em termos do funcionamento total do indivíduo e as prováveis explicações para tais desempenhos. Bons procedimentos de avaliação levam em consideração o fato de que o desem¬ penho de alguém, em qualquer tarefa, é influenciado pelas exigências da própria tarefa, pela história e pelas características que o indivíduo traz para a tarefa e pelos fatores inerentes ao meio em que é realizada a avaliação. A avaliação é o processo de coletar informação. Parte da informação cole¬ tada pode constituir-se de dados de testes; mas a maior parte consistirá, pro¬ vavelmente, em outras formas de informação. Entretanto, a avaliação é mais do que simplesmente a coleta de informação; é a coleta com um objetivo. A avaliação é o processo de coletar dados com o objetivo de (1 ) especificar e verificar problemas e (2 ) tomar decisões sobre os alunos. Como nos mostra a Figura 1.1, cinco1 tipos gerais de decisões são tomadas: encaminhamento, triagem, classificação, planejamento educacional e avaliação do progresso do aluno. Como também nos mostra a Figura 1.1, nas escolas, especificamos e verificamos problemas em três áreas: acadêmica, comportamental e física. 1. Na verdade, há, pelo menos, mais três razões para a avaliação. Os indivíduos podem ser avaliados porque estão curiosos sobre si mesmos, porque participam de estudos de pesquisa ou porque um distrito escolar está avaliando os programas educacionais. rocha Highlight rocha Highlight rocha Highlight TIPOS DE DECISÕES Decisões de Encaminhamento Decisões de encaminhamento são decisões sobre a necessidade de buscar as¬ sistência adicional de outros profissionais da educação. Embora qualquer pes¬ soa possa encaminhar alunos (por exemplo, os pais, os próprios alunos ou outros indivíduos), geralmente quem faz o encaminhamento é o professor. Os professores regularmente encaminham alunos para outros profissionais da escola e, algumas vezes, para profissionais ou órgãos fora do âmbito escolar. Estudos recentes mostraram que 3 a 5% dos alunos em escolas públicas, nos Estados Unidos, são encaminhados todos os anos para avaliação psicológica e educacional. Cerca de 92% dos alunos encaminhados são submetidos a testes e aproximadamente 73% dos que são testados são encaminhados para a educação especial (Algozzine, Christenson, & Ysseldyke, 1982). Quem os professores encaminham para avaliação? Esta questão pode ser respondida de uma maneira muito simples: eles encaminham os alunos que os incomodam. Embora a questão possa ser respondida de uma maneira simples, não é fácil dizer se um aluno deve ou não ser encaminhado. Professores diferentes são perturbados por comportamentos diferentes, embora alguns com¬ portamentos e características provavelmente incomodem a maior parte (senão todos) dos professores. Decisões de Triagem Visto que há alguma variabilidade na tolerância e no grau de compreensão dos professores com relação a vários problemas, pode haver alunos excepcionais em salas de aula normais e que não estão tendo suas necessidades atendidas. Como os distritos escolares desejam encontrar esses alunos e providenciar serviços especiais para eles, iniciam-se programas de triagem. Portanto, as decisões de triagem são de natureza essencialmente administrativa. Em todos os alunos em escolas particulares ou p blicas são feitos exames rápidos para descobrir se algum dos alunos necessita de uma avaliação mais intensiva, mais acurada. Os testes podem ser aplicados para identificar alunos que dife¬ rem, de maneira significativa, de seus colegas de mesma idade (tanto em um sentido positivo como negativo) e que, portanto, requerem serviços de edu¬ cação especiais. Assim como testes de visão e audição são rotineiramente aplicados para identificar alunos com problemas visuais ou auditivos, os testes de inteligência são administrados para identificar alunos que possam necessi¬ tar de atenção especial, seja devido a uma capacidade intelectual limitada, seja devido a uma habilidade intelectual extremamente superior. Testes de rendi¬ mento, medidas do que tem sido ensinado aos alunos e do que eles aprendem, rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight 7 são rotineiramente dados para identificar alunos que estejam enfrentando uma dificuldade na área acadêmica e para os quais pode ser apropriada uma avaliação suplementar. A triagem é um estágio inicial, durante o qual aqueles que apresentam um problema particular, dist rbio, incapacidade ou doença são distinguidos da população geral. A triagem iniciou-se na medicina e usa a terminologia das práticas médicas de triagem. Fala-se de indivíduos que apresentam um desem¬ penho pobre, segundo os testes de triagem, como sendo de risco ; indivíduos que têm um desempenho pobre nos testes de triagem, mas que, mais tarde, saem-se bem em avaliações posteriores são descritos como falsos positivos”. Por vezes os alunos não demonstram nenhum problema no momento da tria¬ gem e são selecionados como normais” . Posteriormente, esses mesmos alu¬ nos podem apresentar exatamente os mesmos problemas que foram avaliados pela triagem; tais alunos são chamados de “ falsos negativos” . Finalmente, quando se fala da exatidão das decisões de triagem, freqiientemente se fala de “ índice de acertos” (proporção de decisões positivas exatas) para a triagem. Decisões de Classificação As decisões de classificação podem assumir diversas formas. Nas escolas, tais decisões referem-se ao grau de necessidade de um aluno com relação aos serviços especiais: serviços de educação especial, serviços de educação cor¬ retiva, serviços de fonoaudiologia e assim por diante. Neste livro, preocu¬ pamo-nos, essencialmente, com a necessidade de serviços de educação espe¬ cial. Assim sendo, interessamo-nos pelo problema de se saber se um aluno é excepcional. Normalmente, os serviços especiais são muito mais caros que os serviços oferecidos aos alunos na educação geral. Além disso, esses custos extras (às vezes chamados de custos de excesso) são pagos, em parte, pelos governos federal e estadual. Os governos querem assegurar-se de que o di¬ nheiro dos impostos seja aplicado em programas para indivíduos que real¬ mente necessitam de serviços custeados pelo governo. Além do sistema de classificação empregado pelo governo federal, cada Estado possui um código de educação que especifica os tipos de alunos consi¬ derados deficientes. Os Estados têm nomes diferentes para a mesma deficiên¬ cia. Por exemplo, na Califórnia, alguns alunos são chamados de educacional¬ mente deficientes; em outros Estados, como o Texas, esses mesmos alunos são chamados de incapazes para o aprendizado. Estados diferentes têm pa¬ drões diferentes para classificação da mesma deficiência. Na Pensilvânia, o QI máximo para os indivíduos mentalmente deficientes é 80; em Minnesota, o Q1 máximo é 70; na Califórnia, um aluno negro não pode ser testado com um teste individual de inteligência para classificação como mentalmente defi¬ ciente. Alguns Estados consideram alunos superdotados como excepcionais e com direito aos serviços de educação especial; outros Estados não o fazem. rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight 8 Em alguns Estados, alunos com lesões cerebrais são considerados exceptio¬ nal; em outros, não há qualquer regulamentação para uma categoria de alunos com lesões cerebrais. Cada Estado possui seu próprio critério para cada tipo de deficiência assistida pela educação especial. Na maior parte dos Estados, os alunos devem ser avaliados por especialistas em diagnóstico, antes de terem direito a serviços de educação especial. A Lei Pública 94-142, o Ato de 1975 para a Educação de todas as Crianças Deficientes, especifica que a neces¬ sidade, a classificação e ou as decisões de enquadramento devem ser tomadas por uma equipe de profissionais, com a concorrência dos pais do aluno. Na avaliação para classificação, as pessoas responsáveis pela determinação da necessidade do aluno desenvolvem um plano para esclarecer e verificar se o aluno é deficiente. Os dados são, então, reunidos (isto é, os testes são aplicados, são feitas observações sistemáticas, realizadas entrevistas etc.) para esclarecer e especificar em que medida os alunos preenchem os requisitos para ter direito aos serviços para pessoas deficientes. Embora existam muitos problemas, aparentes no uso de testes, para tomar decisões de classificação, a maior parte da legislação federal e estadual exige que as decisões sejam baseadas em testes. Tal exigência existe para proteção dos alunos. Se os professores, diagnosticadores e administradores tivessem permissão para tomar decisões de classificação e enquadramento baseados em impressões subjetivas, a classificação seria desordenada e parcial. Decisões de Planejamento Educacional Os dados de avaliação são freqiientemente utilizados para esclarecer e espe¬ cificar como e onde um aluno déve ser ensinado. Portanto, os testes são aplicados numa tentativa de auxiliar professores e administradores a planejar programas de educação para indivíduos ou grupos de alunos. A informação dos testes pode ser usada para decidir sobre a inserção do aluno em grupos de leitura ou sobre sua designação para programas compensatórios ou corretivos específicos. As observações e entrevistas podem ser utilizadas para decidir se os serviços especiais devem ser realizados em uma sala de aula comum ou em um ambiente especial de educação. Os resultaaos dos testes são também usados para decidir que metas devem ser reforçadas, que objetivos devem ser ensinados, e como ensiná-lo, tanto para indivíduos como para grupos. Com o aumento da atenção às incapacidades de aprendizagem e com os requisitos federais e estaduais para programas de educação individualizados para alunos excepcionais, presenciou-se uma expansão na utilização de pro¬ cedimentos de avaliação, baseados no currículo, no planejamento de esforços educacionais. Os méritos e limitações no uso de testes no planejamento de programas específicos de educação são discutidos em diversos capítulos das partes 3 e 4 desta obra. O capítulo 25 é dedicado, em grande parte, à discussão e ilustração desse objetivo dos testes. rocha Highlight rocha Highlight 9 Decisões sobre o Progresso do Aluno Finalmente, os dados de avaliação são utilizados para verificar se o aluno fez progressos e para especificar os objetivos particulares que tenham (ou não) sido atingidos no currículo educacional prescrito. Vários tipos de dados de avaliação são usados para se monitorar o progresso diário de um aluno, de modo que o professor possa aperfeiçoar os programas educacionais. Outros espécies de dados de avaliação são utilizadas para dizer aos professores, aos pais e aos próprios alunos qual a amplitude dos progressos feitos durante períodos de tempo mais longos (por exemplo, por um semestre). Os graus, nos testes feitos por professores, e os escores, nos testes padronizados de rendi¬ mento, são os indicadores usuais do progresso acadêmico. Alguns testes mostram aos professores e pais que objetivos educacionais específicos foram ou não atingidos. A avaliação do progresso do aluno está intimamente re¬ lacionada ao prográma particular em que o estudante está envolvido. É abso¬ lutamente essencial que o conte do da avaliação seja exatamente igual ao programa escolar. Se isso não ocorrer, as decisões sobre o progresso serão, muito provavelmente, incorretas. Portanto, deve-se distinguir entre aquisição e rendimento. Aquisição é o que um indivíduo aprendeu, não importando onde foi aprendido. Rendimento é o que foi aprendido como um resultado da instrução nas escolas. Qualquer teste de informação fatual mede a aquisição; contudo, um teste de informação fatual é um teste de rendimento apenas se medir o que foi diretamente ensinado. Somente os testes de rendimento podem ser utilizados para se monitorar o progresso do aluno. Seria inútil usar um teste que não avaliasse o que um professor ensinou. ÁREAS DE PROBLEMAS PARA ESPECIFICAÇÃO E VERIFICAÇÃO A avaliação é um processo de coleta de dados com os propósitos de (1) especificar e verificar problemas e (2) tomar decisões sobre os alunos. Apenas descrevemos os tipos de decisões que são tomadas nos meios educacionais. Agora, descreveremos os três tipos de problemas aos quais normalmente a avaliação se relaciona: problemas acadêmicos, de comportamento e físicos. Ao fazermos isso, descreveremos a especificação e verificação de problemas com o intuito de tomar diferentes tipos de decisões. Problemas Acadêmicos A razão mais comum pela qual os alunos são encaminhados para avaliação psicológica ou educacional é a de que um professor ou pai acredita que eles não estão apresentando um desempenho tão bom quanto o esperado academi- rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight 10 camente. Os professores normalmente tomam essa decisão baseados em suas observações do desempenho do aluno em áreas do programa acadêmico: lei¬ tura, matemática, ortografia, ciências, estudos sociais etc. Quando os alunos são encaminhados para avaliação, é necessário que os professores especi¬ fiquem suas preocupações. Os professores que encaminham alunos para ava¬ liação devido a problemas de leitura fornecem, aos especialistas em diag¬ nóstico, informações limitadas. Na medida em que os professores descrevem e especificam a natureza dos problemas de um aluno (por exemplo, Richy é o leitor mais fraco da classe e, consistentemente, apresenta dificuldades para associar letras e sons ), auxiliam os diagnosticadores. Alguns professores muito eficientes recolhem, regularmente, informações sobre o progresso dos alunos em áreas do programa acadêmico e usam tais dados para tomar decisões de encaminhamento. O desempenho acadêmico é, quase sempre, avaliado quando se tomam decisões de classificação. Por exemplo, a um aluno encaminhado devido a problemas de leitura pode ser aplicado um teste de leitura que forneça uma comparação do desenvolvimento das habilidades de leitura com relação a outros alunos da escola ou, mesmo, da nação. Os resultados do teste seriam utilizados para verificar a existência de um problema. O desempenho acadêmico é quase sempre avaliado quando se tomam de¬ cisões educacionais. Para se decidir o que ensinar a um aluno é necessário especificar as habilidades que o aluno já possui e as que ainda não adquiriu. Problemas de Comportamento Os alunos são, freqiientemente, encaminhados para avaliação psicológica ou educacional porque demonstram problemas de comportamento. Os alunos em que podem ser especificados e verificados sérios problemas de comportamento são, com frequência, indicados para serviços de educação especial. Os problemas de comportamento incluem falta de relacionamento com os colegas, atividades delinquentes e isolamento excessivo, bem como compor¬ tamento desordeiro e desrespeitoso. Por exemplo, a Sra. Swanson, professora, percebe que Larry é muito quieto e isola-se de seus colegas. Ela pode, então, começar a verificar se esse é realmente o problema através da contagem da frequência das interações de Larry com os colegas. Uma baixa contagem não indicaria, por si só, um problema. Por isso, a Sra. Swanson seleciona um outro garoto cujo comportamento ela julga ser apropriado e conta a frequência de suas interações com os colegas. Ela pode, então, verificar que Larry interage muito menos freqiientemente do que um garoto sem problemas de interação. A Sra. Swanson pode, então planejar um programa de modificação de comportamento para Larry, para aumentar o número de interações positivas com os colegas de classe. Ela pode sistematicamente coletar dados sobre a eficácia desse novo programa e tomar algumas decisões sobre o progresso de Larry. rocha Highlight rocha Highlight 11 Problemas Físicos Problemas físicos incluem deficiências sensoriais (visão e audição), proble¬ mas de estrutura física (por exemplo, espinha bífida ou paralisia cerebral) e problemas crónicos de saúde (diabetes ou asma). Sérios problemas físicos são os primeiros assinalados, pelos médicos, aos pais de uma criança antes de sua entrada na escola. Quando uma criança com um sério problema físico entra na escola, os pais devem fornecer informações específicas dos médicos que confirmem e especifiquem a natureza física do problema da criança. Problemas menores, mas igualmente importantes, que não tenham sido percebidos pelos pais, são normalmente descobertos durante a triagem rotineira. Por exemplo, a White Haven Area Schools pode solicitar à enfermeira da escola (a Sra. Slique) que aplique, regularmente, testes de audição (por exemplo, um teste audiométrico de tons puros para audição dentro da frequência da fala). Quando os alunos da primeira série são examinados, a Sra. Slique nota que Jane tem uma perda de 65 decibéis em seu melhor ouvido. Uma perda de audição de tal magnitude, se confirmada, teria sérias implicações educacionais e necessitaria de substanciais modificações educa¬ cionais para que Jane pudesse aproveitar sua educação. Contudo, a avaliação de triagem foi realizada na enfermaria, que é à prova de som, e com um equipamento que não foi recentemente checado com relação à precisão. Por isso, a Sra. Slique decide que será melhor chamar um audiologista para examinar Jane e diagnosticar seu problema auditivo. SUMÁRIO A aplicação de testes faz parte de um conceito mais amplo: a avaliação. Na avaliação, a informação é reunida por duas razões. Em primeiro lugar, os dados de avaliação são utilizados para esclarecer e verificar a existência de problemas educacionais nas áreas de funcionamento acadêmico, adaptação comportamental e social e desenvolvimento físico. Em segundo lugar, a avaliação fornece dados para facilitar a tomada de decisões. Cinco tipos de decisões são especialmente pertinentes na avaliação em educação especial: de encaminhamento, de triagem, de classificação, de planejamento educacional e de avaliação do progresso do aluno. rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight 13 CAPITULO 2 CONSIDERAÇÕES BÁSICAS EM AVALIAÇÃO A avaliação é um processo de coleta de dados com dois propósitos: (1) especificação e verificação de problemas e (2) tomada de decisões sobre e pelos alunos. Os dados de avaliação são utilizados para se tomarem muitos tipos diferentes de decisões sobre alunos, como mostra o primeiro capítulo. As pessoas que avaliam alunos devem estar atentas aos diversos pressupos¬ tos inerentes à avaliação e ao modo como o fracasso para satisfazer tais pressupostos afeta diretamente a validade dos resultados obtidos. Elas devem considerar muitos fatores na avaliação, indo além dos alunos para reunir tipos adicionais de informação. Neste capítulo, descrevemos os fatores a serem considerados e as várias espécies de informação coletadas no processo de avaliação. Também fazemos a distinção entre avaliação formal e informal. Os que avaliam os alunos precisam identificar um ponto de partida para a avaliação e decidir que tipos específicos de dados serão coletados. Colocamos diversas perguntas comumente feitas quando se decide como os alunos serão avaliados. Finalizamos o capítulo com uma série de regras para a aplicação, pelos professores, de testes padronizados. PRESSUPOSTOS SUBJACENTES À AVALIAÇÃO Certo n mero de pressupostos subjaz à correta avaliação dos alunos. Na medida em que tais pressupostos não são satisfeitos, os resultados e as interpretações do teste perdem a validade. Newland (1973) identificou e discutiu os seguintes cinco pressupostos subjacentes à avaliação. A Pessoa que Aplica o Teste É Capacitada Quando os alunos são testados, presume-se que a pessoa que está aplicando o teste tenha o treinamento adequado ao objetivo do teste. Presume-se, tam¬ bém, que o aplicador saiba como e realmente consiga estabelecer uma relação com os alunos, que, em geral, apresentam um melhor desempenho em rocha Highlight rocha Highlight rocha Highlight 14 uma atmosfera de confiança e segurança. Além disso, presume-se que o aplicador saiba como administrar corretamente o teste. A aplicação de testes consiste em uma apresentação padronizada de estímulos. Se a pessoa que aplica o teste não apresenta corretamente as perguntas ou materiais, os escores obtidos perderão a validade. Presume-se, também, que a pessoa que aplica um teste saiba como julgar os escores. Uma correta atribuição de pontos é um pré-requisito para se conseguir um retrato significativo de um aluno. Finalmente, presume-se que uma interpretação precisa pode e será feita. A aplicação de testes, a atribuição de escores e a interpretação requerem diferentes graus de treinamento e perícia, que dependem da espécie de teste aplicado e do grau de interpretação requerido para se estabelecer um signifi¬ cado para o desempenho da pessoa testada. Embora a maioria dos professores possa facilmente aplicar ou aprender a aplicar, a grupos, testes de rendimento e de inteligência, uma pessoa deve ter passado por um considerável trei¬ namento para atribuir escores e interpretar grande parte dos testes individuais de inteligência e personalidade. Atualmente, a maior parte dos Estados exige que a pessoa possua um certificado ou seja licenciada como psicóloga, a fim de aplicar esses tipos de teste. A licença ou o certificado, por sua vez, de¬ pendem, com frequência, da demonstração de competência. Obviamente, há um ponto extremamente importante implícito neste pri¬ meiro pressuposto. Os profissionais deveriam aplicar somente os testes para os quais estão qualificados. Infelizmente, muitas vezes, fica-se sabendo de pessoas sem treinamento em testes individuais de inteligência que, contudo, aplicam tais testes; ou, então, pessoas sem um treinamento formal na apli¬ cação ou interpretação de testes de personalidade aplicando-os. Esses testes podem parecer fáceis de se aplicar; no entanto, a aplicação, a atribuição de escores e a interpretação corretas são complexas. Visto que os testes são usados muito freqiientemente para se tomarem decisões que afetarão o futuro de uma criança, este pressuposto, de um observador ou aplicador capacitado, reveste-se de especial importância. O Erro Estará Presente Nenhuma medida psicológica ou educacional está livre de erros. Certa quantia de erros está sempre presente quando aplicamos um teste. Embora os erros de medida sejam tratados amplamente no capítulo 7, alguns pontos são apro¬ priados aqui. Nunnally (1978) distingue dois tipos de erros em qualquer esforço de medida: o erro sistemático, ou desvio, e o erro aleatório. Ele ilustra o erro sistemático com o exemplo de um químico que utiliza um termómetro inexato, que sempre mostra 2 graus a mais do que a temperatura real de um líquido. Todas as leituras feitas pelo químico apresentarão um desvio, mas isso será sistemático; ou seja, todas as leituras terão um erro de 2 graus. rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight 15 No processo de medida, o erro aleatório ocorre de duas maneiras. Em primeiro lugar, a pessoa que faz a medida pode ser inconsistente. A ilustração que Nunnally dá para isso é a de um químico míope que lê um termómetro de precisão de maneira incorreta. As leituras sempre apresentarão erros, mas o valor e a direção do erro serão aleatórios. Em alguns casos, o químico pode ler o termómetro com 5 graus a mais; em outros, com 4 graus amenos. Um valor indeterminado de erro, então, afeta as medidas obtidas. Em segundo lugar, os instrumentos de medida podem produzir resultados inconsistentes. Por exemplo, uma régua de borracha elástica produz medidas de comprimento inconsistentes. A confiabilidade depende de quão livre do erro aleatório esteja o instru¬ mento de medida. Um teste com muito pouco erro aleatório, um teste de precisão, é considerado confiável, enquanto um teste com um considerável erro aleatório, um teste impreciso, não é confiável. Os testes diferem conside¬ ravelmente no grau de confiabilidade. Na medida em que instrumentos não- cònfiáveis (instrumentos com um considerável erro aleatório) são utilizados para se tomarem decisões sobre alunos, tais decisões podem, de fato, ser erróneas. Os fatores que contribuem para a falta de confiabilidade do teste são discutidos no capítulo 7. A Aculturação É Comparável Cada aluno possui um conjunto particular de experiências anteriores em ambientes educacionais, sociais e culturais. Quando testamos alunos usando um instrumento padronizado e os comparamos a um conjunto de normas para extrair um índice de sua posição relativa, presumimos que os alunos testados sejam semelhantes àqueles pelos quais o teste foi padronizado; ou seja, presumimos que sua aculturação seja comparável, mas não necessa¬ riamente idêntica à dos alunos que constituíram a amostra normativa para o teste. Quando as experiências gerais de uma criança diferem das crianças em cima das quais um teste foi padronizado, então, o uso das normas desse teste, como um índice para avaliar o desempenho atual da criança ou para prognos¬ ticar seus futuros desempenhos, pode ser inadequado. Também podem ser tomadas decisões educacionais incorretas. Devem-se assinalar que a acultu¬ ração é muito mais uma questão de antecedentes de experiências do que de antecedentes étnicos, raciais ou de cor de pele. Quando se diz que a acultu¬ ração de uma criança difere da do grupo usado como norma, diz-se que os antecedentes experimentais diferem, e não simplesmente que a criança é de uma origem étnica diferente, por exemplo, da das crianças que constituíram o padrão de teste. Infelizmente, muitos psicólogos, orientadores, terapeutas e outras pessoas que selecionam testes para serem aplicados a alunos frequentemente fazem-no rocha Highlight rocha Highlight rocha Highlight rocha Highlight 16 dando pouca importância às características dos alunos que constituem as amostras normativas. Muitos administradores de escola rotineiramente com¬ pram testes mais interessados nos preços do que na adequação técnica e adaptabilidade de tais testes. O Teste Rápido (Quick Test), por exemplo, foi padronizado em crianças brancas de Missoula, em Montana; contudo, é usado, cotidianamente, para se medir a inteligência de crianças negras que vivem no gueto, crianças cujos antecedentes educacionais, sociais e culturais podem diferir amplamente dos antecedentes das crianças que constituíram a amostra normativa. A seção de desempenho da Escala Wechsler de Inteligência para Crianças- Revista (Wechsler Intelligence Scale for Children-Revised WISC-R ) con¬ siste em diversos testes (em sua maioria, de manipulação, como combinar as peças de um quebra-cabeça para formar objetos) que não exigem qualquer resposta verbal da criança. O fato de a criança não ter que falar, tem encora¬ jado os psicólogos a utilizarem o teste em uma tentativa para testar crianças surdas. Levine (1974), em um estudo sobre as práticas de aplicação de testes usados por psicólogos que trabalham com surdos, relatou que o teste mais freqiientemente utilizado para se medir a inteligência das crianças surdas é a ?eção de desempenho da WISC: normas totalmente baseadas no desempenho de jovens que podem ouvir são usadas para interpretar os desempenhos de crianças surdas! A aplicação correta das normas supõe que a criança avaliada possa ouvir as instruções e tenha tido uma aculturação comparável à das crianças da amostra normativa. Diversos subtestes não-verbais das escalas de Wechsler (por exemplo, conclusão de um Desenho e Ordenação de um De¬ senho) exigem competência verbal. A Amostragem de Comportamento É Adequada Um quarto pressuposto subjacente à avaliação psicoeducacional é o de que a amostragem de comportamento é adequada com relação à quantia e represen¬ tativa em área. Todo teste é uma amostra de comportamento. Se se desejam informações sobre as habilidades matemáticas de um aluno, dá-se-lhe uma amostra de problemas matemáticos para serem resolvidos. Da mesma forma, se se quer saber a respeito de habilidades de ortografia, pede-se que o aluno soletre um n mero representativo de palavras. Quando se aplica um teste de matemática ou de ortografia, supõe-se que se tem uma amostra de itens ampla o suficiente para permitir que sejam feitas declarações referentes ao completo desenvolvimento da habilidade de um aluno na área. Poucos professores pe¬ diriam a um aluno para resolver somente dois problemas aritméticos e supo¬ riam que os resultados trariam muita informação sobre o desenvolvimento da habilidade desse aluno em aritmética. A aplicação de testes requer uma amostragem adequada de comportamento para auxiliar nos processos de tomada de decisão. rocha Highlight rocha Highlight rocha Highlight 17 Não somente se presume que a amostragem de comportamento é adequada em quantia, como também se supõe que o teste mede o que seus autores de¬ claram que mede. Presume-se que um teste de inteligência meça a inteligência e que um teste de ortografia meça as habilidades em ortografia. Um teste de adição seria uma medida deficiente da habilidade total em matemática, porque a matemática abarca muito mais que a adição. Da mesma forma, uma medida da habilidade de um aluno em adição de n meros de apenas um dígito fornece apenas uma parte de um teste da habilidade daquele aluno em adição. Não se pode confiar no nome de um teste quando se tenta definir os comportamentos amostrados por ele. Muitos testes, por exemplo, são chamados testes de leitura . No entanto, a leitura possui diversos subcomponentes, tais como reconhecimento, compreensão e análise fonética. Como se demonstra no capítulo 17, nenhum teste de leitura avalia a leitura per se” . Cada teste examina um ou mais comportamentos de leitura. O usuário dos testes de leitura ou de quaisquer testes, aliás deve ir além dos nomes dos testes, em uma tentativa de verificar os comportamentos que os testes avaliam. Na medida em que os testes utilizados para medir os desempenhos dos alunos são incompletos ou não conseguem medir o que dizem que medem, as decisões baseadas nos escores dos alunos nesses testes podem muito bem estar erradas. Observa-se o Comportamento Atual, Infere-se o Comportamento Futuro Quando se aplica um teste, observa-se apenas o desempenho da pessoa em uma amostragem de comportamento, em um determinado momento, sob determinadas condições de aplicação de teste e em uma determinada situação. Observa-se o que uma pessoa faz; pode-se ou não observar o que essa pessoa é capaz de fazer. Examina-se um n mero limitado de comportamentos e gene- raliza-se o desempenho do indivíduo em outros comportamentos semelhantes. Por exemplo, como Heathcote resolve corretamente todos os dez problemas de adição de números com um dígito, infere-se que ele poderia fazer o mesmo com números de dois dígitos. Além disso, podem ser feitos julgamentos ou prognósticos sobre o comportamento de um indivíduo no futuro. Tais prog¬ nósticos são inferências a que se podem atribuir graus variáveis de confiança. Pode-se confiar mais nas inferências feitas sobre o desempenho futuro se se checou se os outros pressupostos sobre a avaliação foram satisfeitos. Se foi aplicado um teste que é adequado em sua amostragem de comportamento e representativo em área, que está relativamente livre de erros e que foi apli¬ cado, avaliado e interpretado com precisão, usando-se, como normas, alunos que possuem antecedentes comparáveis aos dos que foram testados, então pode-se confiar razoavelmente na adequação dos dados observados. Dados rocha Highlight rocha Highlight rocha Highlight rocha Highlight 18 obtidos dessa forma podem ser usados com mais segurança ao se fazerem prognósticos do que dados obtidos sob condições em que qualquer um dos pressupostos não é satisfeito. O comportamento humano é extremamente complexo e devemos lembrar que qualquer prognóstico sobre o comportamento futuro é uma inferência. FATORES CONSIDERADOS NA AVALIAÇÃO Circunstâncias Atuais de Vida O desempenho de um indivíduo, em qualquer tarefa, deve ser compreendido à luz das circunstâncias atuais desse indivíduo. Deve-se compreender tais circunstâncias para se ter consciência do que a pessoa traz para uma tarefa. Em avaliação educacional, a saúde é uma circunstância significativa da vida diária. A saúde e o estado nutricional podem ter um importante papel no desempenho das crianças em grande número de tarefas. Crianças doentes ou desnutridas tendem a ser letárgicas, desatentas e, talvez, irritadiças. As atitudes e os valores das crianças também devem contribuir em nossa avaliação de seu desempenho. A vontade de cooperar com um adulto relati¬ vamente estranho, a vontade de fazer esforços substanciais nas tarefas e a crença na validade da tarefa ou da educação influenciam no desempenho. Finalmente, o nível de aculturação que as crianças trazem para uma tarefa é da maior importância. O conhecimento de uma criança, a aceitação dos costumes e valores sancionados socialmente, o uso da linguagem-padrão e a base de informação cultural geral ou específica influenciam o desempenho das tarefas relacionadas à escola. História do Desenvolvimento As circunstâncias da vida atual de uma pessoa são moldadas pelos eventos que constituem sua história de desenvolvimento. Acontecimentos prejudiciais, em especial, podem ter efeitos profundos no desenvolvimento físico e psi¬ cológico. Limitações físicas e sensoriais podem restringir as oportunidades de um aluno para adquirir diversas habilidades e competências. Uma história de má saúde ou nutrição pode resultar em oportunidades perdidas para ad¬ quirir diversas habilidades e competências. A história de recompensas e punições de um indivíduo molda o que essa pessoa irá realizar e como ela reagirá com outras. Em suma, não basta avaliar o nível atual de desempenho de um aluno; os avaliadores devem também compreender o que moldou esse desempenho atual. rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight 19 Fatores Extrapessoais Além da competência, características e habilidades que um aluno traz para qualquer tarefa, outros fatores afetam o processo de avaliação. A maneira pela qual uma outra pessoa interpreta ou reage a vários comportamentos ou carac¬ terísticas pode até mesmo determinar se um indivíduo será avaliado. Alguns professores, por exemplo, não compreendem que certa porcentagem de agressão física é típica de crianças pequenas ou que a agressão verbal é típica de alunos mais velhos. Tais professores podem encaminhar crianças normalmente agres¬ sivas para avaliação porque interpretaram a agressão como um sintoma de algum problema subjacente. A orientação teórica do diagnosticador (a pessoa responsável pela reali¬ zação da avaliação) também tem um importante papel no processo de avaliação. Os antecedentes e o treinamento dos diagnosticadores podem predispô-los a procurar certos tipos de patologias. Assim como os freudianos podem procurar conflitos não resolvidos, enquanto os behavioristas buscarão os antecedentes e as consequências de determinados comportamentos, os diagnosticadores podem deixar que sua orientação teórica influencie sua interpretação de determinada informação. Enfim, as condições sob as quais um aluno é observado ou as condições sob as quais determinados comportamentos são descobertos podem influenciar o desempenho desse aluno. Por exemplo, o nível de linguagem utilizado em uma pergunta ou a presença de estímulos competitivos no ambiente imediato podem afetar as respostas de um aluno. Interpretação do Desempenho Depois que o comportamento e as características de um indivíduo forem con¬ siderados à luz das circunstâncias atuais de vida, da história de desenvolvimento e dos fatores extrapessoais que podem influenciar o desempenho, a informação é sintetizada. Isso, freqiientemente, resulta na classificação e na rotulagem do indivíduo avaliado. O avaliador chega à opinião de que, quando tudo é con¬ siderado, a criança “ encaixa-se” em determinada categoria. Uma criança pode, por exemplo, ser julgada como deficiente mental, emocionalmente perturbada, incapaz de aprendizagem, educacionalmente deficiente, cultural ou socialmente prejudicada, atrasada, normal, superdotada ou um dos melhores alunos do grupo de leitura da escola. Os avaliadores, especialmente quando apontam classificações negativas, tentam, com frequência, atribuir uma causa à situação do indivíduo. A clas¬ sificação de acordo com a causa (etiologia) é comum em medicina, mas me¬ nos comum em educação e psicologia. Em alguns casos, a causa da condição é altamente provável. Por exemplo, Kevin pode ter se desenvolvido nor- rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight 20 malmente até sofrer um grave traumatismo craniano, após o que seu desem¬ penho e desenvolvimento são medidos como retardados. Contudo, na maioria dos casos, as causas são ilusórias e especulativas. Prognose Todas as avaliações e classificações dos alunos contêm uma prognose ex¬ plícita ou implícita, uma previsão do desempenho futuro. Um prognóstico pode ser oferecido a alunos tanto em seu ambiente e circunstâncias de vida normais, como em alguns ambientes terapêuticos ou corretivos. Por exemplo: Se Rachel for deixada em seu atual ambiente educacional, ela provavelmente apresentará um atraso cada vez maior em relação às outras crianças e desen¬ volverá comportamentos problemáticos. Se for colocada em um ambiente onde receberá uma atenção mais individualizada, fará mais progresso, social e academicamente . Tais prognoses são feitas, espera-se, com base mais em dados concretos que em especulações. TIPOS DE INFORMAÇÃO DE AVALIAÇÃO Embora este livro se refira, principalmente, aos testes e à sua aplicação, é sempre bom lembrar que um teste é apenas uma das diversas técnicas ou procedimentos de avaliação disponíveis para se reunirem informações. A Figura 2.1 mostra que há seis classes gerais de fontes de informação para o diag¬ nóstico; a classificação exibida na figura depende do momento em que a informação é coletada (atual ou histórico) e de como a informação é coletada (através de observação, testes ou opiniões). Informação Atual vs. Histórica A informação diagnóstica pode ser categorizada de acordo com a atualidade da informação: informações que descrevem como uma pessoa está agindo no presente e informações que descrevem como essa pessoa agiu no passado. Obviamente, a distinção entre a informação atual e a histórica é obscura, e o ponto em que a informação atual se toma histórica depende, em parte, de determinado fato ou trecho de informação. Por exemplo, se Johnny teve seu apêndice removido há três anos, sabe-se que, atualmente, ele não tem apêndice. Por outro lado, se Jane, de 9 anos, pesava 27 quilos há três anos, não se pode concluir que ela apresenta o mesmo peso atualmente. Há diversas vantagens em se ter e usar a informação atual. A primeira é a mais óbvia: a informação atual descreve os atuais comportamentos e carac- terísticas de uma pessoa. Oferece também duas vantagens mais sutis: (1) o rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight rocha Highlight TIPOS DE INFORMA ÇÕ ES 21 MOMENTO EM QUE É RECOLHIDA A INFORMAÇÃO ATUAL HISTÓRICO Observações Testes Opiniões FIGURA 2.1 Fontes de informação de diagnóstico classificadas de acordo com o tipo de informações e momento em que a informação é coletada. diagnosticador pode selecionar a informação a ser coletada e (2) a informação pode ser verificada. Contudo, a informação atual, por si só, não pode fornecer um quadro completo do atual nível de funcionamento de uma pessoa, porque os antecedentes desse funcionamento não são considerados. Eis a vantagem da informação histórica. Os diagnosticadores escolares não podem voltar no tempo para observar características, comportamentos e situações anteriores. O especialista em diagnóstico que deseja incorporar a história de um aluno ao procedimento de avaliação deve basear-se na informação coletada anteriormente ou na memória de indivíduos que conheceram o aluno. A informação histórica apresenta quatro limitações a que devem estar atentos os diagnosticadores. Em primeiro lugar, o especialista em diagnóstico não pode controlar que tipo de informação foi coletado no passado; pode ser que trechos cruciais de informação nunca tenham sido coletados. Em segundo Contagens da frequência de ocorrência de um determinado comportamento Antecedentes de comportamento Incidentes críticos Resultados de um teste de inteligência aplicado durante a avaliação Resultados do teste de ortografia dado pelo professor Avaliações dos pais de como a criança relaciona-se com a família, os vizinhos, etc. Escalas de classificação elaboradas por professores, assistentes sociais, etc. A razão do professor para o encaminhamento Peso ao nascer Registros anedóticos Observações feitas pelo professor do ano anterior Resultados de uma bateria de testes de rendimentos padronizados dada no final do ano anterior Diagnósticos médicos, psicológicos ou educacion¬ ais anteriores Fichas pessoais anteriores Rememoração dos pais so¬ bre a história do desenvol¬ vimento, doenças não diag¬ nosticadas da infância, etc. rocha Highlight rocha Highlight rocha Highlight 22 lugar, a informação passada é difícil e, por vezes, impossível de ser verifi¬ cada. Em terceiro, as condições sob as quais a informação foi coletada são, com frequência, difíceis de serem avaliadas. Em quarto, as observações rememoradas podem não ser tão confiáveis como as observações atuais. Tipos de Informação A informação diagnóstica pode também ser categorizada de acordo com o tipo de informação: observações, testes e opiniões. Cada um desses três tipos de informação apresenta tanto vantagens como desvantagens. Cada tipo pode ser coletado por um diagnosticador (neste caso, os dados tomam-se informação direta) ou por uma outra pessoa (informação indireta ). Os especialistas em diagnóstico não têm tempo, competência ou oportunidade para coletar todos os tipos possíveis de informação. Nos casos em que se faz necessária a infor¬ mação especializada, eles devem basear-se nas observações, testes e opiniões de outros. Se um comportamento ocorre com pouca frequência ou apenas fora da escola, o diagnosticador pode ter que se basear nas observações e opiniões de outras pessoas que têm mais oportunidade de coletar a informação: os pais, talvez, ou os responsáveis pela custódia em meios institucionais. Por exemplo, o fato de urinar na cama não acontece na escola, mas poucos especialistas questionariam a veracidade dos relatos dos pais sobre isso. Além disso, se uma criança apresenta uma enurese intermitente, o diagnosticador teria que passar diversas noites na casa dessa criança a fim de observar o compor¬ tamento diretamente. Em tais casos, normalmente, a informação indireta é adequada. As observações podem fornecer uma informação altamente precisa, de¬ talhada e verificável não somente sobre a pessoa que está sendo avaliada, mas também sobre os contextos em que as observações estão sendo feitas. Há dois tipos de observações: não-sistemática e sistemática. Na observação não-sis- temática, o especialista simplesmente observa um indivíduo em seu ambiente e toma nota dos comportamentos, características e interações pessoais que pareçam significativos. A observação não-sistemática tende a ser anedótica e subjetiva. Na observação sistemática, o especialista decide observar um ou mais comportamentos. O observador especifica ou define os comportamentos a serem observados e, então, normalmente conta ou mede, de alguma forma, a frequência, a duração, a magnitude ou a latência dos comportamentos. A maior desvantagem da observação sistemática é que ela pode fazer com que sejam ignorados outros comportamentos e características importantes. Há duas dificuldades principais na coleta de dados através da observação sistemática e não-sistemática. A primeira é que essa observação consome muito tempo; o diagnosticador paga a informação altamente precisa e específica fornecida pela observação com a impossibilidade de coletar outras informa¬ ções. O segundo problema é que a própria presença de um observador pode rocha Highlight rocha Highlight 23 distorcer ou, de certa forma, alterar tanto a situação que o comportamento de um indivíduo observado também se alterará. Os testes são um conjunto predeterminado de perguntas ou tarefas para as quais se esperam tipos predeterminados de respostas comportamentais. Os testes são particularmente úteis porque permitem que as tarefas e perguntas sejam apresentadas exatamente da mesma maneira para cada pessoa testada. Como o examinador obtém e julga o comportamento de um modo predeter¬ minado e consistente, os desempenhos das diversas pessoas testadas podem ser comparados, não importando quem aplicou o teste. Portanto, os testes tendem a tornar consistentes muitos fatores extrapessoais na avaliação de todas as pessoas testadas. Basicamente, dois tipos de informação, quantitativa e qualitativa, podem ser obtidas através da aplicação de um teste. Os dados quantitativos referem-se aos escores reais obtidos no teste. Exemplos de dados quantitativos incluem afirmações como: Lee obteve um escore de 80 em seu teste de matemática ou “ Henry teve um percentual de 83 em uma medida de aptidão escolástica . A informação qualitativa consiste em observações não- sistemática feitas enquanto uma criança é testada, e nos diz como essa criança obteve o escore. Por exemplo, para obter uma escore de 80 em seu teste de matemática, Lee deve ter resolvido todos os problemas de adição e subtração, à exceção daqueles que requeriam um reagrupamento. Henry deve ter tido um desempenho melhor nas medidas de sua habilidade para definir palavras e deve ter demonstrado certa dificuldade para compreender afirmações verbais. Quando se utilizam testes na avaliação, não basta simplesmente saber os escores que um aluno obteve em um determinado teste; é importante saber como o aluno obteve tais escores. As opiniões e avaliações feitas por outras pessoas podem desempenhar um importante papel na avaliação. Em casos em que um diagnosticador não possui a competência necessária para emitir uma opinião, as opiniões daqueles que possuem tal competência são essenciais. Os especialistas em diagnóstico pro¬ curam outros profissionais para complementar suas próprias habilidades e seu preparo. Dessa forma, encaminhar um aluno a vários especialistas (especia¬ listas em audição e em visão, professores de leitura etc.) é uma prática comum e conveniente em avaliação. As opiniões de professores, orientadores, psicólo¬ gos e quaisquer outros funcionários da escola podem ser teis em determina¬ das circunstâncias. A perícia para se emitirem opiniões depende, freqiiente- mente, da familiaridade com o aluno que está sendo avaliado. Os professores regularmente expressam opiniões profissionais; por exemplo, as notas do boletim escolar representam a opinião do professor sobre o progresso aca¬ dêmico de um aluno durante o período de tempo assinalado; os encaminha¬ mentos para avaliação psicológica representam um tipo diferente de opinião baseado na experiência com muitos alunos e nas observações de um aluno em especial. As opiniões representam tanto os melhores como os piores dados de avaliação. As opiniões feitas por indivíduos conscienciosos, capazes e objeti¬ vos podem ser um auxílio incalculável no processo de avaliação. Opiniões 24 imprecisas, preconceituosas e subjetivas podem ser, no melhor dos casos, enganosas e, no pior, nocivas. Finalmente, toda avaliação requer, em ltima instância, opiniões. Integração da Informação de Avaliação Para vermos como os vários tipos de informação podem entrar em jogo em uma avaliação, consideremos o exemplo seguinte. Mary, tem 6 anos, está atrasada em leitura, segundo o relato de sua professora (opinião atual). A professora também declara que Mary não escuta, não presta atenção e tampouco associa sons com letras (observações atuais). Uma inspeção nos registros do jardim de infância de Mary indica que ela esteve ausente durante trinta e um dias em janeiro e fevereiro (observação passada). Os escores de Mary no teste de destreza em leitura, aplicado em junho, no jardim de infância, foram sufi¬ cientemente elevados para que a professora recomendasse sua promoção para o primeiro ano (opinião passada). Uma entrevista com os pais de Mary revelou que ela tem, em sua história, o tratamento de infecções do ouvido médio (observações e opiniões passadas) durante os invernos. De acordo com seus pais, ela atualmente tem uma infecção de ouvido que está sendo tratada pelo médico da família (observação atual). Ao reunir todas essas informações, as autoridades da escola emitem a hipótese de que Mary está tendo problemas auditivos. Obtém-se um exame de audição (teste atual), que indica que Mary está, atualmente, sofrendo de uma perda moderada de audição, de magnitude suficiente para afetar, de maneira adversa, seu progresso em leitura (opinião atual). Com a informação atual e com os antecedentes, é possível, agora, avaliar (compreender e interpretar) o comportamento de Mary em sala de aula. Com tratamento médico para seu problema de ouvido e com alguma intervenção na sala de aula por parte da professora, Mary poderá ter um melhor desempenho na escola. Avaliação Formal vs. Informal Cada vez mais, os educadores estão advogando a avaliação informal em detri¬ mento da formal, especialmente na tomada de decisões educacionais e na avaliação do progresso do aluno. Quando tal distinção é feita, qualquer avaliação que envolve a coleta de dados através de algo que não seja um teste baseado em uma norma (teste padronizado) é geralmente considerada como avaliação informal. A coleta de informação através da observação é, freqiientemente, encarada como uma avaliação informal, bem como a informação reunida através de entrevistas e por meio de testes elaborados por professores. Durante a década passada, houve um aumento significativo na avaliação baseada no currículo. Esta inclui (1) a observação direta e a análise do am- 25 biente de aprendizagem, (2) a análise dos processos utilizados por alunos na abordagem das tarefas, (3) o exame da produção dos alunos e (4) o controle e planejamento de tarefas para os alunos. Dá-se relevância à avaliação do desempenho contínuo de um aluno dentro do currículo existente. A observação do ambiente de aprendizagem envolve o exame dos tipos de materiais educacionais que estão sendo utilizados com os alunos, bem como dos fundamentos para a seleção dos materiais. As técnicas específicas de observação incluem a análise sistemática do modo como a instrução é organi¬ zada e seqiienciada, dando especial atenção às possíveis armadilhas existentes na organização educacional; envolvem também o exame da adequação das maneiras através das quais a instrução está sendo apresentada (leitura, livro de exercícios, instrução programada etc.); e o período de tempo que deve ser alocado para a instrução, bem como até que ponto o aluno está ativamente envolvido na resposta ao conteúdo acadêmico. Também fazem parte da avaliação baseada no currículo a análise das maneiras pelas quais os alunos abordam tarefas, o exame do comportamento do aluno, da atenção que ele dispensa às tarefas e até que ponto ele lê e segue instruções. Os professores que seguem a avaliação baseada no currículo examinam cuidadosamente a produção dos alunos numa tentativa de analisar os tipos específicos de erros cometidos por alunos. Por exemplo, os profes¬ sores podem examinar os erros contidos nos exercícios de matemática com o intuito de determinar padrões de dificuldades. A avaliação baseada no currículo é freqiientemente chamada de ensino diagnóstico, porque os profes¬ sores ou os especialistas em diagnóstico têm a oportunidade de modificar diversos aspectos da instrução e estudar o impacto de tais adaptações no desempenho do aluno. Progressivamente, os funcionários das escolas têm usado os tipos de estratégias de avaliação informal especificados acima. Nesta obra, decidimos nos concentrar na avaliação formal. Em nossa opinião, o tópico de avaliação informal requer um tratamento adequado em um livro separado. ABORDAGENS PARA A AVALIAÇÃO Há três abordagens diferentes para avaliar alunos e que diferem, principalmente, no que é avaliado e onde o avaliador inicia a avaliação. Cada abordagem é descrita a seguir. Avaliação do Aluno Mais freqiientemente, quando os alunos são encaminhados para avaliação porque estão enfrentando problemas acadêmicos ou de comportamento, os funcionários da escola utilizam uma abordagem em que avaliam o aluno. Este 26 tipo de avaliação faz a pergunta O que está errado com o aluno? . Os testes são aplicados em uma tentativa de identificar as deficiências ou incapacidades inerentes ao aluno, ou de encontrar pontos fracos ou fatores no desenvolvimento de habilidades específicas. Como se pode perceber, a avaliação do aluno é a abordagem mais freqiien- temente utilizada e também é a mais ensinada nos cursos de magistério e universitários. Esta abordagem é baseada em diversos pressupostos. Presume- se que os alunos que enfrentam dificuldades acadêmicas apresentam con¬ dições internas (chamadas déficits, distúrbios, incapacidades ou disfunções ) que causam suas dificuldades acadêmicas. Presume-se que os testes podem e devem ser utilizados na identificação dos déficits dos alunos, que os déficits podem ser identificados de uma maneira válida e confiável e que podem ser selecionadas abordagens educacionais baseadas no desempenho do aluno nos testes. Dessa forma, os especialistas em educação se dedicam à avaliação de habilidades de percepção, perceptivo-motoras, psicolingiiísticas e outras, e tentam corrigir tais habilidades. A abordagem que inicia a avaliação através do diagnóstico do aluno tem sido criticada contínua e intensamente. Demonstrou-se que os pressupostos subjacentes à abordagem não podem ser satisfeitos (Ysseldyke & Salvia, 1974), que a abordagem é tecnicamente inadequada (Ysseldyke & Marston, 1982) e que raramente leva a uma instrução afetiva (Alter & Jenkins, 1979; Engelmann, Granzin & Severson, 1979). Diagnóstico da Instrução Engelmann, Granzin e Severson (1979) recomendam que a avaliação seja iniciada com a diagnose da instrução, cujo propósito é determinar aspectos da instrução que são inadequados, descobrir, de maneira precisa, como eles são inadequados e sugerir o que deve ser feito para corrigir a inadequação” (p. 361). Em tal abordagem, deve-se iniciar a avaliação com a pergunta: Em que medida os problemas do aluno são causados por fraca instrução?” Este tipo de diagnose consiste na análise sistemática da instrução e da adequação desta ao aluno. Inclui o envolvimento em atividades descritas an- teriormente na discussão sobre a avaliação baseada no currículo: observação do ambiente de aprendizagem, avaliação das maneiras através das quais os alunos abordam tarefas, exame da produção da instrução e ensino diagnóstico. Avaliação do Ambiente Educacional Até recentemente, a maioria das atividades de avaliação nos meios escolares consistia em tentativas de se avaliar o aluno ou de se diagnosticar a instrução. Entretanto, os funcionários das escolas têm, freqiientemente, dificuldade para 27 desenvolver as recomendações educacionais baseados apenas na informação sobre as características dos alunos. É óbvio, também, que a instrução envolve mais do que o currículo. Ela é uma atividade complexa e seus resultados dependem de uma complexa interação de muitos fatores. Apenas alguns desses fatores estão relacionados às características do aluno ou são específicos das tarefas instrucionais. O reconhecimento desse fato tem levado a tentativas de se avaliar a natureza qualitativa dos meios educacionais dos alunos. A avaliação do ambiente educacional consiste em se analisar sistema¬ ticamente em que medida esses fatores, que produzem diferenças na aprendi¬ zagem, estão presentes na instrução que os alunos recebem. Por exemplo, há um consenso sobre o fato de que é necessário que estejam presentes amplas quantias de duas espécies de práticas controlada (guiada) e independente (individual) para que o aluno apresente um rendimento ideal. Da mesma forma é óbvio que os alunos aprendem mais quando recebem um retomo corretivo de seu trabalho. Os pesquisadores que coletam dados sobre a quali¬ dade dos ambientes acadêmicos dos alunos analisam diversos fatores para saber até que ponto é dada, aos alunos, oportunidade adequada para praticar com materiais apropriados, em que medida a repetição e a prática prosseguem até que as habilidades tomem-se automáticas, se os alunos recebem uma informação imediata e específica sobre seu desempenho ou comportamento e se são ou não corrigidos quando cometem erros. CONSIDERAÇÕES NA SELEÇÃO DE TESTES Quem Deve Ser Testado? Ao responder a pergunta Quem deve ser testado? devemos considerar dois pontos importantes. Em primeiro lugar, devemos decidir se queremos testar um nico aluno ou um grupo de alunos. Em segundo lugar, devemos deter¬ minar em que medida o aluno (ou qualquer aluno do grupo) demonstra limi¬ tações especiais que devam ser consideradas na aplicação do teste. Testes Coletivos vs. Individuais A distinção entre um teste coletivo e um teste individual é, ao mesmo tempo, óbvia e sutil. Os testes coletivos podem ser aplicados a uma pessoa ou a diversas pessoas simultaneamente; os testes individuais devem ser administra¬ dos a apenas uma pessoa por vez. Qualquer teste coletivo pode ser aplicado a um indivíduo; nenhum teste individual deve ser aplicado a mais de uma pessoa ao mesmo tempo. Esta é uma distinção óbvia. No entanto, há diversas distinções sutis. 28 Em um teste individual, as perguntas e instruções são dadas, em geral, oralmente por um examinador que também observa as respostas do indivíduo e, em muitos casos, registra-as. O examinador pode controlar o tempo e o ritmo do teste e, freqiientemente, pode refazer ou esclarecer perguntas, bem como sondar respostas a fim de obter um melhor desempenho. Se um aluno que está sendo submetido a um teste apresentar cansaço, o examinador pode interromper ou finalizar o teste. Se o aluno se confundir no teste, o examina¬ dor pode auxiliá-lo; se ele demorar demais para responder, o examinador pode apressá-lo; se lhe faltar confiança, o examinador pode encorajá-lo. Os testes individuais normalmente permitem que o examinador estimule os melhores esforços da pessoa testada e reúna uma considerável quantia de informação qualitativa. Dessa forma, o examinador pode inferir pontos fortes e fracos tanto em termos de informação quantitativa como qualitativa. Com um teste coletivo, o examinador pode fornecer instruções orais para as crianças pequenas, mas para as crianças que estão acima da quarta série, as intruções são normalmente escritas. Os alunos escrevem ou assinalam suas próprias respostas e o examinador deve monitorar o progresso deles simulta¬ neamente. Em geral, o examinador não pode reformular, sondar ou propiciar respostas. Mesmo quando um teste coletivo é dado a um único aluno, é muito difícil, senão impossível, obter a informação qualitativa. A escolha entre um teste individual e um coletivo é determinada, em parte, pela decisão a ser tomada e pela eficiência com que esse objetivo pode ser atingido. Basicamente, quando testamos com vistas à avaliação do programa, triagem e alguns tipos de planejamento curricular (por exemplo, para seguir alunos classificados em grupos segundo as habilidades), é mais apropriada a utilização de testes coletivos. Os testes individuais poderiam ser utilizados, mas o tempo e os gastos não se jústificariam em termos da informação dese¬ jada. Quando planejamos programas individuais, os testes individuais são mais apropriados. Normalmente, quando um aluno deve ser colocado sob um programa de educação especial, a lei requer que um teste seja aplicado indi¬ vidualmente. Limitações e Considerações Especiais Um determinado aluno pode ter limitações especiais que fazem com que um teste coletivo seja inadequado. Como foi discutido anteriormente, a maioria dos testes aplicados em grupo é limitado em sua aplicabilidade devido à maneira como suas perguntas são apresentadas (ou seja, requerem que as pessoas testadas sejam capazes de ler) e à forma como as respostas devem ser dadas (geralmente, por escrito ou com a assinalação de um x ). O senso comum nos diz que, se um aluno não pode ler as instruções ou escrever as respostas, um teste que requeira tais habilidades é inadequado. Em tais casos, o teste mede muito mais a incapacidade para ler instruções ou escrever res- 29 postas do que a capacidade ou habilidade no conteúdo do teste. Uma criança sem braços pode saber o conteúdo do teste, mas pode não responder a nenhu¬ ma pergunta porque não pode escrever. Da mesma forma, crianças mudas ou com sérios problemas de linguagem podem saber as respostas de um teste, mas ser incapazes ou não querer responder mesmo ao teste individual aplicado da forma mais sensível possível, mas que requer respostas orais. Crianças com deficiências físicas ou sensoriais podem ter um desempenho mais lento do que crianças normais simplesmente devido a suas deficiências. Um teste que concede pontos para a velocidade, assim como para a precisão da resposta não seria um teste válido sobre o domínio que tais crianças têm do conteúdo. Um outro problema é a relação entre o nível funcional e a maturidade so¬ cial de uma pessoa. Frequentemente, avaliam-se indivíduos mais velhos com níveis relativamente baixos de desenvolvimento de habilidades. Em tais casos, o examinador deve ter o cuidado de selecionar materiais de teste que reflitam a maturidade social da pessoa a ser testada. Um adolescente que está começando a aprender a ler pode ressentir-se com o uso de materiais de teste elaborados para crianças de 6 anos. A utilização de materiais inadequados em termos da maturidade social de um indivíduo mais velho pode reduzir ou eliminar o interesse e, dessa forma, comprometer a exatidão dos resultados do teste. Que Comportamentos Devem Ser Testados? Todo teste é uma amostra de comportamento. Ao decidir que comportamentos devem ser testados, o examinador deve considerar três subquestões: Que exigências de estímulo e resposta serão feitas? Que domínio (conteúdo) será medido? Quantos domínios serão testados? Exigências de Estímulo e Resposta Um teste, ou um item individual de um teste mede a habilidade de um in¬ divíduo para receber um estímulo e, então, fornecer uma resposta. Tais exi¬ gências estão presentes em todos os testes. A habilidade no conteúdo de um teste não pode ser medida de maneira precisa se as exigências de estímulo e resposta de uma pergunta estiverem além das capacidades da pessoa exami¬ nada. Como foi assinalado anteriormente, os testes podem ser aplicados oral ou visualmente: um examinador pode mostrar materiais escritos a um aluno enquanto simultaneamente os lê. Há poucas razões pelas quais um teste não possa ser aplicado de maneira tátil também, de modo que alunos com limi¬ tações especiais possam compreender suas exigências básicas de estímulo. As exigências de respostas também podem variar. As instruções do teste podem requerer uma resposta oral sim ou não ou uma definição ou elaboração orais. Os testes podem também requerer respostas escritas que variam desde 30 um simples sim-não, verdadeiro-falso ou respostas de m ltipla escolha até um elaborado ensaio escrito. O examinador deve ser sensível a qualquer limitação que um aluno possa apresentar. As limitações são especialmente importantes com relação às exi¬ gências de estímulo e resposta dos testes. O examinador deve também ter intenções bem específicas ao medir uma determinada habilidade ou caracterís- tica. Deve-se considerar o modo de se medir, assim como o que vai ser medido. Por exemplo, nem todos os testes de ortografia são iguais. Escrever palavras a partir de um ditado é um tipo de teste de ortografia diferente de se reconhecer uma palavra grifada correta ou incorretamente em um formato de mútipla escolha. O Domínio O domínio do conteúdo que é testado é o que geralmente se denomina tipo de teste. Há muitos tipos de teste, muitos traços ou características que podem ser medidos: inteligência, personalidade, aptidão, interesses, desenvolvimento perceptivo-motor, habilidade linguística, etc. A maioria dos traços ou caracte¬ rísticas gerais pode subdividir-se. Por exemplo, a inteligência pode ser di¬ vidida em habilidades de desempenho e habilidades verbais, ou fracionada em até 120 habilidades diferentes (Guilford,1967). Há também muitas habilidades e áreas do conhecimento que podem ser medidas: leituras, matemática, estu¬ dos sociais e anatomia são apenas algumas delas. Alguns testes foram con¬ cebidos para medir o desenvolvimento de habilidades em uma área de con¬ teúdo específica (por exemplo, leitura), enquanto outros testes medem o de¬ senvolvimento de habilidades em diversas áreas diferentes. Os primeiros são conhecidos como testes de habilidade individual e os outros são baterias de habilidades múltiplas. Muitas vezes, um item de um teste presta-se facilmente para apenas um domínio. Teríamos problemas para utilizar a pergunta Você gosta de si mes¬ mo? em um teste que não fosse de personalidade. Contudo, geralmente, determinados itens de um teste são identificados com determinados domínios, dependendo da idade e da experiência do aluno. Por exemplo, a pergunta “ Quanto são 3 mais 5?” pode ser utilizada para medir diversos domínios diferentes, dependendo do aluno em questão. Se uma criança acabou de receber instrução sistemática a respeito da adição de números de um dígito, a pergunta seria apropriada em um teste de rendimento. Se a pergunta fosse feita a uma criança que não recebeu instrução formal em adição (uma criança de 4 anos, por exemplo), a pergunta seria apropriada em um teste de inteligência. Se a mesma pergunta fosse feita a uma criança que tivesse recebido, por diversos anos, instrução sistemática, ela seria apropriada em um teste de aptidão matemática. Em suma, o tipo de teste em que é colocado um item depende mais das características da pessoa que deve ser testada ou do uso que se pretende fazer do teste do que do conteúdo desse item. 31 Quais São os Dados Interpretativos Desejados? O processo para decidir que dados interpretativos o examinador quer obter inclui, necessariamente, a resposta a diversas subquestões: (1) 0 examinador está interessado no atual nível de domínio do aluno ou em um índice da posição relativa do aluno? Em outras palavras, o examinador usará uma avaliação baseada em critérios ou em normas? (2) O examinador está interes¬ sado no desempenho máximo do aluno ou no nível de desempenho que o aluno pode atingir em um determinado período de tempo? Em outras palavras, o examinador utilizará testes de resistência (testes sem limite de tempo) ou testes de velocidade (testes cronometrados)? Testes Baseados em Normas vs. Testes Baseados em Critérios A maioria dos testes não-educacionais são dispositivos baseados em normas, que comparam o desempenho de um indivíduo ao desempenho de seus colegas. Na avaliação baseada em normas, a aprendizagem de um determinado conteúdo ou de determinadas habilidades só é importante na medida em que a aprendizagem diferencial permite que o examinador classifique os indivíduos em ordem, desde os que aprenderam muitas habilidades até os que aprenderam poucas. A ênfase é dada muito mais à posição relativa dos indivíduos do que ao domínio absoluto do conteúdo. Os testes baseados em normas são de dois tipos: escalas de pontos e escalas de idade. Tais escalas diferem em sua construção. As escalas de idade são menos comuns atualmente do que no passado, devido a limitações estatísticas e conceituais. As escalas de idade são elaboradas, através da atribuição de graus aos itens de teste, em termos de porcentagens das crianças de diferentes idades que respondem corretamente a cada item. Por exemplo, um item deve ser colocado no nível de 6 anos de 25% das crianças de cinco anos, 50% das crianças de seis anos e 75% das crianças de sete anos responderam-no correta¬ mente. Quando uma pergunta de um teste está corretamente colocada em uma escala de idade, as crianças mais novas falham nesse item e as mais velhas o resolvem. As limitações estatísticas e conceituais das escalas de idade são discutidas no capítulo 5, nas seções que tratam dos escores e quocientes de desenvolvimento. Devemos advertir o leitor para o fato de que alguns testes, tais como a revisão de 1972 da Stanford-Binet, parecem ser escalas de idade, mas são considerados, mais corretamente, como escalas de pontos (comparar Salvia, Ysseldyke & Lee, 1975). Uma escala de pontos é construída através da seleção e ordenação dos itens de diferentes níveis de dificuldade. Os níveis de dificuldade não são asso¬ ciados com as idades. Nas escalas de pontos, as respostas corretas (isto é, os pontos) são somadas e o escore total bruto é transformado em várias escalas derivadas (ver capítulo 5). 32 Normalmente, os dispositivos baseados em normas são concebidos para fazer apenas uma coisa: separar os desempenhos dos indivíduos de modo que haja uma distribuição de escores. Eles permitem que o examinador discrimine entre os desempenhos de certo n mero de indivíduos e interprete como o desempenho de uma pessoa pode ser comparado com o de outros indivíduos com características semelhantes. Na aplicação de testes baseados em normas, o desempenho de uma pessoa em um teste é medido com relação ou com referência aos desempenhos de outros indivíduos que, presumivelmente, são semelhantes ao dessa pessoa. Os testes baseados em normas são padronizados a partir de grupos de indivíduos e obtêm-se desempenhos típicos para alunos de certas idades ou de certas séries. O escore bruto que um aluno consegue em um teste é comparado aos escores obtidos por outros alunos e utiliza-se um escore transformado (por exemplo, uma classe de percentil) para expressar a posição de determinado aluno no grupo. Todos os testes baseados em normas e critérios são objetivos. Os testes objetivos são os que possuem respostas e padrões predeterminados para qualificar uma resposta. São objetivos no sentido de que atitudes, opiniões e idiossincrasias do examinador não afetam os escores; dois examinadores quaisquer atribuiriam, a uma resposta, o mesmo escore1. A atribuição objetiva de escores não implica uma pontuação justa ou justificável; implica somen¬ te critérios predeterminados e procedimentos padronizados de qualificação. Suponha que um examinador mostre a uma criança fotografias de um navio, um automóvel, o vagão de um trem de passageiros e um ônibus e, então, lhe pergunte “ Qual é diferente?” A resposta considerada adequada (a resposta objetiva) é navio; o navio é o único transporte aquático. Se a criança racioci¬ nar que somente um automóvel é um meio de transporte particular e der a resposta carro, tal resposta será qualificada como incorreta. Da mesma forma, se a criança raciocinar que o vagão do trem de pas¬ sageiros é o nico veículo que não tem propulsão própria ou o único que requer trilhos e responder de acordo com esse raciocínio, a resposta será qualificada como incorreta. “ Ser justo” não tem nada a ver com uma atribuição objetiva de escores. Os dispositivos baseados em normas apresentam uma vantagem em relação aos baseados em critérios quando o objetivo do teste é a triagem ou a ava¬ liação do programa: fornecem um meio de se comparar o desempenho de um aluno ao desempenho obtido por outros. Assim, com muita frequência, as decisões de posicionamento são tomadas após a aplicação de dispositivos baseados em normas, que possibilitam que a equipe encarregada do posicio- 1. Um teste subjetivo, em contrapartida, é um teste para o qual uma resposta predeterminada não existe. Por conseguinte, os julgamentos subjetivos, as atitudes e as opiniões do examinador podem afetar a atribuição do escore. Muitas pessoas, erroneamente, definem o teste em que se deve escrever um ensaio como um teste subjetivo. Tal teste poderia ser objetivo se houvesse critérios explícitos e predeterminados para as respostas corretas; então, à mesma resposta, seria dado o mesmo escore por dois ou mais examinadores. 33 namento de um aluno observe onde este se situa em relação aos outros alunos. De fato, na maioria dos estados, a avaliação com testes baseados em normas deve ocorrer em qualquer decisão de posicionamento. Além disso, os testes baseados em normas são teis, na triagem de classes inteiras de alunos, para Identificar aqueles que demonstram tipos particulares de dificuldades. Con¬ tudo, os testes baseados em normas possuem muitas limitações. Os testes baseados em critérios representam um desenvolvimento recente na educação e na psicologia behaviorista. Mais do que indicar a posição relativa de uma pessoa no desenvolvimento de habilidades, os testes baseados em critérios medem o desenvolvimento de habilidades particulares de uma pessoa em termos de níveis absolutos de domínio. Assim sendo, tais testes fornecem respostas a perguntas específicas, tais como Maureen escreve a palavra cachorro corretamente? . Quando os testes são aplicados com o objetivo de auxiliar o professor a planejar programas adequados às crianças, recomendam-se os testes baseados em critérios. Ao planejar um programa para um único aluno, o professor deve preocupar-se mais em identificar as habilidades específicas que o aluno tem ou não do que em saber como o aluno pode comparar-se com outros. Na medida baseada em critérios, a ênfase é dada à avaliação de comportamentos específicos e relevantes que tenham o aluno como um indivíduo, em vez de simplesmente fornecer índices numéricos sobre a posição do aluno em uma variedade de contínuos subtestes. Os itens dos testes baseados em critérios estão, com frequência,
Compartilhar