Buscar

CAED; AMAZONAS Guia de estudos - processo de formação de profissionais da educação ública

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 154 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 154 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 154 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

2012
Guia de estudos - 2012
processo de formação de profissionais da educação pública
© 2012 Centro de Políticas Públicas e Avaliação da Educação
Nenhuma parte desta publicação pode ser reproduzida por qualquer meio, sem a prévia autorização deste órgão/entidade.
Projeto Gráfico: Hamilton Ferreira
Diagramação: Henrique de Abreu Oliveira Bedetti
Revisão: Daniela Werneck Ladeira Réche
Reitor da Universidade Federal de Juiz de Fora Henrique Duque de Miranda Chaves Filho
Vice-Reitor José Luiz Rezende Pereira
Faculdade de Educação Diva Chaves Sarmento - Diretora
Fadepe Hélio Antônio da Silva - Presidente
Coordenação Geral Lina Kátia Mesquita Oliveira
Coordenação de Planejamento e Controle Manuel Fernando Palácios da Cunha e Melo
Coordenação da Unidade de Formação Beatriz de Basto Teixeira
Governador do Estado do Amazonas Omar José Abdel Aziz
Vice-Governador José Melo de Oliveira
Secretário de Estado da Educação e Qualidade do Ensino Gedeão Timóteo Amorim
Secretária Executiva Sirlei Alves Ferreira Henrique
Secretária Executiva Adjunta da Capital Ana Maria da Silva Falcão
Secretária Executiva Adjunta do Interior Magaly Portela Régis
Departamento de Planejamento e Gestão Financeira Maria Neblina Marães
Gerente de Avaliação e Desempenho Jane Bete Nunes Rodrigues
Gerente de Pesquisa e Estatística Silvana da Silva Morais
Guia de Estudos
AVALIAÇÃO EDUCACIONAL
TEXTO 1
AvAliAção EducAcionAl: umA brEvE ExplicAção
Especialistas do CAEd/UFJF
TEXTO 2 
AvAliAção EducAcionAl Em GrAndE EscAlA: A ExpEriênciA brAsilEirA 
Luís Antônio Fajardo Pontes
TEXTO 3
indicAdorEs sociAis E EducAcionAis
Especialistas do CAEd/UFJF
TEXTO 4
indicAdorEs EducAcionAis no brAsil E no mundo: 
As divErsAs fAcEs dA EducAção
Luís Antônio Fajardo Pontes
TEXTO 5
o idEb – ÍndicE dE dEsEnvolvimEnto dA EducAção básicA
Especialistas do CAEd/UFJF
TEXTO 6
o ÍndicE dE dEsEnvolvimEnto dA EducAção básicA (idEb):
 intErprEtAção, mEtAs E rEsultAdos
Luís Antônio Fajardo Pontes
TEXTO 7
fAtorEs AssociAdos Ao dEsEmpEnho
Especialistas do CAEd/UFJF
TEXTO 8
o sAdEAm 
(sistEmA dE AvAliAção do dEsEmpEnho EducAcionAl do AmAzonAs)
Especialistas do CAEd/UFJF
5
19
35
43
61
67
81
93
sumÁrio
5
Guia de Estudos
Especialistas do CAEd/UFJF
introdução
O tema da avaliação educacional não se apresenta como uma novidade propriamente dita, 
sobretudo, nos dias atuais. Entretanto, façamos um exercício inicial, na tentativa de responder ao 
que parece simples: o que é avaliar?
Uma rápida consulta ao dicionário é quase suficiente para conhecer algumas definições. 
Entender os significados, conceitos e terminologias pode ser um bom começo para explorar um 
determinado terreno. No entanto, o ponto aqui não é apenas precisar definições, mas, também, 
mobilizar os elementos que já fazem parte do nosso repertório e com os quais lidamos em boa 
parte do nosso trabalho realizado nas escolas, e, assim, ter ferramentas para empreender ações 
próprias do processo avaliativo.
Talvez por isso, a pergunta natural subsequente à primeira seja: para que avaliar? Todos os 
dias, nossa prática pedagógica é revestida de questões ligadas ao ato de avaliar. Como atividade 
informal, ela, inclusive, nasce com o próprio homem. Afinal, são da natureza humana atos como 
os de julgar, mensurar e observar. Desde o surgimento da instituição escolar, a ideia de verificar 
a aprendizagem dos alunos sempre existiu. Evidentemente que, para isso, o que se fazia era ainda 
frágil e, por vezes, muito intuitivo, comparativamente ao que dispomos, hoje, em termos de 
recursos e informações.
Procuremos imaginar a escola de antigamente. Sabemos, por exemplo, que, quando 
essa instituição nasceu, ela não era acessível a todos, mas somente a uma parcela restrita 
da população. Tratava-se, portanto, de uma educação voltada para a elite. Com efeito, havia 
certa homogeneidade nos desempenhos. A partir do processo de democratização do ensino, o 
ingresso de diferentes segmentos sociais conferiu à escola um caráter bastante diversificado e 
complexo. Muitos estudos, iniciados na década de 1960, chegaram a apontar a forte relação 
entre desempenho educacional e classe social. Mas as análises voltadas, especificamente, para 
a identificação dos processos de aprendizagem, o “como” e o “por que” uns aprendiam mais que 
outros, ainda eram incipientes e carregadas de julgamentos subjetivos.
Diante de tamanha complexidade, a chegada dos processos formais de avaliação anuncia um 
avanço notório na busca por dados mais objetivos e confiáveis do desempenho dos alunos. Essa 
teXto 1
AvAliAção EducAcionAl: umA brEvE ExplicAção
6
Processo de Formação de Profissionais da Educação Pública
conquista democrática vem respondendo às demandas da sociedade por maiores possibilidades 
de escolarização. Esse, sem dúvida, foi um passo importante para compreender como se dá a 
aprendizagem e a construção do próprio conhecimento. Agora, conhecemos com mais clareza e 
urgência a necessidade do “por quê” e “para que” se avaliar.
A partir da segunda metade do século XX, os estudos sobre a avaliação educacional 
foram ganhando cada vez mais fôlego. Ultrapassada a etapa “do que é” e “para que” se 
avaliar, foi preciso delinear e refinar quais seriam os instrumentos capazes de dar conta do 
conteúdo escolar a ser avaliado. Entretanto, ainda que haja variações nas linhas teóricas 
adotadas, a avaliação educacional pode ser identificada a partir de duas dimensões: uma 
interna (avaliação da aprendizagem realizada, sobretudo, pelo professor, como parte do 
seu fazer pedagógico); e outra externa (avaliação do desempenho escolar em larga escala, 
de natureza sistêmica, realizada por agente externo à escola). A seguir, vejamos em que 
consiste a avaliação da aprendizagem.
1.1. avaliação da aprendizaGem – avaliação interna
A avaliação interna, ou avaliação da aprendizagem, busca a obtenção de informações 
fidedignas sobre o trabalho realizado com os alunos nas diferentes áreas do conhecimento. 
Nesse caso, tal como aponta Jacques Grégoire (2000), mais importante que identificar o sucesso 
ou fracasso, é entender o que subjaz aos desempenhos observados: a abordagem seguida 
pelo aluno para chegar à resposta que ele nos propõe e o sentido do procedimento utilizado. A 
avaliação só tem sentido se for encarada, pelo professor e pela escola, como uma aliada tanto 
da evolução de cada aluno, como da consecução das metas de eficácia e qualidade fixadas pela 
unidade escolar ou pelos sistemas educacionais de cada país.
Uma avaliação que emerja de uma prática e que desempenhe uma função que vai além 
da constatação de resultados não pode ser uma avaliação facilitadora, daquelas que mascaram 
a realidade, e muito menos uma avaliação que apenas classifica e reprova. Ela deve ser o 
resultado de uma análise crítica e permanente da prática pedagógica, possibilitando a leitura e a 
compreensão do seu desenvolvimento. Constitui o ponto de partida para a tomada de decisões 
voltadas para o aperfeiçoamento dessa prática (AZZI, 2001).
Ela é, portanto, um importante instrumento de significativas possibilidades depráticas 
pedagógicas. Quando vinculada ao processo de ensino e aprendizagem, pode garantir um retorno 
permanente ao professor do que e em que medida o aluno está aprendendo. Esse feedback não 
serviria somente para avaliar o aluno e seu conhecimento, mas também toda uma proposta de 
escola, contribuindo, assim, para validar e/ ou rever o trabalho pedagógico, a cada momento em 
que isso se fizer necessário (RABELO, 1999). Se é assim, se a avaliação antecede, acompanha e 
sucede o trabalho pedagógico, ela assume funções diferenciadas, de acordo com a situação de 
aprendizagem e o momento em que é demandada. São elas: Diagnóstica, Formativa e Somativa.
7
Guia de Estudos
A avaliação diagnóstica tem como função básica informar sobre o contexto em que o trabalho 
pedagógico irá realizar-se e, também, sobre os sujeitos que participarão desse trabalho. Essa 
avaliação ocorre em dois momentos distintos:antes e durante o processo de instrução. No 
primeiro momento, tem por funções verificar se o aluno possui determinadas habilidades básicas, 
tidas como pré-requisitos para a nova aprendizagem (compreensão em leitura, habilidades de 
cálculo etc.); determinar que objetivos de um curso já foram dominados pelo aluno; classificar e 
agrupar alunos conforme suas características; e encaminhar alunos a estratégias e programas 
alternativos de ensino. No segundo momento, busca a identificação das causas não pedagógicas 
de repetidos fracassos de aprendizagem.
A avaliação formativa indica os avanços e as dificuldades que aparecem ao longo do processo. 
Podemos considerar como formativa toda prática de avaliação contínua que pretenda contribuir 
para melhorar as aprendizagens em curso, qualquer que seja o quadro e qualquer que seja 
a extensão concreta da diferenciação do ensino (PERRENOUD, 1999). Ocorre a cada etapa da 
instrução, inclui todos os conteúdos importantes e retorna ao aluno o que foi ou não aprendido. 
Esse feedback, também oferecido ao professor, é fundamental para a identificação, tanto das 
falhas dos alunos quanto dos aspectos problemáticos da própria prática docente: métodos, 
adequação dos conteúdos, capacidade de envolvimento dos alunos etc. A avaliação formativa tem 
como princípios o atendimento às diferenças individuais dos alunos e a prescrição de medidas 
alternativas de recuperação das falhas de aprendizagem. Quando bem utilizada e explorada, a 
avaliação pode ser transformada em fonte de motivação para os alunos, mostrando o que ele 
atingiu e o que pode atingir, em termos de domínio de conteúdos em cada etapa da instrução.
A avaliação somativa ocorre ao final da instrução, com a finalidade de verificar o que o aluno 
efetivamente aprendeu. Inclui, por isso, os conteúdos mais relevantes e os objetivos mais amplos do 
período de instrução. Além disso, visa à atribuição de notas e certificados para aqueles que concluíram 
determinado período escolar. Serve, com relação a cursos subsequentes, para determinar o ponto 
de partida do ensino e para estimar o desempenho do aluno. Fornece, também, feedback ao aluno 
(informa-o quanto ao nível de aprendizagem alcançado), ao mesmo tempo em que presta-se à 
comparação de resultados obtidos com diferentes alunos, métodos e materiais de ensino.
Avaliação é algo que sempre esteve presente nas escolas. Tradicionalmente, existem 
as avaliações efetuadas em sala de aula a partir de exames (provas abertas ou objetivas, 
observações, registros, portfólios etc.) elaborados pelos próprios professores, que servem para 
aferir o processo de aprendizagem e são utilizados para determinar os estudantes que possuem 
condições de avançar no sistema. Outro procedimento tradicional são avaliações feitas por 
sistemas de inspeção; nesse caso, averiguam-se as condições de funcionamento das escolas, se 
os professores cumprem suas obrigações funcionais, se os currículos ministrados são adequados, 
ou seja, avaliam-se insumos e processos.
A esses procedimentos tradicionais de avaliação educacional somam-se, no período 
mais recente, outros tipos de avaliação educacional: as avaliações externas, normalmente 
realizadas em larga escala. Nessas avaliações, utilizam-se instrumentos (em geral, testes de 
8
Processo de Formação de Profissionais da Educação Pública
proficiência, provas, questionários) produzidos e aplicados por pessoas de fora da escola ou das 
turmas submetidas a esses exames. Tais avaliações, normalmente, são aplicadas de forma 
padronizada em um número grande de pessoas, abrangendo diferentes alunos, turmas e escolas.
1.2. avaliação em larGa escala – avaliação eXterna
As avaliações externas em larga escala podem assumir diferentes formas, em função de seus 
objetivos variados. Dentre eles, destacam-se a autoavaliação, a certificação, o credenciamento 
ou seleção, o diagnóstico e a rendição de contas.
Autoavaliação: Algumas avaliações visam a oferecer uma referência para que pessoas, em 
uma situação homogênea, possam proceder à sua autoavaliação com vistas a escolhas futuras, 
tanto em relação ao mercado de trabalho, quanto em relação à continuidade dos estudos. 
Nesse caso, trata-se de um instrumento que permite a comparação de cada um com seus 
pares e iguaiscom aqueles que encontram-se na mesma situação. A autoavaliação não se dá 
pela referência a uma medida absoluta ou fixa, mas ao quadro móvel e relativo de habilidades 
e competências construído por uma população com alto grau de homogeneidade. O Exame 
Nacional do Ensino Médio – ENEM – constitui exemplo de avaliação com esses objetivos.
certificação: Algumas avaliações permitem àqueles que nelas têm um bom desempenho 
ter um reconhecimento formal das habilidades e competências que demonstraram possuir. Em 
alguns casos, o resultado dessa avaliação autoriza que uma pessoa venha a ser reconhecida 
como detentora de um determinado nível de estudos (conclusão do Ensino Fundamental, 
Médio ou Superior) ou da competência para o exercício de alguma atividade profissional.
credenciamento: Com esse objetivo, encontram- se as avaliações que visam a selecionar, 
como os exames praticados nos concursos públicos e nos vestibulares. Tais avaliações 
ordenam os indivíduos pelo domínio de determinados conhecimentos, habilidades ou 
competências, habilitando os melhores à passagem para níveis superiores de ensino ou 
ao exercício de determinada atividade profissional. Trata-se, portanto, de uma avaliação 
que hierarquiza e ordena, para que os que estão no topo possam ocupar posições escassas 
ou reguladas, na universidade ou no mercado de trabalho.
diagnóstico: A maior par te dos sistemas de avaliação da educação básica tem o objetivo de 
realizar diagnósticos, sejam dos sistemas de ensino, de programas ou mesmo do próprio aluno. As 
avaliações diagnósticas destinam-se a fornecer informações aos gestores, diretores e professores 
sobre o desempenho dos alunos, das escolas e dos sistemas de ensino, assim como avaliar políticas 
e práticas educacionais, de modo a se compararem os resultados com os objetivos estabelecidos 
ou esperados. Com base nesse diagnóstico, torna-se possível alterar ou aperfeiçoar um conjunto 
variável de procedimentos, de modo que os objetivos possam ser de fato alcançados.
rendição de contas: A todas as avaliações externas pode ser agregado ainda um outro 
objetivo, que é a rendição de contas. Nesse caso, os resultados das avaliações são amplamente 
9
Guia de Estudos
divulgados, para que a sociedade deles tome conhecimento e possa participar ativamente na 
melhoria dos processos em avaliação. Desse modo, os resultados deixam de ser tratados 
apenas por especialistas, fornecendo informações objetivas e claras para um produtivo 
debate dentro da sociedade, a respeito de seus programas e objetivos.
As avaliações em larga escala prosperaram em todo o mundo a partir dos anos 1960 
e, no Brasil, depois dos anos 1980, quando se implantou o SAEB (Sistema de Avaliação da 
Educação Básica).
Nessas avaliações em larga escala, que se valém de testes padronizados, um dos pontos 
fundamentais é a definição das habilidades, competências ou tipo de conhecimento que se deseja 
transmitir à população selecionada. A definição desses conteúdos constitui as chamadas 
matrizes de referência dos testes, ou seja, aquilo que cai na prova. Essas matrizes são elaboradas 
por especialistas, que levam em conta os conteúdos que os alunos deveriam aprender por série 
e por idade. Em outros termos, as matrizes devem ser o resultado do trabalho de um grupo 
multidisciplinar de especialistas, atentos tanto à idade dos alunos, quanto aos conteúdos a 
serem dominados por elesao longo do processo escolar.
Os resultados das avaliações em larga escala devem preencher os requisitos de validade 
e confiabilidade dos testes. Para isso, procedimentos metodológicos e critérios rígidos 
na elaboração dos testes e de monitoramento dos dados devem ser utilizados. O primeiro 
problema é: como ter certezade que o teste está realmente medindo o que se propõe, em termos 
de habilidades dos alunos em determinadas áreas do conhecimento? A resposta a essa questão 
se refere ao grau de validade do teste. Nesse caso, os itens do teste devem ser cuidadosamente 
pré-testados e analisados pedagogicamente por especialistas, para determinar se, de fato, cada 
item está referido ao conjunto de conceitos ou habilidades previsto na matriz de referência.
Outro aspecto refere-se à confiabilidade ou à fidedignidade dos dados obtidos. Como saber 
se um teste é confiável? Em que medida os resultados obtidos apresentam nível adequado 
de estabilidade? Isso pode ser verificado de duas formas. Podemos, por um lado, relacionar 
o comportamento do aluno num determinado item com o resultado geral do teste. Ou seja, 
podemos relacionar o acerto em um item com outros itens, confirmando ou eliminando a 
hipótese de o aluno ter acertado por acaso. Por outro lado, é necessário, também, verificar 
se testes parcialmente diferentes, e que tenham o mesmo objetivo, são capazes de produzir 
a mesma medida, garantindo a comparabilidade. Para isso, são realizados procedimentos 
estatísticos variados, que buscam relacionar cadernos de testes diferentes, ou mesmo 
avaliações realizadas em períodos diferentes, por meio da inclusão de itens comuns aos 
diversos processos. O importante, aqui, é compreender que as matrizes de referência, os 
itens e os testes devem ser cuidadosamente construídos e analisados, sempre buscando o 
maior grau possível de coerência naquilo que é avaliado. Preenchidos os requisitos de validade 
e confiabilidade, pode-se concluir que o teste estará medindo as habilidades realmente 
desenvolvidas pelos alunos nas diferentes áreas de conhecimento avaliadas, permitindo o 
cotejo com aquilo que é esperado pela matriz de referência.
10
Processo de Formação de Profissionais da Educação Pública
Para que a avaliação possa transformar-se numa perspectiva produtiva para professores, 
diretores e gestores, ela deve conter tanto as informações relativas aos resultados obtidos pelos 
alunos nos testes padronizados, quanto os dados denominados de “fatores associados” a esses 
resultados. Sabemos que a escola é uma organização complexa e que vários fatores influenciam os 
resultados obtidos pelos alunos: as condições socioculturais, o modo de organização administrativa 
e pedagógica da escola, o cotidiano dos jovens, a localização geográfica, a infraestrutura e os 
equipamentos e, fundamentalmente, os professores e a equipe de direção. Por isso, as avaliações 
em larga escala se fazem acompanhar de outros instrumentos (em geral, questionários dirigidos 
a alunos, professores, diretores, pais etc.), destinados a capturar a presença e a importância 
de fatores associados ao aprendizado. Assim, as avaliações podem ser utilizadas tanto para a 
comparação dos resultados dos alunos de uma escola ou turma com outras, como para a análise 
desses fatores associados ao ensino, aumentando nosso grau de compreensão dos diversos níveis 
de habilidade e competências demonstrados por alunos de diferentes turmas e escolas.
No que se refere à abrangência, as avaliações podem ser amostrais ou censitárias. Muitos 
aspectos da avaliação de programas educacionais podem ser atingidos por meio de exercícios 
de avaliação de base amostral. Nesse tipo de avaliação, define-se, claramente, a população de 
interesse da avaliação, mas testa-se apenas uma amostra – uma parte – relativamente pequena 
dessa população. Essa parte menor deve ser representativa do conjunto a ser investigado, gerando 
informações que podem ser generalizadas para o conjunto maior. É mais ou menos como as 
pesquisas de opinião que apresentam a intenção de voto da população nos candidatos à presidente 
da República, embora apenas uma parte dos brasileiros tenha sido entrevistada.
Existem, no entanto, aspectos que não podem ser tratados no âmbito de avaliações de base 
amostral e limites que não podem ser superados, como os resultados para cada município e para 
cada unidade escolar. Em outros termos, uma avaliação de base amostral serve para um diagnóstico 
do país, de macrorregiões ou de redes, mas não pode ser utilizada para determinar a posição de cada 
município e de cada escola. A amostra não autoriza essa particularização dos resultados.
Uma avaliação censitária significa a investigação de todas as escolas, e não apenas de uma parte 
delas, como na avaliação amostral. Façamos uma comparação para um melhor entendimento: se, 
nas pesquisas de opinião, apenas uma amostra dos brasileiros é consultada, no Censo Nacional, 
todas as casas existentes no território nacional são visitadas e investigadas, tratando-se, portanto, de 
uma pesquisa censitária. Isso significa que todos os brasileiros, de algum modo, foram objetos de 
investigação. Um programa de avaliação educacional censitária tem como objetivo avaliar todas as 
escolas e alunos de uma série escolar, ou mais de uma série, em uma ou em todas as redes existentes.
1.3. as avaliações em larGa escala promovidas pelo Governo federal no 
brasil
Nas últimas três décadas, o Governo Federal, os governos estaduais e municipais e mesmo 
entidades privadas promoveram um grande crescimento do número de avaliações externas. O Brasil 
11
Guia de Estudos
também se vale de algumas avaliações internacionais, no intuito de estabelecer um diagnóstico 
da qualidade educacional brasileira por comparação com outros países. A participação do Brasil 
em avaliações educacionais internacionais, como o PISA (no âmbito da OCDE) e o PERCE (na 
UNESCO), reforçaram tecnicamente as equipes nacionais para a realização e entendimento 
dessas avaliações educacionais externas em larga escala. O Brasil foi o único país não membro 
da OCDE a participar de todas as avaliações do PISA (2000, 2003, 2006 e 2009).
Vamos aqui destacar algumas dessas avaliações feitas pelo Governo Federal, que envolvem a 
educação básica no Brasil.
o enem (eXame nacional do ensino médio)
O ENEM foi realizado, pela primeira vez, em 1998. Trata-se de um exame, anual e voluntário, para 
avaliar os alunos em vias de concluir, ou que já tenham concluído, o Ensino Médio. Ou seja, é uma 
avaliação somativa e relativa a normas, ocorrendo ao final de uma etapa de aprendizado e permitindo 
a comparação de cada um que a ela se submete com os resultados dos demais participantes. 
Em primeiro lugar, é um teste que provê a cada participante a oportunidade de uma 
autoavaliação, tendo em vista a possibilidade da comparação com os escores obtidos pelos 
demais participantes. Dessa maneira, oferece a todos eles uma série de elementos para 
a tomada de decisões a respeito de sua vida, como a da continuidade dos estudos, a procura 
de uma colocação no mercado de trabalho, e assim por diante. Vários centros de ensino superior 
passaram a se valer dos resultados do ENEM como critério, parcial ou exclusivo, de seleção 
para ingresso nos seus cursos. Nessas circunstâncias, o ENEM é empregado para os objetivos 
de certificação e credenciamento. Em seu segundo ano, o exame passou a ser utilizado como 
modalidade alternativa, de modo integral ou parcial, para o ingresso em diversas Instituições de 
Ensino Superior, incluindo algumas universidades de elevado prestígio acadêmico. Mais de 600 
instituições de educação superior utilizaram os resultados do ENEM nos seus processos seletivos. 
Ainda em 2009, o MEC propôs ao conjunto das universidades federais que o ENEM substituísse, no 
todo ou em parte, os tradicionais vestibulares para a seleção de seus estudantes.
Na mesma direção, o MEC reforçou esses objetivos ao vincular o ENEM ao Programa 
Universidade para Todos – ProUni. Criado pelo Governo Federal em 2004, o programa tem 
como finalidade a concessão de bolsas de estudos, integrais e parciais, a estudantes de cursos 
de graduação, ou sequenciais de formação específica, em instituições privadas de educação 
superior. Em contrapartida, as instituições que acolhessem os bolsistas seriam contempladascom a redução de impostos. Em 2005, o MEC passou a se valer da pontuação obtida no 
ENEM para a concessão dessas bolsas integrais ou parciais a estudantes que desejavam 
a continuidade de seus estudos no terceiro grau. A atribuição crescente desses objetivos de 
certificação e credenciamento, para as universidades e o ProUni, fez com que o número de 
participantes crescesse sistematicamente ao longo dos anos: de 110 mil, em 1998, para mais 
12
Processo de Formação de Profissionais da Educação Pública
de 4 milhões, em 2008. Mais de dois terços dos que se submeteram ao exame declararam que 
aceitaram participar da avaliação com os objetivos de certificação e credenciamento, seja junto 
às universidades ou ao ProUni.
A adesão maciça dos concluintes do Ensino Médio ao ENEM fez com que ele pudesse atingir os 
objetivos de diagnóstico e de rendição de contas. Uma importante inovação foi introduzida em 2005 
no que diz respeito aos resultados do ENEM e para acentuar o objetivo de diagnóstico: levando-se 
em consideração a ampla aceitação da matriz do exame – e o não enfrentamento de problemas de 
motivação do ENEM comuns às outras avaliações em larga escala –, seus resultados, além das 
médias nacionais, passaram a ser divulgados por estado, sistema de ensino e por escola, tomando-
se apenas os resultados dos concluintes do Ensino Médio que realizam cada edição do ENEM. Um 
cuidado importante teve que ser levado em consideração: como o exame é voluntário, os resultados 
poderiam estar enviesados, ou seja, poderiam não refletir a situação de uma escola. Para corrigir 
esse possível problema, foram estabelecidos critérios de mínimos de participação para a divulgação 
por escola e criado um corretor de participação, que propicia a representação da nota média da 
escola, caso todos os alunos matriculados na série final do Ensino Médio tivessem realizado o exame.
Assim também, desde 2005, o ENEM passou a contribuir para o estabelecimento de um 
diagnóstico do sistema educacional brasileiro e a fazer parte de um sistema de rendição de 
contas, ao lado da Prova Brasil e do SAEB. As proposições de reforma do Ensino Médio, divulgadas 
recentemente pelo MEC, resultam da análise dos dados obtidos com a aplicação do ENEM. Resta 
observar que os indicadores decorrentes do ENEM, assim como quaisquer outros, têm um alcance 
determinado. O principal limite dos seus resultados é a ausência de um caráter longitudinal, ou 
seja, a dificuldade de seu uso para comparações em momentos diferentes no tempo.
o encceJa (eXame nacional para certificação de competências de Jovens e adultos)
A LDB prevê, em seu artigo 38, a realização de exames supletivos que garantam ao estudante 
ou a qualquer cidadão – que não tenha desfrutado do acesso ao ensino regular ou tenha sofrido 
problemas de continuidade no Ensino Fundamental e Médio – a possibilidade de prosseguir 
seus estudos em caráter regular. Esses exames são feitos com o objetivo de determinar o domínio 
de conteúdos previstos nessas etapas do ensino, por parte dos candidatos, e são organizados pelo 
INEP, que mantém o Exame Nacional para Certificação de Competências de Jovens e Adultos – 
ENCCEJA. Trata-se, portanto, de uma avaliação que confere aos candidatos um certificado de 
Ensino Fundamental ou Médio.
Inicialmente, os exames não tinham uma frequência regular, mas, a partir de 2006, 
começaram a ser realizados anualmente, no mês de dezembro. Vale observar que a atribuição 
de certificação do Ensino Fundamental e Médio pertence aos municípios e estados, que podem 
aderir ao ENCCEJA, adotando os resultados nele registrados. Na edição 2010, mais de 147 mil 
candidatos participaram do programa.
13
Guia de Estudos
O participante poderá ser certificado, no Ensino Fundamental, nas seguintes áreas: 1) 
Língua Portuguesa, Língua Estrangeira Moderna, Educação Artística e Educação Física; 2) 
História e Geografia; 3) Matemática; e 4) Ciências Naturais. No Ensino Médio, a certificação 
abrange: 1) Linguagens, Códigos e suas Tecnologias; 2) Ciências Humanas e suas Tecnologias; 
3) Matemática e suas Tecnologias; e 4) Ciências da Natureza e suas Tecnologias. Em 2006, 
depois de algumas modificações técnicas – a incorporação da teoria da resposta ao item (TRI) –, 
os resultados do ENCCEJA passaram a ser comparáveis ao longo do tempo, de modo que um 
participante de uma determinada edição do exame pode ter seus resultados comparáveis com 
o de outros participantes de edições diferentes do exame. Isso conferiu ao ENCCEJA uma 
capacidade diagnóstica importante, ao lado do ENEM.
Além do objetivo acima descrito, o ENCCEJA também busca construir uma referência 
nacional de autoavaliação para jovens e adultos, por meio de avaliação de competências 
e habilidades adquiridas no processo escolar e, sobretudo, nos processos formativos que se 
desenvolvem na vida familiar, na convivência humana, no trabalho, nos movimentos sociais e 
organizações da sociedade civil e nas manifestações culturais. Além de referencia nacional 
de autoavaliação, o ENCCEJA é também um indicador qualitativo importante para a avaliação 
de políticas públicas de Educação de Jovens e Adultos. Desde 2001, ele é também realizado para 
brasileiros que residem temporariamente no exterior.
o saeb e a prova brasil 
O SAEB (Sistema Nacional de Avaliação da Educação Básica), já na sua primeira aplicação 
realizada ao final dos anos 1980, nasceu sintonizado com a perspectiva diagnóstica. Desde 
seu início, ele surge destinado à produção de informações e resultados entendidos como 
“subsídios para a definição de ações voltadas para a correção das distorções identificadas e o 
aperfeiçoamento das práticas e dos resultados apresentados pelas escolas e pelo sistema de 
ensino”. Alves et alli (2005). Assim, a partir dos subsídios oferecidos pelo SAEB, o MEC e as 
secretarias estaduais e municipais poderiam definir ações com os objetivos de diagnóstico, 
buscando a “...correção das distorções e debilidades identificadas e dirigir seu apoio técnico 
e financeiro para o desenvolvimento e redução das desigualdades ainda existentes no sistema 
educacional brasileiro”. Além desse objetivo, a realização da avaliação e a divulgação de seus 
resultados constituem uma forma “...de o poder público prestar contas de sua atuação a alunos, 
professores, país e a sociedade em geral, proporcionando uma visão clara do processo de ensino 
e das condições em que ele é desenvolvido”. (MEC/INEP – Relatório SAEB 2005).
A iniciativa de criação de uma avaliação nacional da educação básica se inaugura no contexto 
marcado pela ampliação do acesso ao Ensino Fundamental – que levou para o interior da escola 
uma população pobre e tradicionalmente excluída do sistema escolar –, e pela descentralização 
da educação, inflexão que multiplicou o número de sistemas de ensino nos municípios. 
Nesse ambiente de reforma, de descentralização e de extrema heterogeneidade dos alunos e 
14
Processo de Formação de Profissionais da Educação Pública
professores, a Constituição e a LDB reservaram ao Governo Federal as funções de regulação e 
assistência técnica e financeira a estados e municípios que, por sua vez, foram contemplados 
com a responsabilidade direta, de natureza administrativa, pedagógica e financeira, sobre seus 
sistemas de ensino. Uma vez assegurada a base legal, pela previsão de avaliação pela LDB, os 
levantamentos de dados do SAEB passaram a ser realizados de dois em dois anos, através de uma 
amostra aleatória representativa dos alunos das escolas estaduais, municipais e particulares, 
urbanas e rurais, dos 26 estados da federação e do Distrito Federal. A cada levantamento, 
são pesquisados, aproximadamente, 700 municípios, 3.000 escolas públicas e privadas, 25 
mil professores, 3.000 diretores e 300.000 alunos do Ensino Básico (do 5º e 9º anos do Ensino 
Fundamental e da 3º ano do Ensino Médio) nas disciplinas Língua Portuguesa e Matemática.
os instrumentos do saeb
O SAEB aplica dois tipos de instrumentos de coleta de dados: os cognitivose os contextuais. 
Os instrumentos cognitivos são os testes de Língua Portuguesa e de Matemática, aplicados 
aos alunos de 5º e 9º anos séries do Ensino Fundamental e do 3º ano do Ensino Médio, com a 
finalidade de medir habilidades em cada uma das disciplinas. O foco desses testes encontra-se 
na leitura, quando se trata de Língua Portuguesa, e na resolução de problemas, no caso da 
Matemática. Em alguns anos, foram ainda aplicadas avaliações de Ciências, História e Geografia. 
Os questionários contextuais são aplicados a alunos, professores e diretores e levantam 
informações sobre o padrão de vida dos alunos, das suas famílias, dos professores, sobre as 
condições da escola, ou seja, sobre características e aspectos da vida escolar e social que podem 
interferir no desempenho acadêmico dos alunos. São os chamados fatores associados, aos 
quais já nos referimos. A vinculação das informações dos questionários contextuais com os 
dados de desempenho dos alunos permite detectar quais fatores intraescolares e extraescolares 
influenciam, de forma positiva ou negativa, os resultados dos alunos.
Os resultados do SAEB são divulgados para o Brasil como um todo e desagregados por 
região, estado, localização (rural ou urbana) e dependência administrativa (estadual, municipal, 
federal e particular). As análises dos resultados do SAEB são, ainda, realizadas, levando-se em 
consideração o contexto do ensino. Esses estudos, realizados pelo INEP e que buscam associar 
o contexto do aluno e da escola ao desempenho, revelam que existe uma relação estreita entre 
desigualdades sociais e condições de oferta educacional. Além disso, tornam patente que o 
contexto geográfico, num país de grandes desigualdades regionais como o nosso, possui um 
papel relevante na distribuição das oportunidades educacionais.
Como já assinalado, os objetivos do SAEB estão voltados para o monitoramento da qualidade 
da educação básica oferecida pelos sistemas de ensino, para a prestação de contas à sociedade 
e para o desenvolvimento de subsídios para a formulação de políticas educacionais. O modo 
como ele foi imaginado, e é executado, permite que esses objetivos sejam alcançados. Em 
primeiro lugar, os resultados do desempenho dos alunos podem ser comparados ao longo 
15
Guia de Estudos
do tempo. Os conteúdos e habilidades que devem ser medidos pelos testes são permanentes, 
mudando-se apenas os itens – as perguntas – que são submetidos aos alunos a cada dois anos. 
Além disso, alguns desses itens são mantidos em diferentes edições dessas avaliações, o que 
possibilita que as médias da proficiência dos alunos, ou seja, as medidas do desempenho nos 
testes, tornem-se comparáveis no tempo. Assim, podemos saber como evolui a qualidade do nosso 
ensino num determinado período. Por outro lado, a aplicação do mesmo teste aos alunos das 
várias redes também permite a comparação da eficácia ou da qualidade dessas mesmas redes.
Em segundo lugar, os dados dos questionários contextuais, que recolhem informações 
relevantes sobre os alunos e a escola, constituem um rico material para análise e formulação 
de políticas educacionais. Eles identificam, além das características sociais que afetam positiva 
ou negativamente o desempenho dos alunos, iniciativas sistêmicas – das várias redes – ou 
das escolas, que aprofundam o aproveitamento dos estudantes e oferecem maior qualidade ao 
ensino. Nesse sentido, o SAEB oferece a todos um enorme painel da educação brasileira, 
proporcionando subsídios concretos para a adoção de políticas educacionais – locais, estaduais 
e nacionais – destinadas a aumentar a qualidade do ensino oferecido as nossas crianças.
Foram realizados, até 2008, nove ciclos de avaliação e incorporados avanços metodológicos 
importantes, como, por exemplo, a comparabilidade entre anos e séries, mesmo que a população 
avaliada se modifique, possibilidade estabelecida a partir de 1995. Ao mesmo tempo, 
desenvolveram-se planos amostrais que conferiram maior validade aos resultados. O SAEB 
consolidou-se como um instrumento que garante a qualidade e a confiabilidade das avaliações 
diagnósticas realizadas no Brasil, e, por meio dele, introduziu-se e consolidou-se uma cultura 
de avaliação no país. Com base nos seus resultados, detectou-se, de forma precisa, a questão 
da qualidade do ensino como o principal desafio da educação brasileira, depois do amplo 
esforço de incorporação universal das crianças ao sistema escolar nacional. Contudo, o SAEB 
não conseguia – e não podia – responder à crescente necessidade de informações por parte 
dos gestores e educadores. Dado o seu caráter amostral, ele não apreendia toda a diversidade 
e a singularidade das escolas e dos sistemas de ensino, ampliadas e diversificadas com o amplo 
processo de descentralização e municipalização que caracteriza a educação brasileira no 
período de pós-redemocratização. Esse limite demandou uma resposta específica por parte das 
autoridades educacionais do país.
a criação da prova brasil
A partir de 2005, o Sistema Nacional de Avaliação da Educação Básica (SAEB) passou a ser 
composto por duas avaliações, desenvolvidas e conduzidas pelo Instituto Nacional de Estudos e 
Pesquisas Educacionais Anísio Teixeira (INEP): Avaliação Nacional da Educação Básica (ANEB) e 
Avaliação Nacional do Rendimento Escolar (ANRESC).
A Avaliação Nacional da Educação Básica (ANEB) deu continuidade à tradicional avaliação 
amostral do SAEB, mantendo desenho, metodologia e objetivos idênticos, o que garante a 
16
Processo de Formação de Profissionais da Educação Pública
continuidade da série histórica dos dados de desempenho dos alunos de 5º e 9º anos do Ensino 
Fundamental e do 3° ano do Ensino Médio das redes públicas e privadas.
Assim, a ANEB continuará a avaliar, a cada dois anos, o desempenho dos alunos nas disciplinas 
Língua Portuguesa (com foco em leitura) e Matemática, e a produzir resultados para as regiões, 
os estados e as redes de ensino estaduais, municipais e privadas do país. Pelo fato de manter as 
mesmas características do antigo SAEB, a ANEB recebe o nome de SAEB em suas divulgações.
A Avaliação Nacional do Rendimento Escolar (ANRESC) foi criada para ser mais extensa 
e detalhada do que a ANEB, com o foco em cada unidade escolar do país. Por seu caráter 
universal, recebe o nome de Prova Brasil em suas divulgações. A Prova Brasil foi idealizada 
para produzir informações sobre o ensino em cada município e em cada escola. Os seus 
resultados constituem um valioso instrumento de melhoria da qualidade do ensino nas mãos 
dos governantes, que podem, assim, tomar decisões mais adequadas sobre a aplicação de 
recursos financeiros e técnicos, e para cada comunidade escolar, especialmente no que se 
refere ao estabelecimento de metas e à implantação de ações pedagógicas e administrativas 
com o objetivo de melhorar a qualidade do ensino oferecido.
A entrada em cena, em 2005, da Prova Brasil teve como objetivo aumentar conteúdo 
informacional da avaliação diagnóstica e permitir que todos os sistemas educacionais públicos 
brasileiros se “enxergassem” mutuamente na avaliação, o que é particularmente importante 
em um país com a multiplicidade de sistemas educacionais como o Brasil. Além disso, um novo 
passo passou a ser possível com a Prova Brasil, qual seja, o de agregar à perspectiva de avaliação 
para o diagnóstico as noções de transparência e, especialmente, de rendição de contas.
Os resultados da Prova Brasil também identificam, aos diretores e professores das escolas, 
aquelas habilidades que seus alunos já dominam e aquelas que ainda não foram atingidas. 
Esse diagnóstico fortalece a reflexão sobre metas a serem alcançadas e estratégias de ensino a 
serem adotadas por cada escola. Por sua vez, os gestores das redes podem avaliar que medidas 
devem ser tomadas para a melhoria do ensino, como, por exemplo, o processo de capacitação e 
qualificação dos docentes, considerando as necessidades apontadas pelos resultados. Pela sua 
abrangência, a Prova Brasilconstitui uma referência importante para verificar a qualidade e a 
equidade da educação oferecida no Brasil, seja por região ou por redes, estimulando uma ampla 
discussão sobre as políticas para a correção dos problemas existentes ou para a preservação 
dos ganhos registrados.
A primeira edição da Prova Brasil ocorreu em cerca de 5.400 municípios de todas as unidades 
da federação, e avaliou 3.306.378 alunos de 4ª e 8ª séries do Ensino Fundamental, distribuídos 
em 122.463 turmas de 40.920 escolas públicas urbanas com mais de 30 alunos matriculados na 
série avaliada. Nas escolas onde o Ensino Fundamental estava organizado em regime de nove 
anos, a prova foi aplicada nas turmas do 5º e do 9º anos. Além das provas de Língua Portuguesa 
e Matemática, os alunos responderam a um questionário destinado a coletar informações sobre 
seus contextos econômico, social e cultural.
17
Guia de Estudos
A metodologia de avaliação é a mesma utilizada na ANEB, o que permite a comparação 
dos resultados ao longo dos anos. A diferença, vale repetir, é que a Prova Brasil busca produzir 
informações para cada escola e, por isso mesmo, um diagnóstico mais fino e preciso das redes. 
Enquanto a Prova Brasil é censitária, o SAEB (ANEB) é amostral. O universo da Prova Brasil são as 
escolas públicas e urbanas nas 4ª e 8ª séries (5º e 9º anos) do Ensino Fundamental. Desse modo, 
não estão incluídas, nesse universo, as escolas particulares, o 3º ano do Ensino Médio e as escolas 
rurais na 4ª série, que se encontram dentro do universo investigado pelo SAEB. Em 2005, a Prova 
Brasil avaliou apenas as escolas com mais de 30 alunos na série/ ano do seu universo. Esse limite 
foi reduzido para 20 alunos em 2007. No entanto, as redes municipais com apenas uma escola são 
avaliadas independentemente do numero de alunos na série/ano prevista na Prova Brasil.
a fusão saeb e prova brasil
Em 2005, as duas avaliações (o SAEB e a Prova Brasil) foram realizadas separadamente, com 
instrumentos diferentes (testes e questionários) no final do ano. Em 2007, as duas avaliações se 
fundiram, e voltamos a ter uma única avaliação externa de caráter federal, em que os segmentos 
que compõem o universo da Prova Brasil (escolas públicas e urbanas na 4ª e 8ª séries do Ensino 
Fundamental) foram avaliados censitariamente, enquanto os outros segmentos – que compõem o 
SAEB, mas não a Prova Brasil –, foram avaliados amostralmente (o 3º ano do Ensino Médio, as 
escolas particulares nas três séries avaliadas e as escolas rurais na 4ª série do Ensino Fundamental). 
Mas em ambas foram utilizados os mesmos instrumentos (testes e questionários). Uma diferença 
importante, em 2005, era que, no SAEB, um aluno respondia ou ao teste de Português ou ao de 
Matemática e, na Prova Brasil, ele respondia aos dois testes. A partir de 2007, também os alunos 
examinados no SAEB passaram a responder aos testes de Português e Matemática.
Desde 2005, portanto, o Brasil conta como um sistema de avaliação do Ensino Fundamental e 
Médio, para diagnóstico e para rendição de contas leve. Com base na Prova Brasil/ SAEB, cada escola 
pública urbana e cada rede de ensino (municipal e estadual) que participam das avaliações tem seus 
resultados em Português e Matemática divulgadas para as 4ª e 8ª séries do Ensino Fundamental 
(5º e 9º anos). No caso do Ensino Médio, como a Prova Brasil não atinge censitariamente as escolas 
públicas, mas apenas amostralmente, não há resultados da Prova Brasil/SAEB por escola. Os exames 
nessa série são feitos por amostragem, de modo que se podem ter apenas resultados para o Brasil, 
regiões e estados. Assim, o sistema de rendição de contas para o Ensino Médio, com base na Prova 
Brasil/SAEB, só alcança as redes estaduais de ensino. Para as escolas de Ensino Médio, inclusive as 
da rede particular, a divulgação dos dados do ENEM cumpre o papel de rendição de contas.
os principais desafios colocados pela e para a avaliação em larGa escala no brasil.
Ao longo de quase duas décadas, o Brasil desenvolveu importantes instrumentos de 
avaliação educacional. Não por acaso, esses programas surgiram simultaneamente ao esforço 
18
Processo de Formação de Profissionais da Educação Pública
de universalização do Ensino Fundamental e do Ensino Médio, embora, no último caso, esse 
objetivo ainda não tenha sido alcançado. Mas o que mostram os resultados desses processos 
de avaliação em larga escala? Revelam que, se a universalização está a se tornar realidade, ainda 
enfrentamos o grande problema da qualidade da educação que é oferecida às crianças e aos jovens 
no Brasil. Esse desafio não é jogado para fora dos próprios processos de avaliação, como se eles se 
limitassem apenas a avaliar habilidades e depois jogassem toda a responsabilidade pela melhoria 
do ensino nas mãos de outros atores, como os professores e gestores educacionais.
Disso resulta um duplo desafio para os programas de avaliação. Em primeiro lugar, eles devem 
ainda aperfeiçoar-se, no sentido de revelar com maior clareza as políticas e práticas que 
fazem diferença na qualidade do ensino. Isso é fundamental se entendermos que a avaliação 
é um instrumento de melhoria da educação, e não apenas um modo de medir conhecimentos. 
Em segundo lugar, a avaliação deve tornar-se um instrumento normal do processo educacional, 
incorporada pelas equipes de gestores, pela direção das escolas e pelos professores, sem 
excetuar atores sociais interessados na educação. Para isso, é crucial não apenas a divulgação 
dos resultados e das análises, mas o treinamento de todos na utilização do riquíssimo material 
produzido pelas avaliações. Ao trazer para as suas práticas concretas as avaliações em larga 
escala e seus resultados, os professores e as equipes de direção estarão ampliando o horizonte 
com que trabalham, com o objetivo de melhorar o ensino que oferecem. O mesmo pode ser dito 
no caso dos gestores, que se habilitam, ao dominar todos os processos de avaliação, a formulação 
de políticas públicas mais eficazes e produtivas.
referências
ALVES, Fátima, BONAMINO, Alícia; FRANCO, Creso. Investigação de fatores associados à eficácia 
escolar no Brasil: dados do SAEB 2003. In: Relatório Técnico INEP/MEC. Mimeo, 2005.
AZZI, Sandra. Avaliação de desempenho: novos paradigmas. In: Avaliação de Desempenho e 
Progressão Continuada. Minas Gerais: PROCAD, 2001.
GREGOIRE, Jacques (org). Avaliando as Aprendizagens – os aportes da psicologia cognitiva. Porto 
Alegre: ArtMed, 2000.
PERRENOUD, Phillipe. Avaliação: Da Excelência à Regulação das Aprendizagens. Porto Alegre: 
Artmed, 1999.
RABELO, Edimar Filho. Avaliação: Novos tempos, novas práticas. Petrópolis: Vozes, 1999.
19
Guia de Estudos
Luís Antônio Fajardo Pontes1
introdução
As avaliações educacionais em grande escala são um fenômeno que vêm sendo observado 
no Brasil particularmente nas décadas mais recentes, e que, nesse mesmo período, vêm 
ganhando um espaço cada vez maior, não somente em termos de disseminação pelos 
diferentes estados da federação, como também quanto às implicações diretas para as escolas 
por eles avaliadas, notadamente as públicas. Essa tendência nacional de avaliar e, em alguns 
casos, estabelecer consequências para o desempenho educacional, é o que vamos discutir 
neste capítulo, que, para fins de exposição e análise do tema, divide a trajetória brasileira de 
avaliação em grande escala em três períodos que, grosso modo, correspondem: (1) às suas 
origens; (2) à sua expansão e (3) à adoção de políticas de responsabilização, atreladas às 
medidas e metas de desenvolvimento educacional.
1. uma visão preliminar: a eXpansão da educação pública no brasil
No ano de 1950, ou seja, precisamente na entrada da segunda metade do século 20, o Brasil 
ainda convivia com uma situação educacional extremamente inquietante, visto que, de cada dois de 
seus cidadãos em idade escolar ou superior, um não sabia ler nem escrever. Em outras palavras, 
o Brasil tinha, nessa ocasião, uma taxa de analfabetismo de nada menos que 50%,segundo dados 
do Instituto Brasileiro de Geografia e Estatística, IBGE. Portanto, os elevados índices nacionais de 
analfabetismo representavam um desafio, ao mesmo tempo, imediato e formidável, ao propósito 
governamental de fornecer a todos os brasileiros o acesso à Educação Básica. 
Nas décadas que se seguiram imediatamente a esse período, observou-se uma contínua e 
acentuada redução do analfabetismo no Brasil, como resultado de uma considerável ampliação 
das redes educacionais no país. Dessa forma, em 1970, a taxa de analfabetismo reduzir-se-ia 
para cerca de um terço da população nacional e, em 1980, para um quarto dela. Essa tendência 
1Colocar referência do professor.
teXto 2
AvAliAção EducAcionAl Em GrAndE EscAlA: 
A ExpEriênciA brAsilEirA
20
Processo de Formação de Profissionais da Educação Pública
de expansão do ensino básico continuou a ser observada nas décadas mais recentes, fazendo 
com que, no ano de 2009, o analfabetismo caísse para cerca de um décimo da população nacional.
Naturalmente, a expansão das taxas de alfabetização não tem sido um processo uniforme, 
nem entre as diferentes regiões brasileiras, nem entre as diversas faixas etárias em que se 
divide a população nacional. De fato, é possível constatar, por exemplo, que as taxas gerais 
de analfabetismo são consideravelmente mais elevadas nas regiões Nordeste, Norte e 
Centro-Oeste do país, comparativamente às do Sudeste e do Sul. Elas também diferem, naturalmente, 
muito no que diz respeito à idade da população, sendo maiores para a parcela mais idosa dos 
brasileiros. Por outro lado, os mais jovens já vêm se beneficiando de um acesso muito mais amplo à 
educação, principalmente à de nível fundamental, como se pode observar na tabela abaixo:
tabela 1: Taxas de escolarização
brasil
Ano
Ensino Fundamental¹ Ensino Médio²
Líquida Bruta Líquida Bruta
2001 93,4% 125,5% 37,5% 82,0%
2002 93,9% 124,9% 40,4% 83,2%
2003 94,0% 123,4% 43,5% 88,5%
2004 94,0% 121,2% 44,9% 89,8%
2005 94,6% 121,0% 45,8% 89,1%
2006 95,0% 119,5% 47,5% 90,2%
2007 94,6% 120,3% 48,3% 91,1%
2008 94,9% 119,2% 50,6% 92,5%
2009 95,3% 120,5% 51,1% 89,7%
1) Pessoas de 7 a 14 anos    
2) Pessoas de 15 a 17 anos    
fonte: IETS - http://www.iets.org.br    
Conforme se vê por esses dados, estamos atualmente caminhando para uma universalização 
do Ensino Fundamental no Brasil. Em 2009, nesta etapa de ensino, para as pessoas entre 7 e 
14 anos de idade, era de 95,3% a taxa de escolarização líquida, e de 120,5% a taxa bruta no 
país. Este último número, que se encontra consideravelmente acima do valor ideal de 100%, 
pode ser parcialmente explicado pelo fato de que muitos alunos que haviam evadido do sistema 
educacional foram por ele reabsorvidos, especialmente como uma consequência de programas 
nacionais como o Bolsa Escola, que, desde 2004, vieram concedendo às famílias pobres 
brasileiras um auxílio financeiro condicionado à frequência de seus filhos aos bancos escolares.
Entretanto, se a frequência às escolas apresentou um grande progresso no Brasil, a qualidade 
e a equidade educacionais permanecem como um formidável desafio que os responsáveis pelas 
21
Guia de Estudos
políticas públicas e os profissionais da educação ainda têm diante de si. Dessa forma, a discussão 
da qualidade educacional, e não somente da quantidade, vem ganhando impulso nas últimas 
décadas e ocupando um espaço muito relevante em diversas agências governamentais, como o 
Ministério da Educação e os governos estatais.
Um ponto que mereceu – e continua merecendo – destaque nessa agenda de reforma 
educacional no país é a questão da avaliação externa da aprendizagem, como um mecanismo 
de, ao mesmo tempo, fornecer um diagnóstico do nível de conhecimento atingido pelos alunos 
após cumprirem determinadas etapas da escolarização e de também permitir aos gestores 
planejar e implementar ações com vistas a aperfeiçoar os sistemas de educação no país. Nesse 
sentido, particularmente a partir da década de 1990, surgiu e floresceu no Brasil uma cultura 
de avaliação educacional externa e em grande escala, da qual inicialmente participou o governo 
federal, no que foi, entretanto, seguido por diversos estados da federação. 
Desde a sua origem na década de 1990, esse processo brasileiro de avaliação em grande 
escala tem sofrido uma influência considerável de algo semelhante já vivido pelos Estados 
Unidos a partir das últimas décadas do século 20. Por exemplo, naquele país, desde 1969, já se 
observaram esforços sistemáticos do governo federal no sentido de criar um sistema nacional de 
avaliação, que resultaram no National Assessment of Educational Progress (literalmente, Avaliação 
Nacional do Progresso Educacional), ou NAEP, de cujo formato e concepção o Sistema Nacional 
de Avaliação da Educação Básica – SAEB –, no Brasil, herdou diversas características relevantes, 
como o desenho amostral e a estruturação das provas. Outro grande marco da avaliação 
educacional norte-americana veio a ocorrer já na entrada do século 21, com a assinatura, em 
2002, pelo presidente George W. Bush, do No Child Left Behind Act, (literalmente, Ato Nenhuma 
Criança deixada para Trás, ou NCLB, sua sigla original em inglês), uma lei que alteraria 
sobremaneira os rumos da educação americana, principalmente a pública de nível fundamental 
e médio. Basicamente, o NCLB estabelece uma ajuda financeira federal à Educação Básica 
nos estados norte-americanos, os quais, em contrapartida, precisam implementar sistemas 
de avaliação capazes de monitorar o desempenho e o progresso acadêmico de seus alunos. 
Dependendo, então, desses resultados, os estados e as escolas podem receber diversos tipos 
de incentivos positivos ou negativos, como, por exemplo, aumentos de verbas e intervenções 
escolares, respectivamente.
De uma certa maneira, o Brasil vem, nas duas últimas décadas ou um pouco mais, também 
vivenciando esse processo rumo à avaliação e à prestação de contas em educação. Nesse sentido, 
o país tem vivido uma trajetória que, grosso modo, pode-se dividir em três períodos, como se segue:
1) 1990 a 1997: Alicerces
2) 1997 a 2007: Expansão
3) 2007 ao presente: Metas e prestação de contas
É sobre cada um desses períodos que o presente texto tratará um pouco mais detalhadamente 
a seguir.
22
Processo de Formação de Profissionais da Educação Pública
2. primeiro período (1990-1997): os alicerces
O primeiro período da avaliação educacional em grande escala no Brasil corresponde, 
aproximadamente, ao intervalo entre 1990 e 1997, anos durante os quais o país assistiu à 
implementação de uma série de políticas e metodologias de testagem de proficiência que viriam 
a exercer um impacto relevante e duradouro sobre os períodos que a ele se seguiriam. Há, pelo 
menos, três importantes aspectos que se devem ressaltar nessa primeira fase. Um deles foi 
a criação, pelo Ministério da Educação e Cultura (MEC), através do seu Instituto Nacional de 
Estudos e Pesquisas Educacionais Anísio Teixeira (INEP), do Sistema Brasileiro de Avaliação 
da Educação Básica, o SAEB, que veio a servir de modelo a praticamente todos os sistemas 
de avaliação educacional em grande escala que continuariam a ser implementados no país. 
Uma segunda característica desse período foi a adoção das chamadas escalas de proficiência, 
com as quais se tornou possível averiguar, por exemplo, se os alunos avaliados estão ou não 
alcançando determinados níveis de conhecimento ou competência numa determinada disciplina 
avaliada. E, por fim, um terceiro passo importante nessa fase inicial, associado particularmente 
ao aspecto metodológico da avaliação, foi a adoção, pelo SAEB, dos procedimentos estatísticos 
da Teoria da Resposta ao Item (TRI) no tratamento dos itens e dos testes aplicados, bem como na 
construção e na interpretação das escalas, em substituição aos modelos estatísticos clássicos 
até então utilizados. Passaremos, a seguir, a discorrer um pouco mais sobre cada um desses 
três importantes marcos da primeira faseda avaliação educacional em grande escala no Brasil.
2.1. o sistema brasileiro de avaliação da educação bÁsica
O SAEB foi aplicado pelo Ministério da Educação do Brasil pela primeira vez em 1990, tendo 
sido o resultado de alguns anos de estudos preliminares conduzidos no final da década de 1980 
por técnicos e outros especialistas educacionais, inspirados principalmente, como já se disse, 
num programa nacional de avaliação educacional nos Estados Unidos conhecido como NAEP, ou 
National Assessment of Educational Progress. Segundo informações do próprio INEP,
(...) o SAEB é a primeira iniciativa brasileira, em âmbito nacional, no sentido de 
conhecer mais profundamente o nosso sistema educacional. Além de coletar dados 
sobre a educação no país, procura conhecer as condições internas e externas 
que interferem no processo de ensino e aprendizagem, por meio da aplicação de 
questionários de contexto respondido por alunos, professores e diretores, e por meio 
da coleta de informações sobre as condições físicas da escola e dos recursos de que 
ela dispõe. (INEP, 2012)
Portanto, além dos testes de proficiência aplicados aos alunos, o SAEB procura também 
averiguar as condições em que o ensino é oferecido e em que a aprendizagem ocorre. Essa 
diversidade de dados coletados permite, assim, a constituição de bancos com informações 
23
Guia de Estudos
suficientes para a realização de relevantes pesquisas sobre as condições de ensino nas escolas 
e a sua associação com a aprendizagem dos alunos. 
A segunda edição do SAEB ocorreu em 1993 e, desde então, ele vem sendo aplicado 
ininterruptamente em um intervalo de dois em dois anos. Na aplicação de 1995, houve, por 
parte da equipe responsável pela sua concepção e implementação, a adoção de uma série de 
procedimentos técnicos que visavam a alcançar uma maior comparabilidade de resultados ao 
longo dos anos. Entre outras medidas então tomadas, decidiu-se que o SAEB se concentraria 
em três séries correspondentes ao final de cada um dos três ciclos da escolarização básica, 
e que correspondem ao final do 5º e 9º anos (ou 4ª e 8ª séries, segundo a nomenclatura 
então utilizada) do Ensino Fundamental e à 3ª série do Ensino Médio. A partir daí, portanto, 
a concentração nessas três séries permitiria traçar a evolução dos níveis de desempenho na 
educação básica do país.
Além disso, outra característica relevante do SAEB é o fato de que ele trabalha segundo 
uma base amostral, ou seja, os testes e questionários não são aplicados a todos os alunos 
dessas séries, mas sim a amostras que permitem obter uma representatividade por estado 
da federação (e também regiões do país), assim como por redes de ensino: federal, pública 
(estaduais e municipais) e particular.
Os instrumentos do SAEB consistem, basicamente, de provas de Língua Portuguesa e 
Matemática2, que são aplicadas aos alunos na forma de testes compostos por itens de múltipla 
escolha, formato este que tem o objetivo de facilitar a confiabilidade e a velocidade de correção. 
Por sua vez, os questionários contextuais, aplicados aos alunos, pais e diretores de escolas, 
tratam de uma grande variedade de dimensões que são consideradas relevantes ao processo de 
aprendizagem, como o nível socioeconômico dos principais atores escolares, as atitudes frente 
à aprendizagem, o clima escolar, as relações interpessoais e a infraestrutura escolar. Como os 
testes, os questionários também se compõem de itens de múltipla escolha.
2.2. escalas de proficiência
Em 1997, com a participação de especialistas em Língua Portuguesa e Matemática, o SAEB 
elaborou as especificações de cada uma das disciplinas de seus testes, que desde então foram 
utilizadas como padrões para a avaliação educacional no Brasil. Há documentos distintos para 
cada disciplina, que também são conhecidos como matrizes de referência da avaliação. Cada 
uma dessas matrizes apresenta uma lista e descreve detalhadamente o que os alunos devem 
ser capazes de fazer com vistas a demonstrar que adquiriram um nível desejado de domínio 
na respectiva disciplina. Mais especificamente, as matrizes se compõem de um conjunto de 
descritores que se relacionam ao conteúdo daquilo que está sendo avaliado em cada série, sendo 
2 Embora as primeiras edições do SAEB também contivessem instrumentos para outras disciplinas, como Ciências.
24
Processo de Formação de Profissionais da Educação Pública
que cada descritor também se relaciona a um certo nível de operação mental cujo domínio é 
necessário para que os alunos demonstrem ter adquirido um certo nível de habilidade, conforme 
mensurado pelos itens de múltipla escolha. A seguinte ilustração apresenta um excerto de uma 
matriz de referência do Sistema Permanente de Avaliação da Educação Básica do Ceará, que se 
baseia na metodologia do SAEB e exemplifica a ideia dos descritores.
figura 1: Excerto de uma matriz de referência de Língua Portuguesa
tópicos descritor detalhamento
4 - Decodificação 
e compreensão de 
palavras.
D10 - Decodificar palavras no padrão 
consoante/vogal.
Avalia se o aluno decodifica palavras por 
sílabas no padrão canônico: consoante/vogal 
(ex: sí-la-ba).
D11 - Decodificar palavras nos 
padrões: vogal, consoante/vogal/
consoante, consoante/consoante/
vogal.
Avalia se o aluno decodifica palavras 
formadas por sílabas nos padrões não 
canônicos: vogal (ex: a-ba-ca-te); consoante/
vogal/consoante (ex: tex-to, ve-ri-fi-
car);consoante/consoante/vogal (ex:pa-la-
vra).
D12 - Compreender palavras no 
padrão consoante/vogal.
Avalia se o aluno lê com compreensão 
palavras formadas por sílabas no padrão 
canônico: consoante/vogal (ex: sí-la-ba).
D13 - Compreender palavras nos 
padrões: vogal, consoante/vogal/
consoante, consoante, consoante, 
vogal.
Avalia se o aluno lê com compreensão 
palavras formadas por sílabas nos padrões 
não canônicos: vogal (ex: a-ba-ca-te); 
consoante/vogal/consoante (ex: tex-to, ve-ri-fi-
car);consoante/consoante/vogal (ex:pa-la-vra).
fonte: CAEd (2008)
2.3. as escalas do saeb
Para cada disciplina (Língua Portuguesa e Matemática) avaliada no SAEB, foram elaboradas 
escalas que associam as pontuações obtidas pelos alunos nos testes à sua respectiva capacidade 
de resolver problemas de diferentes níveis de complexidade. Para facilitar a utilização e a 
interpretação dessas escalas, convencionalmente se estabeleceu que cada uma delas se compõe 
de valores que, grosso modo, variam de 125 a 500 pontos, e que os 250 pontos correspondem à 
média nacional da 8ª série do EF, conforme estabelecido arbitrariamente para a avaliação de 1997.
A fim de facilitar a interpretação pedagógica e a utilização dessas escalas, elas costumam 
ser divididas num pequeno conjunto de níveis progressivos de desempenho, como três ou 
quatro. Por exemplo, nos casos em que quatro níveis são definidos, em algumas situações 
eles costumam ser chamados de “abaixo do básico”, “básico”, “adequado” e “avançado”, como 
mostra a figura abaixo.
25
Guia de Estudos
figura 2: Determinação de níveis de proficiência em Matemática para diferentes séries no Sistema de 
Avaliação de Rendimento Escolar do Estado de São Paulo (SARESP), com base na escala nacional do SAEB
níveis de proficiência 5º Ef 7ºEf 9ºEf 3ºEm
Abaixo do Básico < 175 < 200 < 225 < 275
Básico 175 a < 225 200 a < 250 220 a < 300 275 a < 350
Adequado 225 a < 275 250 a 300 300 a 350 350 a 400
Avançado ≥ 275 ≥ 300 ≥ 350 ≥ 400
fonte: SÃO PAULO (2010)
2.4. a teoria da resposta ao item (tri)
O esforço sistemático do SAEB para garantir uma maior comparabilidade de seus resultados 
também levou esse sistema, a partir de 1997, a adotar a Teoria da Resposta ao Item, ou TRI, como 
método estatístico utilizado na elaboração e análise dos itens, bem como na própria elaboração 
dos testes. Antes dessa mudança, o tratamento dos itens e testes no SAEB se pautava pela 
chamada Teoria Clássica dos Testes – TCT –, método comumente empregado, por exemplo, nas 
avaliações nas salas de aula, nas quais, digamos,a nota de um aluno se determina pelo número 
ou pelo percentual de acertos de itens em um determinado teste. Um problema da TCT é que 
medidas fundamentais, como o parâmetro de dificuldade de um item ou questão, dependem dos 
alunos avaliados: quanto mais gente acerta um item, mais fácil ele é considerado, de modo que 
esse processo está sujeito a grandes instabilidades estatísticas. Por outro lado, na TRI, através 
de procedimentos probabilísticos cujo detalhamento matemático foge ao escopo deste texto, 
é possível calcularem-se parâmetros para os itens que não dependem dos sujeitos que estão 
sendo avaliados, garantindo, assim, estimativas mais úteis e confiáveis desses parâmetros. 
Embora a TRI permita a concepção e uso de diversos modelos estatísticos para tratar dessas 
informações, há particularmente três que são bastante relevantes para os propósitos práticos 
dos testes de proficiência, e que se relacionam à/ao:
1) nível de dificuldade de um item ou questão;
2) capacidade de um item de discriminar os alunos segundo sua respectiva proficiência na 
disciplina avaliada (ou seja, trata-se da capacidade de distinguir quem conhece mais ou menos 
uma disciplina, com base no acerto ou erro do avaliado numa determinada questão);
3) acerto casual, ou seja, possibilidade de um aluno acertar um item mesmo tendo uma 
proficiência geral considerada como teoricamente baixa ou insuficiente para acertá-lo, devido à 
sorte de marcar inconscientemente a resposta correta num item de múltipla escolha.
A figura abaixo ilustra a chamada curva característica do item – CCI – segundo um modelo de 
três parâmetros da Teoria da Resposta ao Item. Nela, no eixo horizontal, é representada, numa 
26
Processo de Formação de Profissionais da Educação Pública
escala arbitrária, a proficiência (theta) de um aluno, que é tanto maior quanto mais à direita 
avançamos na figura. No eixo vertical, representa-se a probabilidade de acerto – P(T) – de um dado 
item ou questão, que varia de zero (sem chance de acerto) até 1 (ou 100% de chance de acerto). 
figura 3: Curva característica de um item de três parâmetros segundo a Teoria da Resposta 
ao Item. 
P
(T
)
Theta
–1–2–3
0.0
0.2
0.4
0.6
0.8
1.0
10 2 3
fonte: BRANNICK (2012)
Observa-se que, à medida que se avança para o lado direito da figura, a curva sobe, indicando 
que indivíduos com maior proficiência têm uma maior probabilidade de acertar o item representado 
por esta curva. Aproximadamente no meio da curva, observa-se que ela sofre uma inclinação mais 
acentuada. Nesse trecho, diz-se que o item ou questão tem uma maior possibilidade de discriminação, 
visto que um pequeno deslocamento para a direita no eixo horizontal (ou seja, um pequeno aumento 
da proficiência do aluno), faz-se acompanhar de um aumento mais acentuado da curva no eixo 
vertical (ou seja, faz aumentar consideravelmente a chance de o aluno acertar a questão). Por fim, 
também se observa que, na extremidade esquerda da figura, a curva não se aproxima de zero, mas 
sim tende a assumir um valor positivo não-nulo. Isto quer dizer que, por menor que seja a proficiência 
do indivíduo, suas chances de acertar o item continuam sendo consideravelmente superiores a zero, 
visto que é possível que ele chegue na resposta correta através de um “chute”, ou acerto casual, 
como frequentemente ocorre nos casos de questões de múltipla escolha.
Uma forma comum de garantir a comparabilidade entre, por exemplo, testes feitos em uma 
mesma região em momentos diferentes, ou entre diversas regiões em um mesmo momento, é 
inserir em um teste um número pequeno, porém significativo, de itens já utilizados na prova que está 
servindo como uma referência para a comparação. Esses itens em comum têm suas propriedades 
psicométricas todas já bem conhecidas – como seu nível de dificuldade e sua capacidade de 
discriminação –, de tal forma que, conhecendo os parâmetros dessas questões, é possível não só 
calibrar os itens não-comuns (ou seja, encontrar os seus respectivos parâmetros), como também 
obter a proficiência de todos os alunos avaliados nos dois testes diferentes. Esse procedimento, 
27
Guia de Estudos
chamado de equalização3, é bastante empregado nos testes trabalhados com a TRI e, por ele, é 
possível, por exemplo, comparar os resultados do SAEB de diferentes edições – como as de 2009 
e 2011 –, bem como comparar os testes do SAEB com os das diversas avaliações implementadas 
pelos estados brasileiros, como em São Paulo, Minas Gerais, Goiás, Pernambuco etc., desde que 
esses testes apresentem entre si itens em comum, para serem utilizados na equalização.
3. seGundo período (1997–2007): eXpansão
O segundo período vivido pelos sistemas de avaliação educacional no Brasil tem seu 
início associado a um marco de grande relevância no âmbito dos esforços avaliativos no país: 
o surgimento da Prova Brasil, também realizada pelo MEC, e que compartilha com o SAEB 
uma série de características relevantes, embora em relação a ele também apresente algumas 
diferenças não menos importantes. 
Dentre as características que a Prova Brasil tem em comum com o SAEB, destacam-se a 
periodicidade de dois anos, a avaliação de Língua Portuguesa e Matemática, o uso de escalas de 
proficiência do SAEB, o emprego de itens ou questões de múltipla escolha e a adoção da TRI nos 
procedimentos de correção e análise dos resultados.
Entretanto, diferentemente do SAEB, a Prova Brasil não inclui o 3º ano do Ensino Médio, mas 
somente o 5º e 9º anos (4ª e 8ª séries) do Ensino Fundamental, possui um desenho censitário (e não 
amostral como é o caso do SAEB) e somente se aplica às escolas públicas. Devido ao seu caráter 
censitário, a Prova Brasil produz resultados também no nível das escolas, que são utilizados não 
somente para propósitos de diagnóstico e planejamento, mas também para o monitoramento do 
desempenho individual de todas as escolas públicas brasileiras de nível fundamental.
Um segundo aspecto dessa fase vivida pela avaliação educacional em grande escala no 
Brasil é a expansão que se verificou, especialmente a partir dos últimos anos da década de 
1990, dos sistemas estaduais de avaliação, impulsionada pelo desejo das diversas secretarias 
de educação de conceberem e implementarem seus sistemas de avaliação mais adequados às 
diversas realidades estaduais. As secretarias estaduais tinham, com isso, o interesse de realizar 
avaliações mais detalhadas, bem como de fazer com que esse processo se aproximasse mais 
das características e necessidades específicas de suas respectivas redes de ensino.
Nesse sentido, observa-se, por exemplo, o fato de que as avaliações estaduais tendem a se 
realizar anualmente, diferentemente do SAEB e da Prova Brasil que, conforme se viu, são aplicadas 
a cada dois anos. Como os governos estaduais são, a princípio, trocados a cada quatro anos em 
função das eleições para governador, a periodicidade de dois anos das avaliações federais, acrescida 
do fato de que há um tempo extra, que chega a cerca de um ano, para o devido processamento 
3 Também se costuma utilizar a expressão original em inglês para esse termo técnico, que é equating.
28
Processo de Formação de Profissionais da Educação Pública
e análise dos dados dessas avaliações, faz com que as suas respectivas informações cheguem 
muito tarde para que as autoridades estaduais delas se apropriem adequadamente e utilizem-nas 
para fins de aperfeiçoamento de seus respectivos sistemas. Portanto, a periodicidade anual, aliada 
ao processamento e análise muito mais rápidos que se conseguem obter com as avaliações feitas 
pelos próprios estados, faz com que os resultados tenham condições de fornecer subsídios para 
intervenções que podem ser concebidas, executadas e monitoradas várias vezes por uma mesma 
administração governamental ao longo de seu respectivo mandato.
Outro ponto que favorece a adoção dos sistemas próprios de avaliação dos estados decorre 
do fato de que, até recentemente, as escolas rurais não eram devidamente contempladasnas 
avaliações federais, seja porque eram tratadas apenas do ponto de vista amostral (como é o 
caso do SAEB), o que impossibilitava o monitoramento de todas elas, seja porque eram simples 
e totalmente excluídas das avaliações (como foi o caso da Prova Brasil em várias das suas 
primeiras edições). Portanto, os sistemas estaduais vieram a preencher essa lacuna, sendo que 
esse aspecto salienta também duas outras importantes características suas: a tendência em 
fazer avaliações censitárias, ou seja, que incluem todos os alunos e escolas das redes estaduais, 
e o propósito, encontrado em vários estados, de utilizar os resultados desses testes para criar 
mecanismos de monitoramento do desempenho educacional nas mais diversas instâncias da 
educação do estado, chegando mesmo ao nível da escola.
Via de regra, esses novos sistemas de avaliação foram primeiramente implementados nos 
estados economicamente mais desenvolvidos e densamente povoados do país, como alguns da 
região Sudeste: São Paulo (que, na verdade, iniciara seu sistema próprio de avaliação um pouco 
antes disso, em 1996), Minas Gerais (desde 2000) e o Rio de Janeiro (em 2004). Alguns estados 
de outras regiões também se situam entre os primeiros a aderir a essa tendência, como o Rio 
Grande do Sul, Pernambuco e o Ceará.
Do ponto de vista das características e da metodologia das avaliações estaduais, um ponto que, 
em geral, se observa nesses sistemas é a semelhança com as avaliações nacionais do SAEB e da 
Prova Brasil. Dessa forma, a grande maioria deles privilegia a avaliação das últimas séries dos 
principais ciclos do ensino básico, concentra-se em testes de Língua Portuguesa e Matemática, 
emprega itens de múltipla escolha e utiliza a metodologia da Teoria da Resposta ao Item no 
tratamento estatístico das questões e das provas. Além disso, outra característica extremamente 
relevante dessas avaliações é o fato de que elas tiveram – e têm tido até os dias de hoje – a 
preocupação de tornar seus dados nacionalmente comparáveis, o que se tem conseguido por meio 
da adoção das mesmas escalas de proficiência do SAEB. Na prática, isso se consegue mediante 
a adoção de itens comuns com as avaliações nacionais do MEC, que permitem a equalização de 
resultados entre os diversos sistemas, conforme já comentado anteriormente.
Nesse mesmo sentido, um caso à parte é o estado de São Paulo, justamente o mais 
economicamente desenvolvido do país e também o pioneiro nas avaliações estaduais, que, em 
várias de suas edições iniciais, utilizava ainda escalas próprias de proficiência, que não tinham 
comparabilidade com as escalas nacionais do SAEB. Essa situação perduraria até 1997, ano em 
29
Guia de Estudos
que o SARESP – Sistema de Avaliação de Rendimento Escolar do Estado de São Paulo – resolveu 
aderir à métrica nacional, passando também, daí em diante, a equalizar seus resultados com os 
do SAEB. Tal fato marcou, tanto do ponto de vista simbólico quanto prático, uma consolidação das 
avaliações nacionais do SAEB e da Prova Brasil como referências incontornáveis na avaliação 
educacional em grande escala no país, situação esta que vem se verificando até os dias de hoje.
4. terceiro período (2007–presente)
O terceiro período vivido pelas avaliações educacionais em grande escala no Brasil tem seu 
início no ano de 1997, com a determinação, pelo Ministério da Educação, das metas do Índice 
de Desenvolvimento da Educação Básica, o Ideb, um instrumento nacional de mensuração e 
monitoramento do desempenho do ensino básico no país. Outras duas importantes características 
se salientam nesse período, ambas significativamente associadas ao surgimento do Ideb: a adoção, 
cada vez mais difundida, de medidas de prestação de contas das escolas em diversos estados 
da federação e a disseminação, praticamente universal, dos sistemas estaduais de avaliação 
educacional. Passaremos agora a discorrer sobre cada uma dessas três características.
4.1. o ideb
A partir do ano de 2005, o Ministério da Educação, através do INEP, começou a divulgar e 
utilizar um índice para aferir a situação geral do ensino básico no Brasil, medida esta que recebeu 
o nome de Ideb: Índice de Desenvolvimento da Educação Básica. O Ideb, para um ano específico e 
uma determinada unidade educacional (como uma escola, município, estado, região, ou mesmo o 
país como um todo) é calculado de acordo com a seguinte fórmula: Ideb = N x P onde:
N = média combinada das disciplinas de Língua Portuguesa e Matemática, segundo avaliações 
do SAEB ou na Prova Brasil, e que se expressa em uma escala transformada que varia de 0 a 10.
P = uma taxa combinada de aprovação para todas as séries ou anos que compõem um ciclo 
escolar específico (por exemplo, as séries de 1 a 3 para o Ensino Médio), e que se exprime numa 
escala que varia de 0 a 1 (por exemplo, uma média de aprovação igual a 92% corresponderia a P 
= 0,92). (INEP, 2010)
Um aspecto relevante do Ideb é que, para aumentá-lo, é necessário que a unidade educacional 
em questão promova o aumento de um dos fatores do produto FLUXO X DESEMPENHO, sem 
fazer com que o outro fator diminua na mesma proporção. O ideal, nessa mesma linha, seria, na 
verdade, promover um aumento simultâneo de ambos os fatores, o que, via de regra, é uma tarefa 
difícil. Isto porque o aumento do desempenho escolar comumente se associa a um maior rigor nos 
critérios de avaliação interna das escolas, o que, por sua vez, resultaria, em tese, numa diminuição 
da aprovação ou fluxo dos alunos através das séries. O contrário também tende a se verificar, ou 
30
Processo de Formação de Profissionais da Educação Pública
seja, um relaxamento do nível de exigência para a aprovação acarretaria, a princípio, um aumento 
do fluxo, porém em prejuízo da aprendizagem e, consequentemente, do desempenho nas provas.
Outro ponto importante a respeito do Ideb é o fato de que o Ministério da Educação passou a 
projetar, para cada unidade educacional de interesse, como escolas e estados brasileiros, o valor 
que cada unidade deverá apresentar desse índice para fazer com que, no futuro, o Brasil, como 
um todo, experimente um vigoroso aumento da qualidade da sua educação básica. Para que o 
país atinja essa melhoria, tomou-se como referência o ano de 2022, que tem uma considerável 
importância simbólica para o país, visto que nele se comemorará o bicentenário da independência 
do Brasil4. Nesse ano, o MEC estabeleceu como meta que o Brasil deverá atingir um Ideb médio 
igual a 6, numa escala que varia de 0 a 10. Segundo estudos comparativos internacionais, estima-
se que esse Ideb de 6 corresponderia, grosso modo, a um “Ideb” médio que teriam os países 
da Organização para a Cooperação e o Desenvolvimento Econômicos – OCDE –, um organismo 
internacional que congrega as economias mais avançadas do mundo, como os Estados Unidos, 
Austrália, Japão e os países da Europa Ocidental, entre outros. Considerando, portanto, as taxas 
atuais médias de fluxo de alunos no Ensino Básico nesses países, bem como o desempenho de 
seus estudantes nos testes do Programa Internacional de Avaliação de Alunos – PISA –, realizado 
também pela OCDE, estima-se que um valor de 6 seria a média dos países dessa organização.
O estabelecimento dessas metas sinalizou, portanto, para o Brasil como um todo, o 
surgimento de um esforço nacional em prol da prestação de contas das unidades educacionais. 
A partir de então, as escolas passariam, a cada edição da Prova Brasil, a ter seus respectivos 
valores de Ideb divulgados e comparados com as metas que se lhes haviam traçado. Entretanto, 
o cumprimento ou não das metas do Ideb por parte das escolas ainda não resultou, na prática, 
em consequências muito drásticas para as próprias escolas ou para os profissionais nelas 
envolvidos, a não ser, naturalmente, a exposição pública dos valores reais do índice com suas 
respectivas metas, e as consequentes implicações que isso pode vir a ter em termos de prestígio 
ou propaganda das escolas junto às suas respectivas

Continue navegando