Avaliação Psicológica
176 pág.

Avaliação Psicológica


DisciplinaPsicologia63.935 materiais447.954 seguidores
Pré-visualização35 páginas
industrial: aproximações entre 
psicologia e estatística. InterMeio, 14 (28), 41-56.
Schultz, D. P, & Schultz, S. E. (2007). História da Psicologia Moderna. 8a ed. 
São Paulo: Thom son Learning.
Silva, M. C. R. & Vendramini, C. M. M. (2005). A utoconceito e desempenho 
de universitários na disciplina Estatística. Psicologia Escolar e Educacional, 
9 (2), 261-268.
Tabachnick, B. G., & Fidell, L. S. (2007). Using Multivariate Statistics. 5a ed. 
Boston: Allyn & Bacon.
Urbina, S. (2007). Fundamentos da Testagem Psicológica. Porto Alegre: Artm ed 
Editora.
Vendramini, C. M. M., Silva, M. C. R. & Dias, A. S. (2009). A valiação de 
atitudes de estudantes de psicologia via modelo de crédito parcial da TRI. 
Psico-USF, 14 (3), 287-298.
Yunis, F. A. (2006). Factors influencing the psychology student in dealing with 
statistics courses. /C O T S, 7, 1-5.
80
Capítulo 4
Teoria de Resposta ao Item na Avaliação 
Psicológica
Felipe Valentini 
Jacob Arie Laros
Maria, psicóloga recém-formada, na sua primeira experiência 
profissional é requisitada para realizar uma avaliação das habi­
lidades cognitivas de um cliente. Após selecionar alguns testes 
com pareceres favoráveis pelo Sistema Satepsi (disponível em 
www2.pol.org.br/satepsi) e estudar os respectivos manuais, 
Maria continua com algumas dúvidas: Um dos manuais indica 
que os itens possuem dificuldade média de 0,50 e boa capaci­
dade discriminativa (correlações bisseriais entre 0,40 e 0,80). 
O que isso indica? Outro manual sugere, por meio da curva de 
informação, que o teste é mais eficiente ao avaliar pessoas com 
escores baixos no construto. O que isso significa? O último teste é 
aplicado via computador, com base na TAC (Testagem Adaptiva
Avaliação psicológica: guia de consulta para estudantes e profissionais de psicologia
Computadorizada), por meio da qual as pessoas podem ser compa­
radas entre si, mesmo respondendo a questões diferentes. Como 
isso é possível?
Este capítulo foi construído visando a apresentar os princi­
pais conceitos e discussões acerca da Teoria Clássica dos Testes 
(TCT), bem como na Teoria de Resposta ao Item (TRI). Espera- 
-se, desse modo, auxiliar os psicólogos e estudantes de graduação 
a \u201cresolver\u201d as dúvidas de Maria, assim como outros problemas 
que surgem na prática da Avaliação Psicológica e que envolvem 
conceitos básicos de psicometria. Primeiramente, serão exploradas 
as definições básicas da TCT. Posteriormente, será apresentada a 
TRI e suas principais aplicações.
Teoria Clássica dos Testes (TCT)
Em qualquer área do conhecimento (até mesmo para as ciên­
cias exatas), o problema da medida é inerente à ciência. Como 
medir a distância entre duas estrelas, por exemplo, localizadas a 
anos-luz da Terra? Nesse contexto, é fácil perceber que as medidas 
produzidas (mesmo para o tamanho do parafuso utilizado em naves 
espaciais) não estão isentas de erros. N a psicologia, a ciência que 
se ocupa da medida e do seu erro é a psicometria.
A medida, de acordo com a psicologia, pode ser definida como 
a utilização de números e de categorias para representar um 
comportamento (Andrade, Laros & Gouveia, 2010; Nunnally 
& Bernstein, 1994). Além dos comportamentos, a psicometria 
moderna interessa-se pela medida do traço latente ou theta (9). 
O traço latente pode ser definido como a habilidade, aptidão ou
82
fp.ni.i de Resposta ao Item na Avaliação Psicológica
lor hipotético que organizam e agem sobre os comportamentos 
{P.isquali, 2003). Neste sentido, a psicometria moderna ocupa-se 
(nulo da medida dos comportamentos quanto dos traços latentes.
Um dos aspectos importantes da medida e do erro na TCT, que 
dr baseia na Teoria do Escore Verdadeiro (TEV), diz respeito à 
fidedignidade. A teoria parte do pressuposto de que, a despeito do 
cm 1 0 de medida, uma parte dos escores dos examinandos é genui­
namente verdadeira. Sendo assim, os escores totais observados (e 
a variância) de um grupo de pessoas são equacionados pela soma 
ilos escores verdadeiros e do erro. Ou seja, escore observado = 
escore verdadeiro + erro (Crocker & Algina, 1986; Hogan, 2006; 
Nunnally & Bernstein, 1994).
A fidedignidade refere-se à estabilidade dos escores dos sujeitos 
cm administrações repetidas do mesmo teste ou formas paralelas. 
I;m outras palavras, a fidedignidade (ou precisão) é o grau em que 
o,s escores z de um sujeito permanecem consistentes em admi­
nistrações repetidas de um mesmo teste. Em termos práticos, a 
lidedignidade, na TCT, indica a porcentagem que representa o 
escore verdadeiro sobre o escore total. Suponha-se, por exemplo, 
que o manual de um teste relate um coeficiente de fidedigni- 
dade de 0,85. Por meio da equação da TEV, é correto afirmar 
que 85% da variância dos escores observados são atribuíveis à 
variância verdadeira. Além disso, 15% devem-se à variância de 
erro. Ressalta-se, no entanto, que o coeficiente de fidedignidade 
para um conjunto de escores é um conceito puramente teórico 
(I'rocker & Algina, 1986).
No que se refere ao item, as principais qualidades da medida 
avaliadas são a dificuldade, a capacidade de discriminação e a 
possibilidade de resposta ao chute (Nunnally & Bernstein, 1994).
83
Avaliação psicológica: guia de consulta para estudantes e profissionais de psicologia
O parâmetro da dificuldade do item na T C T é operacionali- 
zado por meio do cálculo da proporção de acerto (Nunnally & 
Bernstein, 1994). Um item, por exemplo, submetido a cem parti­
cipantes e respondido corretamente por oitenta deles, teria o seu 
parâmetro de dificuldade igual a 0,80 (ou seja, 80/100=0,80), indi­
cando que, em média, 80% das pessoas acertam o item. Nota-se 
que esse indicador de dificuldade é apresentado em uma escala 
invertida: quanto maior o parâmetro de dificuldade, mais fácil é 
o item, pois uma proporção maior dc pessoas consegue responder- 
-lhe corretamente. Por esse motivo, tem-se dito que o parâmetro 
de dificuldade na TCT, na realidade, é um indicador de facilidade 
do item.
O parâmetro discriminação diz respeito à qualidade do item 
em separar os examinandos em grupos conforme suas capacidades 
(ou escores). Ou seja, o poder do item está em distinguir sujeitos 
com escores relativamente parecidos. Um item pouco discrimina- 
tivo tem sua utilidade diminuída, uma vez que pouco auxilia o 
teste a separar as pessoas mais habilidosas das menos habilidosas. 
N a TCT, a discriminação é avaliada, principalmente, por meio 
da correlação bisserial ou pela correlação ponto-bisserial entre o 
item e o escore total. Neste aspecto, é esperada uma correlação 
item-total positiva, refletindo o fato de que as respostas corretas 
ao item são mais freqüentes nos examinandos com escores 
totais altos. Quanto maior a correlação, maior a discriminação 
(Hambleton, Swaminathan &. Rogers, 1991; Nunnally & Bern­
stein, 1994; Pasquali, 2003). Correlações negativas indicam que 
as respostas corretas ao item são mais freqüentes nos examinandos 
com os menores escores totais. Neste caso, há indícios de que o
84
íirm apresenta algum problema, normalmente relacionado à troca 
dr gabarito (Andrade, Laros & Gouveia, 2010).
Finalmente, na TCT, a avaliação da possibilidade de acerto ao 
iicaso (ou \u201cchute\u201d) é dada em função do número de alternativas
< le resposta. Por exemplo, um item de múltipla escolha com quatro 
alternativas (A, B, C e D) possui 25% (1 item / 4 alternativas =
0,25) de chance de acerto devido ao acaso (Nunnally & Bern­
stein, 1994). O pressuposto é que o examinando que não tem a 
habilidade suficiente para dar a resposta chutará cegamente, sem 
avaliar qual das respostas é a mais provável. Destaca-se que este 
pressuposto da T C T foi amplamente criticado, uma vez que, em 
geral, as alternativas incorretas não têm a mesma atratividade 
(Fmbretson